MTS AI озвучит до 10 тысяч книг для сервиса "Строки"

МТС сообщает о смелом решении озвучить до 10 тысяч произведений с помощью искусственного интеллекта MTS AI. Аудиокниги в рамках этого проекта будут доступны пользователям книжного сервиса "Строки". Будет задействована собственная разработка для распознавания и синтеза речи Audiogram. В этом продукте объединены возможности использования нейронных сетей, технологии ML обработки естественного языка (NLP). 

Аудиопроизведения будут сформированы в формате EPUB - формат популярный в области цифровых книг, а вот для сохранения звука его использовали не так часто. 


Картинка нарисована с использованием нейросети DALL.E 2 и Nightcafe.
Надеюсь платформа МТС озвучивает тексты лучше, чем эта платформа рисует картинки
.

“В перспективе использование технологий синтеза речи позволит издательствам и электронным библиотекам существенного сократить время на подготовку аудиоверсии книги и снизить затраты на производство аудиоконтента. Команде MTS AI удалось добиться того, чтобы на подготовку первоначальной версии аудиокниг уходило 30-60 минут, тогда как студийная запись живым голосом занимает кратно больше времени, до нескольких дней с учетом технической обработки и монтажа”, - Дмитрий Буланцев, технический директор MTS AI

“Формат аудиопотребления книжного контента очень удобен и становится все более популярным. При этом огромный объем книг - более 90% - не озвучены, их трансформация в аудиоформат традиционным способом заняла бы годы. Технологии искусственного интеллекта позволяют существенно ускорить, упростить и удешевить этот процесс. И значит огромное число произведений - как литературных, так и нонфикшн станут доступным в удобном аудиоформате,” - комментирует Евгения Рыкалова, руководитель книжного сервиса "Строки" от МТС.

МТС обещает, что платформа не только синтезирует речь, но также правильно расставляет ударения и паузы, воспроизводит побудительные и вопросительные интонации. Вместе с тем, я не думаю, что даже лучшие алгоритмы уже сегодня способны убить такой жанр как озвучивание книг. Оплачиваемые заказы на этом рынке получить будет сложнее, но работы мастеров этого жанра будут продолжать пользоваться спросом. 

В МТС ожидают, что платформу Audiogram можно будет задействовать не только для озвучки книг, но также в образовании, для подготовки аудиолекций, для озвучивания видео, статей, создания материалов для людей с ограниченными возможностями, например, по зрению. 

пресс-релиз МТС 

UPD: Послушал примеры работы Audiogram. Выглядит приемлемо, если почему-то предпочтительнее аудиформат. Но вряд ли поклонники тех или иных чтецов будут готовы перейти на такую озвучку. С другой стороны, встречаются и чтецы, которые читают не лучше или хуже (особенно беда с ударениями, а иногда и интонациями). К сожалению, примеры в целом не очень наглядные, например, непонятно, будет ли какая-то раскладка по голосам, когда идет речь о диалогах, например. 

Чего точно не хотелось бы, так это того, чтобы дети в большом объеме сталкивались с такими вариантами озвучки, т.к. "чужинка" в озвучке присутствует. И лучше бы детям давать слушать тексты в исполнении профессиональных чтецов или лучших из любителей, а не в исполнении ИИ. По крайней мере, пока что.

Сэмплы доступны в Telegram:
https://t.me/c/1172581942/2238
https://t.me/c/1172581942/2239

--

Комментариев нет:

Популярные сообщения

Желающие следить за новостями блога, могут подписаться на рассылку на follow.it (отписаться вы сможете в один клик). 

Еще можно подписаться на Telegram-каналы @abloud62 @abloudrealtime, где также дублируются анонсы практически всех новостей блога. 

 

Translate