МТС сообщает о смелом решении озвучить до 10 тысяч произведений с помощью искусственного интеллекта MTS AI. Аудиокниги в рамках этого проекта будут доступны пользователям книжного сервиса "Строки". Будет задействована собственная разработка для распознавания и синтеза речи Audiogram. В этом продукте объединены возможности использования нейронных сетей, технологии ML обработки естественного языка (NLP).
Аудиопроизведения будут сформированы в формате EPUB - формат популярный в области цифровых книг, а вот для сохранения звука его использовали не так часто.
Надеюсь платформа МТС озвучивает тексты лучше, чем эта платформа рисует картинки.
“В перспективе использование технологий синтеза речи позволит издательствам и электронным библиотекам существенного сократить время на подготовку аудиоверсии книги и снизить затраты на производство аудиоконтента. Команде MTS AI удалось добиться того, чтобы на подготовку первоначальной версии аудиокниг уходило 30-60 минут, тогда как студийная запись живым голосом занимает кратно больше времени, до нескольких дней с учетом технической обработки и монтажа”, - Дмитрий Буланцев, технический директор MTS AI.“Формат аудиопотребления книжного контента очень удобен и становится все более популярным. При этом огромный объем книг - более 90% - не озвучены, их трансформация в аудиоформат традиционным способом заняла бы годы. Технологии искусственного интеллекта позволяют существенно ускорить, упростить и удешевить этот процесс. И значит огромное число произведений - как литературных, так и нонфикшн станут доступным в удобном аудиоформате,” - комментирует Евгения Рыкалова, руководитель книжного сервиса "Строки" от МТС.
МТС обещает, что платформа не только синтезирует речь, но также правильно расставляет ударения и паузы, воспроизводит побудительные и вопросительные интонации. Вместе с тем, я не думаю, что даже лучшие алгоритмы уже сегодня способны убить такой жанр как озвучивание книг. Оплачиваемые заказы на этом рынке получить будет сложнее, но работы мастеров этого жанра будут продолжать пользоваться спросом.
В МТС ожидают, что платформу Audiogram можно будет задействовать не только для озвучки книг, но также в образовании, для подготовки аудиолекций, для озвучивания видео, статей, создания материалов для людей с ограниченными возможностями, например, по зрению.
UPD: Послушал примеры работы Audiogram. Выглядит приемлемо, если почему-то предпочтительнее аудиформат. Но вряд ли поклонники тех или иных чтецов будут готовы перейти на такую озвучку. С другой стороны, встречаются и чтецы, которые читают не лучше или хуже (особенно беда с ударениями, а иногда и интонациями). К сожалению, примеры в целом не очень наглядные, например, непонятно, будет ли какая-то раскладка по голосам, когда идет речь о диалогах, например.Чего точно не хотелось бы, так это того, чтобы дети в большом объеме сталкивались с такими вариантами озвучки, т.к. "чужинка" в озвучке присутствует. И лучше бы детям давать слушать тексты в исполнении профессиональных чтецов или лучших из любителей, а не в исполнении ИИ. По крайней мере, пока что.
Сэмплы доступны в Telegram:
https://t.me/c/1172581942/2238
https://t.me/c/1172581942/2239
--
Комментариев нет:
Отправить комментарий