Субтитрование на татарском: искусственный интеллект поможет

Субтитрование на татарском: искусственный интеллект поможет
Фото: realnoevremya.ru/Максим Платонов

Институт прикладной семиотики Академии наук РТ запускает пробный сервис субтитрования видео на русском языке с переводом на татарский. Как можно воспользоваться новой возможностью и какие еще разработки запустят до конца этого года, «Реальному времени» рассказал директор института Ринат Гильмуллин.

Чем искусственный интеллект поможет журналисту?

Функция субтитрования появилась на фоне основной разработки: институт прикладной семиотики сейчас работает над речевым переводчиком. Все это будет возможно на действующей платформе Тatsoft.

— Это означает, что есть возможность получать переводы на татарском и русском языках, используя голос. Сервис создается на базе нашего переводчика Тatsoft. Мы наполняем его функционалом с речевым интерфейсом, чтобы можно было вводить текст через диктовку, — рассказал Ринат Гильмуллин.

Сейчас в аккаунтах Института продолжается сбор речевых образцов для того, чтобы сделать сервис переводов еще более качественным. Проходит конкурс среди самых активных. Через telegram-бот необходимо послать тысячу речевых образцов и оценить не менее 1000 озвучек.

Как рассказал директор Института прикладной семиотики, в рамках основной работы над проектом сервиса речевого переводчика появились и дополнительные, промежуточные результаты.

— Сейчас есть возможность использовать наши наработки для других сервисов, в частности субтитрования видеороликов, — говорит Гильмуллин. — Сначала субтитрование будет доступно на «Рутьюбе», а потом и для любых других видео. Возможно, мы сделаем для этого какую-то отдельную страницу или сервис. Люди смогут самостоятельно загружать свое видео и просматривать его с субтитрами.

Чтобы воспользоваться этой возможностью, нужно будет установить в браузере плагин. Сейчас сервис запускается в направлении с русского на татарский, в дальнейшем будет запущено обратное направление — с татарского на русский. Для эксперимента ученые взяли выпуск программы «Новости Татарстана» на ТНВ: он идет на русском языке и здесь же появляются субтитры — синхронный перевод на татарский язык с помощью машинного перевода Тatsoft.

скриншот realnoevremya.ru из видео «Татарстан хәбәрләре»/youtube.com, аккаунт «ТНВ Татарча»

— Надо понимать, что перевод делает не человек, а машина с использованием технологий искусственного интеллекта, — говорит Гильмуллин. — Сейчас главное для нас — это правильно передать суть. Несмотря на то, что перевод является достаточно качественным, есть технические нюансы с обеспечением синхронности перевода. Но, тем не менее, по смыслу все соответствует. Все понятно.

В институте уже умеют распознавать и синтезировать татарскую речь. Реализуется задача создания синхронного переводчика. В ближайшем будущем сервисов для татарского языка с использованием речевых технологий станет еще больше.

Сейчас идет работа на следующим проектом: загружаешь аудиофайлы, которые записаны во время интервью, — и получаешь тексты на татарском и русском. Планируется запустить телеграм-бот, куда можно будет загружать аудиозаписи. Сейчас бот проходит этап тестирования и доработки для улучшения качества сервиса.

«Пишу голосом»

Еще одна задумка ученых-практиков сможет примирить тех, кто не любит, когда ему в мессенджерах отправляют голосовые сообщения, с теми, кто ленится набирать текст вручную и предпочитает общаться голосом. Появится бот, который делает расшифровку голосового сообщения и переводит его в текст.

realnoevremya.ru/Ринат Назметдинов

Более глобальная задача — обеспечить данными на татарском языке те платформы и разработки, где их еще нет, говорит директор:

— Взять тот же Chat GPT, который работает с мировыми языками. Татарский здесь еще не представлен на должном уровне, это направление еще предстоит развивать.

Кроме того, сообщил Гильмуллин, у них есть идея создать современный портал литературного татарского языка. Люди могли бы загружать любые произведения и получать возможность озвучивания и наоборот. Есть интересная идея, связанная с клонированием голоса.

— Есть известные писатели, исторические личности. Если сохранены записи их живых голосов, тогда, применяя те технологии, которые мы сейчас разрабатываем, мы сможем озвучивать их голосами написанные ими же произведения. Голосами авторов! Технологии уже готовы, их нужно просто адаптировать и находить тренировочные датасеты для этих целей.

Миляуша Кашафутдинова
Общество Татарстан

Новости партнеров