Сайдаш Мифтахов: «Присутствие татарского языка в интернете практически равно нулю»
Специалист по искусственному интеллекту призывает не упрощать татарский язык
На базе онлайн-проекта «Ачык университет» («Открытый университет») открылся бесплатный курс по изучению возможностей искусственного интеллекта, он ведется на татарском языке, включая всю терминологию. Авторами идеи стали новый председатель Всемирного форума татарской молодежи Райнур Хасанов и специалист в сфере искусственного интеллекта Сайдаш Мифтахов. Корреспондент «Реального времени» пообщался со спикером курса и узнал, когда новые технологии «заговорят» по-татарски.
«Всю жизнь пас коров, собирал картошку и наслаждался прелестями деревенской жизни»
Все началось с вебинара на татарском языке на тему искусственного интеллекта и его применения, который был организован летом 2023 года в рамках «Ачык университет». Его посетили около 60 человек.
— Мы и сами не ожидали, что это вызовет такой ажиотаж. Честно говоря, мы с Райнуром провели вебинар ради интереса. Дальше я много раз выступал с темой ИИ. Позднее у нас появилась идея сделать специальный курс, — рассказал Сайдаш Мифтахов.
Уроженец Кукморского района из села Уразай в 11-м классе победил в олимпиаде и поступил в Высшую школу экономики в Москве. Во время учебы увлекся сферой IT. На 3-м курсе съездил по обмену в Голландию, погрузился в тему искусственного интеллекта. А на 4-м курсе уже работал в компании «Северсталь» — автоматизировал производство с помощью ИИ. Дальше поступил в магистратуру в Сколково. Параллельно продолжал работать в разных компаниях, продвигал свои стартапы. Но затем вернулся в Казань, а в прошлом году перешел на работу в компанию «Яндекс».
«Сейчас идет процесс упрощения татарского языка»
На бесплатный курс по искусственному интеллекту на татарском языке записались почти 300 человек всех возрастов, занятых в разных сферах.
— Слушатели курса очень разные — много учителей, журналистов, IT-специалистов, школьников. Один из самых активных наших участников — известный журналист и общественный деятель Римзиль Валиев. Он всегда очень заинтересован, задает нужные вопросы, тем самым обогащает наш курс. Я рассказываю слушателям, как применять ИИ в обычной жизни, — рассказывает Мифтахов.
Курс читается полностью на татарском языке, включая всю терминологию, которую зачастую сложно перевести. По словам авторов проекта, главная цель — обогащение татароязычного контента в интернете.
— Я считаю, что сейчас проблема развития нашего языка состоит в его упрощении — мы не можем уйти далеко от Сабантуя, чак-чака и эчпочмака. Все новейшие технологии преподносятся на английском и русском языках. Мы надеемся, что наш проект хоть немного, но начнет исправлять сложившуюся ситуацию, — говорит Мифтахов.
По словам специалиста, присутствие татарского языка в сфере искусственного интеллекта очень ограничено, но начало уже положено.
— Основную работу в этом направлении ведет Институт прикладной семиотики АН РТ. Тот же знаменитый онлайн-переводчик и есть ИИ. Мы уже столько лет пользуемся этим сервисом, не подозревая, что это и есть искусственный интеллект. Скоро институт семиотики запустит функцию перевода аудиозаписи в текст.
Для того, чтобы создать ИИ, говорит Мифтахов, нужен, во-первых, очень большой объем информации, который мог бы объять весь интернет. Сейчас самая большая база — в институте прикладной семиотики.
— В целом создание ИИ — это очень сложный, дорогостоящий процесс. Чем больше ресурсов и финансов в него внести, тем лучше он получится, — считает молодой человек.
«В интернете нас нет»
Сайдаш Мифтахов считает, что сейчас присутствие татарского языка в интернете практически равно нулю.
— У нас нет ресурсов, которые смотрят миллионы. Нет блогеров, которые говорят о темах узкой направленности, связанной с наукой, например. У нас больше тех, кто показывает только свой лайф-стайл — как и что они едят и пьют, как одеваются, общаются и так далее. Такие блогеры, безусловно, тоже нужны, но нельзя этим ограничиваться, — уверен специалист по ИИ.
По мнению Мифтахова, большой вклад вносит «татарская Википедия», благодаря которой всемирные искусственные интеллекты хоть что-то знают о татарском языке. К примеру, открытый чат GPT. Он пока не умеет составлять целые тексты, но какие-то слова на татарском уже может осилить.
— Но этого, конечно, мало. Недостает объемов информации на татарском языке. Например, если ты хочешь найти информацию по физике, ты все равно должен перейти на русскоязычный контент, так как татароязычного по этой теме попросту нет. Такими темпами татарский превратится только в язык бабушек-дедушек и эстрады. Не будет языком знаний, новых технологий и возможностей. Кроме того, есть еще одна опасность, такое применение татарского может привести к тому, что сама лексика станет скудной. Уже сейчас мало кто говорит на сложном, качественном, по-настоящему красивом татарском языке. Если говорить глобально, в интернете нас нет. Эту ситуацию надо исправлять. Для этого нужны качественные блогеры, качественный контент, — уверен Сайдаш.
— Давайте зададимся таким вопросом — есть ли популярное и при этом качественное медиа для молодых людей на татарском языке? Мне приходит на ум единственный молодежный журнал и все. Часто ориентируются в первую очередь на спрос, однако с этим я хочу не согласиться. Думаю, надо начинать с того, чтобы сделать такое медиа. В противном случае, мы можем прийти и к тому, что сам татарский язык не будет иметь спроса.
Все зависит от нас самих, резюмирует молодой человек: «Мы сами должны проявить инициативу и начать что-то делать. Сейчас очень много молодых людей, которые горят этим, хотят создавать новые проекты. Но пока мы все действуем локально и разрозненно. Нам нужно объединяться или действовать по-отдельности, но с пониманием главной задачи — выводить татарский язык на новый уровень. Мне кажется, что наше общество проснется. Появятся новые проекты, в том числе в интернете, чтобы татарский язык смог обеспечивать сам себя в цифровом пространстве».
Подписывайтесь на телеграм-канал, группу «ВКонтакте» и страницу в «Одноклассниках» «Реального времени». Ежедневные видео на Rutube, «Дзене» и Youtube.