Может ли ИИ правильно нарисовать Габдуллу Тукая

Как нейросеть может помочь татарскому языку. Часть 2-я, генерация изображений

Может ли ИИ правильно нарисовать Габдуллу Тукая
Тукай играет в конструктор?. Фото: предоставлено Райнуром Хасановым

Райнур Хасанов, председатель Всемирного форума татарской молодежи и IT-специалист, ежедневно использующий сервисы искусственного интеллекта для улучшения, упрощения и ускорения работы над различными проектами, продолжает рассказывать о своем опыте работы с искусственным интеллектом, отвечая на вопрос: как ИИ может помочь в развитии татарского языка?

Создание изображений одинаковых персонажей

«Если говорить в целом, то для генерации изображений существует множество различных нейросетей, — уточняет Райнур Хасанов. — Наиболее популярные из них: DALL-E (в связке с ChatGPT), Midjourney, LeonardoAI, модель Stable Diffusion, а также российская нейросеть «Кандинский». Сегодня мы рассмотрим некоторые из них и их практическое применение для татарского языка».

Когда создаешь с помощью ИИ иллюстрации к какой-нибудь истории с одним персонажем, возникает проблема. По словам Хасанова, одна и та же нейросеть рисует при идентичных текстовых запросах разных персонажей:

— Для решения этой проблемы приходилось делать множество настроек и очень подробно описывать промпты. Но недавно с помощью DALL-E 3 и нового приложения GPT — Consistent Character GPT создание одинаковых персонажей стало гораздо проще.

  1. Перейдите в GPT Store и в поиске напишите «Consistent Character GPT».
  2. Нажмите на кнопку «Начать чат».
  3. Нажмите «Click here to start creating character designs».
  4. Укажите пол персонажа и его имя (например, в моем случае пусть будет «Rainur»).
  5. Введите дополнительные детали: возраст, город, прическу, одежду, телосложение, цвет кожи, особенности лица.
  6. Обязательно добавьте «Тело полностью (Full body)».
  7. Выберите стиль изображения, например Pixar Animation.

Промпты лучше писать на английском. Эффект будет лучше, объясняет эксперт. Также можно попросить ИИ изменить позу персонажа (например, когда он ходит или прыгает), сохраняя атрибуты исходного изображения. Потребуется несколько попыток для достижения нужного результата. Советуют избегать терминов типа «лицом влево» или «лицом вправо», чтобы не было поворота изображения. Приложение доступно только для платных пользователей ChatGPT Plus.

Эту нейросеть можно использовать для генерации различных поз и выражений для игр, анимации и комиксов. Естественно, все идеально не получится, но уже можно будет получить некий макет персонажа с разными позами и доработать его в профессиональном приложении для художников.

Leonardo AI

Leonardo AI — это программа, которая помогает создавать изображения и тексты с помощью искусственного интеллекта. Она может рисовать картинки по описанию, редактировать фото и писать тексты, например статьи или рекламные материалы. Это удобно для дизайнеров, маркетологов и других творческих людей, потому что ускоряет и упрощает их работу.

В России сервис работает без VPN, предлагает 150 внутренних монет для генерации картинок. Каждые 13 часов запас монет заново пополняется. Программа генерирует по четыре картинки за 10—30 монет.

Например, попросим сгенерировать абстрактного персонажа, который ассоциируется с татарской культурой. Похоже? Думаю, вы сами можете ответить на вопрос.

При генерации картинок татарский программа не понимает, поэтому промпты надо писать на английском языке. При генерации можно выбирать различные модели, размеры, стили и многое другое. Не так давно появилась возможность генерировать из картинки видео. Можно будет как-нибудь попробовать.

AI Comic Factory

На платформе Hugging Face есть модель искусственного интеллекта, которая генерирует комиксы. Можно выбрать стиль, написать историю, выбрать время дня и года. В течение 20 секунд ИИ сгенерирует картинку. Можно попросить что-то заменить, улучшить и так далее.

На Hugging Face один из активистов нашего сообщества «Нейротатарлар» Галим Турумтаев создал модель ИИ, с помощью которой можно генерировать картинки Тукая. Вот ссылка на модель.

Нужно пройти регистрацию на сервисе и найти поле Inference API Text-to-Image, вписать запрос, начиная со слов: «TUKAI man». На постере к этой статье молодой Тукай играет в конструктор.

В следующей статье рассмотрим и другие ИИ-сервисы.

Подготовил Радиф Кашапов

Подписывайтесь на телеграм-канал, группу «ВКонтакте» и страницу в «Одноклассниках» «Реального времени». Ежедневные видео на Rutube, «Дзене» и Youtube.

ОбществоТехнологииIT Татарстан

Новости партнеров