Яндекс представил новое поколение визуальной нейросети YandexART 2.0

10 Oct 2024, 10:25 by Анатолий Почивалов · The GEEK

Создание текста на изображениях, логотипов, этикеток и многое другое

Яндекс представил обновленную визуальную нейросеть YandexART 2.0. Теперь пользователи могут генерировать надписи на картинках, комбинировать несколько стилей в одном изображении, размещать объекты более естественно.

YandexART 2.0 основана на новой гибридной архитектуре, сочетающей элементы сверточных и трансформерных нейросетей. Это позволяет лучше распознавать текстуры и формы, а также обрабатывать более длинные и сложные запросы.

Модель была обучена на сотнях миллионов изображений и текстов к ним. Для повышения точности текстовых описаний Яндекс использовал собственную модель VLM, которая детально анализирует и описывает содержимое картинок. Это дало возможность YandexART 2.0 учитывать больше деталей и лучше соответствовать запросам пользователей.

Яндекс также добавил в обучающий датасет несколько сотен тысяч изображений с текстом, что позволило нейросети генерировать надписи латинскими буквами на изображениях.

Обычные пользователи могут использовать YandexART 2.0 для повседневных и творческих задач через виртуального ассистента Алису с опцией «Про». Алиса позволяет не только генерировать изображения, но и изменять их по запросу.

Как отмечают в компании, нововведения позволяют использовать YandexART 2.0 для создания брендовых логотипов, этикеток, иллюстраций для сайтов и постов в социальных сетях, а также для повышения эффективности рекламных и маркетинговых кампаний.

Источник:
Яндекс