Яндекс представил диффузионную нейросеть YandexART 1.3. Нейросеть перешла на новую технологию для генерации изображений — латентную диффузию. Кроме того, датасет, на котором обучалась модель, был увеличен в 2,5 раза. Благодаря этому YandexART лучше понимает текстовые запросы и создаёт ещё более реалистичные изображения в разных форматах. Новая версия нейросети уже применяется в Шедевруме, а позднее появится и в других сервисах Яндекса.

Технология латентной диффузии потребляет меньше вычислительных ресурсов и позволяет создавать более реалистичную графику. Она формирует промежуточное представление картинки в виде латентного кода — компактного описания, содержащего основную информацию об изображении в сжатой форме. Затем нейросеть за один шаг разворачивает код в полноценное изображение высокого разрешения. Такой подход более эффективен, чем многоэтапное уточнение картинки в каскадной диффузии.

Чтобы модель лучше понимала запросы пользователей, в датасет, на котором она обучалась, были добавлены синтетические тексты — сгенерированные нейросетью подробные описания изображений. Сам набор данных был увеличен до более чем 850 миллионов пар картинок с текстом. Для того чтобы YandexART учитывала больше деталей из промта, в новой модели используются не один, а два текстовых энкодера. С их помощью YandexART распознаёт текстовый запрос пользователя и переводит его на машинный язык.

Фото: Яндекс

Кроме того, обновление YandexART даст пользователям возможность создавать изображения в разных форматах, таких как 16:9, 4:3 или 3:4. Теперь изображения, созданные в Шедевруме, можно будет использовать, например, для обложек журналов или фотообоев на телефон.

По результатам замеров асессорами Яндекса, нейросеть YandexART 1.3 выигрывает в 57 процентах случаев в сравнении с Midjourney V5.2 и в 63 процентах случаев в сравнении с предыдущей версией YandexART 1.2.




Источник: https://news.unipack.ru/97961/



Другие новости

17.05.2024 Auge Design обновили дизайн итальянской пасты Agnesi Итальянское агентство Auge Design представляет новый дизайн пасты Agnesi. Бренду, существующему в Северной Италии с 1824 года, понадобилось обновление. Дизайнеры обратились к архивам компании и создали более современный образ, основанный ... 17.05.2024 Российский экспортный центр открыл в Харбине новую точку продвижения российских продуктов питания 16 мая в городе Харбин, столице северо-восточной провинции Хэйлунцзян, КНР, состоялась торжественная церемония открытия новой площадки павильона с отечественными продуктами питания под брендом Good Food Russia. Новая точка дополнит постоянно ... 17.05.2024 Origin Materials представила самый легкий ПЭТ-колпачок для газированных напитков Origin Materials, одна из ведущих в мире компаний по производству углеродно-отрицательных материалов, задача которой заключается в том, чтобы обеспечить переход мира к экологически чистым материалам, недавно объявила о выпуске самого ... 17.05.2024 "Магнит Маркет" запустил сайт Маркетплейс «Магнит Маркет» запустил сайт mm.ru и провел ребрендинг мобильного приложения KazanExpress, завершив основной этап интеграции приобретенного ранее актива. К запуску нового сайта mm.ru команда «Магнит Маркета» обновила ряд пользовательских интерфейсов ... 17.05.2024 ILPRA FoodPack 1440 запаивает стаканчики с клубникой Компания ILPRA, один из ведущих мировых производителей упаковочного оборудования, выпускающая широкий спектр технологических машин для упаковки пищевых продуктов, опубликовала новое видео трейсилера FoodPack 1440 для упаковки свежей клубники в бумажных ... 17.05.2024 Funky разработал фирменный стиль корейского стрит-фуда ЁЮ Специалисты агентства Funky разработали фирменный стиль бистро и доставки кофейского стрит-фуда ЁЮ. В корейском языке «ёю» означает «избыток, нечто дополнительное», а «обладать ёю» — значит быть собранным и расслабленным одновременно. Поэтому ...