Сериал «Эйфория» закрывается после третьего сезона
Стоимость обучения в вузах выросла на 10,7% в 2026 году
Синтия Эриво назвала расистскими шутки о том, что она телохранитель Арианы Гранде
На чемпионате мира по футболу будут использовать мячи с датчиками
Мик Джаггер заявил, что не может дождаться возвращения The Rolling Stones на сцену
В Сербии обсуждают возможность отмены безвиза с Россией
Пол Беттани рассказал, что все еще тяжело скорбит по Хиту Леджеру
Гигантская черешня появилась на старом Арбате в Москве
Минобрнауки изменило правила приема в аспирантуру
В «Лужниках» установили мировой рекорд по самому массовому турниру по настольному теннису
Эмилия Кларк раскритиковала слухи о больших зарплатах актеров «Игры престолов»
Мэддокс, сын Брэда Питта и Анджелины Джоли, намерен отказаться от фамилии отца
Американка потратила три месяца на создание точной копии кухни «Симпсонов»
Чечня, Чукотка и Краснодарский край оказались самыми некурящими регионами в России
Дастин Хоффман и Лео Вудолл в первом отрывке триллера «Настройщик»
Okko провел «Прайм Стадиван» — показ финала Лиги чемпионов на большом экране
На набережной Тараса Шевченко появится ландшафтный парк
Концерты Канье Уэста и Трэвиса Скотта отменили в Италии
Пол Маккартни рассказал, кто сейчас его любимый «битл»
Тейлор Свифт и «История игрушек» намекнули на возможное сотрудничество
Канье Уэст назвал свой концерт в Стамбуле самым массовым платным стадионным выступлением в истории
Сиквел «Minecraft в кино» получит название «A Minecraft Movie Squared»
Кристину Лекси, бывшую девушку Паши Техника, арестовали по делу о распространении порнографии
ПСЖ победил в финале Лиги чемпионов
ИИ-агентам дали под управление симуляцию общества. Grok совершил 183 преступления и вымер за 4 дня
Хоррор 26-летнего ютубера с бюджетом в 750 тыс. долларов собрал в прокате 100 млн
Водка в России за год подорожала почти на 15%
СМИ: вскрытие туши горбатого кита Тимми проведут 4 июня

Alibaba представила бесплатный генератор картинок Qwen-Image

Изображение: Alibaba

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHub, Hugging Face и ModelScope.

Главное отличие Qwen-Image от многих конкурентов ― точная отрисовка текста. Новинка поддерживает как алфавитные, так и иероглифические системы письма, позволяя сочетать латиницу и иероглифы на одном изображении.

В компании отмечают, что их продукт отлично работает со сложной типографикой и многострочной версткой. Кроме того, он показывает «высокую стабильность при редактировании изображений, сохраняя смысловую целостность». По запросу можно стилизовать картинку, отредактировать текст, поменять фон или позы изображенных персонажей, удалить или заменить объекты. Это позволяет создавать контент вроде постеров, слайдов, витрин магазинов, каллиграфии и инфографики.

Журналист Venture Beat, опробовавший генерацию картинок в Qwen-Image, отметил, что точность следования запросу и качество текста оказались не выше, чем у Midjourney. Иногда модель неверно понимала запросы и передавала текст ― не спасали даже переформулировки.

Qwen-Image основана на архитектуре MMDiT с 20 млрд параметров — такой же, как у Flux.1 и будущей Stable Diffusion 3. Согласно техническому отчету, модель прошла многоэтапное обучение на миллиардах пар «изображение + текст».

В публичных тестах Qwen-Image показала равные или лучшие результаты, чем GPT Image 1, Seedream 3.0 и Flux.1 Kontext Pro. На платформе AI Arena модель занимает 3-е место среди всех и 1-е место среди open-source-решений.

Расскажите друзьям
Теги: