Øneheart выпустил эмбиент-трек «Mistakes», в котором впервые звучит его голос
Первый за три года концерт Гарри Стайлса покажут на Netflix
HBO Max и Paramount+ планируют объединить в один стриминговый сервис
СМИ: пиарщица Джима Керри уверяет, что премию «Сезар» посетил именно он (а не двойник)
Уровень цифровой грамотности россиян в 2025 году снизился впервые за семь лет
Винс Вон случайно убивает диджея в трейлере экшн-комедии «Майк, Ник, Ник и Элис»
Операторы сделали бесплатными звонки для абонентов из РФ, находящихся в странах Ближнего Востока
В Москве впервые церемонии бракосочетания прошли на станции метро «Сокольники» БКЛ
Команда «Сменки» запустила конкурс на разработку дизайна современного школьного кабинета
В Госдуме предложили обеспечить бесплатный Wi-Fi в общественном транспорте
Крестильное платье королевы Елизаветы II впервые представят на выставке
LEGO выпустит коллаборацию с «Формулой-1»
В Нидерландах обнаружили неизвестную картину Рембрандта
В Петербурге солнце в феврале светило почти 67 часов
Завершились съемки медицинской драмы «Хоспис» Евгения Стычкина
Минтранс РФ: воздушное пространство 10 стран закрыли на Ближнем Востоке
Иньяки Годой в поисках сокровища в финальном трейлере «One Piece. Большой куш»
Реджина Холл и Анна Фэрис в первом трейлере «Очень страшного кино-6»
Apple представила бюджетный iPhone 17e
В Москве началось строительство пешеходного моста на Болотной набережной
Журналист провел интервью с Гослингом с обочины. Актер переживал за него больше, чем за фильм
Гендир Netflix уверен, что за слиянием Paramount и Warner Bros. последуют масштабные сокращения
«Ну, погоди!» — любимый мультфильм большинства россиян
adidas выпустил футболку к 20-летию «Ханны Монтаны»
Вышел трейлер хоррора «Пиноккио: Раскрепощенный»
Большинство россиян считают биографию Петра l самой интересной
В США нашли утерянную короткометражку Жоржа Мельеса ― первый в истории фильм про робота
На аукционе продали медаль с первых современных Олимпийских игр 1896 года

Alibaba представила бесплатный генератор картинок Qwen-Image

Изображение: Alibaba

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHub, Hugging Face и ModelScope.

Главное отличие Qwen-Image от многих конкурентов ― точная отрисовка текста. Новинка поддерживает как алфавитные, так и иероглифические системы письма, позволяя сочетать латиницу и иероглифы на одном изображении.

В компании отмечают, что их продукт отлично работает со сложной типографикой и многострочной версткой. Кроме того, он показывает «высокую стабильность при редактировании изображений, сохраняя смысловую целостность». По запросу можно стилизовать картинку, отредактировать текст, поменять фон или позы изображенных персонажей, удалить или заменить объекты. Это позволяет создавать контент вроде постеров, слайдов, витрин магазинов, каллиграфии и инфографики.

Журналист Venture Beat, опробовавший генерацию картинок в Qwen-Image, отметил, что точность следования запросу и качество текста оказались не выше, чем у Midjourney. Иногда модель неверно понимала запросы и передавала текст ― не спасали даже переформулировки.

Qwen-Image основана на архитектуре MMDiT с 20 млрд параметров — такой же, как у Flux.1 и будущей Stable Diffusion 3. Согласно техническому отчету, модель прошла многоэтапное обучение на миллиардах пар «изображение + текст».

В публичных тестах Qwen-Image показала равные или лучшие результаты, чем GPT Image 1, Seedream 3.0 и Flux.1 Kontext Pro. На платформе AI Arena модель занимает 3-е место среди всех и 1-е место среди open-source-решений.

Расскажите друзьям
Теги: