«Я горжусь тобой». Джастин Тимберлейк прокомментировал кавер Джастина Бибера на его песню
Презервативы Durex подорожают на 30% из‑за войны на Ближнем Востоке
Лерчек представила новый бренд косметики
В «Ростелеком» разработали российский аналог Figma
В Мещанском районе Москвы построят «школу будущего»
Режиссер байопика о Майкле Джексоне поставил под сомнение обвинения против артиста
Байопик «Баста. Начало игры» выйдет в прокат 24 декабря
Почти треть россиян накопили до 50 тысяч рублей наличными
СМИ: Сидни Суини должна была появиться в «Дьявол носит Prada-2», но сцену с ней вырезали
23 апреля в Москве пройдет выставка «Эра Водолея» петербургской художницы Алины Утробиной
Из России в КНДР впервые можно будет добраться на автомобиле
Дрейк спрятал дату выхода нового альбома внутри ледяной скульптуры
Зомби-кошмар в замкнутом пространстве: смотрим русский трейлер «Колонии» от автора «Поезда в Пусан»
В ДК «Альфа Кристалл» открывается «Рестик» — новый проект создателей «Оригинала» и «Диско-клуба»
Вышел первый тизер-трейлер мультфильма «Лунтик. Обратная сторона Луны»
В Twinby появился статус «Ищу компанию на майские»
Биографии Высоцкого и Булгакова промаркируют из‑за запрета пропаганды наркотиков
Anikv и OG Buda станут хедлайнерами фестиваля «Тех-Френдли Викенд» в Нижнем Новгороде
Вторую часть «Я — легенда» снимет Стивен Кейпл-мл.
На Московских трамвайных диаметрах появились цветные обозначения маршрутов
Крупнейший в мире айсберг А23а практически полностью разрушился
Мессенджер Max переименовали в «Макс»
Rambler&Co: большинство россиян резко негативно относятся к введению шестидневной рабочей недели
Задержан гендиректор «Эксмо» Евгений Капьев
ТНТ выпустит фэнтези-сказку «Очень сказочные дела» перед Новым годом
Сандра Буллок и Николь Кидман в трейлере сиквела «Практической магии»
Билеты на громкие культурные события, куда сложно попасть, начали отдавать за «Спасибо»
Дженна Ортега — на первом кадре третьего сезона «Уэнсдей»

Нейросеть научили превращать текст в картинки. Она изобразила редиску с собачкой и кресло-авокадо!

Изображение на превью: OpenAI

Американская команда разработчиков OpenAI создала нейросеть, способную превращать текст в картинки. В ее основе — алгоритм последнего поколения для обработки языка GPT-3, который уже обучали генерировать идеи для бизнеса, тексты песен, статьи и даже отвечать на философские вопросы.

Новая разработка получила название DALL·E. Принцип ее работы следующий: человек описывает некий предмет или ситуацию, к примеру, «редиска выгуливает собаку» или «кресло в форме авокадо», а алгоритм изображает это на картинке.

При одном и том же запросе результат каждый раз получается разным. Некоторые из сгенерированных картинок будут неотличимы от созданных человеком, другие — едва связными и понятными. Однако серьезных ошибок и абсолютной бессмыслицы алгоритм не допускает.

На сайте OpenAI показаны десятки примеров работы алгоритма, в которых можно самостоятельно поменять параметры. Например, «профессиональную высококачественную иллюстрацию химеры жирафа и черепахи» можно превратить в не менее качественно нарисованную смесь кота и слона или льва и цыпленка, создавая сотни различных версий мутантов (иногда милых, иногда пугающих).

Все примеры на сайте — это 30 лучших, по мнению разработчиков, изображений из 512, сгенерированных нейросетью по указанному запросу. Никакой ретуши к картинкам не применялось.

DALL·E учитывает 12 млрд параметров (цвет, высота, названия предметов, их расположение и так далее) и может создавать антропоморфных животных, фотографически точные изображения, а также комбинировать несвязанные понятия.

К примеру, нейросеть способна понять фразу «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны». Однако разработчики подчеркивают, что результат сильно зависит от формулировки запроса. Часто идентичные по смыслу предложения интерпретируются алгоритмом по-разному и приводят к неверной визуализации.

Текстовый запрос: «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны».

Программа также может изобразить объект с разных ракурсов — она видит различие между «капибарой крупным планом» и «капибарой, сидящей в поле». Более того, изображения гипсового бюста под разными углами, сгенерированные DALL·E, позволили создать плавную 3D-анимацию вращающейся головы.

Исследователи считают, что работа с генеративными моделями, такими как DALL·E, может оказать серьезное влияние на общество. В будущем они планируют проанализировать связь подобных моделей с социальными проблемами, к примеру с воздействием экономики на рабочие процессы и профессии, а также изучат долгосрочные этические последствия, к которым может привести технология.

Расскажите друзьям