19-летняя Мирра Андреева выиграла «Ролан Гаррос». Это ее первая победа на турнире Большого шлема
Милли Олкок и Дэвид Коренсвет в новом отрывке из «Супергерл»
80-й Каннский кинофестиваль пройдет с 11 по 22 мая 2027 года.
Несколько штатов США готовят иск против сделки Paramount и Warner Bros.
Билл Найи снимется в фильме «Каин» по вселенной «Джона Уика»
Hulu снимет сериал по культовой комедии «Кабельщик» с Джимом Кэрри
Умер актер Энтони Хэд, звезда сериалов «Баффи» и «Тед Лассо»
«Devil May Cry» от Netflix завершится после третьего сезона
The Wolf Among Us 2 и новая игра по «Пиле»: что показали на Summer Game Fest
Фанаты Макса Коржа устроили масштабный салют в Стамбуле перед концертом
Мадонна выпустит фильм «Confessions II — The Film» на YouTube
В сети завирусилось видео грузинского танцевального ансамбля Apkhazeti
ФИФА внедрит ИИ для борьбы с хейтерскими комментариями во время чемпионата мира
Петербуржцы подрались в очереди за автографом нобелевского лауреата Мо Яня
Генри Кэвилл и Кевин Харт снимутся в шпионской комедии. Ее выпустит Netflix
В Москве заработает первый центр ментального здоровья для подростков
Парижский Диснейленд не окупил себя за 30 лет работы
ИИ-боты обогнали людей по объему веб-трафика
Половина россиян считает, что об экологии должны совместно заботиться государство, бизнес и общество
Умер актер Энтони Хед из сериала «Баффи — истребительница вампиров»
Netflix выпустит документальный фильм о Жан-Мишеле Баскии
Ученые испекли хлеб из дрожжей, найденных в 5000-летней мумии
Фиби Бриджерс анонсировала тур, в котором зрителям запретят пользоваться телефонами
Россия и Танзания запускают прямое авиасообщение
Бывшая сеть Pandora закрыла почти все магазины в России
Компания Apple удалила мессенджер «Макс» из App Store из-за санкций
Wired: Meta* тайно добавила код для распознавания лиц в приложение для умных очков
Стартовали съемки «Острова Мэн» с Ченнингом Татумом и Ив Хьюсон

Нейросеть научили превращать текст в картинки. Она изобразила редиску с собачкой и кресло-авокадо!

Изображение на превью: OpenAI

Американская команда разработчиков OpenAI создала нейросеть, способную превращать текст в картинки. В ее основе — алгоритм последнего поколения для обработки языка GPT-3, который уже обучали генерировать идеи для бизнеса, тексты песен, статьи и даже отвечать на философские вопросы.

Новая разработка получила название DALL·E. Принцип ее работы следующий: человек описывает некий предмет или ситуацию, к примеру, «редиска выгуливает собаку» или «кресло в форме авокадо», а алгоритм изображает это на картинке.

При одном и том же запросе результат каждый раз получается разным. Некоторые из сгенерированных картинок будут неотличимы от созданных человеком, другие — едва связными и понятными. Однако серьезных ошибок и абсолютной бессмыслицы алгоритм не допускает.

На сайте OpenAI показаны десятки примеров работы алгоритма, в которых можно самостоятельно поменять параметры. Например, «профессиональную высококачественную иллюстрацию химеры жирафа и черепахи» можно превратить в не менее качественно нарисованную смесь кота и слона или льва и цыпленка, создавая сотни различных версий мутантов (иногда милых, иногда пугающих).

Все примеры на сайте — это 30 лучших, по мнению разработчиков, изображений из 512, сгенерированных нейросетью по указанному запросу. Никакой ретуши к картинкам не применялось.

DALL·E учитывает 12 млрд параметров (цвет, высота, названия предметов, их расположение и так далее) и может создавать антропоморфных животных, фотографически точные изображения, а также комбинировать несвязанные понятия.

К примеру, нейросеть способна понять фразу «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны». Однако разработчики подчеркивают, что результат сильно зависит от формулировки запроса. Часто идентичные по смыслу предложения интерпретируются алгоритмом по-разному и приводят к неверной визуализации.

Текстовый запрос: «эмодзи пингвина, который одет в синюю шапку, красные перчатки, зеленую футболку и желтые штаны».

Программа также может изобразить объект с разных ракурсов — она видит различие между «капибарой крупным планом» и «капибарой, сидящей в поле». Более того, изображения гипсового бюста под разными углами, сгенерированные DALL·E, позволили создать плавную 3D-анимацию вращающейся головы.

Исследователи считают, что работа с генеративными моделями, такими как DALL·E, может оказать серьезное влияние на общество. В будущем они планируют проанализировать связь подобных моделей с социальными проблемами, к примеру с воздействием экономики на рабочие процессы и профессии, а также изучат долгосрочные этические последствия, к которым может привести технология.

Расскажите друзьям