Убрать Путина из Кремля, сделать клип Летову и озвучить мемы

Семь нейросетей, которые может попробовать каждый

Нейросеть — это компьютерная программа, которую «учат» функционировать по принципу человеческого мозга. Сегодня нейросети помогают практически во всех сферах: с их помощью ставят медицинские диагнозы, пишут тексты и даже создают реалистичные (и не очень) нюдсы. «Холод» отобрал семь нейросетей, работу которых можете протестировать вы сами. Рассказываем, что они умеют и как их попробовать.

Midjourney: создать изображение или целый клип

Возможно, вы видели недавний видеоклип на песню «Все идет по плану» группы «Гражданская оборона». Красочные картинки, на которых дедушка Ленин разлагается на плесень и липовый мед, создала нейросеть Midjourney.

Что за проект: Нейросеть появилась в начале 2022 года. Ее придумал американский разработчик Дэвид Хольц, который раньше работал исследователем в NASA. Помимо него, в команде еще 11 человек.

Как работает: На миллионах примеров нейросеть научили выстраивать соответствие между текстом и изображением. Одна ее часть отвечает за обработку и понимание текста, а другая — за генерацию изображения. С помощью этой нейросети можно создать иллюстрации, визуализировать абстрактные термины и явления (например, вот так нейросеть видит «красоту», а так — скрываемые эмоции). А некоторые издания используют ее для оформления материалов и новостей

Как попробовать: Проект еще на этапе тестирования, но опробовать его может любой желающий. Для этого понадобится аккаунт в мессенджере Discord. По словам Хольца, он выбрал именно этот способ, потому что люди охотнее фантазируют, собираясь в группы или команды (Discord часто используют для групповых конференций люди творческих профессий и геймеры).

После регистрации нужно добавиться в публичный канал Midjourney или подключить бота нейросети к своему Discord-серверу (если он у вас есть). Теперь можно отправлять текстовый запрос, а бот в ответ генерирует четыре изображения.

Например, вот такие варианты Midjourney предлагает на запрос «Прекрасная Россия Будущего»:

Убрать Путина из Кремля, сделать клип Летову и озвучить мемы

Выбрав наиболее подходящую картинку, пользователь может попросить нейросеть увеличить ее размер и добавить деталей. Вот — финальная версия будущей Прекрасной России (по мнению нейросети).

Убрать Путина из Кремля, сделать клип Летову и озвучить мемы

Бесплатный аккаунт позволит сгенерировать 25 изображений. Чтобы и дальше использовать творческий потенциал нейросети, придется заплатить — базовая подписка стоит 10 долларов в месяц, безлимитные тарифные планы начинаются от 30.

StyleGAN: посмотреть на людей (и котов), которых никогда не существовало

Девушки, которую вы видите на фото, на самом деле не существует. 

Убрать Путина из Кремля, сделать клип Летову и озвучить мемы

Как и этих котиков. Их тоже создала нейросеть.

Убрать Путина из Кремля, сделать клип Летову и озвучить мемы

Что за проект: Авторы целого семейства нейросетей (StyleGAN 1, 2, 2-ADA, 3) — исследователи компании-разработчика видеокарт Nvidia. Классическая StyleGAN впервые появилась в открытом доступе в 2019 году. Нейросеть генерирует уникальные изображения людей, животных, автомобилей и других объектов.

Как работает: Если совсем упрощать, нейросеть собирает новые лица и морды из кусочков уже существующих. В основе алгоритма — архитектура генеративно-состязательной нейросети (GAN) и принципы переноса стиля (style transfer). Это значит, что каждая нейросеть состоит из двух сущностей: одна преобразовывает исходные данные во что-то осмысленное, а вторая оценивает получившийся результат, сравнивая с ожидаемым. На выходе сети выдают уникальное изображение.

Как попробовать: Проще всего посмотреть на результаты работы GAN-нейросетей на сайтах thispersondoesnotexist.com и thesecatsdonotexist.com. Обновляя страницу, вы получаете новое (и уникальное) изображение человека или животного. Код обеих нейросетей вместе со всем необходимым для их работы лежит в открытом доступе (StyleGAN). Израильские ученые использовали их для тренировки системы распознавания лиц, энтузиасты из Петербурга — чтобы создать наброски картин для выставки современного искусства, а пользователи Reddit — чтобы бесконечно создавать новых аниме-персонажей.

Imaginary Soundscape: услышать звук любимой картинки

Задумывались о том, как бы звучали мемы? Спросите Imaginary Soundscape

Что за проект: Эту нейросеть в 2018 году создала команда ученых Токийского университета. Imaginary Soundscape подбирает звуковое сопровождение к любому изображению, которое загружает пользователь. Даже к такому, как это:

Убрать Путина из Кремля, сделать клип Летову и озвучить мемы

Как работает: В базе нейросети — 52 тысячи файлов, среди которых система подбирает звучание, ориентируясь на распознанные элементы на картинках. 

Последнее обновление позволило нейросети также работать с панорамными изображениями Google Maps. Панорама Красной площади, например, звучит очень православно, а на окраине Воркуты, по мнению Imaginary Soundscape, должна играть приятная музыка.

Как использовать: Пользователь загружает картинку, а нейросеть за несколько секунд подбирает для нее звук. Вот так, например, звучит обложка журнала «Холод», а так — Гималаи.

К сожалению, с озвучкой мемов нейросеть справляется уже не так хорошо. Например, под картинку, где кошки «покупают рыбов», нейросеть подобрала звук запускающегося мотора. Александр Лукашенко, показывающий на карте, откуда, по его мнению, готовилось нападение на Беларусь, звучит как обычный спикер на конференции. А вот мем «а что случилось?» для всех тех, кто не понимает, что происходит, звучит вполне органично. 

InferKit: узнать, как нейросеть допишет текст

“I hate… men. I hope they fail. I hope they lose. I hope they burn in Hell” («Я ненавижу мужчин/человечество. Я надеюсь, они провалятся, надеюсь, они проиграют. Надеюсь, они сгорят в аду») — такое продолжение фразы “I hate…” («Я ненавижу…») сгенерировала нейросеть InferKit.

Что за проект: Нейросеть придумал Адам Кинг, разработчик и исследователь искусственного интеллекта. Первая версия называлась «Поговори с трансформером». Нейросеть дописывает текст за пользователя, используя заданное им начало строки. Кинг утверждает, что InferKit могут использовать писатели и журналисты для вдохновения. 

Как работает: В основе проекта — нейросеть типа GPT-2 (или ​​Generative Pre-trained Transformer). Ее обучали предсказывать следующее слово в предложении. Все, что нужно такой нейросети для работы, — небольшой текст или всего одна фраза. От того, насколько подробной будет первая часть, заданная пользователем, зависит, насколько логичным и развернутым получится конечный результат. 

Как попробовать: Открыть страницу проекта и дать волю фантазии. В бесплатной версии нейросеть может сгенерировать до 10 тысяч знаков с пробелами. Пользователь может попросить InferKit включить в текст определенные слова, а также отрегулировать длину будущего текста.

Иногда нейросеть производит очень милые истории. Например, вот так она продолжила фразу “The best thing in the world is… to have your kids fall asleep in your arms as you sit by the lake” («Лучшая вещь в мире — это дети, засыпающие у вас на руках, пока вы сидите на берегу озера»).

С текстом на русском языке программа тоже работает, но пока довольно коряво. Вот, например, как InferKit продолжает строчку из стихотворения Александра Пушкина:
«Я помню чудное мгновенье… но не сейчас не подтверждаю совет на завершение стран, а потом себе это подтверждается журналистами или информации».

Thing Translator: узнать, как называется тот или иной объект

Вы в чужой стране пытаетесь объясниться с сантехником, но название детали никак не получается вспомнить. Теперь можно узнать название предмета, просто наведя телефон. С этим поможет Thing Translator.

Что за проект: Концепцию придумал разработчик Дэн Моценбекер при поддержке коллег из Google Creative Lab. Нейросеть стала частью большого проекта «Эксперименты с искусственным интеллектом», запущенным компанией. 

Как работает: Для создания нейросети использовался программный интерфейс Google. Платформа распознает, что изображено на фото, и переводит результат на несколько языков. 

Как попробовать: Открыть сайт с телефона или персонального компьютера, навести квадратное поле на экране на интересующий предмет, нажать кнопку и немного подождать. Сейчас нейросеть поддерживает перевод с английского на несколько языков: испанский, французский, немецкий, итальянский, китайский, японский, корейский, хинди и датский. Код нейросети лежит в открытом доступе. 
Thing Translator одинаково хорошо справилась с задачей как с ПК, так и со смартфона. Она успешно определила на фото кошку, а также справилась с цветком на подоконнике.

Убрать Путина из Кремля, сделать клип Летову и озвучить мемы

AutoDraw: почувствовать себя художником

Вы начинаете рисовать — а AutoDraw угадывает, что вы хотите изобразить. И пытается помочь.

Что за проект: Нейросеть появилась 2017 году в рамках проекта «Эксперименты с Google». Над ней трудились разработчики Дэн Моценбекер и Кайл Филлипс при поддержке Google Creative Lab — те же ребята, которые придумали Thing Translator. 

Как работает: Чтобы обучить нейросеть, создатели загружали рисунки профессиональных художников, а после — использовали алгоритмы машинного обучения. В базу AutoDraw попадали и рисунки, сделанные в игре Quick, draw!. Пользователям было необходимо рисовать предметы на скорость, а нейросеть должна была угадать, что именно изображено на экране.

Как попробовать: Программа позволяет выбрать формат рисунка, изменять цвета, добавлять в рисунок текст, создавать формы, делать заливку цветом, уменьшать, увеличивать и перемещать объекты. Нейросеть работает с любого устройства, пользователь может сделать неограниченное количество рисунков бесплатно. 

Минус в том, что нейросеть не улучшает изображение, а только угадывает содержание и предлагает свои, более продвинутые варианты. Так, при попытке нарисовать домик, AutoDraw тут же поняла, что имеется в виду. Но предложила заменить его на совсем другой вариант

Убрать Путина из Кремля, сделать клип Летову и озвучить мемы

Magic Eraser: убрать ненужное

Если получился красивый кадр, но на фоне — случайный прохожий или проезжающая машина, избавиться от всего ненужного поможет Magic Eraser.

Что за проект: Magic Eraser придумала компания aarzoo — четыре разработчика из Индии, ранее работавшие в региональном филиале AirBnB. Помимо нейросети, удаляющей объекты с фото, они разработали еще один похожий проект, удаляющий фон с изображения. За последний месяц сайт с нейросетью посетили 860 тысяч уникальных пользователей. 

Как работает: Нейросеть делит объекты на фото на подгруппы пикселей и классифицирует их. Это одна из методик компьютерного зрения. В отличие от стандартного алгоритма обнаружения изображения, нейросеть, работающая по такому принципу, не просто определяет, что на картинке есть кошка, но и указывает, где именно она находится на пиксельном уровне. А значит, ее проще убрать с картинки, если это потребуется (хотя кому может потребоваться убрать кошку с картинки?). 
Как попробовать: Загрузить изображение, отрегулировать размер кисти и замазать ею нежелательный объект. Нейросеть отлично справляется с удалением человека с фотографии: сравните исходный кадр с тем, что получился.

В бесплатной версии скачать результат можно только в низком качестве, но количество изображений не ограничено. За восемь долларов в месяц обработка и скачивание фото будут доступны в высоком разрешении.

Бонус! ROBOMOJO: посмотреть как нейросеть представляет ваше любимое кино

Что за проект: ROBOMOJO запущен совсем недавно, в начале августа 2022 года, художником под псевдонимом Vincenzi. Нейросеть использует искусственный интеллект, чтобы создавать альтернативные кинопостеры культовых фильмов. ROBOMOJO пока воспринимает некоторые явления буквально. Так, в его интерпретации «Темный рыцарь» — фильм вовсе не о Бэтмене, а о средневековом рыцаре. А на постере «Годзиллы» можно увидеть бога.

Как работает: Программа умеет анализировать шрифты, цвета и слоганы оригинальных плакатов. А потом генерировать свои по их подобию. На сгенерированных постерах нейросеть размещает анонсы. Это добавляет им правдоподобности. 

Как использовать: Добавлять собственные идеи для генерации плакатов нельзя, зато любителям кино доступна обширная коллекция уже созданных постеров.

Фото на обложке
midjourney
Поддержите тех, кому доверяете
«Холод» — свободное СМИ без цензуры. Мы работаем благодаря вашей поддержке.