Несколько форматов, тематик и технологических возможностей для вдохновения:
Вайб калифорнийца Джейсона Сильвы (Jason Silva) мы предлагаем обозначить как «классический триповый» Для этого видео Джейсон собрал небольшой продакшн из специалистов, работающих с генерациями видео, трекингом в After Effects, и добился впечатляющего результата — достоверно показал мир глазами человека, принявшего 250 мг LSD:
Обязательно посмотрите его канал, там много прекрасного.
Уже не впервые наша редакция замирает и не может пройти мимо ai-генераций снежных пространств (см. Манович и его чувство снега). Вот и теперь Дрю Медиана (Drew Mediana) и его слоноподобные тихоходки в заснеженной Японии — прекрасный эмбиент и подрагивающая (wobbly) картинка.
И если Джейсон Сильва, сразу видно, богач, которого интересует влияние, то Дрю — художник, который продает свое время, более-менее постоянное его дело — рисовать световые спецэффекты для игр вроде Marvel’s Avengers. Но аренда в Сан-Франциско дорогая, так что Дрю еще собрал коллекцию NFT из своих ai-экспериментов. Однако вернемся к обещанной тихоходке:
Вообще это один из самых распространенных ai видео жанров: динамичное перетекание объектов в определенной стилистике под музыку. Вот, посмотрите, например, видео известного ai-видеохудожника Криса Алена (Chris Allen):
Знаете ли вы, что в качестве основы для ai-видео можно использовать изображения и видео? Базовый принцип использования мы описали в ультимативном гиде. А здесь пара примеров популярного формата, когда основой становится видео танцующего человека:
Автором второго видео является текущий краш нашей редакции — русскоязычный программист Алекс (его патреон). Алекс не просто делает видео — он коллаб-редактор и инженер. О том, что это такое, смогут узнать участники нашего митапа, который пройдет в zoom вечером 13 сентября.
А это видео российской художницы, фотографа и ведьмы — Валерии.
По просьбе редакции она рассказала нам об этой своей работе:
Это самый насыщенный ролик из всех моих «Нейротарковских», он состоит из 300 фреймов и промптов (последовательных текстовых запросов) и сделан в Disco Diffusion v5. Запросы вдохновлены сюжетами и эстетикой фильмов и фотографий Андрея Тарковского, но саму нейросеть я на фотографиях А.Т. и кадрах из его фильмов не обучала.
Я начала работать с «полароидами Тарковского» ещё в 2021 году, когда не слишком успешно тренировала ГАНы (GAN — generative adversarial network) и решила продолжить, когда появились первые диффузные модели. Когда появилась возможность ai-анимации, я почти сразу решила делать большой ролик. После нескольких неудачных попыток в феврале 2022 появилась эта анимация и я ее интерполировала (генерация кадров между уже готовыми исходными кадрами).
Не будем углубляться в технологию производства, просто, знаете ли — гав, всем собака, и пожелания выходить сухими, откуда бы вы ни шли. В следующем материале расскажем о зарождающейся индустрии создания ai-видео к музыкальным композициям, а пока записывайтесь к нам на курс — будем безумствовать коллективно и упорядоченно.
В этом эссе автор объясняет, почему методы, основанные на вычислениях, намного эффективнее подходов, использующих человеческие знания. Через примеры из истории AI он показывает, как интуитивные подходы тормозят прогресс, тогда как мощные вычисления открывают путь к прорывам. Это вдохновляющее чтение для тех, кто задумывается о будущем искусственного интеллекта.