Американские разработчики научили нейросети по текстовому описанию создавать короткие анимированные ролики с персонажами мультсериала Флинтстоуны

Для обучения разработчики использовали 25184 вручную размеченных трехсекундных (75 кадров) роликов со сценами из мультсериала «Флинтстоуны», при разметке которых авторы указывали кто присутствует на экране и что он делает. CRAFT на обучающей выборке «понимает» кто и что делает, и затем использует подходящие части роликов при генерации новых сцен, а не рисует картинку с нуля. Результаты работы программы после обучения можно оценить на демонстрационного видео, опубликованного разработчиками:

Из ролика видно, что программа иногда выдает ошибки на разных уровнях исполнения: например, Вильма разговаривает по телефону, повернувшись лицом в другую сторону, а Фред в одном из роликов бежит на месте. Тем не менее, CRAFT демонстрирует заметный прогресс в области генерации видеоконтента из текстового описания — многие сцены выглядит именно так, как себе их мог бы представить человек, прочитавший текст. Стоит отметить, что пока что возможное применение представленного метода сильно ограничивает необходимость в ручной разметке большого объема данных.
©

xsi: снять 5 сезонов сериала с актёрами, спецэффектами и атрибутами, а следующие 5 сгенерировать при помощи ии.

Комменты из Vk:

Оставить комментарий

Примечание - Вы можете использовать эти HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <img http="" https="" alt="" height="" src="" width=""> <iframe alt="" height="" src="" width=""> <ul> <li> <ol> <src> <p>

Яндекс.Метрика

Copyleft 2010 - 2018 © Obobrali.ru
Disclaimer
Все права на оригинальные тексты и картинки принадлежат их авторам
Все материалы на сайте рассчитаны на категорию адекватных людей 18+