В Китае показали новую нейросеть CogVideo, которая генерирует короткие видео по текстовому описанию
Разработчиками из Китая создана нейронная сеть, способная на генерацию коротких видеороликов, причем для создания сюжета программе достаточно всего лишь текстового его описания. Специалисты назвали ее CogVideo. Даже на начальных стадиях разработки CogVideo справляется с генерацией видео с приличной частотой кадров. Так, для четырех секунд записи потребуется 32 кадра. Сообщает веб-сервис GitHub.
Для демонстрации возможностей специалисты создали и успешно обработали шаблонные запросы. Среди вариантов для генерации были словосочетания «мужчина ест пиццу», «лев, пьющий воду», «женщина верхом на лошади в море». Если говорить о принципиальной схеме работы алгоритма, подобным образом организован обработчик нейросетей DALL-E 2 и Imagine, которые специализируются на создании графики (изображений), основываясь на текстовых описаниях.
Уже можно сказать, что даже на предварительных стадиях разработки версия CogVideo значительно превосходит по качеству работы нейросети общедоступных моделей. Сами авторы пока не спешат представлять как исходные коды программы, так и схемы моделей для обучения собственных нейросетей.
Ранее ГЛАС сообщал, что, придерживаясь определенных правил, можно продлить заряд батареи телефона.