CHANGELOG 9 мая 2026 г. 5 мин

В каталог приехал SkyReels V4: видео со звуком из текста или картинки

Новая видео-нейросеть от Skywork. Описываете сцену словами или загружаете картинку — получаете готовый ролик до 15 секунд с фоновым звуком и голосами. Уже работает на NetRoom.

NetRoom

РЕДАКЦИЯ, NETROOM

Что нового

В каталоге NetRoom появилась видео-нейросеть SkyReels V4 от компании Skywork. Это одна модель, которая закрывает почти все задачи по видео: от создания ролика по описанию до правки готового материала. Главная особенность — она сама добавляет звук: голоса персонажей, шум окружения, музыку и эффекты.

Что она умеет

SkyReels V4 объединяет шесть режимов работы. Раньше под каждый из них держали отдельную нейросеть — теперь всё в одном окне.

1. Видео по описанию

Пишете, что должно быть в кадре: герои, обстановка, движение, настроение. Нейросеть собирает ролик с нуля. Подходит для быстрых концептов, превью под заказчика или коротких видео в соцсети, когда подходящего материала просто нет под рукой.

2. Оживление картинок

Загружаете одну, две или три собственные картинки — модель связывает их движением. Можно указать, какая будет в начале ролика, какая в конце, а какая посередине, и нейросеть нарисует, как камера и сцена переходят между ними. Удобно, когда у дизайнера уже есть финальный кадр, а нужно показать, как камера к нему пришла.

3. Переделка готового видео

Подаёте свой ролик плюс описание изменений — модель меняет в нём то, что вы попросили: переодевает героя, переписывает сцену под новую погоду, переносит движение из одного видео в другое и сохраняет композицию исходника. Звук исходного ролика остаётся на месте.

4. Продолжение ролика

Если заказчик попросил «добавьте ещё пять секунд», нейросеть достраивает хвост клипа в той же стилистике и с той же динамикой. Бесшовно, без склеек и видимых стыков.

5. Точечная правка

В готовом видео можно поменять одну область — фон за окном, надпись на стене, цвет машины, форму героя — и оставить остальной кадр как было. Никакого ручного перерисовывания.

6. Лип-синк по голосу

Можете дать модели голосовой образец до 15 секунд — она подставит его под движение губ персонажа. Полезно для аватаров, спикеров в рекламе и любых сцен с диалогом.

Звук в комплекте

Включаете одну галочку — и SkyReels V4 сама добавляет к видео звуковую дорожку: шаги по полу, шорох ткани, голоса, удары волн, городской шум, фоновую музыку под настроение сцены. Звук синхронизирован с тем, что происходит в кадре. Для большинства черновых и средних задач отдельный звукорежиссёр больше не нужен.

Подсказки для лучшего результата

Описывайте сцену развёрнуто: что в кадре, как двигается камера, какой свет, какое настроение. Чем подробнее, тем точнее попадание.
Если хотите конкретного героя или конкретное место — приложите картинку. Модель сохранит лицо, костюм и фактуру.
Короткие ролики (5–8 секунд) выходят стабильнее: меньше шансов, что сюжет «уплывёт» к концу клипа.
Не спорьте с моделью формулировками вроде «без шапки» или «без бороды» — нейросеть лучше понимает, что вы хотите видеть, а не чего не хотите. Переформулируйте на положительный лад.

Технические характеристики

Качество: до 1080p, 32 кадра в секунду.
Длительность одного ролика: от 3 до 15 секунд.
Соотношения сторон: горизонтальное 16:9 (YouTube, баннеры), вертикальное 9:16 (TikTok, сторис), классическое 4:3, портретное 3:4 и квадрат 1:1 (Instagram-лента).
Форматы файла на выходе: MP4, WEBM, MOV.
За один запуск можно получить до четырёх разных вариантов одной сцены — выбираете тот, который попал ближе всего.

Где попробовать

Карточка модели — /model/skyreels-v4/. Запустить можно прямо в чате, через каталог или через API. Какой режим включится — нейросеть определит сама по тому, что вы прислали: только текст, текст с картинкой или текст с готовым видео.