Seedance 2.0: видео ByteDance со звуком из коробки
Добавили Seedance 2.0 — новую видео-нейросеть ByteDance. Делает ролики до 15 секунд со звуком из коробки: диалогами, фоновым шумом и эффектами. Работает по тексту, по картинке, по видео и по аудио.
Коротко
В каталоге NetRoom появилась Seedance 2.0 — новая видео-нейросеть от ByteDance. Делает ролики до 15 секунд со звуком из коробки: диалоги, фоновый шум и эффекты модель пишет сама и сводит синхронно с картинкой. Работает по тексту, по картинке, по другому видео и даже по загруженной аудио-дорожке.
Что умеет
Seedance 2.0 закрывает почти всё, ради чего раньше приходилось собирать пайплайн из трёх-четырёх сервисов.
- Видео по описанию. Пишешь, что хочешь увидеть — получаешь ролик. Промпт может быть длинным: можно описать сразу несколько сцен, ритм камеры и реплики персонажей, и модель сама порежет это на шоты.
- Видео из картинки. Загружаешь одну картинку — она становится первым кадром, дальше всё дорисовывается. Можно зафиксировать и первый, и последний кадр — модель сделает между ними плавный переход.
- Видео по референсу. Загружаешь ролик-образец — модель берёт оттуда динамику, движение камеры и геометрию сцены, а действия и стиль переписывает по твоему описанию.
- Видео под звук. Прислал аудио-дорожку с диалогом или шумами — Seedance подгонит видео под её таймлайн, чтобы губы попадали в реплики, а движение в кадре — в ритм.
- Правка и продление. Можно точечно править готовый ролик и дотягивать его длиннее, не теряя стиль.
Звук
Это та фича, ради которой стоит присмотреться к модели в первую очередь. Seedance 2.0 пишет двухканальную синхронную звуковую дорожку прямо вместе с видео: диалоги, шумы локации и эффекты. Не нужно отдельно гонять текст в TTS, не нужно потом сводить губы с озвучкой. На выходе — готовый MP4 со звуком. Если ролик нужен немой, аудио отключается одним переключателем в интерфейсе.
Качество и форматы
Доступны три уровня качества — 480p, 720p и 1080p. Соотношения сторон под любые площадки: горизонталка 16:9, вертикалка 9:16 для Reels и TikTok, квадрат 1:1, классические 4:3 и 3:4, и широкий кинематографический 21:9 для тизеров и обложек YouTube. Длина ролика — от 3 до 15 секунд, шагами по 3, 5, 8, 10, 12 и 15. Есть и автоматический режим, в котором модель сама подбирает длину под смысл промпта.
Сколько стоит
Цена считается посекундно. Видео из текста и из картинки на 480p — $0,07 за секунду, на 720p — $0,16 за секунду. Режим «видео из видео» дороже, потому что нагрузка на железо выше: от $0,13 за секунду на 480p и от $0,28 за секунду на 720p. На NetRoom цена показана в рублях — точные тарифы и кнопка «Сгенерировать» на странице модели: /model/seedance-20.
Куда брать
Сильнее всего модель ощущается там, где раньше нужно было держать команду из видеомейкера, звукорежиссёра и монтажёра.
- Реклама в соцсетях. Короткие ролики 5–10 секунд для Reels, TikTok и Shorts: с диалогом, с фоновым шумом, с эффектами — и всё это за один прогон.
- Концепт-арт и превиз. Быстро проверить идею до того, как заряжать полноценный продакшен. Камера двигается, объекты ведут себя как в реальной жизни — этого хватает, чтобы понять, работает сцена или нет.
- Дубляж и переозвучка. Прислал готовую звуковую дорожку — получил видео под неё. Удобно, когда нужно адаптировать существующий ролик под другой язык или другой голос.
- Продление коротких клипов. Был 5-секундный шот — стал 15-секундный, без сшивок и потери стиля.
- Кинематографические форматы. Соотношение 21:9 закрывает запросы на тизеры, трейлеры и letterbox-обложки.
Что важно знать заранее
- Один ролик — максимум 15 секунд. Если нужно дольше, собирай из нескольких или используй режим продления.
- Негативный промпт не поддерживается. Если что-то не должно быть в кадре — формулируй через позитивное описание и подкрепляй референсами.
- У ByteDance очень строгая модерация на входящие картинки. Лица реальных людей, документы, паспорта, узнаваемые персональные данные модель отбивает сразу — это её политика, и обойти её нельзя. Для тестов и продакшена используй сгенерированные или обезличенные картинки.
- 1080p и длинные клипы рендерятся не мгновенно — три минуты и больше. На NetRoom это учтено, ролик дождётся своей очереди и придёт уведомлением.
- Режимы «фиксация кадров» и «загрузка референсов» — разные сценарии. В одном запросе можно использовать что-то одно: либо подставляешь свой первый/последний кадр, либо подкидываешь референсные картинки/видео/аудио.
Как попробовать
Открой страницу /model/seedance-20 — там доступны все режимы. Выбираешь, что хочешь сделать (видео из текста, из картинки, из видео или под звук), указываешь разрешение и длительность, при необходимости загружаешь референсы и жмёшь «Сгенерировать». Никакой возни с кодом и параметрами — всё в обычной форме.