Veo 3.1 издига аудио и креативния контрол на следващото ниво във Flow

  • Нативният звук е синхронизиран във всички инструменти на Flow, включително изображения във видео, кадри и разширения.
  • Подобрено бързо придържане и по-голяма съгласуваност на обекта при конвертиране на изображения във видеоклипове.
  • Нови контроли за редактиране: вмъкване сега и изтриване скоро, с визуална и звукова непрекъснатост.
  • Достъпно чрез Flow, Gemini API, Vertex AI и приложението Gemini, със система от многостепенни кредити.

Google Veo 3.1

Google DeepMind представи Veo 3.1, версия на своя модел за генериране на видео, която подобрява... конвертиране на изображения в клипове, спазване на инструкциите и, като ключова иновация, създаването на интегрирано аудио. Подходът има за цел да рационализира производствените процеси за тези, които изискват по-предсказуеми и контролируеми резултати.

Моделът може да се използва от Flow, Gemini API, Vertex AI и приложението Gemini, с каталог от инструменти, който набляга на... полезност за създатели Отвъд простата техническа демонстрация, Google казва, че целта е потребителят да насочи прецизно резултатите, без да губи работния поток.

Основни новини

Големият принос на Veo 3.1 е синхронизиран оригинален звук по време на целия работен процес на редактиране. Системата генерира гласове, атмосфера и ефекти, съобразени с изображението, без допълнителни стъпки за постпродукция, нещо, което преди това тихомълком обхващаше функции като „Съставки към видео“, „Кадри към видео“ и „Разтягане“.

За да се постигне това, моделът използва архитектура, която съвместно обработва визуални и звукови сигнали, така че звукът излиза от контекста описано от подканата и препратките. Резултатът са клипове, готови за публикуване или полиране, с кохерентна звукова основа от първото рендериране.

Отвъд аудиото, Google твърди напредък в спазване на сложни инструкции (множество обекти, специфични действия, дефинирани стилове) и съгласуваност на символите в последователни кадри, намалявайки нежеланите промени.

Инструменти и работни процеси

Виждам 3 Google Clouds

„Съставки към видео“ ви позволява да качвате до три референтни изображения за да се установят герои, обекти или естетика. Flow използва тези „съставки“ като ръководство за композиране на сцени с визуална приемственост и вече с интегриран звук.

„Кадри към видео“ генерира прехода между начален кадър и краен кадър, избран от потребителя. Тази функция е полезна за контролирани промени в сцените, музикални произведения или разказвателни поредици с ясни опорни точки.

Extender изгражда по-дълги клипове въз основа на последователни удължения, надвишаващи една минута с наративна съгласуваностВсяко разширение използва последната секунда от предишния клип като отправна точка, запазвайки визуалната и слуховата непрекъснатост.

Вмъкване добавя нови елементи в рамките на вече генериран план, като автоматично ги управлява сенки, осветление и затъмнения за да ги интегрирате естествено. Функцията „Изтриване“, която ще се появи по-късно, ще ви позволи да премахвате обекти или герои и да възстановите фона, без да преработвате цялото видео.

Спецификации и режими

Veo 3.1 произвежда базови последователности от около 8 секунди при 1080p и 24 FPS, с поддръжка за 16:9 и вертикално 9:16. Продължителността може да бъде удължена с последователни разширения, запазвайки времевата непрекъснатост.

Моделът предлага два режима на употреба: качество, с по-голяма прецизност и по-дълго време за обработка, и Бързо, проектиран да извършва бързи итерии по време на творческата фаза.

Наличност и цени

Достъпът е структуриран по нива на абонамент със система от кредитиБезплатният план предлага 100 кредита месечно; Google AI Pro ($19,99/месец) включва 1.000 кредита и достъп до бърз режим; а Google AI Ultra ($249,99/месец) предоставя 25 000 кредита и пълен достъп.

Veo 3.1 е достъпен чрез Състояние на Поток за абонати, в API на Gemini за разработчици, в Вертекс AI за компании и в Приложението Gemini за широката общественост, с внедряване по пазар.

Производителност и подобрения

При вътрешни тестове новата версия показва забележимо увеличение на вярност на подканата, особено когато има множество обекти или точни физически инструкции (гравитация, сблъсъци, материали). Също така има по-добро разбиране на чертите на лицето и архитектурните детайли при конвертиране от изображение във видео.

Подобрена е съгласуваност на героите с по-малко нежелани вариации (очи, пропорции или гардероб). В допълнение, физически модел по-достоверно отразява взаимодействието с околната среда, което помага в сложни сцени.

Известни ограничения

Виждам 3 Google Clouds

Както и при други видео генератори, може да има артефакти при бързи движения или много взискателни преходи. Синхронизирането на устните, макар и по-добро, понякога изисква ръчни настройки за напълно професионални резултати.

Кредитната система може да бъде скъпо в големи обеми продукция, а безплатният пакет не е достатъчен за интензивни работни процеси. Всички клипове включват видим воден знак и вграден SynthID на кадър, за да се гарантира проследимост.

практически употреби

В сферата на технологиите или видеоигрите, Veo 3.1 улеснява демонстрации, визуализации и обяснения без наемане на филмови екипи. В маркетинга това ускорява създаването на прототипи на идеи и намалява стъпките за обработка на звука в основната постпродукция.

За образованието, рамките и функциите за разширение помагат за анимиране на процеси, пресъздават исторически периоди или илюстрират научни концепции с насочени преходи между състояния.

Пътна карта

Google планира да продължи да разработва итерации въз основа на действителната употреба. Функцията Премахване ще завърши пакета за неразрушително редактиране във Flow, докато бъдещата работа ще се фокусира върху намаляване на артефактите, фина настройка на синхронизирането на устните и удължаване на максималната продължителност без загуба на последователност.

На масата е и по-дълбока интеграция с. Джемини, Работно пространство и YouTube, в допълнение към възможни специализирани режими (анимация, фотореализъм или артистични стилове), насочени към специфичните нужди на всеки профил на създател.

Veo 3.1 е позициониран като еволюция, фокусирана върху ежедневното производство: интегрирано аудио Още от първото рендериране, инструменти за управление на резултата и по-добро управление на съгласуваността между изображенията, всички налични в екосистемата на Google с опции за тестване, итерация и мащабиране.

изображение звук
Свързана статия:
Най-новите иновации и тенденции в образа и звука: технологии, обучение и решения за днешния потребител

Следвайте ни в Google Новини