OpenAI пуска Sora 2: Задвижвано от изкуствен интелект видео и аудио, идващи в социално приложение

  • OpenAI представя Sora 2 със синхронизирано генериране на видео и аудио и значителни подобрения във физиката.
  • Социално приложение за iOS пристига с проверени камери, персонализируема емисия и подобрена модерация.
  • Мерки за сигурност: водни знаци, контрол на самоличността, ограничения за тийнейджъри и ограничения за съдържание.
  • Първоначална наличност с покана в САЩ и Канада, безплатно ползване с ограничения и разширен достъп за Pro абонати.

Видео генераторът Sora 2 на OpenAI

Създаването на клипове с почти професионален завършек започва да бъде достъпно за всеки: OpenAI представи Сора 2, новия си видео модел с интегрирано аудио, заедно с приложение за iPhone, което улеснява по-директното и социално използване. Предложението се фокусира върху достъпността и визуална и звукова съгласуваност, с резултати, които според демонстрациите изглеждат много по-правдоподобни.

Стартът съчетава технически подобрения с продуктов слой, предназначен за създатели и широката публика. Sora 2 обещава по-добра физическа прецизност, непрекъснатост между кадрите и контрол на стила, както и инструмент за редактиране, който ви позволява да вмъкнете свой собствен човек в генерираните сцени. Разгръщането започва с покани в САЩ и Канада, безплатно с места и опции с по-високо качество за абонати на ChatGPT.

Какво е Sora 2 и какво всъщност предлага?

Сора 2
Свързана статия:
Sora 2: OpenAI се стреми към видео, задвижвано от изкуствен интелект, и социално приложение

Новата версия прави значителен скок напред от първата Sora: сега системата поддържа постоянство на обекти и състояния в множество равнини, той свързва действията, без да нарушава непрекъснатостта, и по-добре се подчинява на законите на физиката. OpenAI илюстрира това с неуспешен баскетболен удар, който този път, отскача естествено вместо да се „телепортира“ до обръча, често срещан провал в предишни модели.

Sora 2 от OpenAI, социално приложение и генератор на видеоклипове

Това по-правдоподобно поведение се подкрепя от мащабно обучение с видео данни и по-прецизни техники за контрол на наратива. Моделът разбира сложни сигнали, зачита пространствената и времевата непрекъснатост и предлага стилове, вариращи от филм към анимацията, с по-последователни корекции на продължителността и промени в сцените.

Интегрирано аудио, стилове и творчески контрол

Друга новост е генериране на естествен звукSora 2 създава звукови пейзажи, ефекти и дори диалози, синхронизирани с изображението, с една проста команда. Тази интеграция осигурява потапяне в картината и намалява зависимостите от постпродукция, нещо, което само няколко алтернативи на пазара са предлагали досега.

Системата позволява модулация на тона, кадриране и визуална обработка, както и кратки поредици - обикновено от до 10 секунди— предназначен за мобилно потребление. Въпреки че напредъкът е очевиден, OpenAI признава, че моделът все още допуска грешки и че пълна последователност не е гарантирано във всички контексти.

Социалното приложение: камери, персонализирана емисия и модериране

Заедно с модела, OpenAI пуска iOS приложение, наречено Sora, с видео емисия и функции. ремиксПотребителят може да се появи като камео в сцени, генерирани след кратка проверка на лицето и гласа, което позволява вмъкването на изображението му с изрични разрешения. По дизайн създаването се извършва в рамките на приложението и с изключение на този процес на проверка, не поддържа качване на файлове от албума с камерата на този етап.

Компанията твърди, че алгоритъмът за подаване се ръководи от инструкции на естествен език и дава приоритет на съдържанието от хора, с които потребителят взаимодейства, като избягва оптимизиране на времето за използване. За да засили сигурността, Sora налага ограничения по подразбиране на Тийнейджъри, интегрира родителски контрол от ChatGPT и ограничава чувствителната употреба: лица на публични личности без съгласие, както и съдържание за възрастни или екстремно съдържание не са разрешени.

В произхода и правата, всички видеоклипове включват водни знаци и цифрови удостоверения да идентифицира произхода му. OpenAI твърди, че има вътрешни инструменти за откриване и дори ограничава скрийншотовете. На ниво интелектуална собственост компанията поддържа система от заявка за изключване за притежателите на права, решение, което възобнови дебата относно обучението с материали, достъпни в интернет.

Достъп, цена и пътна карта

Достъпът започва с покана в Съединените щати и Канада, с първоначална употреба безплатни и щедри квоти в зависимост от изчислителния капацитет. Абонатите на ChatGPT Pro имат опция с по-високо качество, Sora 2 Pro, и компанията планира да отвори API по-късно. Предишният модел, Sora 1 Turbo, също се запазва, а е планирана и версия за Android, като все още няма потвърдена дата.

OpenAI планира да позволи плащанията да генерират повече видеоклипове, ако търсенето надвишава ресурсите. В Европа разширяването ще зависи от регулаторни съображения, така че засега няма публичен календар.

Въздействие върху създателите и пазарната конкуренция

За малки студия, агенции и самостоятелни творци, Sora 2 намалява бариерите, като позволява висококачествен материал на по-ниска цена и време. В същото време това оказва натиск върху сектори като стоково видео или определени работни процеси за анимация и визуални ефекти, които ще трябва да съществуват едновременно с изкуствен интелект, способен да възпроизвежда задачи за секунди.

Движението е в съответствие с процъфтяваща екосистема: Google промотира Veo 3, Meta изследва социални формати с изкуствен интелект, а платформи като Runway и Pika постигат напредък в генерирането на аудиовизуални материали. Ангажиментът на OpenAI за обединяване модел и социална мрежа се стреми да се диференцира с интегрирано преживяване, което съчетава създаване, участие и контрол на идентичността.

Сора 2 точки в ясна посока: по-достоверни видеоклипове, синхронизирано аудио и социален слой, предназначен за създаване и споделяне с по-малко напрежение. Проектът идва със засилен контрол и открити спорове относно правата и обучението, но също така и с обещанието да предостави на повече хора усъвършенствана аудиовизуална продукция, в очакване на глобалното ѝ внедряване.


Следвайте ни в Google Новини