Създаването на клипове с почти професионален завършек започва да бъде достъпно за всеки: OpenAI представи Сора 2, новия си видео модел с интегрирано аудио, заедно с приложение за iPhone, което улеснява по-директното и социално използване. Предложението се фокусира върху достъпността и визуална и звукова съгласуваност, с резултати, които според демонстрациите изглеждат много по-правдоподобни.
Стартът съчетава технически подобрения с продуктов слой, предназначен за създатели и широката публика. Sora 2 обещава по-добра физическа прецизност, непрекъснатост между кадрите и контрол на стила, както и инструмент за редактиране, който ви позволява да вмъкнете свой собствен човек в генерираните сцени. Разгръщането започва с покани в САЩ и Канада, безплатно с места и опции с по-високо качество за абонати на ChatGPT.
Какво е Sora 2 и какво всъщност предлага?
Новата версия прави значителен скок напред от първата Sora: сега системата поддържа постоянство на обекти и състояния в множество равнини, той свързва действията, без да нарушава непрекъснатостта, и по-добре се подчинява на законите на физиката. OpenAI илюстрира това с неуспешен баскетболен удар, който този път, отскача естествено вместо да се „телепортира“ до обръча, често срещан провал в предишни модели.

Това по-правдоподобно поведение се подкрепя от мащабно обучение с видео данни и по-прецизни техники за контрол на наратива. Моделът разбира сложни сигнали, зачита пространствената и времевата непрекъснатост и предлага стилове, вариращи от филм към анимацията, с по-последователни корекции на продължителността и промени в сцените.
Интегрирано аудио, стилове и творчески контрол
Друга новост е генериране на естествен звукSora 2 създава звукови пейзажи, ефекти и дори диалози, синхронизирани с изображението, с една проста команда. Тази интеграция осигурява потапяне в картината и намалява зависимостите от постпродукция, нещо, което само няколко алтернативи на пазара са предлагали досега.
Системата позволява модулация на тона, кадриране и визуална обработка, както и кратки поредици - обикновено от до 10 секунди— предназначен за мобилно потребление. Въпреки че напредъкът е очевиден, OpenAI признава, че моделът все още допуска грешки и че пълна последователност не е гарантирано във всички контексти.
Социалното приложение: камери, персонализирана емисия и модериране
Заедно с модела, OpenAI пуска iOS приложение, наречено Sora, с видео емисия и функции. ремиксПотребителят може да се появи като камео в сцени, генерирани след кратка проверка на лицето и гласа, което позволява вмъкването на изображението му с изрични разрешения. По дизайн създаването се извършва в рамките на приложението и с изключение на този процес на проверка, не поддържа качване на файлове от албума с камерата на този етап.
Компанията твърди, че алгоритъмът за подаване се ръководи от инструкции на естествен език и дава приоритет на съдържанието от хора, с които потребителят взаимодейства, като избягва оптимизиране на времето за използване. За да засили сигурността, Sora налага ограничения по подразбиране на Тийнейджъри, интегрира родителски контрол от ChatGPT и ограничава чувствителната употреба: лица на публични личности без съгласие, както и съдържание за възрастни или екстремно съдържание не са разрешени.
В произхода и правата, всички видеоклипове включват водни знаци и цифрови удостоверения да идентифицира произхода му. OpenAI твърди, че има вътрешни инструменти за откриване и дори ограничава скрийншотовете. На ниво интелектуална собственост компанията поддържа система от заявка за изключване за притежателите на права, решение, което възобнови дебата относно обучението с материали, достъпни в интернет.
Достъп, цена и пътна карта
Достъпът започва с покана в Съединените щати и Канада, с първоначална употреба безплатни и щедри квоти в зависимост от изчислителния капацитет. Абонатите на ChatGPT Pro имат опция с по-високо качество, Sora 2 Pro, и компанията планира да отвори API по-късно. Предишният модел, Sora 1 Turbo, също се запазва, а е планирана и версия за Android, като все още няма потвърдена дата.
OpenAI планира да позволи плащанията да генерират повече видеоклипове, ако търсенето надвишава ресурсите. В Европа разширяването ще зависи от регулаторни съображения, така че засега няма публичен календар.
Въздействие върху създателите и пазарната конкуренция
За малки студия, агенции и самостоятелни творци, Sora 2 намалява бариерите, като позволява висококачествен материал на по-ниска цена и време. В същото време това оказва натиск върху сектори като стоково видео или определени работни процеси за анимация и визуални ефекти, които ще трябва да съществуват едновременно с изкуствен интелект, способен да възпроизвежда задачи за секунди.
Движението е в съответствие с процъфтяваща екосистема: Google промотира Veo 3, Meta изследва социални формати с изкуствен интелект, а платформи като Runway и Pika постигат напредък в генерирането на аудиовизуални материали. Ангажиментът на OpenAI за обединяване модел и социална мрежа се стреми да се диференцира с интегрирано преживяване, което съчетава създаване, участие и контрол на идентичността.
Сора 2 точки в ясна посока: по-достоверни видеоклипове, синхронизирано аудио и социален слой, предназначен за създаване и споделяне с по-малко напрежение. Проектът идва със засилен контрол и открити спорове относно правата и обучението, но също така и с обещанието да предостави на повече хора усъвършенствана аудиовизуална продукция, в очакване на глобалното ѝ внедряване.