Компанијата „Опен АИ“ претстави нов модел наречен „Сора“ кој може да ги претвори текстуалните инструкции во видео. Моделот „текст во видео“ им овозможува на корисниците да креираат фотореалистични клипови во должина до една минута врз основа на напишаното“, пренесува Guardian.

„Сора“, наречена според јапонскиот збор за – небо, може да создаде комплексни сцени со повеќе ликови, специфични видови движења и прецизни детали за темата и заднината, велат од компанијата. Исто така, се наведува дека моделот може да разбере како предметите постојат во физичкиот свет и прецизно да ги толкува реквизитите и да создава убедливи ликови кои изразуваат живи емоции.

Моделот може да креира видео засновано на неподвижна слика и да ги пополни кадрите што недостигаат на постојното видео, или да го прошири. Демонстративните видеа вклучуваат поглед кон Калифорнија од воздух, за време на „златната треска“, видео што изгледа како да е снимено од внатрешноста на воз во Токио. Сепак, многу од нив содржат одредени знаци кои покажуваат дека се работи за технологија со вештачка интелигенција, како што е „сомнителното“ движење на подот на музејската снимка. Компанијата вели дека моделот може да се мачи прецизно да симулира физика на сложена сцена, но резултатите се генерално доста импресивни.

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) February 15, 2024

