OpenAI Sora võtab videomeistrite leiva laualt

OpenAI teatas eelmisel nädalal uuest AI mudelist nimega Sora, mis suudab genereerida teksti alusel kuni 60 sekundi pikkuseid videoklippe. Ettevõtte pani uudise juurde ka hulga geneeritud videoklippe, mis näevad väga head välja ning on seninähtud katsetustega võrreldes suur samm edasi.

OpenAI teatab, et Sora tehakse praegu kättesaadavaks testmeeskondadele, et hinnata kriitilisi kohtiu kahjude või riskide suhtes. Nende tiimide hulka kuuluvad eksperdid sellistes valdkondades nagu valeinformatsioon, vaenu õhutav sisu ja eelarvamus.

Lisaks sellele testimisele järgib Sora väidetavalt ka DALL·E 3 jaoks kehtivaid ohutusmeetmeid. Ettevõte lisab, et töötab tööriistade kallal, mis aitaksid tuvastada, kas video on loonud Sora.

Kuigi teised rakendused nagu Pika ja Stability AI, on tehisintellekti video genereerimisel OpenAI-d võitnud, on mõned asjad, mis paistavad Sora silma. Sora suudab luua kuni 60 sekundilisi videosid, samas kui konkurendid suudavad vaid umbes neli sekundit. Samut on Sora puhul parem ümbritseva maailma teravus, eraldusvõime ja täpsus.

OpenAI veebisaidil on momendil üle 35 näite. Kuigi tulemused on muljetavaldavad, pole mudel kaugeltki täiuslik. Ettevõte tunnistab, et pregusel mudelil on nõrkusi. Sellel võib olla raskusi keeruka stseeni füüsika täpse simuleerimisega ning see ei pruugi mõista konkreetseid põhjuse ja tagajärje juhtumeid. Näiteks võib inimene küpsisest hammustada, kuid pärast seda ei pruugi küpsisel olla hammustusjälge.

Mudel võib segi ajada ka ruumilisi üksikasju, näiteks segi ajada vasakule ja paremale, ning võib tekkida raskusi aja jooksul aset leidvate sündmuste täpsete kirjeldustega, nagu konkreetse kaamera trajektoori järgimine.

Allikas: Android Authority