Revoluția AI a ajuns în era video. Cu o simplă comandă se pot genera zeci de cadre, aproape la fel ca cele filmate
Your browser doesn't support HTML5 video.
„Generează-mi un clip plin cu flori de mac, pe fundal vedem câteva păsări albe care călătoresc de la stânga la dreapta”. După ce scrii această comandă apeși enter și undeva, într-un cloud - inteligența artificială compune cadru cu cadru imagini. OpenAi, Kling, Runway sunt doar câteva dintre cele mai mari platforme text to video. Cum funcționează și care este rostul acestei tehnologii vedem acum.
Toate aceste secvențe sunt generate cu ajutorul inteligenței artificiale. Fiecare cadru din cele 25 care apar într-o secundă…
Aici a ajuns tehnologia. În punctul în care lumea noastră poate fi recreată fără să fie văzută vreodată printr-un obiectiv de cameră.
Cel mai nou exemplu al acestei revoluții este SORA, dezvoltată de OpenAI. SORA este un model AI de tip text-to-video — adică, la o comandă scrisă în format text, poate genera imagini și videoclipuri complete. În esență, dă viață imaginilor din mintea noastră.
Rezultatele? Uimitoare. Unele videoclipuri par atât de reale, încât e greu de crezut că nu au fost filmate. Dar dacă te apropii de ecran sau le privești mai atent, găsești mici imperfecțiuni — detalii care, cel puțin pentru moment, ne amintesc că privim o creație digitală. Acestea sunt „urmele" lăsate de procesul de generare, un indiciu că tehnologia este încă într-un stadiu de perfecționare.
Și nu este o tehnologie ieftină. Din abonamentul Plus pentru ChatGPT poți genera doar 50 de secvențe, la rezoluție 720p. Mult mai puține la rezoluție FullHD.
Și nu este singura limitare. Sora nu știe și nu înțelege fizică. Un automobil se va mișca ciudat în cadru, omul nu va merge natural, iar din când în când mai pot apărea mâini sau picioare în plus - or oamenii pot dispărea de nicăieri. Știm însă că aceste erori sunt doar temporare.
Diferențele față de anul trecutAdică, așa arătau imaginile generate de AI acum un an și au evoluat în așa ceva. Clipurile pot fi ajustate, ca format (vertical sau orizontal) ori durată.
OpenAI nu sunt primii în această industrie. Runway ajung deja la a generația a 3-a și au deja parteneriate cu Lionsgate și alte Festivaluri dedicate filmelor. „Everything Everywhere All at Once”, „ASAP Rocky” sau „Topgear” au folosit Runway pentru câteva cadre.
De exemplu, pentru că filmul avea echipă mică pentru grafică, au folosit Runway pentru înlăturarea din cadru a celui care împingea pietrele. Cu ajutorul Runway au făcut în 6 secunde ce altfel ar fi durat zeci de ore.
Tot Runway se laudă și cu Act-One. O tehnologie prin care poți să dai viață unor noi personaje fără măști complicate, fără ferme de randat - ci prin înlocuirea directă a feței omului. Inclusiv mișcările de ochi, buze, gesturi, sunt replicate instant. Iar rezultatele sunt gata în câteva minute, iarăși - în loc de zeci de ore.
Runway are și o variantă gratuită, dar, din păcate - poți genera imagini doar cu o tehnologie mai veche. Varianta Standard costă 15 dolari pe lună, dar clipurile sunt limitate ca durată, și-n general creditele alocate sunt consumate destul de repede. Abonamentul nelimitat ajunge la 95 de dolari pe lună.
Și Adobe anunță că în Premiere Pro adaugă video generat de inteligența artificială. Doar că aici implementarea nu se face chiar de la zero, ci poți modifica imaginile ca să se potrivească. Editorul de imagine are posibilitatea să facă anumite secvențe mai lungi ori să schimbe acțiunea actorului.
Chinezii sunt și ei foarte avansați în acest domeniu. Kling este un serviciu disponibil pe toată planeta și care poate genera clipuri la fel de uimitoare, rapid și ieftin. Ba chiar s-au făcut și scurtmetraje. Kuaishou, compania care deține Kling, este parțial deținută de statul chinez. Interesant, nu?
Cel mai important - aceste companii își doresc să poate simula întocmai lumea reală - de la, indiferent că vorbim de mașini, oameni, vreme, peisaje, demolări. Dar, o altă problemă e că aceste modele au fost antrenate pe conținutul oamenilor. Sute de mii de ore de youtube, filme, imagini postate pe rețelele de socializare, inclusiv Meta va lansa curând un serviciu similar.