I LIKE AI: Cele mai importante noutăți anunțate la conferința Google I/O
Sunt puține evenimente de tehnologie despre care vorbește toată planeta.Google I/O este unul dintre ele. Se întâmplă o dată pe an, cu focus pe cele mai cunoscute produse și servicii Google.
Este și o oportunitate prin care gigantul american stă de vorbă cu sutele de mii de dezvoltatori din întreaga lume. Cei mai norocoși participă în carne și oase la conferința la care MC este nimeni altul decât Sundar Pichai, CEO Alphabet.
Ediția I/O de anul acesta a fost ușor atipică. Nu s-a vorbit despre Android 15, Pixel 8a sau Watch, ci despre inteligență artificială. Sunt deja mai bine de 20 de ani de când Google lucrează cu Inteligența Artificială pentru produsele sale, cu prima implementare în 2001, pentru Auto Correct în search și în 2006 pentru Google Translate.
Poate cel mai important milestone a venit în 2016, prin Transformers – o rețea neurală capabilă să înțeleagă limba. Până la Transformer, computerele nu puteau să interpreteze natural cuvintele și legătura dintre ele. Datorită acestui Transformer avem astăzi LLM-uri ca ChatGPT, Gemini, Claude sau Llama. Lucrarea de cercetare se numește „Attention Is All You Need” și chiar merită citită.
Deci, când Google zice ceva despre Inteligență Artificială, trebuie urmărit cu atenție. Și au fost multe noutăți pe care le-a văzut lansate live și colegul nostru, Sorin Kosz – Editor in Chief, Digital PRO TV.
Despre aceste noutăți discutăm în interviul I LIKE AI. Iată cele mai importante noutăți:
Google Search with AI Overview
Search rămâne una dintre cele mai importante surse de venit pentru Alphabet – poate și din acest motiv am văzut puține schimbări semnificative în ultimii ani. Nu vrei să strici ceva ce merge foarte bine, nu? Dar, din 2024 avem AI Overview pentru aproape 1 miliard de utilizatori. Practic, AI-ul face un soi de rezumat al căutării cu opțiunea de a naviga link-urile sursă.
Gemini 1.5 PRO
Cel mai puternic LLM de la Google, Gemini 1.5 PRO este acum disponibil pentru dezvoltatori. Asta înseamnă că poate fi luat și integrat în diverse aplicații ca asistent personalizat. Gemini Nano va fi și el inclus nativ în Chrome pentru sumarizare de articole, ajutor la scris și alte task-uri repetitive.
Google Assistant Gemini
Google Gemini înlocuiește Assistant. Norocoșii primesc o aplicație dedicată, mult mai conștientă de ce faci pe telefon și integrată inclusiv cu aplicațiile Google (Docs, Spreadsheet, Photos, Gmail, Calendar). Și pentru că poate rula și-n format Overlay (adică suprapus peste alte aplicații), Gemini poate să intervină când e nevoie.
Ask Photos - Circle to Search
Deja disponibil pe mai multe telefoane cu Android 14 pentru căutări rapide în imagini, Circle to Search poate fi folosit și pentru a rezolva diverse probleme – inclusiv teme și răspunsuri la întrebări de matematică.
Google Astra
Astra este construit peste Gemini – dincolo de înțelegerea limbajului scris, Astra vede lumea – poate cel mai apropiat pas de AGI (Inteligență Artificială Generală). Astra folosește camera telefonului și poți să întrebi ce vede, ce plantă ai în față sau, așa cum am văzut și în demo, de ce nu merge Pick-up-ul.
Amuzant este că în video-ul publicat de Google am văzut și un prototip de ochelari. La 9 ani de la oprirea producției Google Glass. Ce înseamnă să trăiești prea devreme în viitor, nu?
Urmăriți înregistrarea emisiunii în video-ul de mai sus sau/și citiți transcriptul acesteia, realizat cu aplicația Vatis Tech, care folosește... AI:
Marian Andrei: Bun găsit la un nou episod I Like AI, emisiunea unde ne folosim de oameni ca să aflăm mai multe lucruri despre inteligența artificială, iar invitatul nostru de astăzi este Sorin Kosz, care este Editor In Chief Digital PRO TV. În calitate de dublu invitat, odată la emisiunea noastră, dar și pentru că a fost la Google I/O. Poți să ne povestești un pic despre ce înseamnă acest eveniment și de ce este important pentru lumea tehnologiei?
Sorin Kosz: Sigur, Google I/O este cel mai important eveniment al companiei în fiecare an în care top managerii prezintă cele mai noi tehnologii și cele mai noi lansări de produse. Aș vrea poate un pic să înțelegem ce înseamnă I/O, pentru că cred că nu e clar pentru toată lumea. I/O vine de la input/output și reprezintă un concept al unui sistem informatic între ce înseamnă input - ce intră într-un sistem informatic - și output către lumea exterioară. Asta este o variantă... A doua este "Innovation in the open" I/O, adică compania își prezintă aceste lansări în campusul Google și în amfiteatrul din Shoreline care este într-un decor natural. Și a treia variantă în care I/O vine de la numărul special "googol", care este format din cifra unu și încă 100 de zero. Iar I-O vine primul număr unu și primul de zero, restul dispărând. Astea sunt explicațiile pentru nume. Revenind la importanța evenimentului, spuneam că acolo se anunță cele mai importante realizări ale companiei din perioada anterioară. E la a șaptesprezecea ediție, prima fiind în 2008,are loc o singură dată pe an, în luna mai, undeva, și sunt invitați developeri în primul rând din toată lumea și presă, la fel, cam din toată lumea. Și cu ajutorul Google România am reușit să ajungem și noi acolo.
Marian Andrei: Care este atmosfera?
Sorin Kosz: Atmosfera este una aproape de festival de muzică rock, pot spune, în care vezi foarte, foarte mulți oameni în foarte multe locații, o scenă principală, foarte multe corturi, unde se fac demonstrații, unde se fac prezentări, iar nivelul de IT acolo este înspăimântător de ridicat.
Marian Andrei: Care sunt cele mai importante noutăți pe care le-am văzut acolo, pentru că, în mod normal, se concentra pe un singur produs și restul erau secundare. Era Android .... 13, 14, 12, ș.a.m.d.
Sorin Kosz: Da, din prima, CEO-ul Google, Sundar Pichai, a anunțat: ”Intrăm full în Gemini era”, adică asta înseamnă în modelul de inteligență artificială Gemini, care rulează pe toate produsele Google. Adică dacă vorbim de search in Google, dacă vorbim de worspaces, vorbim de Gmail, vorbim de Maps ș.a.m.d. Toate au în spate acest model de inteligență, artificia, și el este într-un format updatat, este Gemini 1.5 care, după cum spuneam, rulează pe aplicații care sunt utilizate de peste 2 miliarde de oameni în toată lumea.
Marian Andrei: Poți să dai niște exemple de integrare din ce ai văzut acolo?
Sorin Kosz: Sigur. Putem să vorbim, de exemplu, despre ce înseamnă search, cum a evoluat. Este produsul de bază al Google și cu care s-a lansat,la modul în care fiecare utilizator face o căutare, e interesat de un anumit lucru. În momentul de față, în Statele Unite există o variantă care se numește AI overviews, în care rezultatele căutării tale sunt afișate direct în pagina de căutare. Practic, acel AI agreghează toate informațiile pe care le colectează din baza de date și îți livrează un răspuns personalizat, documentat, complex, astfel încât aproape că nu mai ai nevoie să dai click pe link-uri, să ajungi în diverse site-uri, fie că e vorba de știri, fie că e vorba de blog-uri specializate, ca să afli răspunsul la întrebarea ta.
Marian Andrei: Dar nu scade din traficul de pe site-ul tău?
Sorin Kosz: E o discuție aici, pentru că, sigur, reducând vizibilitatea link-urilor de site-uri e probabil ca acest trafic dinspre Google search să scadă. Deocamdată, în România nu este lansat acest produs de AI Overviews, este lansatîn Statele Unite și în alte piețe occidentale. Acolo, da, se observă o scădere a traficului generat din Google Search, dar ca utilizator îți ajunge informație mai rapid. Ca utilizator este o îmbunătățire a experienței tale, pentru că practic îți reduce pașii pe care îi ai de urmat în a-ți rezolva problema.
Marian Andrei: Ce mai înseamnă Gemini AI 1.5 sau Gemini 1.5în celelalte unelte pe care le folosim deja de la Google? Că dacă ești deja în ecosistemul lor ...
Sorin Kosz: Da. Vorbim tot de search, de exemplu. A fost ceva impresionant, în sensul în care există interogarea în search, o poți face nu doar ca text, scriind practic ce vrei să afli, ci poți să faci această accesare pe baza unui video, pe baza unei comenzi locale. Și au dat un exemplu foarte, foarte interesant, în care filmând în timp real o problemă cu un pick-up, de exemplu, care nu funcționa, au făcut o întrebare, de ce nu funcționează pick-up-ul? Iar AI a livrat răspunsul, verifică butoanele cutare și cutare și rezolvă-ți problema. Deci acest concept de multi-modalitate în care funcționează acum pe baza AI-ului, search-ul este un avans tehnologic impresionant.
Marian Andrei: Adică nu mai face-o doar o comandă pur și simplu prin text, ci parcă vorbește cineva...
Sorin Kosz: Exact! La fel, un alt lucru care a fost impresionant, poți căuta direct într-o fotografie, adică dacă te interesează, vezi într-o fotografie că prietenul tău și-a luat o anumită marcă de încălțări sau o pereche de blugi, încercuiești pur și simplu produsul respectiv și dai un search și-ți livrează imediat răspunsul, este tipul cutare, costă cutare, îl găsești acolo. Asta este la fel de impresionant. Extinzând puțintel domeniul în tot ce înseamnă workspace-urile Google, putem vedea și în Gmail, de exemplu, comenzi care înseamnă sumarizare sau rezumat din anumite mail-uri. Poți solicita ca în anumite mail-uri să ți le aranjeze în funcție de anumite criterii. Dacă, de exemplu, ai cerut oferte pentru amenajarea în casă și ai primit 10 oferte din partea a 10 furnizori, poți să-i spui: aranjează-mi-le în funcție de preț, în funcție de termenul de livrare ș.a.m.d. Ți le face! Mai mult, în Google Meet, dacă ai avut o ședință, o videoconferință la care n-ai putut participa, dar îți rămâne acolo înregistrarea, îi poți cere, fă-mi un rezumat, livrează-mi să știu exact ce s-a discutat acolo. Eimpresionant.
Marian Andrei: Mi se pare drăguț, cumva, pentru că, de multe ori, foarte multe soluții de genul acesta sunt doar niște probleme în căutare de rezolvări, dar aici pare că vin pe niște nevoi pe care le simțim cu toții în viața de zi cu zi.
Sorin Kosz: Exact asta spun și cei de la Google. Anticipează, merge cu câțiva pași înainte și îți livrează aceste răspunsuri.
Marian Andrei: Dar e nevoie să plătești pentru o astfel de soluție? Știu că unele sunt gratuite, dar pentru anumite integrări în workspace, de exemplu ...
Sorin Kosz: La nivel de utilizator nu se plătesc aceste aceste features suplimentare. Spuneam de la început că evenimentul este dedicat în principal developerilor. Acolo, cei care sunt abonați la serviciile Google primesc în plus 1.000.000 de token-uri în care își pot dezvolta produsele. Astea sunt ce înseamnă produse plătite, dar la nivel de utilizator nu se plătește absolut nimic.
Marian Andrei: Am văzut câteva demonstrații foarte interesante și despre Deep Mind. Mi se pare că e, așa, într-un cont de umbră al lui Google, un laborator acolo în Alphabet, unde parcă vezi un pic din viitor.
Sorin Kosz: Exact, se numește proiectul ASTRA și este un asistent virtual, un agent AI, de fapt, așa l-au definit ei, care îți permite să poți o discuție la nivel conversațional, ca și cum vorbim noi aici. Poți să-i pui întrebări, îți răspunde, dezvolți conversația, ș.a.m.d. De asemenea, am văzut o demonstrație acolo legată de proiectul ASTRA, în care într-un video cursiv, A.I.-ul îți răspundea, îți spunea ce cod vede pe video lângă tine de pe telefonul tău, îți răspundea la întrebarea unde mi-am lăsat ochelarii, i-ai văzut pe undeva? Și-ți spune: sunt pe birou, în colțul din stânga. S-a merscu acel telefon, s-a arătat un coș de fereastră, se vedea afară și a fost întrebat, pe baza a ceea ce vezi, unde sunt, în ce locație mă aflu? I s-a dat adresa exactă. E impresionant, dar în același timp are și o latură creativă. În momentul în care îi ceri să-ți dea, de exemplu, numele unei formații de rock, făcând o poză sau făcând un video, ce nume de formații rock mi-ai sugera aici? Poate să săofere și astfel de răspunsuri creative. E impresionant. Am avut ocazia să testez și eu personal acestă aplicație și am desenat stângaci, pentru că nu mă pricep foarte bine la desen, pe un ecran, pe un touchscreen, o rachetă - și am întrebat ce reprezintă asta? AI recunoaște, a dat răspunsul corect. Am purtat după aceea o conversație suplimentară, ce e o rachetă, unde zboară? E impresionant...
Marian Andrei: Dar în același timp trebuie să ne ridicăm și niște semne de întrebare legate de etică și se vorbește foarte mult despre asta. Vedem parteneriate în piață între companii foarte mari, care își asumă, să zicem așa, un rol de tutore pentru astfel de agenți. Cum ai văzut tu discuția aceasta acolo?
Sorin Kosz: Da, Google a anunțat foarte clar că dezvoltă în mod responsabil toate aceste aplicații și toată această tehnologie bazată pe AI, având în vedere și beneficiile pe care le poate oferi utilizatori lor la nivel individual, cât și societății în general. Tocmai pentru aceasta, ei au o echipă specială care se numește Red Teaming, care își testează propriile produse tocmai pentru a identifica posibile breșe de securitate și de a le remedia în timp util înainte de lansări. Mai mult decât atât, au un program, o aplicație prin care pun un water mark pe produsele generate cu AI, se numește SynthID,și care pot fi ușor identificate.
Marian Andrei: Pe text, imagine și video?
Sorin Kosz: Pe text, imagine și video, sigur.
Marian Andrei: Pe care noi nu le vedem cu ochiul liber...
Sorin Kosz: Nu, nu le poți vedea, evident, nu le poți vedea, dar în momentul în care vrei să identifici un conținut generat cu inteligența artificială, poți să o faci.
Marian Andrei: Da, pentru că ei au generatoare de conținut atât pe imagine, cât și pe video și pe text.
Sorin Kosz: Evident, da. Dar, asta spuneam, dezvoltarea o fac în mod responsabil, conform declarațiilor.
Marian Andrei: De asta, anumite servicii de genul acesta, anunțate și la Google I/O, nu sunt disponibile imediat în Europa ..
Sorin Kosz: Da, pentru că, acum câteva luni, în Uniunea Europeană a fost introdusă o legislație în ceea ce înseamnă serviciile digitale, care este foarte bună și protejează libertățile individuale, iar marii giganți tech de peste ocean trebuie să-și alinieze toate produsele pentru a respecta aceste prevederi legislative. E o linie fină între ceeea ce înseamnă, să spunem, protejarea libertăților individuale și accesul la tehnologii de ultimă oră, lucru care poate la un moment dat pentru un utilizator din Uniunea Europeană, având în vedere că are acces la câteva luni sau poate chiar și un an de la lansarea pe piață, poate deveni un handicap, să spunem, o problemă în utilizarea serviciului respectiv, având în vedere că un nord-american sau un asiaticși-a făcut deja mâna.
Marian Andrei: Dar, spune-mi, cum se folosește inteligența artificială într-o redacție de știri?
Sorin Kosz: Și în redacția ȘtirileProTV.ro avem și folosim o aplicație care face ceea ce numim noi speech-to text, adică din fișiere video generăm un text pe care îl folosim, apoi îl edităm apoi și ne folosește în construirea articolelor online. Este o aplicație pe care o avem realizată de un furnizor extern, care nu este 100% accurate, dar este o bază de lucru foarte, foarte bună, care ne ajută foarte
Marian Andrei: Am înțeles. Sorin, îți mulțumesc tare mult.
Sorin Kosz: Mulțumesc și eu!
Marian Andrei: Abia aștept să vedem și noi și să testăm aceste produse. Evident, toate episoadele I Like AI sunt în categoria specială de pe site-ul stirileprotv.ro. Numai bine!