Puncte Cheie
Google Project Astra: O privire asupra viitorului asistenților AI
La evenimentul I/O 2024, Google a oferit un teaser pentru Project Astra, oferind o idee despre direcția în care se îndreaptă asistenții AI în viitor.
Astra este o funcție multi-modală care combină inteligența Gemini cu abilitățile de recunoaștere a imaginilor pe care le obții cu Google Lens, precum și răspunsuri puternice în limbaj natural.
Deși videoclipul promoțional a fost impresionant, după ce am avut ocazia să îl testăm în persoană, este clar că mai este mult până când ceva asemănător cu Astra va ajunge pe telefonul tău.
Următoarele sunt trei concluzii din prima noastră experiență cu AI-ul de generație următoare de la Google.
Impresiile noastre despre Project Astra
În prezent, majoritatea oamenilor interacționează cu asistenții digitali folosind vocea, astfel încât modalitatea multi-modală a Astra (adică utilizarea vederii și sunetului în plus față de text/discurs) pentru a comunica cu un AI este relativ nouă.
În teorie, acest lucru permite entităților bazate pe computer să funcționeze și să se comporte mai mult ca un asistent real sau agent – care a fost unul dintre cuvintele de ordine ale Google pentru show – în loc de ceva mai robotic care răspunde pur și simplu la comenzi vocale.
În demonstrația noastră, am avut opțiunea de a cere Astra să spună o poveste pe baza unor obiecte pe care le-am așezat în fața camerei, după care ne-a povestit o poveste drăguță despre un dinozaur și bagheta sa de încredere încercând să scape de o lumină roșie amenințătoare.
A fost distractiv și povestea a fost drăguță, iar AI-ul a funcționat cam așa cum te-ai aștepta.
Dar, în același timp, era departe de asistentul aparent omniscient pe care l-am văzut în teaser-ul Google.
Și, în afară de a distra poate un copil cu o poveste de culcare originală, nu părea că Astra făcea atât de mult cu informațiile pe cât ai dori.
Apoi, colega mea Karissa a desenat o scenă bucolică pe un ecran tactil, moment în care Astra a identificat corect floarea și soarele pe care le-a pictat.
Dar cea mai captivantă demonstrație a fost când ne-am întors pentru o a doua rundă cu Astra funcționând pe un Pixel 8 Pro.
Acest lucru ne-a permis să îndreptăm camerele sale către o colecție de obiecte în timp ce urmărea și își amintea locația fiecăruia.
A fost suficient de inteligentă pentru a recunoaște hainele mele și unde îmi ascunsesem ochelarii de soare, chiar dacă aceste obiecte nu făceau inițial parte din demonstrație.
Într-un fel, experiența noastră a evidențiat potențialele avantaje și dezavantaje ale AI.
Doar abilitatea unui asistent digital de a vă spune unde ați putea să vă fi lăsat cheile sau câte mere erau în coșul dvs. de fructe înainte de a pleca la cumpărături v-ar putea ajuta să economisiți timp real.
Dar, după ce am vorbit cu câțiva dintre cercetătorii din spatele Astra, sunt încă multe obstacole de depășit.
Spre deosebire de multe dintre caracteristicile recente de AI ale Google, Astra (care este descrisă de Google ca o „previzualizare a cercetării”) are încă nevoie de ajutor din partea cloud-ului în loc să poată funcționa pe dispozitiv.
Și, deși suportă un anumit nivel de permanență a obiectelor, acele „amintiri” durează doar pentru o singură sesiune, care în prezent se întinde doar pe câteva minute.
Și, chiar dacă Astra ar putea să își amintească lucruri pentru o perioadă mai lungă de timp, există lucruri precum stocarea și latența de luat în considerare, deoarece pentru fiecare obiect pe care Astra îl reamintește, riscați să încetiniți AI-ul, rezultând într-o experiență mai stângace.
Așadar, deși este clar că Astra are mult potențial, entuziasmul meu a fost temperat cu cunoștința că va trebui să treacă ceva timp înainte de a putea obține mai multă funcționalitate cu caracteristici complete.
Dintre toate progresele AI generative, AI-ul multimodal este cel care mă intrigă cel mai mult.
La fel de puternice cum sunt cele mai recente modele, am dificultăți în a mă entuziasma pentru actualizările iterative ale chatbot-urilor bazate pe text.
Dar ideea unui AI care poate recunoaște și răspunde la întrebări despre mediul înconjurător în timp real pare ceva de genul unui film SF.
Acesta oferă și o imagine mult mai clară a modului în care ultima val de progrese AI vor găsi drumul spre dispozitive noi, cum ar fi ochelarii inteligenți.
Google a oferit un indiciu despre asta cu Project Astra, care ar putea avea într-o zi o componentă de ochelari, dar deocamdată este în mare parte experimentală (ochelarii arătați în videoclipul demonstrativ în timpul discursului de deschidere I/O erau aparent un „prototip de cercetare”).
În persoană, totuși, Project Astra nu părea exact ca ceva dintr-un film SF.
A fost capabil să recunoască cu precizie obiectele care au fost așezate în jurul camerei și să răspundă la întrebări nuanțate despre ele, cum ar fi „cu care dintre aceste jucării ar trebui să se joace un copil de 2 ani”.
A putut recunoaște ceea ce era în schița mea și să inventeze povești despre diferite jucării pe care i le-am arătat.
Dar majoritatea capabilităților Astra păreau la fel cu ceea ce Meta a făcut deja disponibil cu ochelarii săi inteligenți.
AI-ul multimodal al Meta poate, de asemenea, să recunoască mediul înconjurător și să facă un pic de scriere creativă în numele tău.
Și, deși Meta de asemenea facturează aceste caracteristici ca fiind experimentale, ele sunt cel puțin disponibile pe scară largă.
Caracteristica Astra care ar putea să diferențieze abordarea Google este faptul că are o „memorie” încorporată.
După scanarea unui număr de obiecte, încă își putea „aminti” unde au fost plasate anumite elemente.
Deocamdată, se pare că memoria Astra este limitată la o fereastră relativ scurtă de timp, dar membrii echipei de cercetare ne-au spus că ar putea fi teoretic extinsă.
Aceasta ar deschide, evident, și mai multe posibilități pentru tehnologie, făcând ca Astra să pară mai mult ca un asistent real.
Nu am nevoie să știu unde mi-am lăsat ochelarii acum 30 de secunde, dar dacă ai putea să îți amintești unde i-am lăsat aseară, ar părea cu adevărat ca și cum SF-ul a devenit realitate.
Dar, ca atât de mult din AI-ul generativ, cele mai interesante posibilități sunt cele care nu s-au întâmplat încă.
Astra ar putea ajunge acolo în cele din urmă, dar acum pare că Google mai are mult de lucru pentru a ajunge acolo.
Puteți afla mai multe despre știrile de la Google I/O 2024 aici.
Acest articol a apărut inițial pe Engadget la https://www.engadget.com/google-project-astra-hands-on-full-of-potential-but-its-going-to-be-a-while-235607743.html?src=rss.

