Puncte Cheie
xAI lansează Grok-1.5V
xAI, rivalul OpenAI fondat de Elon Musk, a prezentat prima versiune a Grok capabilă să proceseze informații vizuale.
Grok-1.5V este primul model AI multimodal de generație a companiei, care poate procesa nu numai text, ci și „documente, diagrame, grafice, capturi de ecran și fotografii”.
În anunțul xAI, compania a oferit câteva exemple de cum pot fi utilizate capacitățile sale în lumea reală.
Poți, de exemplu, să-i arăți o fotografie cu un fluxogramă și să-i ceri lui Grok să o traducă în cod Python, să-i ceri să scrie o poveste bazată pe o desenare sau chiar să-i ceri să explice un meme pe care nu-l înțelegi.
Noua versiune vine la doar câteva săptămâni după ce compania a dezvăluit Grok-1.5.
Acel model a fost proiectat pentru a fi mai bun la codificare și matematică decât predecesorul său, precum și pentru a fi capabil să proceseze contexte mai lungi, astfel încât să poată verifica datele din mai multe surse pentru a înțelege mai bine anumite interogări.
xAI a declarat că testatorii săi timpurii și utilizatorii existenți vor putea în curând să se bucure de capacitățile Grok-1.5V, deși nu a dat un calendar exact pentru lansarea sa.
xAI introduce setul de date RealWorldQA
În plus față de introducerea Grok-1.5V, compania a lansat și un set de date de referință pe care îl numește RealWorldQA.
Poți utiliza oricare dintre cele 700 de imagini RealWorldQA pentru a evalua modelele AI: fiecare element vine cu întrebări și răspunsuri pe care le poți verifica cu ușurință, dar care ar putea înșela modelele multimodale precum Grok.
xAI a susținut că tehnologia sa a primit cel mai mare scor atunci când compania a testat-o cu RealWorldQA împotriva concurenților, cum ar fi OpenAI’s GPT-4V și Google Gemini Pro 1.5.

