Inteligența Artificială face un pas surprinzător în testele de logică simple, dar relevante pentru viața de zi cu zi. Într-un experiment recent, 53 dintre cele mai avansate modele de AI au fost supuse unui test aparent banal, dar profund revelator pentru limitele actuale ale tehnologiei: alegerea între a merge pe jos sau a conduce spre spălătoria auto, situată la doar 50 de metri distanță. Deși această dilemă pare un exercițiu de bază pentru orice om, rezultatele au demonstrat diferențe semnificative între discursul algoritmilor de ultimă generație și raționamentul uman.
Testul simplu, dar revelator pentru inteligență
Într-un test foarte direct, inteligențele artificiale aveau de decis dacă să-și ducă mașina la spălătorie fie mergând pe jos, fie conducând. Nu li s-a oferit o motivație sau argumente despre beneficii, ci doar li s-a cerut să pună în balanță un raționament. În mod surprinzător, după o singură rulare, majoritatea modelelor – 42 din 53 – au optat pentru „a merge”, considerând această variantă ca fiind cea mai simplă soluție. În plus, fiecare model a fost testat de 10 ori pentru a verifica dacă alegerea era consecventă, confirmând astfel robustețea răspunsurilor.
Printre modelele de succes s-au aflat cele mai avansate modele, precum Claude Opus 4.6, GPT-5, Gemini 3 Pro sau Sonar Pro, multe dintre ele dezvoltate de cei mai mari giganți din domeniu. Interesant este că, în cazul în care un furnizor dispunea de mai multe variante de AI, doar câte unul din aceste modele reușea să înghită provocarea, precum GPT-5 pentru OpenAI sau Opus 4.6 pentru compania Anthropic.
Decizii greșite și răspunsuri surprinzătoare
Însă, nu toate modelele au fost atât de „înțelepte”. Modelele Llama și Mistral, devenite populare în cercurile dezvoltatorilor pentru capacitatea lor de învățare rapidă, au eșuat lamentabil, motivând decizia printr-un raționament total greșit: „50 de metri e o distanță scurtă, mersul pe jos este mai eficient, economisește combustibil și e mai bun pentru mediu”. În mod ironic, aceste argumente nu aveau nicio legătură cu buna interpretare a situației, ci demonstrau dificultățile acestor sisteme în a înțelege noțiuni de bază ale logicii simple.
Ce adaugă un twist frustrant, dar și comic, este cazul modelelor Sonar și Sonar Pro, dezvoltate de Perplexity. Acestea au dat răspunsul corect, dar motivul a fost complet greșit. Ele au citat studii despre arderea caloriilor în timpul mersului pe jos, argumentând că pentru producția de alimente este nevoie de energie, iar această energie consumată face mersul mai poluant decât condusul pe distanța de 50 de metri. Astfel, deși răspunsul final a fost „merg”, raționamentul utilizat era complet în afara logicalității.
Ce relevă aceste rezultate pentru viitorul AI
Rezultatele acestui experiment demonstrează clar că, în ciuda avansurilor tehnologice, modelele de inteligență artificială se află încă departe de a reproduce complet felul în care gândesc și decid oamenii. În timp ce unele modele pot oferi răspunsuri corecte, fundamentul logic și înțelegerea contextului sunt încă probleme în evoluție.
Specialiștii atrag atenția asupra faptului că, pentru AI, posibilitatea de a face greșeli simple nu este doar o chestiune de programare, ci și un semnal al limitărilor în procesul de învățare și raționament. În plus, aceste rezultate pot avea implicații în domenii critice, precum conducerea autonomă sau diagnosticarea medicală, unde deciziile trebuie să fie nu doar corecte, ci și justificate.
Ultimele evoluții indică faptul că cercetarea în domeniu trebuie să se concentreze tot mai mult pe capacitatea modelelor de a înțelege și de a raționa, nu doar de a procesa cantități uriașe de informații. În timp ce inteligența artificială poate ajunge să semene tot mai mult cu cea umană, aceste mici eșecuri sunt semne clare ale drumului lung încă de parcurs pentru a obține o cu adevărat „inteligență” de nivel superlativ.
