Dopo ChatGPT, Gemini alza bandiera bianca: Atari 2600 è il re degli scacchi

Dopo ChatGPT, Gemini alza bandiera bianca: Atari 2600 è il re degli scacchi

Dopo aver mostrato una certa sicurezza nell'affrontare la sfida, Gemini si è rifiutato di giocare a scacchi a causa della sconfitta di ChatGPT. L'IA di Google, verificato il fallimento di ChatGPT contro un Atari 2600, ha ritenuto più saggio ritirarsi

di pubblicata il , alle 12:41 nel canale Videogames
Intelligenza Artificiale
 

All'inizio di giugno, abbiamo riportato il curioso esperimento dell'ingegnere Robert Jr. Caruso, il quale dimostrò come un Atari 2600, console da gioco di quasi 50 anni fa, riusciva a battere ChatGPT in una partita a scacchi. Caruso ha continuato con la sua sperimentazione dei modelli IA più diffusi attualmente, ma l'esperienza con Gemini di Google è stata perfino più sorprendente.

Secondo quanto riportato da The Register, l'IA ha inizialmente ostentato sicurezza, paragonandosi a un motore scacchistico capace di analizzare milioni di mosse – come avevamo scritto in precedenza, l'Atari 2600 era in grado di valutare solo due mosse successive, al massimo.

Tuttavia, dopo un confronto con Caruso e l'evidenza del risultato precedente, Gemini ha ritirato la propria candidatura alla partita, ammettendo che avrebbe probabilmente faticato contro il sistema del 1977.

La motivazione ufficiale fornita da Gemini è stata che annullare la sfida risultava "la decisione più sensata ed efficiente in termini di tempo". Un cambio di tono che ha colpito lo stesso Caruso, il quale ha sottolineato come entrambe le AI coinvolte avessero inizialmente mostrato una fiducia eccessiva, salvo poi ritrattare di fronte all’evidenza.

Il caso offre spunti di riflessione sull’affidabilità dei modelli di intelligenza artificiale che talvolta dimostrano comportamenti contraddittori dovuti alla tendenza a generare risposte compiacenti che trasmettano sicurezza nel fruitore, ma che potrebbero rivelarsi imprecise o del tutto errate.

Caruso ha evidenziato come episodi del genere possano rappresentare un’occasione per introdurre importanti "realtà di controllo" nella progettazione delle AI, rendendole più affidabili e sicure, soprattutto in ambiti dove eventuali errori possono comportare conseguenze concrete.

10 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Mo4218 Luglio 2025, 13:04 #1
Caruso ha evidenziato come episodi del genere possano rappresentare un’occasione per introdurre importanti "realtà di controllo" nella progettazione delle AI, rendendole più affidabili e sicure, soprattutto in ambiti dove eventuali errori possono comportare conseguenze concrete.

Tradotto in parole povere: la bolla sta per scoppiare.

Nessuno mette in dubbio che in futuro le mancanze dell'IA verranno colmate, ma questo "global push" improvviso si sta rivelando essere davvero un passo più lungo della gamba al quale eserciti di boccaloni hanno dato retta.
Bastava avere un pizzico di sale in zucca per capirlo.
Notturnia18 Luglio 2025, 13:35 #2
a queste ignoranti IA (Ignorant+Artificial ? :-D) non riesco ancora a far disegnare un triangolo rettangolo facendogli mettere l'ipotenusa per base.. non mi stupisce che non sappiano giocare a scacchi
omerook18 Luglio 2025, 13:45 #3
E deep blue cosa era un pallottoliere?
Max Power18 Luglio 2025, 13:46 #4
In alcuni contesti l'IA ha un valore...in altri al momento una puttanata
barzokk18 Luglio 2025, 13:54 #5
Originariamente inviato da: Notturnia
a queste ignoranti IA (Ignorant+Artificial ? :-D) non riesco ancora a far disegnare un triangolo rettangolo facendogli mettere l'ipotenusa per base.. non mi stupisce che non sappiano giocare a scacchi

chatgpt
e dire che qualche giorno fa c'ero riuscito a farglielo fare

1° tentativo

Link ad immagine (click per visualizzarla)
barzokk18 Luglio 2025, 13:54 #6
barzokk18 Luglio 2025, 13:56 #7
Gnubbolo18 Luglio 2025, 14:43 #8
e si pi pu pa pem pum pa pepepe pupu pepe pipi pa pu
parole a caso come al solito..

quindi Alpha Zero che impara a giocare a scacchi in 4 ore, batte un grande maestro dopo 9 ore, batte Stockfish 8* è una invenzione della stampa.


deep blue era forza bruta, di base gli stessi algoritmi dell'Atari, dotato come tutti gli algoritmi dagli anni 60 in su di una biblioteca di aperture per iniziare il gioco, ma parallelizzati per funzionare su un mainstream con centinaia di cpu.
non era AI.

*anche questo forza bruta come il software per Deep Blue, ma rinforzato con AI.
Notturnia18 Luglio 2025, 15:06 #9
Originariamente inviato da: barzokk


se vuoi terrorizzarlo digli che i due cateti non sono uguali e che volevi che nel disegno fosse un triangolo rettangolo ma NON isoscele



ho visto che con la geometria lo si mette in crisi facilmente
che motore di chatGPT stai usando ?
barzokk18 Luglio 2025, 15:28 #10
Originariamente inviato da: Notturnia
se vuoi terrorizzarlo digli che i due cateti non sono uguali e che volevi che nel disegno fosse un triangolo rettangolo ma NON isoscele



ho visto che con la geometria lo si mette in crisi facilmente
che motore di chatGPT stai usando ?

sono loggato con un account, gliel'ho chiesto:

che versione sei ?
ChatGPT said:
Stai parlando con ChatGPT basato su GPT-4, con capacità di visione e generazione grafica. Se stai usando ChatGPT Plus, probabilmente stai usando GPT-4-turbo, una versione ottimizzata di GPT-4, più veloce ed efficiente.

quindi direi la 4

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^