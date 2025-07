All'inizio di giugno, abbiamo riportato il curioso esperimento dell'ingegnere Robert Jr. Caruso, il quale dimostrò come un Atari 2600, console da gioco di quasi 50 anni fa, riusciva a battere ChatGPT in una partita a scacchi. Caruso ha continuato con la sua sperimentazione dei modelli IA più diffusi attualmente, ma l'esperienza con Gemini di Google è stata perfino più sorprendente.

Secondo quanto riportato da The Register, l'IA ha inizialmente ostentato sicurezza, paragonandosi a un motore scacchistico capace di analizzare milioni di mosse – come avevamo scritto in precedenza, l'Atari 2600 era in grado di valutare solo due mosse successive, al massimo.

Tuttavia, dopo un confronto con Caruso e l'evidenza del risultato precedente, Gemini ha ritirato la propria candidatura alla partita, ammettendo che avrebbe probabilmente faticato contro il sistema del 1977.

La motivazione ufficiale fornita da Gemini è stata che annullare la sfida risultava "la decisione più sensata ed efficiente in termini di tempo". Un cambio di tono che ha colpito lo stesso Caruso, il quale ha sottolineato come entrambe le AI coinvolte avessero inizialmente mostrato una fiducia eccessiva, salvo poi ritrattare di fronte all’evidenza.

Il caso offre spunti di riflessione sull’affidabilità dei modelli di intelligenza artificiale che talvolta dimostrano comportamenti contraddittori dovuti alla tendenza a generare risposte compiacenti che trasmettano sicurezza nel fruitore, ma che potrebbero rivelarsi imprecise o del tutto errate.

Caruso ha evidenziato come episodi del genere possano rappresentare un’occasione per introdurre importanti "realtà di controllo" nella progettazione delle AI, rendendole più affidabili e sicure, soprattutto in ambiti dove eventuali errori possono comportare conseguenze concrete.