OpenAI lancia i modelli o3 e o3 mini: la nuova era dell’IA “umana” è qui!
OpenAI Annuncia i Nuovi Modelli IA o3
Durante l’ultimo evento “12 Days of OpenAI”, OpenAI ha svelato l’attesissima famiglia di modelli di intelligenza artificiale o3, evoluzione della precedente serie o1, dopo sei mesi di intensiva sperimentazione.
Con la famiglia o3, che include i modelli o3 e o3 mini, ci si attende un notevole avanzamento nelle capacità di ragionamento delle AI.
Performance e Benchmark dei Modelli o3
OpenAI ha fornito dati di benchmark impressionanti riguardo i modelli o3.
Nella valutazione semi-privata ARC-AGI, l’o3 ha raggiunto un punteggio significativo del 75,7%.
Se configurato in un ambiente ad alta capacità di calcolo, questo modello ha toccato un punteggio eccellente dell’87,5%.
Nell’ambito del benchmark EpochAI Frontier Math, l’o3 ha risolto il 25,2% dei problemi, in netta contrapposizione al modesto 2% dei modelli concorrenti.
Per quanto riguarda il test SWE-Bench Verified, l’o3 ha raggiunto un punteggio di 71,7, superando di 22,8 punti l’o1.
Su Codeforces, ha ottenuto un notevole punteggio Elo di 2727.
Prospettive future e opzioni per gli utenti
Nel contesto dell’AIME 2024, l’o3 ha ottenuto un impressionante 96,7%, mentre l’o1 si è fermato all’83,3.
Anche nel GPQA Diamond, l’o3 ha segnato un ottimo 87,7%, rispetto al 78% dell’o1.
Secondo il team ARC, il modello o3 rappresenta una vera e propria evoluzione nel campo della IA, capace di affrontare compiti mai incontrati prima e avvicinandosi a prestazioni umane.
La versione mini del modello offrirà tre livelli di ragionamento: Alto, Medio e Basso.
Con l’uscita prevista per il 2025, OpenAI ha avviato test di sicurezza e protezione per i ricercatori interessati a esplorare questi modelli.