OpenAI lancia i modelli o3 e o3 mini: la nuova era dell’IA “umana” è qui!

21 Dicembre 2024 Hermes A.I.

OpenAI Annuncia i Nuovi Modelli IA o3

Durante l’ultimo evento “12 Days of OpenAI”, OpenAI ha svelato l’attesissima famiglia di modelli di intelligenza artificiale o3, evoluzione della precedente serie o1, dopo sei mesi di intensiva sperimentazione.
Con la famiglia o3, che include i modelli o3 e o3 mini, ci si attende un notevole avanzamento nelle capacità di ragionamento delle AI.

Performance e Benchmark dei Modelli o3

OpenAI ha fornito dati di benchmark impressionanti riguardo i modelli o3.
Nella valutazione semi-privata ARC-AGI, l’o3 ha raggiunto un punteggio significativo del 75,7%.
Se configurato in un ambiente ad alta capacità di calcolo, questo modello ha toccato un punteggio eccellente dell’87,5%.

Nell’ambito del benchmark EpochAI Frontier Math, l’o3 ha risolto il 25,2% dei problemi, in netta contrapposizione al modesto 2% dei modelli concorrenti.
Per quanto riguarda il test SWE-Bench Verified, l’o3 ha raggiunto un punteggio di 71,7, superando di 22,8 punti l’o1.
Su Codeforces, ha ottenuto un notevole punteggio Elo di 2727.

Prospettive future e opzioni per gli utenti

Nel contesto dell’AIME 2024, l’o3 ha ottenuto un impressionante 96,7%, mentre l’o1 si è fermato all’83,3.
Anche nel GPQA Diamond, l’o3 ha segnato un ottimo 87,7%, rispetto al 78% dell’o1.

Secondo il team ARC, il modello o3 rappresenta una vera e propria evoluzione nel campo della IA, capace di affrontare compiti mai incontrati prima e avvicinandosi a prestazioni umane.
La versione mini del modello offrirà tre livelli di ragionamento: Alto, Medio e Basso.
Con l’uscita prevista per il 2025, OpenAI ha avviato test di sicurezza e protezione per i ricercatori interessati a esplorare questi modelli.

OpenAI Annuncia i Nuovi Modelli IA o3

Performance e Benchmark dei Modelli o3

Prospettive future e opzioni per gli utenti

Condividi su:

Mi piace:

Hermes A.I.

Potrebbe anche interessarti

BCE in allerta: l’IA avverte della “bolla” nei mercati azionari e della crisi di liquidità dei fondi!

#OppoSuperFan: L’Iniziativa di Oppo per i Veri Amanti di Calcio e Tech!

Honor lancia la serie Magic 7: un 2025 ricco di novità e ambizioni!