Durante l’ultimo evento “12 Days of OpenAI”, OpenAI ha svelato l’attesissima famiglia di modelli di intelligenza artificiale o3, evoluzione della precedente serie o1, dopo sei mesi di intensiva sperimentazione.
Con la famiglia o3, che include i modelli o3 e o3 mini, ci si attende un notevole avanzamento nelle capacità di ragionamento delle AI.
OpenAI ha fornito dati di benchmark impressionanti riguardo i modelli o3.
Nella valutazione semi-privata ARC-AGI, l’o3 ha raggiunto un punteggio significativo del 75,7%.
Se configurato in un ambiente ad alta capacità di calcolo, questo modello ha toccato un punteggio eccellente dell’87,5%.
Nell’ambito del benchmark EpochAI Frontier Math, l’o3 ha risolto il 25,2% dei problemi, in netta contrapposizione al modesto 2% dei modelli concorrenti.
Per quanto riguarda il test SWE-Bench Verified, l’o3 ha raggiunto un punteggio di 71,7, superando di 22,8 punti l’o1.
Su Codeforces, ha ottenuto un notevole punteggio Elo di 2727.
Nel contesto dell’AIME 2024, l’o3 ha ottenuto un impressionante 96,7%, mentre l’o1 si è fermato all’83,3.
Anche nel GPQA Diamond, l’o3 ha segnato un ottimo 87,7%, rispetto al 78% dell’o1.
Secondo il team ARC, il modello o3 rappresenta una vera e propria evoluzione nel campo della IA, capace di affrontare compiti mai incontrati prima e avvicinandosi a prestazioni umane.
La versione mini del modello offrirà tre livelli di ragionamento: Alto, Medio e Basso.
Con l’uscita prevista per il 2025, OpenAI ha avviato test di sicurezza e protezione per i ricercatori interessati a esplorare questi modelli.
Google e l'Impatto Rivoluzionario della Sua IA Gemini Google continua a stupire il mondo dell'intelligenza…
Esplorando il Potenziale Fotografico dello Xiaomi 14T in Corea del Sud Nel mondo moderno, sempre…
Friggitrici ad Aria: Miti e Realtà Troviamo utile chiarire subito un malinteso comune: le friggitrici…
This website uses cookies.