Categories: Intelligenza Artificiale

Arthur rilascia uno strumento open source per aiutare le aziende a trovare il miglior LLM per un lavoro

Arthur, una startup di monitoraggio dell'apprendimento automatico, quest'anno ha beneficiato dell'interesse per l'IA generativa e ha sviluppato strumenti per aiutare le aziende a lavorare con gli LLM in modo più efficace.
Oggi sta rilasciando Arthur Bench, uno strumento open source per aiutare gli utenti a trovare il miglior LLM per un particolare set di dati.
Adam Wenchel, CEO e co-fondatore di Arthur, afferma che l'azienda ha riscontrato molto interesse per l'IA generativa e gli LLM, quindi si è impegnata molto nella creazione di prodotti.
Dice che oggi, e ammesso che sia passato meno di un anno dal rilascio di ChatGPT, le aziende non dispongono di un modo organizzato per misurare l'efficacia di uno strumento rispetto a un altro, ed è per questo che hanno creato Arthur Bench.
"Arthur Bench risolve uno dei problemi critici che sentiamo con ogni cliente che è [con tutte le scelte di modello], qual è il migliore per la tua particolare applicazione", ha detto Wenchel a TechCrunch.
Viene fornito con una suite di strumenti che puoi utilizzare per testare metodicamente le prestazioni, ma il valore reale è che ti consente di testare e misurare come si comporteranno i tipi di prompt che i tuoi utenti userebbero per la tua particolare applicazione rispetto a diversi LLM.
Crediti immagine: Arthur "Potresti potenzialmente testare 100 diversi prompt e poi vedere come due diversi LLM – come il modo in cui Anthropic si confronta con OpenAI – sui tipi di prompt che i tuoi utenti probabilmente useranno", ha detto Wenchel.
Inoltre, afferma che puoi farlo su larga scala e prendere una decisione migliore su quale modello è il migliore per il tuo particolare caso d'uso.
Arthur Bench viene rilasciato oggi come strumento open source.
Ci sarà anche una versione SaaS per i clienti che non vogliono affrontare la complessità della gestione della versione open source o che hanno requisiti di test più ampi e sono disposti a pagare per questo.
Ma per ora, Wenchel ha detto che si stanno concentrando sul progetto open source.
Il nuovo strumento arriva sulla scia del rilascio di Arthur Shield a maggio, una sorta di firewall LLM progettato per rilevare allucinazioni nei modelli, proteggendo al contempo da informazioni tossiche e fughe di dati privati.

Commenti

17 Agosto 2023

Chi era Frank Rosenblatt, l’inventore della prima intelligenza artificiale
Frank Rosenblatt e il Perceptron: Le Radici dell'Intelligenza Artificiale Moderna Frank Rosenblatt, uno psicologo e… Read More
AI 2024: Le 13 Tendenze Principali che Modelleranno il Futuro
1. L'Intelligenza Artificiale Generativa: Una Rivoluzione Creativa L'intelligenza artificiale generativa (GenAI) sta trasformando il modo… Read More
ChatGPT: Una Rivoluzione nell’App Store, tra le Top 10 delle App più Scaricate
ChatGPT Stabilisce Nuovi Record nel Mercato delle App La scalata di ChatGPT nell'olimpo delle app… Read More

MediaWorld lancia un nuovo “shop-in-shop” al Bennet di Romagnano Sesia!

```html Nuovo MediaWorld Xpress: Sinergia tra Tecnologia e Spesa Quotidiana Si consolida ulteriormente la fruttuosa…

Ambiente

Nintendo Switch 2: il tour imperdibile nelle gallerie dei centri commerciali italiani dal 20 al 27 luglio!

Nintendo Switch 2: Un Lanciamento Da Record La nuova Nintendo Switch 2 ha fatto un'incredibile…

Google

Google sotto accusa: il legale della CGUE conferma la mega multa da 4,1 miliardi della Commissione Europea!

Google e la Sanzione da 4,1 Miliardi: Il Parere della Corte Europea Google si trova…

This website uses cookies.

Arthur rilascia uno strumento open source per aiutare le aziende a trovare il miglior LLM per un lavoro

Commenti

Related Post

Recent Posts

MediaWorld lancia un nuovo “shop-in-shop” al Bennet di Romagnano Sesia!

Nintendo Switch 2: il tour imperdibile nelle gallerie dei centri commerciali italiani dal 20 al 27 luglio!

Google sotto accusa: il legale della CGUE conferma la mega multa da 4,1 miliardi della Commissione Europea!