La scorsa settimana, Nvidia Corp. (NASDAQ:NVDA) ha presentato in sordina un nuovo modello di IA, Llama-3.1-Nemotron-70B-Instruct, che, secondo quanto riferito, ha superato la concorrenza nei test di benchmark.
Cosa è successo
L’ultimo modello di IA di Nvidia ha mostrato una notevole efficienza e prestazioni, nonostante abbia meno parametri.
Il modello Nemotron-70B, costruito sul framework META Llama 3.1 di Meta Platforms Inc. (NASDAQ:META), ha superato modelli più grandi nei test di benchmark, ottenendo un punteggio di 85,0 in Arena Hard, 57,6 in AlpacaEval 2 LC e 8,98 in GPT-4-Turbo MT-Bench.
Le prestazioni superiori del modello in questi test indicano la sua capacità di produrre risposte simili a quelle umane in query generali e applicazioni di codifica.
L’azienda guidata da Jensen Huang ha anche reso il modello Nemotron-70B open-source, rilasciandolo sulla piattaforma della community IA, Hugging Face.
Questa iniziativa consente agli sviluppatori di modificare il modello in base alle proprie esigenze, migliorando ulteriormente la ricerca e lo sviluppo di applicazioni IA.
Il modello è ora disponibile in anteprima sul sito ufficiale di Nvidia, rendendolo più accessibile al pubblico.
Our Llama-3.1-Nemotron-70B-Instruct model is a leading model on the 🏆 Arena Hard benchmark (85) from @lmarena_ai.
Arena Hard uses a data pipeline to build high-quality benchmarks from live data in Chatbot Arena, and is known for its predictive ability of Chatbot Arena Elo… pic.twitter.com/HczLQQ6EOp
— NVIDIA AI Developer (@NVIDIAAIDev) October 15, 2024
Perché è importante
Il lancio di questo nuovo modello di IA sottolinea la crescente influenza di NVIDIA nello spazio del software per l’IA, che si discosta dalla sua tradizionale focalizzazione sulle GPU ad alte prestazioni.
L’enfasi posta dall’azienda sull’efficienza e sull’accessibilità suggerisce un cambiamento strategico volto a rendere l’IA avanzata più applicabile agli sviluppatori e alla community generale dell’IA.
All’inizio di questo mese, il CEO di Nvidia ha elogiato OpenAI, società madre di ChatGPT, come una delle aziende più influenti dell’era attuale in un episodio di Bg2 Pod.
Inoltre, l’ultimo annuncio arriva tra le difficoltà di produzione dei suoi chip Blackwell, che non dovrebbero essere disponibili prima dell’inizio del 2025.
Per ulteriori aggiornamenti su questo argomento, aggiungi Benzinga Italia ai tuoi preferiti oppure seguici sui nostri canali social: X e Facebook.
Ricevi informazioni esclusive sui movimenti di mercato 30 minuti prima degli altri trader
La prova gratuita di 14 giorni di Benzinga Pro, disponibile solo in inglese, ti permette di accedere ad informazioni esclusive per poter ricevere segnali di trading utilizzabili prima di milioni di altri trader. CLICCA QUI per iniziare la prova gratuita.