La startup di Hangzhou sfida i giganti con risorse limitate e una visione open source che privilegia l’efficienza e l’apertura. E sta mettendo paura a Wall Street, dove le Big Tech stanno perdendo terreno
Nonostante il clamore suscitato in queste ore dal modello DeepSeek R1, la startup cinese che lo ha sviluppato rimane poco conosciuta al grande pubblico. Con sede a Hangzhou, DeepSeek è stata fondata nel luglio 2023 da Liang Wenfeng, un ex studente dell’Università di Zhejiang con una formazione in ingegneria dell’informazione ed elettronica.
L’azienda è stata incubata da High-Flyer, un hedge fund creato dallo stesso Liang nel 2015. L’obiettivo dichiarato è ambizioso: sviluppare un’intelligenza artificiale generale (AGI), capace di competere e superare gli esseri umani in una vasta gamma di compiti. Una visione, questa, che a molti ricorderà quella di Sam Altman.
PRIMA DELLE RESTRIZIONI
L’addestramento di modelli linguistici di grandi dimensioni (LLM) richiede una combinazione di competenze avanzate e risorse computazionali significative. Come sappiamo, le restrizioni imposte dagli Stati Uniti all’esportazione di semiconduttori avanzati hanno complicato non poso la vita alle aziende cinesi di intelligenza artificiale. Liang ha però affrontato questa sfida preparandosi con largo anticipo: prima dell’introduzione delle sanzioni, High-Flyer ha accumulato una considerevole riserva di chip Nvidia A100, attualmente vietati per l’esportazione in Cina…
Il presente articolo è stato redatto da FinanciaLounge.com.