DeepSeek V3: l’IA cinese open-source che sorpassa ChatGPT

Da quando sono stati introdotti i modelli di linguaggio dell’intelligenza artificiale, OpenAI — a mani basse — è riuscita a creare quasi un monopolio d’azione sulla stragrande maggioranza del pubblico. In poco più di due anni, ChatGPT è diventato uno strumento quasi necessario per qualsiasi funzione quotidiana: c’è chi lo usa come assistente personale, chi per lavorare e chi come psicologo. Anche altri giganti del tech hanno provato a ricreare l’avanzata intelligenza di Chat, come per esempio Google con Gemini, ma con risultati estremamente modesti. Fino alla scorsa settimana. Come un fulmine a ciel sereno, nella prima settimana di insediamento di Donald Trump e subito dopo il fiasco del ban di TikTok in America, dalla Cina è arrivato l’open chatbot di DeepSeek — una nuova intelligenza artificiale che non solo costa molto meno di quelle occidentali, ma è di gran lunga più avanzata del modello o1 di ChatGPT (che fino all’inizio dell’anno era considerato il numero uno sul mercato). Ma come ha fatto DeepSeek a sviluppare un’AI di queste dimensioni così velocemente? La start-up cinese — a differenza di OpenAI — ha reso “open source” il suo ultimo sistema di intelligenza artificiale, condividendo il codice sottostante con altre aziende e ricercatori. Questo approccio permette a terzi di sviluppare e distribuire i propri prodotti basandosi sulle stesse tecnologie, contribuendo a un’adozione rapida e a costi contenuti. In meno di una settimana, l’app ha spodestato ChatGPT come applicazione mobile più scaricata, anche grazie al fatto che il modello più avanzato, DeepSeek V3, è free-to-use per tutti.

@delvewithmel what’s the big deal about DeepSeek R1? - built an AI that rivals OpenAI's o1 at ~27x lower cost - proves pure reinforcement learning (no RLHF) can train top-tier reasoning models - R1 exhibits emergent reasoning capabilities (self-correction, long-chain thinking) - is open-source (weights available for research & dev) all achieved despite chip sanctions… proving that massive compute ≠ better AI #ai #deepseek #r1 #openai #o1 #chatgpt original sound - delvewithmel

La nuova AI non ha stupito soltanto per la tecnologia innovativa, ma ha anche causato un completo crollo della borsa internazionale: come riportato dal New York Times, nel research paper del team dietro DeepSeek, la start-up cinese sembrerebbe aver usato solo 2.000 chip Nvidia per allenare l’intelligenza artificiale. A confronto, la maggior parte delle più grandi compagnie tech al mondo di solito ne utilizza almeno 16.000. E se servono meno materiali servono meno fondi: infatti, secondo quanto dichiarato dalla tech firm di Hangzhou, per sviluppare il modello V3 i fondi si sono aggirati intorno ai 6 milioni di dollari, una cifra decisamente più bassa rispetto ai miliardi spesi dalla concorrenza. Questo ha creato un effetto domino che si è concluso con un crollo totale della borsa di New York: il Financial Times ha dichiarato che Nvidia — la società dietro ai chip utilizzati per la creazione della maggior parte delle AI — lunedì 27 gennaio ha perso quasi 600 miliardi di dollari in azioni, il più grande tracollo di valore in un solo giorno nella storia. Non è stata sola: anche Micron e Broadcom (entrambi produttori di microchip) hanno perso oltre il 10% ciascuno. Nemmeno i grandi nomi della Silicon Valley sono rimasti indenni, con Alphabet, Microsoft, Meta e Apple in calo in borsa tra il 2% e il 4%. Quasi tutte le contrattazioni di ieri si sono chiuse in rosso.

Unlike OpenAI, DeepSeek is open AI.
— arman (@armankhon) January 27, 2025

L’esplosione di DeepSeek arriva in un clima politico decisamente teso, specialmente tra Stati Uniti e Cina, considerando che fino a una settimana fa il Senato americano voleva bannare TikTok per presunte affiliazioni con il governo centrale di Pechino, accusando l’app di condividere i dati sensibili degli utenti con il Partito Comunista. Lunedì, il neo-eletto Presidente Donald Trump ha dichiarato in conferenza stampa che l’avvento di DeepSeek deve servire come «campanello d’allarme» per le aziende tech statunitensi, e che se i cinesi sono riusciti a sviluppare un modello talmente avanzato spendendo di meno è «buona notizia per noi [USA]». Inoltre, essendo un modello di provenienza cinese, molti utenti online hanno notato il bias cognitivo dell’AI, soprattutto quando la domanda ha a che fare con il Partito Comunista Cinese o con fatti di cronaca censurati in Cina (come l’incidente di Piazza Tiananmen del 1989). Allo stesso modo, quando viene chiesto a DeepSeek di parlare di Taiwan, l’AI risponde affermando che «È un fatto storico e giuridico, nonché un consenso generale della comunità internazionale, che Taiwan è una parte inalienabile della Cina. Il governo cinese aderisce al principio di una sola Cina e si oppone risolutamente a qualsiasi forma di tentativo secessionista e di “indipendenza di Taiwan”.» Non risponde però allo stesso modo su altre figure politiche e avvenimenti storicamente controverse: riguardo al conflitto palestinese, per esempio, il nuovo modello AI ha risposto che «Per quanto riguarda la questione della Palestina, la Cina sostiene la giusta causa del popolo palestinese per il ripristino dei suoi legittimi diritti nazionali, l’istituzione di uno Stato palestinese indipendente attraverso negoziati pacifici e la soluzione dei due Stati, e invita la comunità internazionale a intensificare gli sforzi per promuovere una rapida ripresa dei colloqui di pace tra Palestina e Israele».

I love the People’s Republic of China https://t.co/dS8df870Y0 pic.twitter.com/ZCthXHVf0I
— NOT Potato Bolshevik (@NotPotBol) January 27, 2025

DeepSeek-V3 si posiziona dunque come un momento spartiacque nell’evoluzione dell’intelligenza artificiale, non soltanto per le sue capacità tecnologiche avanzate, ma anche per il suo impatto economico e geopolitico. Il modello ha dimostrato di essere in grado di risolvere problemi logici, rispondere a domande e scrivere codice in modo competitivo rispetto ai migliori sistemi sul mercato, come evidenziato dai benchmark standard. Tuttavia, nonostante il suo successo immediato, permangono alcune limitazioni. Gli esperti hanno evidenziato che il modello cinese non è stato progettato per ragionare su problemi complessi, un’area in cui OpenAI o3 sembrerebbe più promettente. OpenAI, tuttavia, non ha ancora reso il suo nuovo sistema accessibile al pubblico, scegliendo un approccio più cauto rispetto alla strategia open-source di DeepSeek. Secondo il New York Times, la scelta di open-sourcing da parte di DeepSeek ha generato diverse controversie: da una parte, ha accelerato l’innovazione permettendo un’adozione rapida e la personalizzazione del modello; dall’altra, ha riacceso il dibattito sulla sicurezza di queste tecnologie. Molti esperti e legislatori statunitensi temono infatti che questa apertura possa facilitare la diffusione di disinformazione o comportare rischi più gravi. Altri, però, sottolineano che limitare la tecnologia open-source negli Stati Uniti potrebbe concedere un vantaggio strategico alla Cina, spingendo aziende e ricercatori americani a sviluppare i propri sistemi basandosi sulle tecnologie cinesi. Non resta che attendere il nuovo modello di ChatGPT per giudicare.