Nei laboratori di Pechino emerge un chip che sfida le regole dell'intelligenza artificiale
All'interno dei laboratori della capitale cinese, un processore dall'aspetto discreto ma dalla natura rivoluzionaria mette in discussione l'assunto secondo cui l'intelligenza artificiale debba necessariamente divorare enormi quantità di elettricità per evolversi.
Questo chip sperimentale dell'Università di Pechino abbandona la tradizionale logica binaria e recupera un approccio più antico e analogico al calcolo. La promessa? IA più veloce che consuma appena una frazione dell'energia richiesta dalle migliori GPU attualmente disponibili.
L'approccio analogico cinese per superare i limiti energetici dell'intelligenza artificiale
Nell'ultimo decennio, i progressi dell'IA sono stati sostenuti da data center sempre più grandi, stipati di processori grafici che divorano energia. Ogni nuovo modello richiede più silicio, più sistemi di raffreddamento e più elettricità rispetto al precedente.
Il team cinese dietro questo nuovo processatore sostiene che questa traiettoria stia raggiungendo un punto critico. Secondo loro, il processore analogico esegue determinate operazioni 12 volte più velocemente rispetto ai chip digitali avanzati, utilizzando circa un duecentesimo dell'energia.
Un chip per l'IA contemporaneamente più veloce ed efficiente di 200 volte non si limiterebbe a ridurre le bollette; riscriverebbe l'economia del calcolo su larga scala.
La ricerca, guidata dallo scienziato Sun Zhong presso l'Università di Pechino e pubblicata su Nature Communications, non mira a sostituire completamente i processori digitali. L'obiettivo è invece ottimizzare alcune delle operazioni matematiche più energivore al centro dell'IA moderna.
Cosa significa "analogico" quando il tuo smartphone è completamente digitale
Prima che l'elettronica digitale dominasse il panorama, gli ingegneri costruivano computer analogici utilizzando tensioni, correnti e assi rotanti per modellare sistemi fisici. Erano ingombranti e limitati, ma sorprendentemente efficaci per compiti specifici come calcoli balistici o sistemi di controllo.
Il nuovo chip cinese rivisita questa eredità con materiali moderni e circuiti su scala nanometrica.
Come differisce il calcolo analogico dal tuo portatile
I chip digitali rappresentano tutte le informazioni come sequenze di zeri e uni. Ogni operazione viene suddivisa in numerosi piccoli passaggi, eseguiti sequenzialmente attraverso porte logiche.
- Un processore digitale scompone ogni calcolo in operazioni scandite dal clock ed ordinate.
- Un circuito analogico utilizza segnali elettrici continui, permettendo alla natura di realizzare molteplici operazioni simultaneamente.
In un chip analogico per l'IA, i valori sono codificati come tensioni o correnti. Quando questi segnali attraversano una rete progettata con cura di componenti, la fisica del circuito esegue i calcoli in un singolo passaggio.
Questo parallelismo, combinato con l'assenza della necessità di commutare miliardi di transistor individuali ad ogni fase, spiega i drastici risparmi energetici.
Perché l'analogico è passato di moda per poi tornare
Le macchine analogiche classiche caddero in disuso perché difficili da programmare, complicate da riconfigurare e soggette a rumore e deriva. I sistemi digitali, al contrario, si sono sviluppati magnificamente seguendo la Legge di Moore e hanno garantito risultati precisi e ripetibili.
Diverse tendenze stanno ora alterando questo equilibrio:
- La scalabilità dei transistor sta mostrando rendimenti decrescenti, rendendo meno attraente la forza bruta digitale.
- I carichi di lavoro dell'IA tollerano piccoli errori numerici, adattandosi alla natura imperfetta dell'analogico.
- Nuove tecniche di fabbricazione migliorano la stabilità e la calibrazione dei circuiti analogici.
Il chip dell'Università di Pechino si posiziona esattamente in questa intersezione: scambia un po' di precisione numerica per enormi vantaggi in velocità ed efficienza nelle attività tipiche dell'IA.
Un chip progettato per carichi di lavoro IA reali, non solo equazioni da laboratorio
Molti prototipi analogici del passato sono rimasti confinati a problemi "giocattolo". Questo mira a dati del mondo reale. I ricercatori lo hanno testato su sistemi di raccomandazione, un'applicazione di riferimento per i giganti di internet.
Pensa agli algoritmi che Netflix, Amazon o TikTok utilizzano per suggerire cosa potresti voler guardare, acquistare o scorrere. Dietro le quinte, elaborano enormi matrici con cronologie utenti e attributi dei contenuti. Questo tipo di carico è estremamente esigente sia in termini di memoria che di calcolo.
In queste attività di raccomandazione, il chip analogico cinese ha elaborato set di dati paragonabili per dimensione a quelli utilizzati da piattaforme commerciali. Ha fornito risultati molto più rapidamente rispetto all'hardware digitale avanzato, riducendo il consumo energetico a una frazione minuscola.
Il team ha anche sperimentato la compressione delle immagini. In questo ambito, il chip ha ricostruito immagini compresse con una qualità visiva vicina a quella dei metodi digitali convenzionali ad alta precisione, dimezzando i requisiti di archiviazione nei casi di test.
Spesso l'IA non necessita di aritmetica perfetta; necessita di risultati "sufficientemente buoni", in modo rapido ed economico – e i circuiti analogici prosperano in questo regime.
Il trucco matematico nascosto: fattorizzazione di matrici non negative
Al centro di questo progresso si trova una tecnica dal nome poco elegante: fattorizzazione di matrici non negative, o NMF.
Cosa fa realmente la NMF
Immagina di avere un enorme foglio di calcolo di numeri – utenti e film, clienti e prodotti, pixel e livelli di luminosità. La NMF tenta di scomporre quella grande matrice in due più piccole che sono più facili da interpretare, con il vincolo che tutti i valori rimangano non negativi.
Questo rivela schemi nascosti:
- Nelle raccomandazioni, può scoprire "gusti" o "temi" sottostanti.
- Nelle immagini, può separare un'immagine in blocchi base o caratteristiche.
- Nell'audio, può separare i suoni in sorgenti, come note o strumenti.
In hardware digitale, la NMF è computazionalmente pesante, soprattutto quando i set di dati hanno milioni di voci. Può richiedere migliaia o milioni di aggiornamenti iterativi per una singola analisi.
Il team cinese ha integrato queste operazioni di NMF direttamente nel circuito analogico, utilizzando un layout "in-memory" in cui gli stessi componenti archiviano ed elaborano dati. In pratica, la matematica matriciale avviene in un'unica operazione fisica, invece che in una lunga sequenza di istruzioni.
Calcolo in-memory: eliminare il congestionamento del traffico dati
Uno dei maggiori colli di bottiglia nell'IA moderna non è la potenza di calcolo grezza, ma il trasporto interminabile di dati tra chip di memoria e processori. Ogni viaggio spreca tempo ed energia e genera calore.
Il calcolo in-memory riorganizza il sistema affinché la maggior parte dei calcoli avvenga dove i dati già risiedono. Il chip analogico NMF adotta questa filosofia: array di elementi simili a memoria eseguono operazioni mentre le correnti li attraversano.
| Architettura | Dove risiedono i dati | Dove avviene la matematica | Profilo energetico |
|---|---|---|---|
| GPU tradizionale | Memoria esterna ed interna al chip | Core digitali separati | Elevato, per movimento costante di dati |
| Chip analogico NMF | All'interno di array analogici | Negli stessi array, tramite fisica | Basso, movimento minimo di dati |
Questo riprogettazione non risolve tutte le sfide dell'IA, ma attacca la parte più critica dell'addestramento e dell'inferenza su larga scala: il traffico di memoria.
Come si confronta con hardware di livello Nvidia
La GPU Nvidia H100 è diventata un simbolo dell'attuale ondata di IA. Può eseguire trilioni di operazioni al secondo, ma consuma anche centinaia di watt per chip e spesso opera in rack che consumano decine di kilowatt.
Il team dell'Università di Pechino stima che, per attività del tipo NMF, il loro design analogico possa essere almeno un ordine di grandezza più veloce di queste GPU, utilizzando un duecentesimo della potenza. Alcune proiezioni nei materiali dell'università arrivano a suggerire incrementi di velocità di 1.000 volte in configurazioni specifiche, sebbene questi numeri vengano con molte precisazioni.
Significativamente, questi confronti si applicano a una classe ristretta di carichi di lavoro. I chip digitali general purpose continuano a vincere in flessibilità, precisione ed ecosistemi software maturi. Il chip analogico sembra più un acceleratore specializzato che potrebbe coesistere con CPU e GPU nei futuri data center.
Se le GPU digitali sono camion che trasportano qualsiasi cosa, gli acceleratori analogici sono treni ad alta velocità costruiti per una linea e un carico specifici.
Utilizzi potenziali e impatto nel mondo reale
Dove questo tipo di chip potrebbe fare la differenza per primo
Diversi settori si distinguono come primi beneficiari se la tecnologia si espande oltre il laboratorio:
- Piattaforme di streaming e social network – Raccomandazioni più veloci ed economiche per video, musica e feed.
- Telecomunicazioni e reti edge – IA locale in stazioni base o router con budget energetici ristretti.
- Monitoraggio industriale – Rilevamento di pattern in flussi di sensori senza grande raffreddamento sul posto.
- Imaging sanitario – Compressione e analisi dove gli ospedali non possono ospitare grandi data center.
Per gli operatori di data center, un guadagno di efficienza di 200 volte in alcuni carichi di lavoro potrebbe ridurre bollette elettriche e infrastrutture di raffreddamento. Per regioni che cercano di espandere la capacità di IA senza sovraccaricare le reti elettriche, questo conta tanto quanto le prestazioni grezze.
Rischi e ostacoli pratici
La tecnologia affronta anche barriere serie:
- Rumore e precisione – I circuiti analogici captano interferenze e derivano con la temperatura, il che può danneggiare l'accuratezza.
- Complessità di fabbricazione – Fabbricare e calibrare grandi array analogici su scala è difficile.
- Modello di programmazione – I programmatori sono abituati a codice digitale, non a configurare array fisici.
- Standardizzazione – Ogni design analogico è altamente specializzato, il che rallenta la crescita dell'ecosistema.
C'è anche un'angolazione geopolitica. Una classe domestica di acceleratori di IA, meno dipendente da produttori di chip occidentali, si inserisce nella spinta della Cina verso l'autonomia nei semiconduttori e nell'IA. Questo può accelerare finanziamenti e adozione, anche se la tecnologia rimane di nicchia inizialmente.
Cosa significa questo per il futuro dell'hardware di IA
Il chip analogico NMF non segna la fine del calcolo digitale. Invece, illustra uno spostamento verso architetture più diversificate, adattate a kernel matematici specifici.
Potremmo presto vedere sistemi di IA che mescolano:
- CPU general purpose per logica di controllo.
- GPU o acceleratori digitali per addestrare grandi reti neurali.
- Array analogici in-memory per fattorizzazione di matrici, blocchi di attenzione o pattern ricorrenti.
Per gli utenti quotidiani, l'effetto può emergere in modo discreto: raccomandazioni più intelligenti su dispositivi a basso consumo, funzionalità di IA su smartphone più economici, o servizi cloud che smettono di aumentare i prezzi solo per pagare la bolletta elettrica.
Per i decisori politici che affrontano l'impronta di carbonio dell'IA, l'idea che trucchi analogici "vecchio stile" possano ridurre il consumo energetico di due ordini di grandezza offre una rara nota positiva in un settore generalmente definito da una crescita implacabile sia in potenza che in domanda.












