Kinas hemliga teknik använder 200 gånger mindre energi än chips – Pasta Party

Medan datacenter sväller och elräkningar exploderar, knuffar Kina tyst tillbaka en bortglömd beräkningsmetod i rampljuset.

Ingenjörer i Beijing jobbar på ett chip som inte tänker i bitar, utan i spänningar och strömmar. Ingen klassisk logik, utan fysik som räknar direkt. Tillvägagångssättet lät föråldrat i decennier. Nu verkar det plötsligt exakt anpassat till den moderna AI:ns energihunger.

Ett analogt AI-chip som förbrukar 200 gånger mindre energi

Forskare från Peking University har presenterat ett nytt AI-chip som bryter radikalt med den digitala standarden. Resultaten överraskar även inom den akademiska världen.

  • Upp till 12 gånger snabbare än avancerade digitala processorer
  • Upp till 200 gånger lägre energiförbrukning för samma uppgift
  • Designat för verkliga AI-applikationer, inte bara laboratoriestunt

Genom att räkna direkt i minnet undviker chippet den kostsamma pendlingen av data mellan minne och beräkningskärna och låter fysiken själv utföra arbetet.

Medan GPU:er som Nvidias H100 slukar megawatt i stora serverhallar, siktar detta analoga chip mot extremt effektiva beräkningar i kompakt format. Det sätter press på den nuvarande modellen av ”fler och fler datacenter, mer och mer ström”.

Tillbaka till analogt: beräkning som på 60-talet, fast smart

Vad gör en analog dator så annorlunda?

Före mikroprocessorns revolution använde ingenjörer redan analoga datorer. De representerade inte tal som långa rader av nollor och ettor, utan som kontinuerliga storheter: en spänning på en ledning, en ström i en krets.

Digitala chip arbetar steg för steg. Varje beräkning delas upp i elementära instruktioner som processorn hanterar sekventiellt. Tillvägagångssättet är flexibelt och pålitligt, men kostar många växlingar och energi.

Analoga kretsar fungerar fundamentalt annorlunda. Ett nätverk av komponenter utför i ett enda fysiskt tillstånd omedelbart en hel beräkning. Parallellismen ligger inte i mjukvaran, utan i naturlagarna själva.

  • Digital AI: många instruktioner, många dataförflyttningar, hög precision
  • Analog AI: en fysisk process, få dataförflyttningar, begränsad men ofta ”tillräcklig” precision

Länge gällde det som opraktiskt: för mycket brus, svårt att kontrollera, besvärligt att programmera. Tack vare nya material, stabilare komponenter och smart felkorrigering får dessa tvivel en annan tyngd. Där AI-modeller inte behöver perfekt precision blir nackdelarna mindre än fördelarna.

In-memory computing: där data står räknas det genast

Det nya kinesiska chippet bygger vidare på idén om ”in-memory computing”. Istället för att skicka data fram och tillbaka mellan minne och processor utför minnet själv beräkningen.

För AI-uppgifter innebär det: en modells vikter finns i minnet som fysiska värden, och räkneoperationen sker genom att helt enkelt anlägga en spänning. Resultatet kommer ut som en annan spänning eller ström, utan tusentals digitala instruktioner.

Varje undviken förflyttning av data sparar inte bara tid, utan också värme, kylning och i slutändan pengar på elräkningen.

Från matematiskt trick till fysisk operation

NMF: en kärnteknik inbakad i kiselskivan

Centralt i det kinesiska chippet står en matematisk metod: Non-negative Matrix Factorisation (NMF). Den delar upp en stor tabell med enbart positiva värden i två mindre, enklare tabeller. Det låter abstrakt, men i praktiken utgör det ryggraden i många dataapplikationer.

Exempel där NMF spelar en roll:

  • Rekommendationssystem för video och musik
  • Bildkomprimering och brusreducering
  • Ämnesmodeller för texter och sökningar
  • Medicinsk bildanalys, såsom MR-skanningar

På digital hårdvara kostar NMF mycket beräkningskraft, särskilt när miljoner användare eller pixlar är inblandade. Chippet från Beijing gjuter NMF direkt i en analog krets. Faktoriseringen sker i en fysisk process istället för tusentals digitala steg.

Därmed skjuts en besvärlig mjukvaruuppgift över till en sorts ”fysisk genväg”. Chippets komponenter, ofta memristorer eller liknande minneselement, representerar matrixelement som ledningsvärden. Multiplikation och summor sker genom strömmar som fördelar sig enligt Ohms och Kirchhoffs lagar.

Från teori till användningsscenarier: rekommendationer och bilder

Forskarna testade chippet med dataset som liknar dem från plattformar som Netflix eller Yahoo. Användarprofiler, preferenser, tittarbeteende: allt data som lämpar sig väl för NMF. Det analoga chippet uppnådde en jämförbar kvalitet på rekommendationer, men med en bråkdel av energiförbrukningen.

Vid bildbehandling utförde de komprimeringsuppgifter. Chippet minskade datamängden med ungefär hälften, medan den visuella kvaliteten förblev nära exakt digital komprimering. För konsumenter innebär en sådan approach senare möjligen streaming i hög kvalitet på enheter med små batterier eller kameror som fungerar mycket smartare lokalt.

En AI-modell behöver inte alltid spotta ut exakt samma bitar som sin digitala motsvarighet, så länge rekommendationen, diagnosen eller bildkvaliteten förblir övertygande.

Varför dagens AI förbränner så mycket energi

GPU:er sitter fast i datatrafiken

Att stora modeller kräver mycket beräkningskraft är välkänt. Mindre synligt är att flaskhalsen ofta inte är den råa beräkningshastigheten, utan den konstanta transporten av data.

En typisk GPU laddar in datablock från minnet, bearbetar dem, skriver resultat tillbaka och upprepar det miljoner gånger. Varje cykel kräver tid och energi. Med modeller med miljarder parametrar springer det iväg.

Därtill kommer kylningen. Värmen dessa chip producerar tvingar datacenter till dyra kylinstallationer och komplexa designer. Energi förbrukas alltså dubbelt: först i själva chippet, sedan i infrastrukturen runt chippet.

Analoga in-memory-arkitekturer vänder logiken på huvudet. Där digitala chip slänger data fram och tillbaka räknar det analoga chippet exakt på platsen där informationen är lagrad. Det reducerar energin per operation drastiskt och skär samtidigt behovet av kraftig kylning.

Konsekvenser för Kina, Europa och AI-industrin

Strategisk timing för Peking

Kina kämpar med exportrestriktioner på avancerade GPU:er och kompenserar rikligt med egen forskning i alternativ hårdvara. Ett analogt AI-chip som i vissa scenarier verkar snabbare och effektivare än västerländska digitala konkurrenter ger ett geopolitiskt trumfkort.

Dessutom passar tekniken in i den kinesiska ambitionen att styra industrins energiförbrukning strängare. Datacenter i landet växer snabbt; ett effektivare hårdvarulager kan här tjäna som argument gentemot tillsynsmyndigheter och lokala myndigheter.

Aspekt Digitalt AI-chip (GPU) Analogt AI-chip (Peking)
Beräkningsprincip Binär logik, sekventiella instruktioner Fysiska processer, parallellt genom kretsen
Dataförflyttning Intensiv fram och tillbaka mellan minne och beräkningskärna Beräkning i själva minnet
Energiförbrukning Hög, mycket värme och kylning nödvändigt Upp till 200x lägre för bestämda uppgifter
Precision Mycket hög, användbar för generella uppgifter Begränsad, men tillräcklig för många AI-applikationer

Möjligheter och risker för europeiska aktörer

För europeiska företag och forskningscentra öppnar detta en obehaglig fråga: fortsätter man satsa på klassiska GPU:er, eller rör man sig mot hybrida och analoga lösningar?

Europa besitter expertis i nisch-chipdesign, energieffektiv elektronik och fotonik. Dessa domäner kopplar väl till analog och in-memory computing. De som nu satsar på applikationer som medicinsk AI, smarta fabriker eller edge-tillämpningar i städer kan dra nytta av samarbete med liknande initiativ eller egna varianter av denna typ av chip.

Samtidigt uppstår nya risker. Analoga kretsar reagerar känsligt på temperatur, åldring och produktionsvariationer. Pålitlig kalibrering och övervakning blir avgörande ämnen. Även mjukvarustacken – från programmeringsspråk till ramverk – står fortfarande i sin linda. Företag som migrerar för snabbt utan mogen verktygslåda springer på integrationsproblem.

Vad denna utveckling konkret kan innebära

Tillämpningar utanför de stora datacentren

Mest uppmärksamhet går nu till enorma AI-modeller i molnet, men just mindre, riktade applikationer kan först dra nytta av analoga chip:

  • Industriella sensornätverk som utför lokal mönsterigenkänning
  • Medicinsk utrustning som analyserar bilder i realtid utan tunga servrar
  • Autonoma fordon och drönare med begränsad batteribudget
  • Konsumentelektronik som erbjuder personaliserade funktioner utan att löpande ladda upp data

I alla dessa scenarier räknas varje milliwatt. Ett chip som med begränsad noggrannhet men extremt effektivt räknar passar bättre än en gigantisk GPU i en avlägsen serverhall.

Ett skifte i hur vi tänker på ”precision”

Det kinesiska chippet avslöjar också ett filosofiskt skifte: inte varje AI-uppgift behöver perfekt numerisk precision. För en rekommendation, en komprimeringsalgoritm eller en grov förutsägelse ligger standarden annorlunda än för en finansiell beräkning.

Därmed uppstår rum för arkitekturer som medvetet ger upp en del av precisionen i utbyte mot enorm energivinst. Företag som smart segmenterar sina applikationer – kritiska uppgifter digitalt, toleranta uppgifter analogt – kan hitta en gynnsam balans mellan prestanda och kostnader.

För utvecklare betyder detta att de snart inte bara ska välja en modell, utan också en ”fysisk bärare”: fungerar en recommender bättre på ett analogt NMF-chip, eller förblir den på en klassisk GPU? Avvägningen, idag fortfarande sällsynt, kan inom några år bli lika normal som valet mellan CPU och GPU nu.

Rulla till toppen