AI konsumerar energi som ett kryptominingfarm

Artificiell intelligens växande törst efter elektricitet håller på att bli ett allvarligt problem – både för plånboken och för klimatet. Men en ny kinesisk teknik kan vända denna utveckling helt och hållet.

Forskare har påvisat att neurala nätverk kan tränas till en betydligt lägre energikostnad om man kombinerar okonventionell hårdvara med en smart algoritm som istället för att bekämpa fel lär sig att leva med dem.

Bakom det vänliga gränssnittet döljer sig ett energimonster

När du genererar bilder eller chattar med en AI-assistent ser du bara en enkel och tillmötesgående yta. I kulisserna arbetar massiva serverhallar fyllda med processorer och grafikkort. Dessa maskiner drar enorma mängder ström – främst för att träna komplexa modeller som stora språkmodeller.

Ju mer avancerat ett neuralt nätverk är, desto fler beräkningar och desto mer datatransport sker mellan minne och processorer. Det är just dessa operationer som orsakar gigantiska energiförluster. Man talar i allt högre grad om att AI-utvecklingen kan bli en av världens största strömkonsumenter – i nivå med tunga industrisektorer.

Lösningen på AI:s energiproblem handlar inte längre enbart om att optimera kod. Det krävs ett fundamentalt skifte i tillvägagångssättet för själva hårdvaran och för hur modeller tränas.

Memristorer – minne som tänker på plats

En av de mest lovande vägarna mot en mer ”grön” artificiell intelligens är så kallad in-memory computing, alltså beräkning direkt i minnet. Istället för att ständigt flytta data fram och tillbaka mellan minne och processor utförs en del av operationerna där datan redan befinner sig. Memristorer spelar en central roll här.

En memristor är en speciell elektronisk komponent som fungerar som ett motstånd med minne. Dess elektriska resistans beror på historiken för den ström som har flödat genom den, och den kan representera vikterna i ett neuralt nätverk. På så sätt fungerar en enda struktur samtidigt som minne och beräkningsenhet.

Den lagrar information i form av neurala nätverksvikter,
den möjliggör lokala beräkningar utan att skicka data till en extern processor,
den kan reducera datatransporten markant och därmed även energiförbrukningen.

Det låter nästan för bra för att vara sant – och verkliga memristorer är sannerligen inte felfria. De introducerar brus, uppför sig instabilt, och varje skrivoperation är energikrävande och sliter på komponenternas livslängd. Därför fungerar det inte tillfredsställande att bara överföra klassiska träningsmetoder direkt till denna typ av hårdvara.

En ny filosofi: färre korrigeringar, större feltolerans

Ett forskarlag från ett laboratorium i Zhejiang i Kina har föreslagit ett helt annat angreppssätt för att träna AI på memristorer. Istället för att försöka eliminera alla ofullkomligheter har forskarna utformat en metod som medvetet tar hänsyn till dem. De kallar den error-aware probabilistic update, förkortat EaPU – alltså en probabilistisk uppdatering med felmedvetenhet.

Kärnan i metoden är en enkel idé: nätverket försöker inte korrigera varje minimal viktförändring. Om ett fel befinner sig inom hårdvarans toleransgränser förblir parametern orörd. Endast större avvikelser utlöser en egentlig uppdateringsprocess.

Istället för att uppdatera nästan alla vikter i varje träningsiteration uppdaterar nätverket under 0,1% av parametrarna. Färre skrivningar innebär mindre energiförbrukning och längre livslängd för hårdvaran.

Detta tillvägagångssätt har flera konkreta effekter:

Antalet skrivoperationer i memristorerna faller drastiskt,
bruspåverkan minskar eftersom algoritmen inte ”jagar” slumpmässiga fluktuationer,
träningsprocessen blir mer stabil trots imperfekt hårdvara.

Hur mycket energi sparas egentligen?

Enligt de publicerade resultaten kräver själva träningen av neurala nätverk i en memristorbaserad arkitektur med EaPU upp till 50 gånger mindre energi jämfört med tidigare metoder utvecklade för samma typ av hårdvara.

Och det är inte ens hela bilden. När denna uppsättning jämförs med klassisk GPU-baserad nätverksträning blir skillnaden närmast extrem. Forskarna uppskattar att den totala energiförbrukningen kan reduceras med hela sex storleksordningar – motsvarande cirka en miljon gånger.

Lösning	Energiförbrukning (träning)	Modellprecision	Hårdvarans livslängd
Klassiska GPU:er	100%	Hög	Standard
Memristorer utan EaPU	Lägre än GPU, men fortfarande högt	Väsentligt sämre	Begränsad av frekventa skrivningar
Memristorer med EaPU	Cirka en miljon gånger mindre än GPU	Jämförbar med klassiska superdatorer	Upp till tusen gånger längre livslängd

Metoden ökar dessutom nätverkens noggrannhet med upp till 60% jämfört med tidigare memristorbaserade lösningar. Det för resultaten i nivå med dem som uppnås på traditionella superdatorer – och alltså utan kompromiss med kvaliteten.

Tester: från bildbrus till skarp superupplösning

För att bevisa att detta inte bara är teori byggde teamet en verklig memristormatris med en storlek på 180 nanometer. På denna hårdvara tränade de nätverk för två krävande bildbehandlingsuppgifter:

Borttagning av brus från fotografier,
uppskalning av upplösning, även kallad super-resolution.

Testerna gav resultat som var jämförbara med traditionella metoder baserade på processorer och grafikkort. Den avgörande skillnaden låg i energiprofilen – hårdvaran med memristorer och EaPU krävde markant mindre ström för att nå samma resultat.

Kan detta bana vägen för mer ”gröna” språkmodeller?

Man talar mest om stora språkmodeller som driver chatbottar och textgeneratorer. Träningen av dem slukar enorma energimängder och kräver hundratals – ibland tusentals – GPU:er som arbetar parallellt. Det är därför naturligt att forskarna överväger om EaPU kan överföras till just denna klass av modeller.

Författarna bakom studien erkänner att de tillsvidare är begränsade av den tillgängliga hårdvaran. En 180 nm-matris är bara en liten pusselbit av vad som skulle krävas för att träna en fullskalig språkmodell. Samtidigt menar de att själva algoritmens koncept och felhantering inte är specifik för en bestämd uppgiftstyp.

Forskarna antar att samma tillvägagångssätt kan tillämpas på stora språkmodeller, förutsatt att det utvecklas tillräckligt avancerade hårdvaruarkitekturer baserade på memristorer eller besläktade teknologier.

Intressant nog är EaPU inte heller strikt bunden till enbart memristorer. Teamet pekar på att en motsvarande probabilistisk parameteruppdatering sannolikt även kommer att fungera med andra typer av icke-flyktigt minne, såsom ferroelektriska transistorer och magnetoresistiva minnestyper.

En ny generation av AI-hårdvara

Om sådana tekniker hittar vägen ut från laboratorierna kan det tvinga fram en helt ny klass av AI-acceleratorer. Istället för ännu en generation av klassiska GPU:er kommer en del av uppgifterna att övertas av specialiserade in-memory-beräkningskretsar. Denna typ av hårdvara kan hamna inte bara i datacenter utan även i edge-enheter – från intelligenta kameror till medicinsk utrustning.

Föreställ dig ett övervakningssystem som behandlar bilder lokalt, känner igen händelser och bara använder en bråkdel av den energi som dagens lösningar kräver. Eller en smartphone som kör en lokal språkmodell utan att tömma batteriet på några timmar. Det är precis dessa scenarion som kan bli verklighet om energiförbrukningen faller med storleksordningar.

Vad betyder det för användare och företag?

Sett från en vanlig användares perspektiv är de två viktigaste effekterna lägre tjänstekostnader och en mindre miljöbelastning. Mindre ström i datacentren innebär lägre driftskostnader för operatörerna och därmed större chans att avancerade AI-funktioner inte kräver dyra abonnemang.

För företag som implementerar AI betyder ett sådant effektivitetsgenombrott helt nya affärsmässiga kalkyler. Träning av egna modeller upphör att vara ett privilegium förbehållet teknikjättarna. När energikostnaderna faller hundra eller tusen gånger kan mindre aktörer – däribland företag inom medicin, industri och logistik – plötsligt tillåta sig egna skräddarsydda lösningar.

Det är dock viktigt att komma ihåg en sak: verklig förändring kräver inte bara nya algoritmer utan även massproduktion av specialiserade minneskretsar. Det är en lång process som kräver investeringar och tid – liksom övergången från klassiska processorer till specialiserade GPU:er för grafik och AI i sin tid gjorde.

För dem som följer teknikutvecklingen nära finns det ännu ett perspektiv som är värt att uppmärksamma. Ämnet energieffektivitet inom AI blir allt mer centralt i planeringen av nya datacenter och forskningsprojekt. Institutioner och företag som redan nu börjar intressera sig för in-memory computing och feltoleranta tekniker kommer att ha ett försprång när dessa lösningar träder in på den breda marknaden.