AI:s törst efter beräkningskraft växer snabbare än vad vårt elnät hinner med.

Mellan klimatmål och digitala ambitioner uppstår ett spänningsfält.

Medan teknikjättarna i massiv skala bygger nya datacenter söker forskare i det tysta efter sätt att göra AI smartare och mer energieffektiv. Ett nyligen genombrott kring så kallade memristorer och en ny träningsmetod skulle kunna drastiskt sänka energiräkningen för djupa neurala nätverk.

Varför AI blir så energikrävande

Moderna AI-modeller körs oftast på enorma kluster av GPU:er i energiintensiva datacenter. Varje förbättring i precision kräver extra lager, fler parametrar och därmed mer beräkningskraft. Särskilt träning av stora modeller förbrukar gigantiska mängder elektricitet.

I klassiska datorer rör sig data konstant mellan minne och processor. Det dataflödet kostar mycket energi och skapar värme. AI förstärker problemet, eftersom neurala nätverk vid varje steg måste hämta och justera miljoner till miljarder vikter.

Nya AI-modeller levererar imponerande resultat, men deras energiförbrukning riskerar att bli en broms på både innovation och klimatpolitik.

Forskare letar därför efter nya hårdvarukoncept som placerar minnet närmare själva beräkningsprocessen, så att data behöver förflyttas mindre. Där kommer memristorer in i bilden.

Vad memristorer gör annorlunda

Memristorer är elektroniska komponenter som beter sig som motstånd med minne. Deras ledningsförmåga beror på den elektriska historien: vad som tidigare skrivits påverkar det nuvarande tillståndet. Det gör dem väl lämpade för att lagra vikter från ett neuralt nätverk direkt i hårdvaran.

I en memristor-matris sker beräkningarna lokalt. Materialets fysiska egenskaper utför de matematiska operationerna i stället för en rad instruktioner på en traditionell processor. Det sparar datatransport och kan i princip kosta långt mindre energi.

Det finns dock ett stort men vid denna historia: memristorer är inte perfekta. De uppvisar brus, variationer mellan komponenter och oprecisa skrivoperationer. Vid klassiska träningsalgoritmer leder det till instabila modeller och sämre prestanda.

Hårdvaran är energieffektiv, men dess ofullkomlighet förstör precisionen – såvida inte träningsprocessen anpassar sig.

Ett smart trick: eaPU gör fel användbara

Vad går eaPU ut på exakt?

Ett forskarteam från Zhejiang-laboratoriet i Kina presenterade i Nature Communications en ny träningsmetod: error-aware probabilistic update, förkortat eaPU. Kärnan: algoritmen accepterar små fel och undviker onödiga justeringar i memristorerna.

I stället för att uppdatera alla vikter vid varje minibatch, som vid standard backpropagation, uppdaterar nätverket med eaPU mindre än 0,1 procent av parametrarna per steg. Endast när en förändring är större än ett tröskelvärde följer en fysisk skrivoperation i memristorn.

Små variationer förblir oförändrade: modellen tolererar mikrofel.
Stora avvikelser får prioritet: endast signifikanta uppdateringar kostar energi.
Sannolikheten för en uppdatering beror på felstorleken och memristorns egenskaper.

Eftersom skrivning till en memristor kräver långt mer energi än läsning ger den selektionen enorm vinst. Färre skrivcykler innebär dessutom mindre slitage på materialet.

Siffror som hoppar i ögonen

Aspekt	Konventionell memristor-träning	Med eaPU
Andel uppdaterade vikter per steg	Stor del av parametrarna	< 0,1 % av parametrarna
Energiförbrukning vid träning (vs. andra memristor-metoder)	Referens	Upp till 50× lägre
Enheternas livslängd	Begränsad av skrivslitage	Upp till 1 000× längre
Precision	Betydligt lägre än digitala superdatorer	+60 % jämfört med andra memristor-metoder, jämförbar med superdatorer
Jämförelse med GPU-system	Energiintensiv	Cirka en faktor miljon mindre energi

Enligt forskarna faller energiförbrukningen vid jämförelse med GPU-baserade system med omkring sex storleksordningar – en reduktion på cirka en miljon.

Därmed tecknar sig ett scenario där AI-träning inte längre uteslutande är beroende av megadatacenter med kolossal kylning, utan också blir möjlig på kompakt, specialiserad hårdvara.

Från bildbehandling till språkmodeller?

Teamet testade eaPU på en memristor-matris på 180 nanometer. De tränade neurala nätverk för bildbrusreducering och superupplösning. Resultaten låg nära dem från konventionella digitala metoder, medan energiförbrukningen förblev markant lägre.

Den använda chipstorleken och arkitekturen är blygsam jämfört med infrastrukturen för stora språkmodeller. Ändå ser forskarna ingen fundamental barriär för att utvidga metoden till LLM:er.

De förväntar sig att principen med probabilistiska uppdateringar kan tillämpas på nätverk med miljarder parametrar, förutsatt att hårdvaran växer i skala och tillförlitlighet. I uppföljande forskning kommer de att testa direkt hur eaPU beter sig vid flerskiktade transformer-arkitekturer, ryggraden i moderna språkmodeller.

Inte bara för memristorer

Intressant är att metoden inte strikt är bunden till memristorer. Konceptet ”felmedveten probabilistisk uppdatering” kan också köras på andra in-memory computing-teknologier, såsom:

ferroelektriska transistorer
magnetoresistivt minne (MRAM)
hybridarkitekturer med analoga och digitala block

Det ökar chansen för att industripartners kommer att ta den i bruk, eftersom olika tillverkare redan satsar på sådana minnestyper för energieffektiva AI-chips.

Vad detta betyder för datacenter och klimatmål

Tillväxten i AI-förbrukning väcker frågor om det digitala landskapets hållbarhet. Uppskattningar pekar på att storskaliga modeller under kommande år kan förbruka lika mycket ström som medelstora länder, om det inte sker förändringar i den underliggande hårdvaran.

En faktor miljon mindre energi per träningssteg förändrar samtalet: AI behöver inte förbli synonymt med höga CO₂-utsläpp.

Om tekniker som eaPU blir tillämpbara i stor skala kan datacenter utföra samma arbete med långt mindre ström. Det minskar trycket på nätoperatörer, begränsar behovet av nya högspänningsförbindelser och gör förnybar energi mer tillräcklig.

För europeiska länder, däribland Sverige, där lokalt motstånd mot nya datacenter växer, kan denna typ av hårdvaruinnovation mjuka upp debatten. Diskussionen skiftar då från ”datacenter eller ej” till ”vilken teknik använder datacentret inuti?”.

Scenarier för framtida tillämpningar

En praktisk tillämpning ligger vid så kallad edge-AI: modeller som körs nära användaren, på smartphones, bilar, medicinsk utrustning eller industriella sensorer. Med extremt energieffektiv träning och inferens kan sådana enheter lära sig lokalt istället för att skicka allt till molnet.

En bil skulle till exempel kunna finjustera sin körassistent baserat på lokala förhållanden utan att konstant ladda upp data. En bärbar medicinsk enhet skulle kunna anpassa mönster i puls eller glukosevärden, medan batteriet ändå håller i dagar.

Även för företag som arbetar med konfidentiell data, som sjukhus eller banker, erbjuder denna riktning möjligheter. Mindre beroende av centrala GPU-kluster innebär att känslig data inte behöver lämna byggnaden, medan algoritmer ändå förbättras.

Risker, begränsningar och nästa steg

De nuvarande resultaten kommer från laboratorieuppställningar med relativt små chips. Skalbarhet utgör ett stort frågetecken: hur beter sig analoga arrays när miljoner memristorer fungerar sida vid sida med temperatursvängningar och produktionsfel?

Dessutom kräver en sådan ny arkitektur en anpassad mjukvarustack: träningsbibliotek, kompilatorer och ramverk som tar hänsyn till probabilistiska uppdateringar och brus i hårdvaran. Utan användarvänliga verktyg förblir dessa lösningar begränsade till forskningslaboratorier.

Ändå träffar kärnan i förslaget ett bredare tema i AI-världen: acceptera ofullkomlighet där det är möjligt. Genom att inte till varje pris korrigera hårdvarufel, utan att utnyttja dem smart, uppstår utrymme för drastiskt lägre energiförbrukning. Det skiftet i tänkande kan också inspirera andra AI-fält, från neuromorfiska chips till spiking neural networks.

För dem som använder AI i produkter eller tjänster lönar det sig att följa dessa utvecklingar. Valet av hårdvara och träningsstrategi bestämmer inte bara prestandan, utan också energiavtrycket, driftskostnaderna och skalbarheten på lång sikt. Nya generationer av AI-system kommer sannolikt inte bara att bedömas på precision, utan också på antal kilowattimmar per tränad parameter.