Kina utmanar Silicon Valley med nya AI-modeller – så ska de vinna

Från festfyrverkerier till AI-fyrverkerier

Medan fyrverkerier tänds över Pekings natthimmel passar kinesiska teknikjättar på att använda kinesiska nyåret som tillfälle för att lansera en hel våg av nya AI-modeller. Det som för några år sedan såg ut som ett bekvämt försprång för Silicon Valley håller nu på att utvecklas till en regelrätt kapplöpning om förstaplatsen.

Kinesiska företag presenterar avancerade system inom generativ AI, video, bild och kod — ofta öppen källkod och förvånansvärt energieffektiva. Till och med OpenAI-chefen Sam Altman beskriver framstegen som ”remarkable”.

Det kinesiska nyåret handlar inte längre bara om drakdanser och röda lyktor. Vid stora evenemang i landet marscherade humanoida robotar i takt med mänskliga dansare — en levande symbol för Kinas teknologiska ambitioner.

Effektivitet som konkurrensfördel

Medan USA främst satsar på enorma datacenter och extremt kraftfulla chips tvingas kinesiska aktörer av nödvändighet att fokusera på effektivitet. Det amerikanska exportförbudet mot avancerade AI-chips innebär att de kinesiska företagen måste göra mer med mindre beräkningskraft.

På grund av amerikanska chipbegränsningar optimerar kinesiska företag hårt på effektivitet — och det kan resultera i både mer energisnåla och konkurrenskraftiga AI-modeller.

Det skapar en intressant motsättning: dyra, energikrävande amerikanska språkmodeller på ena sidan och allt mer effektiva, lokalt körande kinesiska modeller på den andra.

Öppen källkod som strategiskt vapen

En anmärkningsvärd skillnad från många amerikanska modeller är att en stor del av de kinesiska AI-systemen ges ut som öppen källkod eller som så kallade ”open-weight”-modeller.

  • Öppen källkod: hela koden och modellarkitekturen är offentligt tillgänglig
  • Open-weight: de tränade vikterna är tillgängliga, men kod och träningsdata är delvis stängda

I båda fallen kan en organisation ladda ner modellen och köra den lokalt — på egna servrar eller till och med på en kraftfull stationär dator. Det sparar prenumerationskostnader, minskar datatrafik och ger långt bättre kontroll över intern data.

Att köra modeller lokalt betyder att ingen kunddata skickas till Googles, OpenAIs eller kinesiska datacenters servrar — organisationen behåller full kontroll.

Därmed positionerar kinesiska modeller sig tydligt som ett attraktivt alternativ för organisationer som hanterar affärshemligheter, personuppgifter eller känsliga dokument.

Videogenerering: Seedance 2.0 skrämmer Hollywood

Inom AI-video sticker ett namn särskilt ut: Seedance 2.0 från ByteDance, företaget bakom TikTok. Denna modell genererar hyperrealistiska videor utifrån korta textbeskrivningar, och resultaten påminner om dyra filmproduktioner.

Seedance 2.0 är varken öppen källkod eller open-weight, men demonstrationerna spreds blixtsnabbt på sociala medier. Det väckte omedelbart ett annat problem: stora studior som Disney, Paramount och Netflix anklagar ByteDance för upphovsrättsintrång, eftersom träningsdata möjligen i alltför hög grad bygger på skyddat filminnehåll.

Denna kontrovers påminner om de diskussioner som också omger amerikanska modeller som OpenAIs Sora. Varje deltagare i AI-videokapplöpningen stöter oundvikligen på frågor om rättigheter, återanvändning av bildmaterial och skydd av kreativa upphovsmän.

Alibaba, Zhipu och Moonshot: de nya tungviktarna

Qwen3.5 från Alibaba: en modell som förstår text, bild och video

Alibaba presenterar Qwen3.5, en så kallad vision-language-modell som hanterar text, bilder och video på omkring 200 språk. Systemet kan fungera som en multimodal agent: det läser formulär, navigerar på webbplatser och utför digitala uppgifter som normalt kräver manuell insats.

Qwen3.5 ges ut under en öppen licens och kan laddas ner via GitHub. Utvecklare kan själva anpassa, finjustera eller integrera modellen i egna mjukvarulösningar — helt utan beroende av ett externt API.

GLM-5 från Zhipu AI: mer effektiv tack vare intelligent uppmärksamhet

Zhipu AI introducerar GLM-5, en modell designad för så kallad ”agentisk intelligens” och flerstegresemang. Tekniken bakom GLM-5 använder DeepSeek Sparse Attention (DSA), där modellen inte behandlar alla ord samtidigt, utan istället lär sig att fokusera enbart på de mest relevanta delarna av inputen.

Det sparar beräkningskraft och minne, vilket kan minska inferenskostnaderna markant. En anmärkningsvärd detalj: GLM-5 är fullständigt tränad på Huawei Ascend-chips utan användning av amerikanska GPU:er. Därmed demonstrerar Zhipu att högkvalitativ AI-träning är möjlig med ett helt kinesiskt hårdvaruekosystem.

DeepSeek V4: billigare träning, fortfarande toppnivå

DeepSeek väckte redan uppmärksamhet med version V3, som i benchmarks kom nära ChatGPT, medan träningskostnaderna var markant lägre. Den kommande V4 skulle enligt källor i USA klara sig ännu bättre, särskilt inom programmering och komplex analys.

Fackmediet The Information rapporterade att DeepSeek V4 i vissa tester kan överträffa modeller från Anthropic (Claude) och OpenAI (GPT-serien). Med det rör sig företaget in i den absoluta världsklassen inom generativ AI.

Kimi K2.5 från Moonshot AI: specialistlag i en modell

Moonshot AI lanserade i slutet av januari Kimi K2.5. Denna modell använder en ”mixture of experts” (MoE)-arkitektur, liksom vissa varianter av Google Gemini. Istället för ett stort nätverk som ska klara allt består Kimi K2.5 av flera specialiserade undernätverk som var och en hanterar specifika uppgifter som kod, matematik eller kreativt skrivande.

För varje prompt aktiveras endast de relevanta experterna, vilket begränsar beräkningsbelastningen. På så sätt kan en relativt stor modell köra flytande på mindre kraftfull hårdvara.

Varför klyftan till Silicon Valley snabbt blir mindre

Amerikanska modeller som ChatGPT och Gemini presterar på många officiella benchmarks fortfarande något högre. Men skillnaden krymper kvartal för kvartal. Oberoende tester visar att kinesiska språkmodeller och multimodala modeller klarar sig nästan lika bra — och ibland bättre — inom kärnuppgifter som översättning, programmering, resemang och sammanfattning.

Aspekt Amerikanska modeller Kinesiska modeller
Benchmarks språk och logik Något högre poäng Liten skillnad, växer snabbt
Tillgänglighet Främst via moln-API Många kan köras lokalt
Licenser Övervägande stängda Mycket öppen källkod / open-weight
Effektivitet Stora datacenter, höga kostnader Fokus på besparing och optimering

För internationella företag betyder dessa skillnader allt mer. En bank, ett sjukhus eller en advokatbyrå vill sällan att konfidentiella dokument skickas till ett externt moln — oavsett hur säkert det påstås vara. Lokalt körande modeller är i sådana fall särskilt attraktiva.

Kombinationen av solida prestationer, öppna licenser och lokal användning kan göra kinesiska AI-modeller till standardverktyg världen över inom kort tid.

Vad betyder det för svenska företag?

För organisationer i Sverige och resten av Skandinavien uppstår nu ett nytt strategiskt val. Ska man fortsätta att förlita sig på amerikanska molnmodeller, eller ska man bygga egna AI-lösningar med öppen källkod — eventuellt kinesiska — modeller som grund?

I praktiken ser man redan blandade tillvägagångssätt:

  • Amerikanska molnmodeller för kundkontakt, marknadsföring och allmänna uppgifter
  • Lokalt körande öppen källkod-modeller för känsliga interna dokument
  • Specialiserade modeller för exempelvis video eller kod, valda projekt för projekt

Därmed förskjuts AI-leverantörernas roll: från en ”magisk chatbot” till ett landskap av flera modeller som körs sida vid sida — var och en med sina egna styrkor och svagheter.

Begrepp och risker: vad ska din organisation vara uppmärksam på?

Öppen källkod-modeller ger större frihet, men kräver också större ansvar. Den som kör en modell lokalt måste själv se till att:

  • åtkomststyrning och loggning
  • filtrering av oönskad output
  • efterlevnad av integritetslagstiftning som GDPR
Rulla till toppen