Hur vi testar
hvilkenAI.no testar AI-modeller på praktiska, vardagliga uppgifter — inte akademiska benchmarks.
Oberoende och utan kommersiella band
hvilkenAI har inga affilieringsavtal, sponsorer eller kommersiella partnerskap med AI-leverantörerna vi testar. Vi får ingen provision, rabatter eller förmåner från någon modellleverantör. Alla rekommendationer baseras uteslutande på testresultaten. Vi finansieras av prenumerationsintäkter från Pro-användare och annonsering — aldrig av leverantörerna vi utvärderar.
Vår filosofi
Vad vi mäter
Svenska språkkvalitet (0–5)
Hur bra förstår och skriver modellen svenska? Svarade den på svenska, eller föll den tillbaka till engelska?
Instruktioner (0–5)
Gör modellen det du faktiskt ber om? Rätt längd, format och innehåll räknas.
Hastighet (tokens/sekund)
Hur snabbt får du svar? Vi mäter tokens per sekund och tid till första token (TTFT).
Pris (kr per miljon tokens)
Vad kostar det i svenska kronor? Uppdateras dagligen baserat på valutakurs.
Totalpoäng (0–10)
Viktad totalbedömning som kombinerar svenska, instruktioner, hastighet och värde per krona.
Orkestrator-poäng (0–10) — unikt för hvilkenAI.no
Hur väl lämpad är modellen för att styra andra AI-modeller på svenska? Beräknas från svenska × instruktioner — multiplikation straffar svaghet i båda dimensionerna. En modell som inte skriver svenska kan inte orkestra effektivt på svenska.
Se orkestrator-rankning →Modellurval och testfrekvens
Fokus
Ändringslogg — vad vi har upptäckt
Reella observationer från daglig benchmark. Detta är det kvartalsrapporterna inte fångar.
Varför daglig testning?
De flesta AI-benchmarks publiceras månadsvis eller kvartalsvis. Men AI-modeller uppdateras kontinuerligt — ofta utan att leverantören meddelar det. En modell som var bäst förra veckan kan ha fallit till plats 5 denna veckan. Daglig testning fångar dessa ändringar i realtid.
AI-marknaden förändras från dag till dag. Leverantörer uppdaterar modellerna utan förvarning — vi har fångat flera sådana "tysta uppdateringar" eftersom poängen plötsligt ändrades. En rapport i kvartalet fångar inte detta. Daglig testning gör det.
För företag som använder AI i daglig drift betyder detta att beslutsunderlaget alltid är uppdaterat. Du behöver inte vänta 3 månader på nästa rapport för att veta om du använder rätt modell.
Se även