GPT-5.4 Pro når 150 IQ på Mensa Norges test, OpenAI publicerar hopp i benchmarkresultat
OpenAI:s GPT-5.4 Pro har enligt rapporter fått ett IQ-ekvivalent på 150 på ett öppet Mensa Norway-liknande benchmark som körts av TrackingAI, upp från OpenAIs tidigare o3-resultat på 136. Artikeln ramar in detta som ett stort kapabilitetslyft för AI, vilket sker under en makrotung vecka med fokus på inflation, sysselsättningsdata och centralbanksbudskap.
Det rapporterade 150-poänget för GPT-5.4 Pro anges som att det presterar bättre än 99,96 % av den mänskliga populationen på den specifika publika skalan. OpenAIs releas hävdar också att GPT-5.4 är deras mest kapabla och effektiva frontier-modell för professionellt arbete, med förbättrad kodning, verktygsanvändning och ”datoranvändning”, plus ett kontextfönster som påstås vara upp till 1 miljon token. Texten noterar att OpenAI också rapporterade förbättringar på andra benchmarks (GDPval, OSWorld-Verified), vilket stämmer överens med IQ-liknande resultatet.
Artikeln betonar att offentliga IQ-test är ofullkomliga och känsliga för testdesign, promptstruktur och möjliga bekantskapseffekter. Ändå argumenterar den för att ett hopp från 136 till 150—särskilt tillsammans med framsteg inom kodning och förmåga att hantera långsiktiga uppgifter—kan påverka företagsbudgetering, rekrytering och besluten om arbetsflödesautomation.
För handlare är den viktiga relevansen indirekt: snabbare förbättring av AI-kapabilitet kan förändra förväntningar kring framtida kapitalutgifter och efterfrågan på mjukvara, vilket potentiellt påverkar sentimentet kring AI-relaterade teknikteman snarare än kryptovalutor direkt.
Neutral
Denna rapport är i grunden en “AI-förmågebenchmark”-nyhet, inte en direkt förändring i kryptonätverk, reglering eller on-chain likviditet. GPT-5.4 Pro gick från 136 till 150 på Mensa Norway-stiltestet, vilket kortsiktigt kan förstärka marknadens berättelse om “accelererande AI-framsteg” och därigenom driva sentiment i AI-relaterade techsektorer; men det ger inte ett kvantitativt on-chain-signal som omedelbart påverkar börsflöden, stablecoin-likviditet, on-chain-efterfrågan eller riskaptit. Därför är effekten på kryptomarknaden troligen marginell på sentimentsnivå och i stort sett neutral.
På kort sikt brukar “modellprestandapoäng/benchmarkledarskap” orsaka kortvarig medial och kapitalmässig uppmärksamhet, men det är sällan som detta omedelbart översätts till verifierbara kassaflöden för kryptoaktiva eller protokolländringar. På längre sikt, om prestandaförbättringar verkligen får företag att snabba upp budgetar och automatiseringsimplementering, kan det indirekt gynna narrativ kring AI-relaterad infrastruktur och applikationer; historiskt sett kräver sådana effekter dock längre tid för att realiseras, och marknadsprissättning beror oftare på efterföljande produktintäkter, kapitalutgifter och adoptionsgrad snarare än en enskild benchmarkpoäng.
Sammanfattningsvis: Denna nyhet är mer en “förväntningsuppdatering för AI-industrin” än en “strukturell drivkraft för kryptomarknaden”, vilket motiverar en neutral bedömning.