Google rystet teknologiverdenen 18. november da selskapet avduket sin nye språkmodell, Gemini 3, og beskrev den som «den mest intelligente modellen vi noen gang har laget». Store ord – men de første, uavhengige testene viser at Google faktisk ikke overdriver.
En forsker med brukernavnet Haider hevder at Gemini 3 Pro oppnådde 130 IQ-poeng på en offline IQ-test. Ja, du leste riktig: uten internett, uten mulighet til å hente informasjon fra nettet. Resultatet plasserer modellen i den øverste 2 prosent av menneskelig intelligens.
For sammenligningens skyld: Den gjennomsnittlige personen scorer rundt 100. Mange PhD-kandidater ligger mellom 120 og 130. Det betyr at Gemini 3 Pro nå befinner seg i et sjeldent selskap – høyere enn majoriteten av doktorgradsstudenter, og på nivå med de mest begavede menneskene på planeten.

Men dette var bare oppvarmingen.
Ifølge forskeren knuste modellen også Mensa Norges IQ-test, en betydelig tøffere variant av den klassiske testen. Der fikk Gemini 3 Pro 142 poeng, et nivå kun 0,3 prosent av verdens befolkning oppnår. Til sammenligning fikk Gemini 2.5 Pro tidligere kun 94 og 110 poeng på tilsvarende tester – noe som viser hvor dramatisk spranget er.
Selv om resultatene er spektakulære, er ikke alle i AI-miljøet overbevist om at IQ-tester er riktig måte å måle kunstig intelligens på.

«IQ-tester måler mønstergjenkjenning – ikke ekte forståelse,» skriver AI-entusiasten Priyal Rathore. «En AI som scorer 140+ er flink til tidsbegrensede oppgaver, men det betyr ikke at den forstår verden slik mennesker gjør.»
Flere brukere reagerte også på ironien: Selv med rekordhøy IQ gjør Gemini 3 fortsatt av og til barnslige feil, noe som får enkelte til å tvile på hvor mye IQ-poeng egentlig forteller om en AI-modells virkelige evner.
Hva mener du?
Er slike IQ-tester en gyldig måte å måle hvor «smart» en AI er – eller er det bare en morsom partytriksstatistikk uten reell verdi?