OpenAI värsked AI-mudelid, o3 ja o4-mini, paistavad silma programmeerimise ja matemaatika ülesannetes, kuid kipuvad varasematest mudelitest sagedamini eksima – see tähendab, et nad genereerivad valeinfot. Sisemised testid näitasid, et o3 eksis 33% juhtudest ühes täpsust mõõtvas testis, mis on kaks korda rohkem kui eelmistel mudelitel. O4-mini tulemus oli veelgi kehvem – 48%. OpenAI sõnul vajab selle nähtuse põhjus veel uurimist. Kuigi loogikapõhised mudelid pakuvad teatud eeliseid, võivad nad samas suurendada hallutsinatsioonide ehk valeinfot sisaldavate vastuste hulka, mis teeb nende kasutamise keeruliseks valdkondades, kus täpsus on kriitilise tähtsusega – näiteks õigusteenustes või ärirakendustes.

Allikas: TechCrunch