Mass General Brighami uuring näitas, et üldiste kliiniliste otsuste tegemisel oli vestlusroboti ChatGPT täpsus umbes 72 protsenti, seda alates võimalike diagnooside püstitamisest kuni lõplike diagnooside ja hooldusjuhtimise otsusteni. Tehisintellekti vestlusbot toimis võrdselt hästi nii esmatasandi arstiabis kui ka hädaolukorras kõigil meditsiinierialadel.

“Tõelisi võrdlusaluseid ei ole, kuid meie hinnangul on see tulemus äsja meditsiinikooli lõpetanud inimese tasemel. See näitab meile, et suurtel keelemudelitel on üldiselt potentsiaali täiendada meditsiinipraktikat ja toetada kliiniliste otsuste tegemist muljetavaldava täpsusega,” märkis Mass General Brighami tegevjuht Marc Succi.

Tehisintellekti tehnoloogia muutused toimuvad kiires tempos ja muudavad paljusid tööstusharusid, sealhulgas tervishoidu. Kuid suurte keelemudelite suutlikkust kliinilist ravi täies ulatuses abistada ei ole veel uuritud.

Selles uuringus, kuidas suuri keelemudeleid saaks kliinilises nõustamisel ja otsuste tegemisel kasutada, kontrollisid Succi ja tema meeskond hüpoteesi, et ChatGPT suudab läbi töötada kogu kliinilise kohtumise patsiendiga ja lõpuks panna ka diagnoosi.

Uurijad leidsid, et üldiselt oli ChatGPT täpsus umbes 72 protsenti ja lõpliku diagnoosi tegemisel 77 protsenti täpne. Kõige madalam oli ChatGPT diferentsiaaldiagnooside tegemisel – 60 protsenti. Kliiniliste juhtimisotsuste, nagu näiteks selle väljaselgitamine, milliste ravimitega patsienti ravida pärast õige diagnoosi saamist, tegemisel oli täpsus 68 protsenti.

Uuringu teised märkimisväärsed järeldused hõlmasid seda, et ChatGPT vastused ei näidanud soolist erapoolikust ja selle üldine tulemuslikkus oli stabiilne nii esmases kui ka kiirabis.

Allikas: Science Daily