MIT ja MIT-IBM Watson AI Lab teadlased on välja töötanud roboti navigeerimise meetodi, mis kasutab visuaalsete andmete asemel suuri keelemudeleid (LLM), lihtsustades protsessi ja vähendades arvutuslikke nõudeid.

Uus lähenemisviis muudab visuaalsed vaatlused tekstipealkirjadeks, mida suur keelemudel kasutab seejärel roboti tegevuste juhtimiseks.

See meetod on kasulik, kui visuaalseid andmeid on vähe ja see võimaldab kiiresti genereerida sünteetilisi treeningandmeid. Kuigi see ei ületa nägemispõhiseid meetodeid, parandab see nendega kombineerituna navigeerimise jõudlust. Teadlaste eesmärk on täiendavalt uurida keelepõhist navigeerimist ja selle võimalikke täiustusi.

Allikas: Science Daily