Uus robot õpib kuulates ja vaadates

California Berkeley ülikooli professori Pieter Abbeeli ja tema kolme endise õpilase Peter Cheni, Rocky Duani ja Tianhao Zhangi asutatud ettevõte Covariant kogusid aastaid kaameratest ja muudest anduritest laorobotite andmeiod ning on tänaseks välja töötanud robotid, mis on võimalised ise õppima kuulmise ja vaatluste läbi.

Kombineerides need andmed tohutu hulga tekstiga, mida kasutatakse vestlusrobotite nagu ChatGPT koolitamiseks, on ettevõte loonud AI tehnoloogia, mis annab sellele robotile palju laiema arusaama ümbritsevast maailmast.

Pärast mustrite tuvastamist selles pildirägastikus, sensoorsetest andmetest ja tekstist annab see tehnoloogia robotile jõu tulla toime ootamatute olukordadega füüsilises maailmas. Robot teab, kuidas banaani üles korjata, isegi kui ta pole banaani varem näinud.

Robot võib vastata ka tavalisele inglise keelele, sarnaselt vestlusbotiga. Kui ütlete talle, et “korja banaan üles”, teab ta, mida see tähendab. Kui ütlete talle, et “korja kollane vili”, saab ta sellest ka aru. Robot võib isegi luua videosid, mis ennustavad, mis tõenäoliselt juhtub, kui ta üritab banaani üles korjata. Nendel videotel pole laos praktilist kasu, kuid need näitavad roboti arusaamist ümbritsevast.

“Kui robot suudab ennustada video järgmisi kaadreid, saab see täpselt kindlaks määrata õige strateegia, mida järgida,” ütles dr Abbeel.

AI ettevõtja ja New Yorgi ülikooli psühholoogia ja närviteaduse emeriitprofessor Gary Marcus ütles, et tehnoloogia võib olla kasulik ladudes ja muudes olukordades, kus vead on vastuvõetavad. Kuid ta ütles, et seda oleks keerulisem ja riskantsem kasutada tootmisettevõtetes ja muudes potentsiaalselt ohtlikes olukordades.

“See taandub vea maksumusele,” ütles ta. “Kui teil on 150 naela kaaluv robot, mis võib midagi kahjulikku teha, võib see hind olla kõrge.”

Kuna ettevõtted koolitavad seda tüüpi süsteemi üha suuremate ja mitmekesisemate andmekogude põhjal, usuvad teadlased, et see paraneb kiiresti.

See erineb suuresti sellest, kuidas robotid varem tegutsesid. Tavaliselt programmeerisid insenerid robotid tegema ikka ja jälle samu täpseid liigutusi – näiteks korjama teatud suurusega kasti või kinnitama needi auto tagumise kaitseraua külge. Kuid robotid ei saanud hakkama ootamatute või juhuslike olukordadega.

Digitaalsetest andmetest – sadadest tuhandetest füüsilises maailmas toimuvatest näidetest – õppides saavad robotid hakkama ootamatustega toime tulema. Ja kui need näited on keelega seotud, saavad robotid vastata ka teksti- ja häälsoovitustele nagu vestlusrobot.

See tähendab, et nagu vestlusrobotid ja pildigeneraatorid, muutuvad ka robotid osavamaks.

Allikas: The New York Times