Google soovib muuta oma robotid nutikamaks tehisintellekti õppimismudeli Robotic Transformer (RT-2) väljalaskmisega.
RT-2 on ettevõtte visiooni-keele-tegevuse (VLA) mudeli uus versioon. Mudel õpetab robotitel paremini ära tundma visuaalseid ja keelelisi mustreid, et tõlgendada juhiseid ja järeldada, millised objektid vastavad päringule kõige paremini.
Teadlased katsetasid RT-2 robotkätt köögikontoris, paludes sellel otsustada, milline on hea improviseeritud haamer ja valida jook, mida kurnatud inimesele anda. Samuti käskisid nad robotil tõsta joogipurk Taylor Swifti pildile.
Uus mudel on koolitatud veebi- ja robootikaandmetega, kasutades ära teadusuuringute edusamme suurtes keelemudelites, nagu Google enda Bard ning kombineerides neid robotandmetega (nt milliseid liigeseid liigutada). Masin mõistab juhiseid ka muudes keeltes peale inglise keele.
Teadlased on aastaid püüelnud selle poole, et robotid teeksid paremaid järeldusi, mis aitaks neid reaalses keskkonnas eksisteerida. Varem võttis roboti õpetamine kaua aega. Teadlased pidid suunad individuaalselt programmeerima. Kuid tänu VLA mudelitele, nagu RT-2, saavad robotid juurdepääsu suuremale teabekomplektile, et järeldada, mida edasi teha.
Samas pole ka Google uus robot täiuslik. New York Times nägi roboti reaalajas demo ja teatas, et see tuvastas ebaõigesti sooda maitsed ja tuvastas puuviljad valesti valge värvina.
Allikas: The Verge