Google tõi turule tehisaru mudeli Gemini, loodab alistada GPT-4

Gemini on Google uusim suur keelemudel, mida ettevõtte juht Sundar Pichai mainis esmakordselt juunis toimunud I/O arendajate konverentsil ja mida nüüd avalikkusele tutvustati. Pichai ja Google DeepMindi tegevjuhi Demis Hassabise sõnul on see tehisintellekti mudel tohutu samm edasi ning mõjutab lõpuks praktiliselt kõiki Google tooteid.

Gemini on midagi enamat kui ainult üks AI mudel. Saadaval on kergem versioon nimega Gemini Nano, mis on mõeldud Android-seadmetele ja võrguühenduseta käitamiseks. Tõhusam versioon on nimega Gemini Pro, mis hakkab peagi mõjutama paljusid Google AI-teenuseid ja on nüüdsest Bardi selgroog. On ka veelgi võimekam mudel nimega Gemini Ultra, mis on võimsaim LLM, mille Google on seni loonud ja näib olevat mõeldud peamiselt andmekeskuste ja ettevõtte rakenduste jaoks.

Google käivitab uue AI mudeli praegu mitmel viisil. Bardil on nüüd Gemini Pro ja Pixel 8 Pro kasutajad saavad tänu Gemini Nanole mõned uued funktsioonid. Gemini Ultra tuleb järgmisel aastal.

Alates 13. detsembrist on arendajatel ja klientidel juurdepääs Gemini Prole Google Generative AI Studio või Vertex AI kaudu Google Cloudis. Gemini on praegu saadaval ainult inglise keeles, ilmselt tuleb peagi ka teisi keeli. Kuid Pichai ütleb, et mudel integreeritakse lõpuks Google’i otsingumootorisse, selle reklaamitoodetesse ning Chrome’i brauserisse.

OpenAI GPT-4 versus Google Gemini. “Oleme teinud süsteemidele kõrvuti väga põhjaliku analüüsi ja võrdlusuuringuid,” ütleb Hassabis. Google kasutas 32 väljakujunenud võrdlusalust, milles võrreldi kahte mudelit, alates laiaulatuslikest üldistest testidest, nagu Multi-task Language Understanding etalon, kuni võrdlusaluseni, mis võrdleb kahe mudeli võimet luua Pythoni koodi. “Ma arvan, et oleme nendest kriteeriumidest 30-st 32-st oluliselt ees,” märkis Hassabis.

Nendes võrdlusnäitajates on Gemini selgeim eelis tema võime mõista videot ja heli ning nendega suhelda. Google ei ole välja õpetanud piltide ja hääle jaoks eraldi mudeleid, nagu OpenAI lõi DALL-E ja Whisper. Google ehitas algusest peale ühe multisensoorse mudeli.

Praegu on Gemini kõige elementaarsemad mudelid tekst sisse ja välja, kuid võimsamad mudelid nagu Gemini Ultra saavad töötada piltide, video ja heliga.

Google sõnul on nad teinud kõvasti tööd, et tagada Gemini turvalisus ja vastutus, seda nii sise- kui välistestimise ja spetsiaalse meeskonna loomise kaudu. Pichai juhib tähelepanu sellele, et andmete turvalisuse ja usaldusväärsuse tagamine on eriti oluline ettevõtte jaoks mõeldud toodete puhul, kus enamik generatiivseid tehisintellekte teenib raha.

Allikas: The Verge