Google töötab järgmise põlvkonna tehisintellekti alusmudeli Gemini kallal, mis suudab kombineerida vestlusteksti piltide genereerimisega. Ettevõte on selle nimel kaasanud DeepMindi ja Google Braini meeskonna peamised liikmed ning ilmavalgust näeb toode juba sel sügisel.

Gemini abil loodab Google edestada konkurente, kes on keskendunud peamiselt oma suurtele keelemudelitele. Google Gemini võib ühendada vestlusteksti võimalused AI-kujutiste genereerimisega, muutes selle sobilikuks üldisema kasutusega.

Gemini ei saaks mitte ainult luua teksti nagu ChatGPT, vaid luua ka kontekstuaalseid pilte. Tulevikus saab seda kasutada diagrammide analüüsimiseks, tekstikirjeldustega graafika loomiseks ja tarkvara juhtimiseks teksti- või häälkäsklustega.

Väidetavalt kasutab Google Gemini treenimiseks ka YouTube videosid. YouTube jaoks koolitatud mudelid võivad anda videosisu põhjal nõu, näiteks aidata mehaanikel autoremondivideote põhjal probleemi diagnoosida. YouTube videosisu kasutamine võib aidata Google’l arendada ka tekstist videoks muutmise tarkvara.

Google võib integreerida Gemini oma toodete ja teenuste komplekti, nagu Bard, Google Docs või Slides.

Allikas: Android Authority