OpenAI on välja töötanud platvormi nimega Voice Engine, mis suudab tehisaru abil luua inimese sünteetilise hääle klooni vaid 15-sekundilise näidise põhjal.

Tehisintellekti loodud hääl suudab käsu peale ette lugeda tekstiviipasid kõnelejaga samas keeles või mõnes muus keeles.

OpenAI Voice Engine tootemeeskonna liige Jeff Harris märkis, et mudelit koolitati litsentsitud ja avalikult kättesaadavate andmete kombinatsiooni järgi. Mudel on momendil saadaval ainult umbes 10 arendajale.

AI tekstist heliks genereerimine on generatiivse AI valdkond, mis areneb jätkuvalt. Kuigi enamik keskendub instrumentaalsetele või loomulikele helidele, on vähem keskendutud hääle genereerimisele. Mõned nimed selles ruumis hõlmavad selliseid ettevõtteid nagu Podcastle ja ElevenLabs, mis pakuvad tehisintellekti hääle kloonimise tehnoloogiat ja tööriistu.

Samal ajal püüab USA valitsus piirata tehisintellekti kõnetehnoloogia ebaeetilist kasutamist. Eelmisel kuul keelas föderaalne kommunikatsioonikomisjon AI-hääli kasutavad robotkõned pärast seda, kui inimesed said rämpspostikõnesid tehisintellektiga kloonitud president Joe Bideni häälelt.

Allikas: The Verge