Google on esitellyt uuden Gemini 3.5 Live Translate -mallin reaaliaikaiseen puheen kääntämiseen.
Malli osaa tunnistaa yli 70 kieltä ja tuottaa sujuvaa, luonnolliselta kuulostavaa käännettyä puhetta, joka säilyttää Googlen mukaan alkuperäisen puhujan intonaation, rytmin ja äänenkorkeuden.
Uudistus tulee ensin Google Kääntäjä -sovellukseen Androidilla ja iOS:llä sekä myöhemmin Google Meetiin, jossa se laajentaa reaaliaikaisen puhekäännöksen huomattavasti aiempaa useammille kielille.
MAINOS (ARTIKKELI JATKUU ALLA)
Aiemmin Meet-videopuheluiden puhekäännös tuki vain viittä kieltä ja perustui pitkälti englannin kautta tapahtuvaan kääntämiseen. Uuden mallin myötä Meet tukee yli 2 000 kieliyhdistelmää yhdessä kokouksessa. Tämä tarkoittaa, että käännökset eivät rajoitu enää vain englannin ja muiden kielten välisiin yhteyksiin, vaan osallistujat voivat käyttää huomattavasti laajempaa valikoimaa kielipareja.
Perinteiset puhekäännösjärjestelmät toimivat usein vuoropohjaisesti. Ne odottavat, että puhuja lopettaa lauseensa tai puheenvuoronsa, minkä jälkeen järjestelmä käsittelee sisällön ja tuottaa käännöksen.
Gemini 3.5 Live Translate toimii eri tavalla. Malli tuottaa käännettyä puhetta jatkuvasti samalla, kun alkuperäinen puhuja vielä jatkaa puhumista. Tämän ansiosta käännös pysyy vain muutaman sekunnin puhujan jäljessä ja kuulostaa keskustelussa huomattavasti luonnollisemmalta.
MAINOS (ARTIKKELI JATKUU ALLA)
Käyttäjä voi käynnistää käännöstoiminnon napauttamalla sovelluksen vasemmassa alakulmassa olevaa live-käännöksen painiketta kuulokkeet päässä. Käyttäjä voi kuulla vieraskielisen puheen käännettynä lähes reaaliajassa, esimerkiksi matkalla, kokouksessa, luennolla tai keskustelussa toista kieltä puhuvan henkilön kanssa.
Android-sovellus saa lisäksi uuden kuuntelutilan tilanteisiin, joissa kuulokkeita ei ole saatavilla. Käyttäjä voi tällöin kuunnella käännöksen puhelimen kuulokkeesta pitämällä laitetta korvalla aivan kuten tavallisessa puhelussa.
Google tuo Gemini 3.5 Live Translate -mallin myös kehittäjille. Malli on saatavilla julkisena esikatseluna Gemini Live API:n ja Google AI Studion kautta.
Google kertoo lisäävänsä kaikkiin Gemini 3.5 Live Translaten tuottamiin äänikäännöksiin SynthID-vesileiman. Kyseessä on käyttäjälle huomaamaton vesileima, joka upotetaan suoraan äänisignaaliin. Sen avulla voidaan myöhemmin tunnistaa, että ääni on tekoälyn tuottamaa.
MAINOS (ARTIKKELI JATKUU ALLA)
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla






Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »