Image Image Image Image Image Image Image Image Image Image

Googlen tekoäly kuulostaa yhä enemmän ihmiseltä – ääninäytteet kuunneltavissa Googlen sivuilta

(Mainos: Moi Mobiililta 100 megabitin 4G-liittymä vain 6 €/kk tai rajattomalla datasiirrolla 18 €/kk! Tutustu ja tilaa edullinen Moi-liittymä nyt tästä!)

Google logo

Tekstin muuttaminen puheeksi tietokoneen avulla on vuosikymmeniä vanha keksintö. Perinteisesti puhegeneraattoreita on kuitenkin vaivannut voimakas robottimainen aksentti, joka pahimmillaan on tehnyt puhutun ymmärtämisestä vaikeaa. Googlen uusi Tacotron 2 -projekti pyrkii puuttumaan ongelmaan, tarjoten puhegeneraattorin, jota Googlen mukaan on äärimmäisen vaikea erottaa oikeasta ihmisäänestä.

Toistaiseksi vain englanniksi toimiva puhegeneraattori ottaa tekstin kääntämisessä huomioon lukuisia normaalissa puheessa havaittavia lausumistapoja. Generaattori esimerkiksi muuttaa sanojen äänenpainoa riippuen siitä, onko kyseessä toteamus tai kysymys. Lisäksi Tacotron 2 osaa tunnistaa asiayhteyden, jossa sanoja käytetään ja erottaa homonyymejä (samoin kirjoitettavia, mutta eri asioita tarkoittavia tai eri lailla lausuttavia sanoja).

Esimerkkeinä Google tarjoaa muun muassa englanninkieliset lauseet ”he thought it was time to present the present” (suom. ”hän ajatteli, että oli aika esitellä lahja”) ja ”don’t desert me here in the desert” (suom. ”älä hylkää minua tänne automaahan”). Huolimatta present ja desert sanojen vaihtuvista merkityksistä, Tacotron 2 tunnistaa sanojen asiayhteyden ja muuttaa lausumistaan sen mukaisesti.

Asiayhteyden lisäksi Tacotron 2 muuttaa äänenpainoaan sanojen intonaation mukaisesti, jolloin tarkoitus voi muuttua riippuen siitä, mitä sanoja lauseessa painotetaan. Esimerkkitekstissä voimakas intonaatio oli merkitty sanoihin käyttämällä isoja alkukirjaimia, joten tältä osin Tacotron 2 ei etsi painotuksia tekstin muusta kontekstista.

Muiden ominaisuuksien joukossa Tacotron 2 osaa lukea tekstin oikein huolimatta pienimuotoisista kirjoitusvirheistä ja pystyy toistamaan erilaisia sanaleikkejä. Vähemmän yllättävästi Tacotron 2 ottaa huomioon myös välimerkkien, kuten pilkkujen, tuomat muutokset lauseen lausumiseen.

Tarkemmin Tacotron 2 -projektiin ja julkaistuihin ääninäytteisiin voi tutustua Googlen sivuilta.

(Mainos: Moi Mobiililta 100 megabitin 4G-liittymä vain 6 €/kk tai rajattomalla datasiirrolla 18 €/kk! Tutustu ja tilaa edullinen Moi-liittymä nyt tästä!)

 

Seuraa Mobiili.fitä

Mainos: Nopea 4G-liittymä puhelimeen vain 6 € / kk. Lue kokemuksia Moi Mobiilista

Kommentoi

Peru vastaus

Kommentit

  1. ehkäjatkooon

    No huh. Ei noita erota oikeasta ihmisestä kuin paikoittain, jos osaa oikein kaivamalla etsiä eroja oikeaan puheeseen.

  2. Hendriks

    Vaikuttavaa!. Amerikkalaiset jälleen näyttämässä maailmalle mallia, 👍.

    • Hendriks

      Vaikuttavaa!. Minä olen täällä taas,👎.

  3. Kirsti

    Vai automaahan ;)

  4. N5,5.1(XtraSmooth,FrankoKernel)

    No niin. Ihmiskunnan tuho on taas askeleen lähempänä.

Tuoreimmat jutut