Meta on esitellyt puhetta tuottavaa tekoälymalliaan, joka luo ihmismäistä puhetta vain lyhyen ääninäytteen perusteella. Voiceboxia käytettäneen tulevaisuudessa monin tavoin.
Voicebox on Facebook-ythiö Metan puhetta luova generatiivisen eli tuottavan tekoälyn malli. Muun muassa ChatGPT:stä tuttu tuottava tekoäly luo kehotteiden perusteella esimerkiksi ihmismäistä tekstiä tai kuvia, ja Metan Voicebox tuottaa ääntä pitkälti samalla periaatteella.
MAINOS (ARTIKKELI JATKUU ALLA)
Toimiakseen Voicebox tarvitsee vain kahden sekunnin äänitteen. Sen perusteella tekoäly kykenee tuottamaan puhetta, joka kuulostaa intonaatiota myöten äänitteellä puhujan lausumalta. Mallilla voi esimerkiksi tuottaa kokonaan uutta puhetta tai vaihtoehtoisesti paikata taustahälyn aiheuttamia aukkoja vaikkapa nauhoitettuihin puheisiin.
Voiceboxin avulla halutun äänen voi saada puhumaan monia kieliä. Tuettuja kieliä ovat esimerkiksi espanja, ranska, puola, englanti, saksa sekä portugali, ja valikoimaa on myöhemmin määrä laajentaa.
Metan mukaan ääntä tuottava tekoälymalli Voicebox on vasta kehitysasteella, eikä sitä vielä ole julkaistu yleiseen käyttöön. Tulevina vuosina siitä voitaisiin kuitenkin hyödyntää esimerkiksi niin kutsutuissa metaversumeissa tai vaikkapa videopelien puhutuissa vuorosanoissa.
MAINOS (ARTIKKELI JATKUU ALLA)
Niin ikään uhanalaisten kielten suojelemisessa tuottavan tekoälyn mallista voi Metan mukaan olla myöhemmin apua. Voiceboxista on määrä kuulla lisää ”pian”.
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla
Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »