Meta lisää panostustaan tekoälyyn uusia malleja tuottamalla. Tiedotteessaan se esittelee palveluita, jotka luovat ääntä ja musiikkia tekstin perusteella.
Facebook-yhtiö Meta pyrkii tekoälykehityksen aallonharjalle ja kertoo julkaisevansa kolme erilaista tuottavan tekoälyn mallia julkiseen käyttöön avoimen lähdekoodin periaatteella.
MAINOS (ARTIKKELI JATKUU ALLA)
MusicGen, AudioGen ja EnCodec ovat kaikki äänisisältöä luovia tuottavan eli generatiivisen tekoälyn ratkaisuja. Ne sisältyvät samaan AudioCraft-kokonaisuuteen, joka Metan mukaan tarjoaa tulevaisuudessa ratkaisuja kaikenlaisiin käyttötapoihin.
Kaikki kolme palvelua toimivat samalla periaatteella: lyhyillä tekstikehotteille käyttäjät voivat tuottaa erilaisia ääniä monenlaisiin käyttötarkoituksiin.
AudioGen tuottaa äänimaailmoja ja -tehosteita, MusicGen taas rytmejä ja musiikkia. EnCodec sen sijaan perustuu niin kutsuttuihin neuroverkkoihin sopien muun muassa tiivistetyn, laadukkaan äänen tuotantoon.
MAINOS (ARTIKKELI JATKUU ALLA)
Käytännön esimerkkeinä AudioGen osaa pyöräyttää kokoon vaikkapa auton äänitorvia tai eläinten kutsuhuutoja mukailevia tehosteita, MusicGen taas kokonaan uutta musiikkia esimerkiksi tyylilajin perusteella.
Metan mukaan kutakin palvelua on kehitetty sisäisesti jo pitkään, ja nyt ne ovat valmiita laajempaan käyttöön ja kokeiluun.
Ääntä tuottavat tekoälyratkaisut ovat yleisesti jääneet teksti- ja kuvamallien varjoon, Meta kirjoittaa, mutta kertoo suhtautuvansa luottavaisesti niiden tulevaisuuteen.
Vaikka AudioCraft-palvelukokonaisuus onkin nyt julkaistu avoimen lähdekoodin periaatteella, on se suunnattu lähinnä tutkijoille ja ammattikehittäjille. Nähtäväksi jää, milloin tavalliset käyttäjät pääsevät sitä kokeilemaan.
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla
Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »