Microsoftin uusi tekoäly tuottaa videoita lähes tyhjästä. VASA-1:lle riittää yksi kuva ja ääninäyte.
Microsoft on vastikään esitellyt uuden tekoälymallinsa VASA-1:n, joka tuottaa tarkkuudeltaan 512 x 512 pikselin kokoisia videoita pelkän valokuvan ja ääninäytteen avulla. Esimerkiksi ihmisiä kuvatessaan se kykenee todenmukaisesti jäljentämään esimerkiksi huulten liikkeitä, ilmeitä ja muita pieniä yksityiskohtia, Microsoft kuvailee.
MAINOS (ARTIKKELI JATKUU ALLA)
Microsoftin julkaisemalla esimerkkivideolla erehdyttävän aidon näköinen naishenkilö puhuu luonnollisen kuuloista englantia. Videolla on näkyvissä myös valokuva, jonka perusteella tuotos on tehty.
VASA-1 perustuu generatiiviseen eli tuottavaan tekoälyyn esimerkiksi ChatGPT:stä tutun GPT:n ja monien muiden tekoälymallien lailla.
Tuotetut videot toistuvat 40 ruutua sekunnissa, ja ainakin teoriassa mahdollisuudet kuulostavat lähes rajattomilta – niin hyvässä kuin pahassakin. Siinä missä VASA-1 voisi esimerkiksi ikään kuin herättää eloon historian suurhahmoja, voitaisiin sitä käyttää myös väärin niin kutsuttujen syväväärennösten tuottamiseen.
MAINOS (ARTIKKELI JATKUU ALLA)
Toistaiseksi VASA-1 onkin lähinnä tutkimusprojekti, Microsoft kertoo, eikä se suinkaan ole valmis yleiseen julkaisuun. Yhtiö aikoo odottaa rauhassa ja lanseerata mallinsa vasta, kun tarvittava säännöstely on saatu voimaan.
Toistaiseksi ei olekaan tietoa siitä, milloin VASA-1 kenties julkaistaan suurelle yleisölle. Artikkelin julkaisuhetkellä se on vain Microsoftin itsensä käytettävissä.
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla
Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »