Microsoftin insinööri varoitti tekoälyllä tuotetuista alastonkuvista jo kauan sitten. Ohjelmistojätti painosti hänet kuitenkin poistamaan raporttinsa, mikä saattoi johtaa hiljattaisiin ongelmiin.
Shane Jones on insinööri, joka työskentelee Microsoftin ohjelmistokehityksessä vastuuinsinöörinä. Jonesin alaa ovat muun muassa generatiivista eli tuottavaa tekoälyä hyödyntävät palvelut, joita kehittäessään Microsoft hyödyntää ChatGPT:stä tutun OpenAI:n malleja, kuten tekstikehotteiden perusteella kuvia tuottavaa DALL-E 3:a.
MAINOS (ARTIKKELI JATKUU ALLA)
Jones havaitsi DALL-E 3:sta viime vuoden puolella eräänlaisen porsaanreiän, jota hyödyntämällä käyttäjät kykenisivät kiertämään tekoälymallin estoja esimerkiksi alastonkuvia ja väkivaltaista sisältöä tuottaakseen. Insinööri raportoi löydöksistään työnantajalleen, joka puolestaan kehotti tätä kääntymään OpenAI:n puoleen.
OpenAI lupasi tutkia tilannetta ja palata myöhemmin asiaan, mutta koska mitään ei kuulunut, päätti Jones jakaa löydöksensä julkisesti LinkedInissä. Microsoft reagoi kirjoitukseen nopeasti, ja Jones sai esihenkilöltään kehotuksen poistaa se, aiheesta kirjoittava Geekwire kuvailee.
Myös Microsoftin piti pian perustella Jonesille poistopyyntöään, mutta ei milloinkaan palannut asiaan, insinööri kertoo.
MAINOS (ARTIKKELI JATKUU ALLA)
”Seuranneen kuukauden aikana vaadin jatkuvasti selitystä sille, miksi minun piti poistaa julkaisuni. Tarjouduin myös jakamaan tietoa, jota voitaisiin käyttää löytämäni haavoittuvuuden korjaamiseen sekä tekoälyyn perustuvan, kuvia tuottavan teknologian turvallisuuden parantamiseen”, Jones jatkaa sittemmin tekemässään kirjallisessa selvityksessä, jonka Geekwire sai käsiinsä.
Tapauksesta merkittävän tekee se, että Microsoft joutui vastikään mukauttamaan DALL-E 3-malliin perustuvan Designer-palvelunsa toimintaa, kun joukko innokkaita käyttäjiä onnistui kiertämään säädöksiä ja tuottamaan tekaistuja alastonkuvia laulaja Taylor Swiftin kaltaisista julkimoista. Jonesin löydösten ansiosta ongelmat olisi kenties voitu ainakin osin estää.
OpenAI:n tiedottaja kommentoi tapausta medialle vakuuttaen, että yhtiö perehtyi Jonesin raporttiin välittömästi. Mitään huolestuttavaa ei kuitenkaan löytynyt, eikä Jonesin ”tekniikalla kyetty kiertämään turvajärjestelmiä”.
Artikkelin julkaisuhetkellä on vaikeaa saada selkeää kuvaa tilanteen etenemisestä. Omien sanojensa mukaan Jones kehotti OpenAI:ta vetämään DALL-E 3:n väliaikaisesti markkinoilta jo joulukuussa, kun taas yhtiö itse ei löytänyt mallistaan minkäänlaista vikaa. Microsoft sen sijaan painosti insinööriään poistamaan aikaisemman raporttinsa, mutta joutui kuitenkin kiristämään DALL-E 3:een perustuvan Designer-palvelunsa säädöksiä – vaikka niiden kiertämisen ei pitänyt olla mahdollista.
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla
Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »