Jatkuvasti kehittyneempien tekoälymallien kouluttaminen vaatii paljon dataa, ja sitä on monin paikoin hankittu myös kyseenalaisin keinoin.
Aiemmin tällä viikolla Wired raportoi muun muassa Applen, Claude-tekoälypalvelustaan tunnetun Anthropicin, Nvidian sekä Salesforcen hyödyntäneen tekoälymalliensa kouluttamiseen luvattomasti YouTube-videopalvelusta peräisin olevaa materiaalia.
MAINOS (ARTIKKELI JATKUU ALLA)
Jättiyhtiöt hyödynsivät voittoa tavoittelemattoman EleutherAI:n ensisijaisesti pienille kehittäjille ja tutkimuskäyttöön koostamaa The Pile -data-aineistoa, jonka osana oli yli 170 000 YouTube-videon pohjalta luotu YouTube Subtitles -datapaketti.
Käytännössä Apple ja muut olivat hyödyntäneet YouTube-videoista automaattisesti luotuja tekstityksiä tekoälymalliensa kouluttamiseen. YouTuben käyttöehdot eivät salli palvelun sisältämän materiaalin käyttöä tällä tavalla.
Apple ja muut eivät olleet itse luvatta ladanneet materiaaleja YouTubesta, vaan olivat vastaanottaneet ne välikäden kautta.
MAINOS (ARTIKKELI JATKUU ALLA)
Apple koulutti YouTube-materiaalit sisältävään aineistoon perustuen avoimen koodin OpenELM-tekoälymallejaan, jotka yhtiö julkaisi huhtikuussa.
Kohun jälkeen Apple on nyt vahvistanut, muun muassa 9to5Mac-sivustolle, ettei OpenELM-tekoälymalleja hyödynnetä missään Applen tarjoamissa tekoäly- tai koneoppimistoiminnoissa, ei myöskään Applen jo julkistamissa ja syksystä alkaen julkaistavaksi odotetuissa Apple Intelligence -toiminnoissa.
Lue tästä myös: Apple Intelligence julki – näin Applen tekoäly ja ChatGPT tulevat iPhoneen, iPadiin ja Maciin
Applen mukaan se loi OpenELM-tekoälymallit osallistuakseen tutkimusyhteisön toimintaan ja kehittääkseen avoimen koodin suuria kielimalleja eteenpäin.
Apple on todennut OpenELM:n kehityksen tapahtuneen vain tutkimustarkoituksiin, eikä toimimaan minkään Apple Intelligence -toiminnon taustalla. Lisäksi Applen mukaan sillä ei ole suunnitelmia julkaista uusia versioita OpenELM-mallista.
MAINOS (ARTIKKELI JATKUU ALLA)
Koska OpenELMiä ei käytetä Apple Intelligence -toimintoihin, ei myöskään luvatta hankittuja YouTube-materiaaleja ole käyetty osana niiden taustalla toimivien mallien koulutusta.
Aiemmin Apple on todennut Apple Intelligence -toimintojen tekoälymallien olevan koulutettu perustuen lisensoituun dataan, mukaan lukien tiettyjen toimintojen parantamiseen valittu data, kuin myös julkisesti saatavilla olevaan dataan, jota Applen verkkokeriäin on verkkosivuilta kerännyt.
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla
Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »