Tekoäly-yhtiö OpenAI on päättänyt joulukuun 12 päivän julkistusputkensa esittelemällä uudet tekoälymallinsa o3:n ja o3 minin.
o3-mallit seuraavat OpenAI:n aiemmin vuonna 2024 julkistamia o1-malleja. Laajaan käyttöön OpenAI julkaisi o1:n vasta joulukuun julkistustensa aluksi, mikä kertoo kehityksen vauhdista seuraavien mallien astuessa jo nyt esiin.
MAINOS (ARTIKKELI JATKUU ALLA)
o-mallit eroavat OpenAI:n valtavirtaa edustavista GPT-malleista ”enemmällä ajattelulla” ollen parempia loogisessa päättelyssä sekä laaja-alaisessa pohdinnassa ja pystyen vastamaan tämän myötä monimutkaisempiin kysymyksiin.
Nyt julkistettu o3-mallien perhe koostuu toistaiseksi o3-perusversiosta sekä kevyemmästä, pienemmästä o3-mini-versiosta, joka on räätälöity vastaamaan erityisesti koodiaiheisiin pyyntöihin.
Uudet mallit kantavat o3-nimeä o1:n jälkeen seuraavana vuorossa olleen o2:n sijaan johtuen Isossa-Britanniassa O2-nimellä operaattorista.
MAINOS (ARTIKKELI JATKUU ALLA)
o3-mallien julkistuksen yhteydessä OpenAI on varsin mahtipontisesti todennut, että joiltakin osin o3 lähestyisi jo niin sanottua yleistä tekoälyä (AGI), joka vastaisi ihmisajattelua. Toki todellisuus on vielä rajoitetumpi, ja OpenAI:n AGI-määritelmä itsessään suppeampi käsittäen korkeatasoiset autonomiset järjestelmät, jotka suoriutuvat ihmisiä paremmin taloudellisesti arvokkaimpiin lukeutuvassa työssä.
Samalla turvallisuuden huomioimiseksi uuden mallin yhteydessä OpenAI on kertonut käyttävänsä uutta tekniikkaa, nimeltään englanniksi deliberative alignment, joka mukauttaa o3:n toimintaa OpenAI:n turvallisuustavoitteisiin.
o3 ja o3-mini eivät tule heti yleisesti saataville, vaan OpenAI tuo ne aluksi vain rajatusti turvallisuustutkijoiden saataville esiversioina. OpenAI suunnittelee o3-minin varsinaista julkaisua tammikuun lopulla, minkä jälkeen vuorossa on monipuolisempi o3.
Niin sanotut järkeilevät tekoälymallit jakavat niille esitetyn pyynnön osiin, jonka ne suorittavat vaiheittain ja käytännössä pyrkivät varmistamaan vastauksensa oikeellisuuden ennen etenemistään. Tästä syystä mallit toimivat hitaammin kuin tavanomaiset mallit. Vastauksien syntyminen monimutkaisiin kysymyksiin voi kestää jopa minuutteja.
MAINOS (ARTIKKELI JATKUU ALLA)
OpenAI:n mukaan o3 on koulutettu ”ajattelemaan” uudella tavalla ennen vastaamista. OpenAI kutsuu ratkaisua englanniksi nimellä private chain of thought. Käytännössä kyse on edelleen pyynnön jakamisesta osatehtäviin ja näiden suorittamisesta oikean ratkaisun löytämiseksi. Heti vastauksen tuottamisen sijaan o3-malli harkitsee erilaisia liitännäisiä pyyntöjä ja selittää taustalla tapahtuvan järkeilynsä sen tapahtuessa. Tämän jälkeen malli luo yhteenvedon kokonaisuutena parhaaksi arvioimastaan vastauksesta.
o3:n yhteydessä uutta on mahdollisuus säätää mallin toiminta-aikaa kolmella eri tasolla. Pidempi aika merkitsee parempia vastauksia, mutta hitaammin ja enemmällä laskennalla.
OpenAI:n mukaan tekoälymallien suorituskykyä mittaavissa testeissä o3 on noussut uudelle tasolle.
”Useissa haastavimmista etulinjan arvioinneista OpenAI o3 asettaa uusia virstanpylväitä koodauksessa, matematiikassa ja tieteellisessä päättelyssä. Se myös edistyy merkittävästi ARC-AGI-arvioinnissa ensimmäistä kertaa”, OpenAI toteaa.
MAINOS (ARTIKKELI JATKUU ALLA)
ARC-AGI-testissä, joka mittaa tekoälyjärjestelmien kykyä oppia uusia kykyjä alkuperäisen koulutusdatan ulkopuolelta, o3 saavutti jopa 87,5 prosentin pistemäärän korkeimmalla toiminta-ajan ja laskentatehon asetuksella. Jopa vähäisimmällä asetuksellaan uuden mallin tulokset olivat kolminkertaiset o1:een verrattuna.
Myös muissa testeissä o3 on noussut eri tekoälymallien tiukassa – ja jatkuvasti muuttuvassa – kisassa kärkipaikalle. Esimerkiksi SWE-Bench Verified -testissä o3 voittaa o1:n 22,8 prosenttiyksiköllä. AIME 2024 testissä o3 vastasi väärin vain yhteen kysymykseen. EpochAI:n Frontier Math -matematiikkatestissä o3 pystyi ratkaisemaan 25,2 prosenttia ongelmista, kun yksikään muu tekoälymalli ei ole yltänyt yli kahteen prosenttiin.
Kaiken kaikkiaan uusi o3-malli vaikuttaa siis varsin kyvykkäältä. Kilpailu on kuitenkin jatkuvaa.
Google ehti vasta päivää ennen OpenAI:n o3-malleja julkistamaan oman järkeilevän ja ”ajatuskulkunsa” esittävän Gemini 2.0 Flash Thinking -tekoälymallinsa laajentamaan viimeisimmän sukupolven tekoälymalliensa valikoimaa. Googlelta ja muilta tekoälykehityksen kärjessä OpenAI:n ohella kulkevilta yhtiöiltä voidaan nähdä vielä lisäjulkistuksia ennen o3-mallien laajempaa saataville tuloa.
Enemmän laskentatehoa kuluttavat, pyyntöjä pidemmin käsittelevät järkeilevät mallit ovat nousseet viime aikoina voimallisesti tekoälykehityksen keskiöön samalla, kun perinteisempien suurten kielimallien kehitys on dramaattisesti hidastunut – muun muassa siksi, että merkittävästi enemmän dataa ei yksinkertaisesti ole enää saatavilla uusien mallien kehittämiseen.
On several of the most challenging frontier evals, OpenAI o3 sets new milestones for what’s possible in coding, math, and scientific reasoning.
It also makes significant progress on the ARC-AGI evaluation for the first time. https://t.co/QxPqhf22hQ
— OpenAI (@OpenAI) December 20, 2024
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla
Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »