Google DeepMind on esitellyt uuden Gemma 4 12B -tekoälymallin, joka tuo edistyneet multimodaaliset ja agenttipohjaiset tekoälyominaisuudet paikallisesti tavallisille kannettaville tietokoneille.
12 miljardin parametrin uutuus sijoittuu Gemma-malliston pienemmän Gemma 4 E4B -mallin ja suuremman 26 miljardin parametrin Mixture-of-Experts (MoE) -mallin väliin. Google kuvailee sitä tasapainoksi suorituskyvyn, muistinkulutuksen ja paikallisen käytettävyyden välillä.
Samalla Google kertoi Gemma-perheen mallien ylittäneen merkittävän rajapyykin: mallisarjaa on ladattu jo yli 150 miljoonaa kertaa maailmanlaajuisesti.
MAINOS (ARTIKKELI JATKUU ALLA)
Gemma 4 12B:n merkittävin uudistus on natiivi äänenkäsittelytuki. Toisin kuin monet nykyiset multimodaaliset tekoälymallit, Gemma ei käytä erillisiä kuva- tai ääni-enkoodereita. Sen sijaan kaikki syötteet käsitellään suoraan mallin ytimen kautta.
Tämä tarkoittaa Googlen mukaan pienempää muistinkulutusta, nopeampaa vasteaikaa sekä parempaa eri sisältömuotojen yhteisymmärrystä.
Google kertoo Gemma 4 12B:n saavuttavan suorituskyvyn, joka lähestyy huomattavasti suurempaa 26B MoE -mallia. Muistivaatimukset ovat kuitenkin huomattavasti pienemmät. Malli on optimoitu toimimaan 16 gigatavun VRAM-käyttömuistia sisältävillä grafiikkasuorittimilla tai 16 gigatavun yhteisellä käyttömuistilla. Käyttöön riittää siis esimerkiksi Applen MacBook Pro tai tarpeeksi tehokas Windows-läppäri.
MAINOS (ARTIKKELI JATKUU ALLA)
Google painottaa Gemma 4 12B:n olevan erityisesti agenttipohjaisia työnkulkuja varten kehitetty malli. Se pystyy esimerkiksi käsittelemään dataa itsenäisesti, analysoimaan kuvia, suorittamaan monivaiheisia tehtäviä, käyttämään työkaluja, rakentamaan verkkosivuja sekä tekemään päätöksiä usean vaiheen päättelyketjujen avulla
Google julkaisi samalla uuden Gemma Skills Repositoryn, joka sisältää valmiita agenttitaitoja ja toimintoja Gemma-pohjaisiin järjestelmiin.
Gemma 4 12B julkaistaan avoimena mallina Apache 2.0 -lisenssillä. Mallin voi ladata muun muassa Hugging Facesta, Kagglesta, Ollamasta ja LM Studiosta.
Lisäksi Google toi nyt Gemma 4 12B -mallin rinnalla Google AI Edge Galleryn sekä täysin laitteella toimivan Google AI Edge Eloquent -sanelusovelluksen macOS:lle.
MAINOS (ARTIKKELI JATKUU ALLA)
AI Edge Gallery on Googlen oma ratkaisu paikallisten tekoälymallien, kuten uuden Gemma 4 12B:n, suorittamiseen. Aiemmin sovellus oli saatavilla jo Androidille ja iOS:lle. AI Edge Galleryn voi ladata Googlen verkkosivuilta.
Google AI Edge Eloquent ilmainen sanelutyökalu, joka toimii kokonaan käyttäjän omalla laitteella. Sovellus ei pelkästään muunna puhetta tekstiksi, vaan myös poistaa täytesanoja, korjaa kielioppia, parantaa luettavuutta sekä yleisesti muokkaa tekstiä luonnollisemmaksi
Yksi Eloquentin merkittävimmistä ominaisuuksista on mahdollisuus lisätä omia sanoja. Käyttäjä voi opettaa sovellukselle esimerkiksi nimiä, yritysten nimiä, teknisiä termejä, ammattisanastoa ja lyhenteitä Eloquent tukee myös erilaisia kirjoitustyylejä.
Myös Google AI Edge Eloquent on ladattavissa Googlen verkkosivuilta.
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla







Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »