Kiinalainen DeepSeek on julkaissut uuden sukupolven kielimallit, DeepSeek-V4-sarjan, joissa parannukset keskittyvät erityisesti pitkien tekstien käsittelyyn, päättelyyn ja agenttipohjaisiin tehtäviin.
DeepSeek-V4 on tarjolla kahtena versiona: tehokkaampi Pro sekä kevyempi Flash.
MAINOS (ARTIKKELI JATKUU ALLA)
Suurin uudistus DeepSeekin uusissa malleissa on tuettu kontekstipituus pyynnöissä. DeepSeek-V4 tukee jopa miljoonan tokenin pyyntöjä, mikä mahdollistaa erittäin pitkien dokumenttien, koodikantojen ja analyysien käsittelyn yhdellä kertaa.
DeepSeek-V4-mallit ovat suunnattu erityisesti tutkimukseen, ohjelmistokehitykseen sekä monivaiheisiin tehtäviin.
DeepSeek-V4-Pro on tehokkaampi sisältäen 1,6 biljoonaa parametria, joista 49 miljardia aktiivista, ja on suunnattu vaativaan päättelyyn ja koodaukseen.
MAINOS (ARTIKKELI JATKUU ALLA)
DeepSeek-V4-Flash puolestaan keskittyy nopeuteen sisältäen 284 miljardia parametria (13 miljardia aktiivista), pienemmän ja alhaisemmat kustannukset.
DeepSeek hyödyntää Mixture-of-Experts-rakennetta, jossa vain osa mallin parametreista on käytössä kerrallaan. Tämä parantaa suorituskykyä ilman vastaavaa laskentakuorman kasvua.
Lisäksi mallit käyttävät uusia tekniikoita, kuten tiivistettyä ja harvaa attention-mekanismia, usean tokenin ennustamista sekä matalamman tarkkuuden laskentaa (FP4 ja FP8). Näiden avulla muistinkäyttö ja laskentateho pysyvät kurissa, vaikka mallien koko on kasvanut.
DeepSeek-V4 on rakennettu tukemaan agenttipohjaisia työnkulkuja, joissa tekoäly käyttää työkaluja, suorittaa monivaiheisia tehtäviä sekä tekee päätöksiä useiden vaiheiden kautta. Mallia voidaan integroida esimerkiksi kehitystyökaluihin ja automatisoituihin prosesseihin.
MAINOS (ARTIKKELI JATKUU ALLA)
DeepSeek kertoo mallien tulosten parantuneen erityisesti päättelytehtävissä, ohjelmoinnissa sekä pitkän kontekstin käsittelyssä. DeepSeekin esittelemien testitulosten perusteella DeepSeek-V4-Pro-Max vertautuu hyvin Anthropicin (Claude Opus 4.6 Max), OpenAI:n (GPT-5.4) ja Googlen (Gemini 3.1 Pro) viimeaikaisiin, joskaan ei enää aivan viimeisiin malleihin.
Avoimien mallien joukossa se sijoittuu kärkeen erityisesti agenttipohjaisessa koodauksessa.
DeepSeek-V4 on saatavilla sekä verkkopalvelun että API-rajapinnan kautta. Avointen painojen malleina DeepSeek-V4-mallit ovat myös ladattavissa Hugging Facesta omalla laitteistolla ajettavaksi, joskin tehoa tarvitaan paljon.
DeepSeek-V4-malleja voidaan käyttää myös yhdessä työkalujen, kuten Claude Coden, OpenClaw’n ja OpenCoden kanssa.
MAINOS (ARTIKKELI JATKUU ALLA)
Samalla DeepSeek ilmoitti nyt lopettavansa vanhemmat mallinsa kesään 2026 mennessä.
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla








Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »