Kiinalainen DeepSeek nousi tunnetuksi tekoälyalalla alkuvuodesta 2025, kun se julkaisi kilpailukykyiset mallinsa, jotka oli kerrotun mukaan koulutettu selvästi muita johtavia malleja edullisemmin.
Sittemmin DeepSeek on jatkanut kehitystyötä ja tuonut tarjolle kehittyneempiä malleja, kuten huhtikuusssa V4-mallinsa.
MAINOS (ARTIKKELI JATKUU ALLA)
Nyt DeepSeek on julkaissut merkittävän päivityksen V4-lippulaivamalliinsa. Uusi DSpark-kehys on suunniteltu nopeuttamaan tekoälyn vastausten tuottamista.
DeepSeekin mukaan DSpark voi parantaa vastausnopeutta jopa 85 prosenttia. Tämä voi vähentää tarvetta käyttää entistä suurempia ja kalliimpia piirejä, mikä on erityisen tärkeää kiinalaisyhtiölle Yhdysvaltojen rajoitusten vähentäessä mahdollisuuksia tehokkaan laskentakapasiteetin saavuttamiseksi.
Suurten kielimallien perinteinen tapa tuottaa vastauksia token kerrallaan voi olla hidasta erityisesti pitkissä vastauksissa. DeepSeekin mukaan tämä johtaa usein siihen, että GPU-kiihdyttimiä ei hyödynnetä tehokkaasti ja käyttäjä kokee tehottomuuden pitkänä odotusaikana.
MAINOS (ARTIKKELI JATKUU ALLA)
DSparkin keskeinen tekniikka on speculative decoding eli spekulatiivinen dekoodaus. Siinä kevyempi luonnosmalli ehdottaa vastauksen mahdollisia seuraavia osia, minkä jälkeen suurempi malli tarkistaa ne erissä. Käytännössä siis sen sijaan, että raskas malli tuottaisi kaiken yksi token kerrallaan, pienempi malli tekee alustavan työn nopeasti ja isompi malli varmistaa laadun. Lopputuloksena on nopeammin syntyviä vastauksia pyyntöihin.
DeepSeek on vienyt ratkaisuaan pidemmälle puolittain autoregressiivisellä menetelmällä, jossa malli voi tuottaa pieniä token-ryhmiä eikä vain yhtä tokenia kerrallaan. DSpark sisältää myös luottamukseen perustuvan ajoitusjärjestelmän. Se säätää dynaamisesti, kuinka paljon tarkistusta vastaukseen käytetään sen mukaan, kuinka paljon laskentakuormaa järjestelmässä on.
Kun kysyntä on matala ja tarjolla on vapaata laskentakapasiteettia, järjestelmä voi tehdä tarkistuksia useammin. Kun kysyntä on ememmän, tarkistuksia voidaan vähentää, jotta vastaus saadaan ulos nopeammin. Ratkaisu tasapainottaa näin laatua, nopeutta ja laitteiston käyttöastetta. Käytännössä se voi auttaa tekoälypalvelua toimimaan sulavammin ruuhka-aikoina.
DeepSeek on julkaissut DSpark-tutkimuksensa avoimesti GitHubissa ja HuggingFacessa. Hanke on toteutettu yhteistyössä Pekingin yliopiston kanssa. Yhtiö on testannut kehystä useilla avoimilla malleilla, mukaan lukien Google DeepMindin Gemma ja Alibaban Qwen.
MAINOS (ARTIKKELI JATKUU ALLA)
Jo aiemminkin kiinalaiset tekoälykehittäjät ovat keskittyneet kehitystyössään resurssien niukkuuden vuoksi erityisesti mallien käyttökustannusten ja vastausnopeuden optimointiin, mille DeepSeekin DSpark-julkistus on jatkoa.
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla






Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »