Google esitteli tänään Google I/O -tapahtumassaan odotetusti uusia kehitysaskeleitaan tekoälyn saralla.
Googlen mukaan se on tuonut Gemini-tekoälyn jo kaikkiin yli 2 miljardin käyttäjän palveluihinsa. Yhteensä Google I/O:n avausesityksessä AI eli tekoäly mainittiin 120 kertaa, Google kertoi tilaisuutensa päätteeksi.
Tänään Google keskittyikin erityisesti tekoälyyn, ja esimerkiksi Android 15:n uudistuksista kuullaan lisää vasta keskiviikkona julkaistavan Android 15 Beta 2:n myötä.
MAINOS (ARTIKKELI JATKUU ALLA)
Google esitteli jo viime vuonna hakukoneensa laajan generatiivisen tekoälyn uudistuksen, joka tuolloin kulki nimellä Search Generative Experience ja tuli saataville testiversiona. Uudistuksen myötä sopivissa hakukyselyissä Google tuottaa perinteisten sivustolinkkien yläpuolelle generatiivisen tekoälyn luoman yleiskatsauksen aiheesta.
Nyt Google kertoi, että haun uudet tekoäly-yhteenvedot (englanniksi nyt nimeltään AI Overviews) tulevat yleisesti saataville Yhdysvalloissa tästä viikosta alkaen ja valituissa muissa maissa pian. Kuluvan vuoden loppuun mennessä Google-haun tekoäly-yhteenvedot tulevat olemaan Googlen mukaan jo yli miljardin ihmisen käytössä.
This is Search in the Gemini era. #GoogleIO pic.twitter.com/JxldNjbqyn
— Google (@Google) May 14, 2024
MAINOS (ARTIKKELI JATKUU ALLA)
”Google googlaa puolestasi”, Google kuvaili tekoäly-yhteenvetojen tuloa osaksi hakukonettaan.
Google kehittää haun tekoälytoiminnallisuutta luonnollisesti myös eteenpäin, ja tuo uudistuksia testattavaksi aluksi Labsin kautta. Jatkossa haku osaa esimerkiksi tehdä matkasuunnitelmia tai ateriaideoita useammalle päivälle, kun se oppii pilkkomaan kysymyksiä osiin, jotka se ratkaisee erikseen. Google antoi myös yhden esimerkin siitä, kuinka Google-haku voi auttaa ei vain löytämään lähellä olevia pilates-saleja, vaan myös selvittämään niiden aukioloajat ja antamaan suoraan ohjeet varauksen tekemiseksi – kaiken tämän vain yhdellä haulla.
Google-hakuja voi lisäksi jatkossa tehdä tekstipyynnön tai kuvan lisäksi myös videoon perustuen.
And you’ll also be able to ask questions with video, right in Search. Coming soon. #GoogleIO pic.twitter.com/zFVu8yOWI1
MAINOS (ARTIKKELI JATKUU ALLA)
— Google (@Google) May 14, 2024
Googlen tekoälytoimintojen taustalla ovat sen Gemini-tekoälymallit. Ne toimivat osana Googlen Gemini-palvelua, eli vastinetta OpenAI:n ChatGPT:lle, sekä Gemini-tekoälytoimintoja eri Googlen sovelluksissa.
Google kertoi Gemini Advanced -tilauksensa toimivan nyt Gemini 1.5 Pro -mallin 1 miljoonan tokenin konteksti-ikkunalla, eli mahdollisella pyynnön pituudella, ja olevan saatavilla jo 35 eri kielellä. 1 miljoonia tokenia mahdollistaa esimerkiksi 1 500 sivua pitkän asiakirjan lähettämisen osana pyyntöä.
MAINOS (ARTIKKELI JATKUU ALLA)
Samalla Google julkisti Gemini 1.5 Pro -mallinsa konteksti-ikkunan laajentuvan jatkossa myöhemmin tänä vuonna 2 miljoonaan tokeniin. Aluksi uudistus tulee saataville kehittäjille.
Google esitteli myös uuden Gemini Flash 1.5 -version, Gemini 1.5 Prohon verrattuna kevyemmän mallin, joka suunniteltu nopeaksi ja kustannustehokkaaksi laajassa käytössä. Gemini 1.5 Flash tukee kuitenkin Pron tavoin 1 miljoonan tokenin konteksti-ikkunaa sekä multimodaalisia pyyntöjä, eli tekstin ohella esimerkiksi kuviin perustuvia kysymyksiä.
Gemini-sovellustaan Androidilla Google kehittää kontekstitietoisemmaksi. Gemini ymmärtää jatkossa sen mitä laitteen näytöllä tapahtuu ja voi auttaa siihen perustuvissa kysymyksissä. Tämän myötä myöhemmin tänä vuonna Androidilla mahdolliseksi tulee raahata ja pudottaa generatiivisen tekoälyn luomia kuvia Google Messages -viestisovellukseen ja Gmailiin kuin myös kysyä kysymyksiä YouTube-videoista, tai PDF-tiedostoista, jos käytössä on Gemini Advanced -tilaus.
Gemini on @Android is becoming more helpful and context aware. Later this year, you’ll be able to drag-and-drop generated images into Google Messages & Gmail, and ask questions about @YouTube videos and PDFs right on your device. #GoogleIO pic.twitter.com/ZRajfzXBWw
— Google (@Google) May 14, 2024
Jatkossa Gemini korvaa myös oletuksena Googlen vanhan avustajapalvelun Google Assistantin Androidilla.
Samsungin huippulaitteissa ja Googlen omissa Pixel-laitteissa esiteltyä ja jo yli 100 miljoonassa laiteessa saatavilla olevaa Circle to Search -hakua Google on kehittänyt myös älykkäämmäksi. Circle to Search osaa jatkossa auttaa erilaisissa matemaattisissa ja muissa kysymyksissä, auttaen esimerkiksi opiskelijoita suorittamaan kotitehtävänsä ja oppimaan siinä sivussa.
Circle to Search now makes for a great study buddy 📝 You can circle complex physics problems on your phone or tablet to get step-by-step instructions to learn how to solve. #GoogleIO pic.twitter.com/nFFW36BwWo
— Google (@Google) May 14, 2024
Lisäksi Google kertoi myöhemmin tänä syksynä Pixel-laitteissaan nähtävän ensimmäisenä uuden version kevyestä, laitteessa suoraan toimivasta Gemini Nano -tekoälymallista, joka kehittyy multimodaaliseksi eli ymmärtämään tekstin lisäksi esimerkiksi puhetta ja kuvia. Mielenkiintoinen uusi ominaisuus malliin perustuen on huijauspuhelujen tunnistus: tekoäly kuuntelee taustalla puheluja ja varoittaa havaitessaan kyseessä voivan olla huijauspuhelu.
Thanks to Gemini Nano, @Android will warn you in the middle of a call as soon as it detects suspicious activity, like being asked for your social security number and bank info. Stay tuned for more news in the coming months. #GoogleIO pic.twitter.com/wtc3rrk0Gc
— Google (@Google) May 14, 2024
Androidin TalkBack-helppokäyttöisyystoiminto on myös kehittymässä laitteessa toimivan Gemini Nanon hyödyntämisen myötä. TalkBackin luomat kuvien tekstikuvaukset ovat jatkossa selkeämpiä ja monipuolisempia.
Later this year, @Android’s accessibility feature TalkBack will get a boost with Gemini Nano. Image descriptions will be clearer and richer, helping low-vision and blind users better navigate their phone with spoken feedback. #GoogleIO pic.twitter.com/qGWhJVbeRF
— Google (@Google) May 14, 2024
Google demosi myös tekoälyagenttien tulevia mahdollisuuksia osana eri palvelujaan. Tekoälyagentit ovat älykkäitä järjestelmiä, jotka eivät tarjoa vain vastauksia vaan hoitavat asioita käyttäjän puolesta. Esimerkiksi Google Shoppingin osaksi Google esitteli mahdollisuutta, jossa Gemini-pohjainen tekoälyagentti voi pyydettäessä järjestää kokonaisuudessaan verkkokaupasta ostetun tuotteen palautuksen.
Tekoälyagenttien osalta ollaan vasta alkutekijöissä, kommentoi Googlen toimitusjohtaja Sundar Pichai, eikä Google kertonut vielä yksityiskohtaisista julkaisusuunnitelmista.
Laajemmin Google esitteli kuitenkin jo myös Project Astraa, joka on universaali tekoälyagentti, joka toimii avustajana. Palvelulle voi esittää erilaisia kysymyksiä esimerkiksi kameran reaaliaikaisesta kuvasta. Googlen ennakkoon tallennetussa videodemossa esiteltiin esimerkiksi, kuinka Astra kertoi mitä tietokoneen näytöllä näkyvä koodi tekee tai missä ikkunasta kuvatun maiseman perusteella käyttäjä on.
Osan Project Astran ominaisuuksista kerrottiin olevan tulossa osaksi Gemini-sovellusta myöhemmin tänä vuonna.
We’re sharing Project Astra: our new project focused on building a future AI assistant that can be truly helpful in everyday life. 🤝
Watch it in action, with two parts – each was captured in a single take, in real time. ↓ #GoogleIO pic.twitter.com/x40OOVODdv
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Käytännössä Gemini-sovelluksen toimintaa kohti Astran visiota Google kehittää Gemini Live -toiminnallisuudella, joka sujuvoittaa palvelun käyttöä puhuen. Gemini Live -uudistuksen myötä Gemini vastaa puhuttuihin kyselyihin lyhyesti ääneen. Puhenopeus mukautuu käyttäjän mukaan. Lisäksi Geminin vastauksen voi keskeyttää pyytääkseen esimerkiksi tarkennusta.
Gemini Live on tulossa saataville Gemini Advanced -tilaajille tulevina kuukausina. Lisäksi myöhemmin tänä vuonna Gemini-sovelluksessa voi käyttää kameraa ja kysyä sen kautta näkyvistä asioista kysymyksiä.
This summer, we’re expanding Gemini’s multimodal capabilities — including the ability to have an in-depth two-way conversation using your voice. This new experience is called Live. #GoogleIO pic.twitter.com/eAZbaO5WKz
— Google (@Google) May 14, 2024
Tulevina kuukausina Google on myös mahdollistamassa Geminin kustomoinnin Gems-versioilla. Ne mahdollistavat Geminin muokkaamisen eri tavoin sopimaan omiin käyttötapoihin, sisältäen esimerkiksi pääsyn omiin Google Drive -tiedostoihin. Käytännössä Gems-versiot voivat olla esimerkiksi jonkin tietyn aihealueen eksperttejä.
Yksi Googlen esittelemä Gems-versio on opiskeluavustaja, joka luo vaihe vaiheelta eteneviä ohjeita opiskeluun. Tämä versio hyödyntää Googlen erityisesti oppimiseen suunnattuja Geminiin perustuvia LearnLM-sarjan tekoälymalleja, joissa hyödynnetään opetuksellista tutkimustietoa.
The new Learning coach Gem uses LearnLM to provide step-by-step study guidance, helping you build understanding instead of just giving you an answer. It will launch in Gemini in the coming months. #GoogleIO pic.twitter.com/cjCQX9oRDO
— Google (@Google) May 14, 2024
Yksittäisistä muista Googlen sovelluksista Google Kuvat -sovelluksen hakutoiminto on kehittymässä älykkäämmäksi Gemini-tekoälyn avulla tästä kesästä alkaen. Hakuja voi tehdä jatkossa luonnollisilla kyselyillä puhuen tai kirjottaien.
Google mainitsi esimerkkinä mahdollisesta hausta unohtuneen auton rekisterinumeron etsimisen tai kaikkien eri kansallispuistoissa otettujen kuvien esittämisen.
Google Workspace -sovellusten osalta Gemini 1.5 Pro -tekoälymalli tulee saataville tänään Workspace Labsin kautta ja yleisesti ensi kuusta alkaen. Esimerkiksi Gmailissa sivupalkin kautta voi pyytää yhteenvetoja sähköposteista sekä esimerkiksi niiden sisältämistä tehtävistä. Yhteenveto-ominaisuus tulee saataville ensimmäisille käyttäjille nyt toukokuusta alkaen.
Gmailin sähköposteista tekemien yhteenvetojen lisäksi Gmail saa kattavamman generatiiviseen tekoälyyn pohjautuvan haun, Gmail Q&A:n, joka tarjoaa vastauksia sähköpostien sisältämiin tietoihin perustuen.
Kolmas Gmailin uudistus ovat kontekstitietoiset Smart Reply -vastausehdotukset, jotka sopivat tilanteeseen ja huomioivat aiemmat keskustelut.
Gmail Q&A ja kehittyneemmät Smart Reply -vastaukset ovat tulossa saataville heinäkuusta alkaen.
Googlen NotebookLM-palvelu, jonka avulla voi kysyä kysymyksiä palveluun tallennetuista asiakirjoista, päivittyy puolestaan uusilla ääniyhteenvedoilla, jotka ikään kuin luovat podcasteja muistuttavan keskustelun kahden keskustelijan välillä halutusta aiheesta asiakirjoihin perustuen.
Google esitteli myös uudistuksia kuvia, musiikkia ja videoita luovien tekoälymalliensa osalta. Kuvia luovan Imagen-tekoälymallin uusi 3-versio on entistä realistisempi ja yksityiskohtaisempi.
We’re introducing Imagen 3: our highest quality text-to-image generation model yet. 🎨
It produces visuals with incredible detail, realistic lighting and fewer distracting artifacts.
From quick sketches to very high-res imagery, here’s a look at what it can create. 👀 #GoogleIO pic.twitter.com/XMrQYGeSiO
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Googlen musiikin luomisessa avustava työkalu puolestaan on YouTuben alla julkaistu Music AI Sandbox.
Videoiden luomiseen Google esitteli Veo-mallia, joka luo yli minuutin mittaisia 1080p-tarkkuuden videoita teksti- kuva- tai videopyyntöjen perusteella erilaisissa elokuvallisissa tyyleissä. Videoita voi myös muokata erilaisilla pyynnöillä. Google tuo Veo-mallin tarjolle uuden VideoFX-työkalun kautta jonotuslistalle liittyneille käyttäjille.
🎥Introducing Veo, our new generative video model from @GoogleDeepMind.
With just a text, image or video prompt, you can create and edit HQ videos over 60 seconds in different visual styles. Join the waitlist in Labs to try it out in our new experimental tool, VideoFX #GoogleIO pic.twitter.com/RnMsWu9s1q
— Google (@Google) May 14, 2024
Tekoälylaskentaa datakeskuksissaan tehostamaan Google esitteli uuden sukupolven TPU-suorittimistaan, nimeltään Trillium. Googlen mukaan Trillium tarjoaa jopa 4,7-kertaisen parannuksen laskentatehossa verrattuna edeltävään TPU v5e -sukupolveen.
Kehittäjille Google julkisti myös kaksi uutta avoimen koodin tekoälymallia, mukaan lukien kesäkuussa saataville tulevan Gemma 2:n, josta on tulossa 27 miljardin parametrin kokoinen malli. Gemma 2 toimii TPU- tai GPU-suorittimilla ja peittoaa mittauksissa Googlen mukaan jopa kaksi kertaa suuremmat mallit. Toinen uusi malli on PaliGemma, joka on optimoitu kuvien tekstittämiseen, visuaalisiin kysymyksiin ja muuhun kuvien merkitsemiseen.
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla
Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »