Tekoäly-yhtiö OpenAI julkisti aiemmin toukokuussa kehittyneemmän GPT-4o-mallinsa rinnalla kehittyneemmän, luonnollisemman Voide Mode -äänitilan ChatGPT-palveluunsa.
Nyt tämän Advanced Voice Moden tuominen saataville ChatGPT Plus -käyttäjille on alkanut pienen viivästyksen jälkeen. Julkaisu tapahtuu edelleen vaiheittain. Aluksi saataville tuleva ”alfaversio” saapuu vain pienelle joukolle ChatGPT Plus -käyttäjiä, ja julkaisu jatkuu vaiheittain edeten kaikille ChatGPT Plus -käyttäjille syksyn 2024 aikana. Toiminnon saapuessa saataville käyttäjälle, kerrotaan tästä ChatGPT-sovelluksessa sekä lisäksi käyttöohjeiden kera sähköpostilla.
MAINOS (ARTIKKELI JATKUU ALLA)
Kehittyneempi Advanced Voice Mode on huomattavasti aiempaa luonnollisempi, mahdollistaen esimerkiksi kysymyksen kysymisen ChatGPT:ltä ja sen vastauksen keskeyttämisen kesken kaiken tarkentavilla lisäkysymyksillä. ”Reaaliaikaisen” reagoinnin mahdollistamisen lisäksi se pystyy havainnoimaan käyttäjän äänessä kuuluvan tunteen sekä luomaan äänivastauksia eri tunteiden mukaisissa tyyleissä.
Taustalla kehittyneemmässä äänitilassa on OpenAI:n GPT-4o-tekoälymalli, jossa OpenAI on keskittynyt erityisesti parantamaan kuva-, video ja äänipyyntöjen toimintaa sekä suorituskykyä ja nopeutta eri kielillä.
Julkistuksensa yhteydessä kehittynyt Advanced Voice Mode sai aikaan myös kohun, kun sen Sky-äänivaihtoehto muistutti huomattavasti OpenAI:n kanssa yhteistyöstä kieltäytyneen näyttelijän Scarlett Johanssonin ääntä. OpenAI kiisti käyttäneensä Johanssonin ääntä, mutta poisti lopulta Sky-äänen demosta sekä lykkäsi myös kehittyneemmän äänitilan julkaisun alkua noin kuukaudella alkuperäisistä suunnitelmista.
MAINOS (ARTIKKELI JATKUU ALLA)
Aiemmin ChatGPT Voice Mode -äänitila on hyödyntänyt taustalla kolmea eri tekoälymallia: yhtä käyttäjän puhuen tekemän äänipyynnön muuntamiseen tekstiksi, GPT-4:ää pyynnön käsittelemiseksi sekä sitten kolmatta tekstin muuntamiseksi puheeksi. Nyt GPT-4o-mallin ollessa multimodaalinen se pystyy itsessään hoitamaan kaikki nämä tehtävät, mikä osaltaan on Advanced Voice Mode -tilan nopeusparannuksen takana.
OpenAI:n aiemmin GPT-4o-julkistuksen yhteydessä esittelemät uudet video- ja näytönjako-ominaisuudet ovat tulossa vasta myöhemmin.
We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
Mainos: Noin 1 600 000 tuotteen hintavertailu ja hintaseuranta - katso Hinta.fistä mistä saat halvimmalla
Salasana hukassa?
Etkö ole vielä rekisteröitynyt? Rekisteröidy tästä »