• Näin tekoälyn käyttö on siirtymässä pois näppäimistöltä: Aiempaa parempi keskustelija

    Mallit pystyvät reagoimaan keskeytyksiin ”lennossa”.

    OpenAI on julkistanut kolme uutta äänimallia, joiden tavoitteena on siirtää tekoälyn käyttöä yhä vahvemmin pois näppäimistöltä kohti luonnollista puheohjausta. Yhtiön mukaan puheesta on nopeasti tulossa yksi yleisimmistä tavoista käyttää ohjelmistoja, sillä se mahdollistaa moniajon ja asioiden hoitamisen liikkeellä ollessa.

    Uudet mallit ovat GPT-Realtime-2, GPT-Realtime-Translate ja GPT-Realtime-Whisper. Niiden avulla OpenAI pyrkii tekemään puheeseen perustuvista tekoälypalveluista aiempaa keskustelevampia ja kykenevämpiä suorittamaan tehtäviä reaaliajassa.

    GPT-Realtime-2 on yhtiön ensimmäinen puhemalli, jossa hyödynnetään GPT-5-tason päättelykykyä. Malli pystyy käsittelemään aiempaa monimutkaisempia pyyntöjä, jatkamaan keskustelua luonnollisesti ja reagoimaan keskeytyksiin tai korjauksiin lennossa. OpenAI kertoo mallin soveltuvan erityisesti niin sanottuihin “voice-to-action”-ratkaisuihin, joissa tekoäly ei ainoastaan keskustele käyttäjän kanssa vaan myös suorittaa tehtäviä tämän puolesta.

    Esimerkiksi matkailupalveluissa käyttäjä voisi keskustella tekoälyn kanssa lentojen ja hotellien varaamisesta ilman perinteistä käyttöliittymää. Järjestelmä osaisi myös mukauttaa suunnitelmia automaattisesti, jos esimerkiksi lento viivästyy ja hotellivarausta täytyy muuttaa.

    Käännöksiin suunnattu GPT-Realtime-Translate puolestaan mahdollistaa reaaliaikaisen puheentulkinnan yli 70 syöttökielestä 13 kohdekielelle. Malli on tarkoitettu asiakaspalveluun, opetukseen ja muihin ympäristöihin, joissa eri kieliä puhuvien ihmisten täytyy kommunikoida sujuvasti keskenään.

    Deutsche Telekom rakentaa mallin avulla asiakastukiratkaisuja, joissa asiakkaat voivat puhua omalla äidinkielellään samalla kun järjestelmä kääntää keskustelun reaaliajassa. Myös Vimeo käyttää teknologiaa tuotetietovideoiden live-kääntämiseen, jotta eri maissa olevat käyttäjät voivat seurata sisältöä omalla kielellään ilman erikseen tuotettuja lokalisoituja versioita.

    Kolmas julkaistu malli, GPT-Realtime-Whisper, keskittyy reaaliaikaiseen puheentunnistukseen. Malli muuntaa puheen tekstiksi sitä mukaa kun henkilö puhuu, mikä mahdollistaa esimerkiksi live-tekstitykset, kokousmuistiinpanot ja automaattiset yhteenvedot keskustelun aikana. OpenAI:n mukaan ratkaisu on suunniteltu erityisesti matalan viiveen käyttötapauksiin, joissa nopea reagointi on tärkeää.

    Lähde

    Kuva: Pixabay

    Hei! Luitko jo tämän?

    Tämän takia Mersun tuleva sähköinen C-sarja voi olla myyntihitti

    Tagit: tekoäly  ChatGPT  OpenAI  kielimalli  
      Takaisin
    0 kommenttia:
    Kommentoi: