Artikkelit

Kirjoitettu 10.05.2026 13:11 Kirjoittaja: Futuristi toimitus
Kommentit (0)
Näin tekoälyn käyttö on siirtymässä pois näppäimistöltä: Aiempaa parempi keskustelija

Mallit pystyvät reagoimaan keskeytyksiin ”lennossa”.

OpenAI on julkistanut kolme uutta äänimallia, joiden tavoitteena on siirtää tekoälyn käyttöä yhä vahvemmin pois näppäimistöltä kohti luonnollista puheohjausta. Yhtiön mukaan puheesta on nopeasti tulossa yksi yleisimmistä tavoista käyttää ohjelmistoja, sillä se mahdollistaa moniajon ja asioiden hoitamisen liikkeellä ollessa.

Uudet mallit ovat GPT-Realtime-2, GPT-Realtime-Translate ja GPT-Realtime-Whisper. Niiden avulla OpenAI pyrkii tekemään puheeseen perustuvista tekoälypalveluista aiempaa keskustelevampia ja kykenevämpiä suorittamaan tehtäviä reaaliajassa.

GPT-Realtime-2 on yhtiön ensimmäinen puhemalli, jossa hyödynnetään GPT-5-tason päättelykykyä. Malli pystyy käsittelemään aiempaa monimutkaisempia pyyntöjä, jatkamaan keskustelua luonnollisesti ja reagoimaan keskeytyksiin tai korjauksiin lennossa. OpenAI kertoo mallin soveltuvan erityisesti niin sanottuihin “voice-to-action”-ratkaisuihin, joissa tekoäly ei ainoastaan keskustele käyttäjän kanssa vaan myös suorittaa tehtäviä tämän puolesta.

Esimerkiksi matkailupalveluissa käyttäjä voisi keskustella tekoälyn kanssa lentojen ja hotellien varaamisesta ilman perinteistä käyttöliittymää. Järjestelmä osaisi myös mukauttaa suunnitelmia automaattisesti, jos esimerkiksi lento viivästyy ja hotellivarausta täytyy muuttaa.

Käännöksiin suunnattu GPT-Realtime-Translate puolestaan mahdollistaa reaaliaikaisen puheentulkinnan yli 70 syöttökielestä 13 kohdekielelle. Malli on tarkoitettu asiakaspalveluun, opetukseen ja muihin ympäristöihin, joissa eri kieliä puhuvien ihmisten täytyy kommunikoida sujuvasti keskenään.

Deutsche Telekom rakentaa mallin avulla asiakastukiratkaisuja, joissa asiakkaat voivat puhua omalla äidinkielellään samalla kun järjestelmä kääntää keskustelun reaaliajassa. Myös Vimeo käyttää teknologiaa tuotetietovideoiden live-kääntämiseen, jotta eri maissa olevat käyttäjät voivat seurata sisältöä omalla kielellään ilman erikseen tuotettuja lokalisoituja versioita.

Kolmas julkaistu malli, GPT-Realtime-Whisper, keskittyy reaaliaikaiseen puheentunnistukseen. Malli muuntaa puheen tekstiksi sitä mukaa kun henkilö puhuu, mikä mahdollistaa esimerkiksi live-tekstitykset, kokousmuistiinpanot ja automaattiset yhteenvedot keskustelun aikana. OpenAI:n mukaan ratkaisu on suunniteltu erityisesti matalan viiveen käyttötapauksiin, joissa nopea reagointi on tärkeää.

Lähde

Kuva: Pixabay

Hei! Luitko jo tämän?

Tämän takia Mersun tuleva sähköinen C-sarja voi olla myyntihitti
Tagit: tekoäly ChatGPT OpenAI kielimalli
Takaisin

Kirjoittaja
Futuristi toimitus
toimitus@futuristi.fi Lue lisää >>
Katso kaikki kirjoitukset käyttäjältä Futuristi toimitus >>
0 kommenttia:
Kommentoi:

Artikkelit

Mallit pystyvät reagoimaan keskeytyksiin ”lennossa”.

Hei! Luitko jo tämän?

Tämän takia Mersun tuleva sähköinen C-sarja voi olla myyntihitti

Uusimmat artikkelit

Uusimmat autoartikkelit

Uuden aikakauden alku

Artikkelit

Videot

Autot