haastattelutilanne kadulla

Litterointihaaste: Automaattinen litterointi vs. Manuaalinen litterointi

  • by Sanna

Jokainen litterointia tehnyt tietää, että hyvälaatuisestakin äänitteestä on toisinaan vaikea kuulla, mitä henkilö sanoo. Vaikka kone on usein ihmistä tarkempi, joissakin tilanteissa tekoälyllä on vielä suuria haasteita tunnistaa puhetta. Kuvaamme seuraavaksi tilanteita, joissa ihmiskorva yleensä voittaa koneellisen.

Taustamelu

Yksi suurimmista haasteista automaattisessa litteroinnissa on puheen tunnistaminen epäselvissä tai meluisissa olosuhteissa. Kahvilassa tehdyissä nauhoituksissa taustalla kuuluu muiden asiakkaiden puhetta, ja ulkotiloissa tallennetuissa haastatteluissa nauhalle tulevat myös ympäristön äänet. Aina rauhallinen tilakaan ei takaa hyvää äänenlaatua: hiljaisessa ympäristössä tehdyissä verkkohaastatteluissa nettiyhteyden heittely aiheuttaa häiriötä ja katkoksia ääneen. Kaikki tällaiset tekijät haastavat tekoälyä, jonka on vaikeaa erottaa ja tulkita puhetta, kun taustalla on häiriöitä tai puhuja puhuu epäselvästi. Tämä voi johtaa virheellisiin litterointeihin ja vaikeuttaa tekstin ymmärtämistä.

Useampi puhuja

Monissa seminaari- ja keskustelutallenteissa puhujat puhuvat väistämättä toistensa päälle. Automaattinen litterointi voi saavuttaa jopa yli 80 %:n tarkkuustason, jos puhujia on enintään kaksi ja äänitteellä puhutaan hyvin selkeällä äänellä. Jos äänitteellä on puhujaryhmä, tarkkuus on huomattavasti ihmisen tarkkuutta huonompi. Jos taustalla on lisäksi taustamelua, puheentunnistusteknologia on lähes hyödytöntä.

Kielitaito ja murteet

Kun savolainen puhuu, vastuu on kuulijalla. Miten puheentunnistusohjelma kantaa tämän vastuun? Tekoälyjärjestelmät on usein koulutettu tunnistamaan ja litteroimaan vain tiettyjä kieliä tai murteita. Varsinkin suomen kieli aiheuttaa puheentunnistusteknologialle harmaita hiuksia. Suomen kieli on hyvin joustavaa ja monimuotoista: sanat vääntyilevät sija- ja taivutusmuodoissaan, lukuisista murteistamme puhumattakaan. ekoälylle on tarpeen vielä muutama kielikylpy ennen kuin se ymmärtää kaikkia suomen kielen taivutuspäätteitä, yhdyssanoja ja luovia ilmaisuja.


Me Tutkimustiellä hyödynnämme parhaat puolet sekä manuaalisesta että automaattisesta litterointitavasta.
Pyydä litterointitarjous!

Lue myös

nopeat sormet litteroivat

Litterointihaaste: Automaattinen litterointi vs. Manuaalinen litterointi

  • by Miia

Automaattinen litterointi eli puheentunnistusteknologioita hyödyntävä litterointi on ottanut hurjia harppauksia eteenpäin. Suomen kieltä on kuitenkin edelleen vaikea tulkita koneellisesti. Kerromme tässä tekstissä tiivistetysti, milloin automaattisesta litteraatiosta on hyötyä ja milloin litterointi kannattaa edelleen antaa ihmisten käsiin.
Lue blogi


Lue blogi