Teksteissä käytetään useampia puheentunnistukseen liittyviä termejä. Voit tarkistaa kunkin termin merkityksen tekstin lopussa olevista termilaatikoista.
Manuaaliseen litterointiin sisältyy puhutun kielen sisältöä rikastavaa ja täsmentävää työtä esimerkiksi merkityksellisten taukojen, tunneilmaisujen tai epäröintien merkitsemisen muodossa. Manuaalinen litterointi on mahdollista myös erikseen räätälöidä aineistojen erityispiirteet huomioiden. Nykyisin esimerkiksi anonymisointi tai pseudonymisointi on olennainen osa tutkimusaineistojen käsittelyä.
Interaktiivisuus ja ylimääräinen puhe
Haastattelutilanteessa ihmiset harvoin puhuvat koko ajan selkeästi ja puhtaasti vuorotellen, sillä se ei ole ihmiselle luontaista. Puhe on usein interaktiivista ja sisältää vähintään päällekkäisiä hymähdyksiä ja myötäilyjä.
Nämä ovat niin sanottuja minimipalautteita, joilla kuulija tai toiset keskustelijat osoittavat kuuntelevansa puhujaa. Niillä on tärkeä rooli keskustelun kannalta: aktiivisesti kuuntelevalle yleisölle on kannustavampaa puhua kuin vaitonaisille seuraajille.
Tutkijalle minimipalautteet eivät kuitenkaan välttämättä tuo lisäinformaatiota, vaan päinvastoin saattavat hankaloittaa olennaisen sisällön tavoittamista.
Manuaalisesta litteraatiosta voidaan ihmisen harkintakykyä käyttäen tehdä luettavampi. Puhujat on tunnistettu, ylimääräiset höpinät (esimerkiksi kahvikeskustelut) on jätetty pois, täytesanat, takeltelut ja myötäilyt tarvittaessa karsittu.
Näin pääset heti kiinni keskustelun sisältöön ja voit käyttää aikasi sisällön tehokkaaseen analysointiin.
Litterointitasot
Joissakin tilanteissa, esimerkiksi narratiivisen analyysin yhteydessä, on tärkeää kirjata litteroitaessa ylös jokainen hengenveto ja äänenpainon muutos. Manuaalinen litterointi tarjoaa mahdollisuuden päättää, millä tasolla litterointi toteutetaan.
Haluatko, että puhetyylin ja murteen erityispiirteet säilytetään, vai muokataanko teksti erittäin selkeäksi ja helposti luettavaksi poistamalla ylimääräiset sanat? Ihminen voi muokata litteraation vastaamaan parhaiten juuri sinun käyttötarkoituksiasi
ja tarpeitasi.
Erityistä huomiota vaativat aineistot
Kun litteroinnissa käsitellään ns. erityisiä henkilötietoryhmiä (arkaluontoisia tietoja), kuten terveystietoja, lasten asioita, tai vaikkapa poliittisia asenteita ja mielipiteitä, tietosuoja- ja eettiset haasteet on aina ratkaistava huolellisesti.
Manuaalisessa litteroinnissa henkilötiedot on mahdollista anonymisoida tai pseudonymisoida. Anonymisoidut litteraatiot eivät sisällä enää henkilötietoja,
mutta esimerkiksi ryhmäkeskusteluissa puhujat voidaan kyllä merkata toistuvilla puhujatunnisteilla, jotta keskustelua on helpompi seurata. Aineiston käytettävyyden ja tietosuoja-asioiden vuoksi moni tutkija haluaakin, että haastateltavien tunnistetiedot
poistetaan jo litteroitaessa.
Litteroinnin tehokkuudessa puheentunnistusteknologiaa ja tekoälyä hyödyntävä puheentunnistusjärjestelmä ja ihminen yhdessä ovat voittamaton pari. Järjestelmää käyttämällä vähennetään manuaaliseen työhön kuluvaa aikaa, voidaan lisätä työn tarkkuutta ja vähentää työn tuottamaa rasitusta. Ihmisen asiantuntemusta tarvitaan kuitenkin yksityiskohtien tarkistamiseen ja erityisesti suomen kielen erityispiirteiden korjaamiseen - murteet, sijapäätteet ja kielemme moninaisuus on puheentunnistusteknologialle vielä liian haastava pala. Jos litteroinnin tarkoitus on ainoastaan saada äänitteellä oleva asia pääpiirteittäin kirjalliseen muotoon, automaattinen
litteraatio on siihen erinomainen väline. Luotettavan tutkimustiedon tuottamiseen tarvitaan edelleen asiantuntijatyötä.
Muista aina tarkistaa käyttämääsi palveluun liittyvät tietosuojanäkökulmat. Käymme tietosuojanäkökulmia läpi seuraavassa tekstissä:
Manuaalinen litterointi: Äänitiedoston tai puheen manuaalista muuntamista tekstiksi. Ihminen kuuntelee äänitiedoston ja kirjoittaa sen sanat ylös.
Automaattinen litterointi: Prosessi, jossa tietokoneohjelma muuntaa automaattisesti äänitiedoston tekstiksi. Ihminen ei osallistu litteraation tuottamiseen, vaan litteraatio on tietokoneen tekemä.
Puheentunnistusteknologia: Tietotekniikan alue, joka mahdollistaa ihmisen puheen automaattisen tunnistamisen ja muuntamisen kirjoitetuksi tekstiksi tai toiminnoksi. Teknologia käyttää algoritmeja ja koneoppimismenetelmiä äänisignaalien analysointiin ymmärtääkseen puhuttua kieltä ja muuttaakseen sen digitaaliseen muotoon.
Puheentunnistusjärjestelmä: Laaja teknologinen infrastruktuuri tai alusta, joka sisältää tarvittavat laitteet, ohjelmistot ja algoritmit puheen tunnistamiseen ja prosessointiin. Kun puhutaan litterointiin soveltuvista järjestelmistä, käyttäjille on tarjolla sekä omalle koneelle ladattavia puheentunnistusjärjestelmiä että API-rajapintojen avulla järjestelmiä käyttäviä sovelluksia ja palveluita.
Tekoälypohjainen tai tekoälyä hyödyntävä puheentunnistusjärjestelmä: Puheentunnistusjärjestelmä, johon on integroitu tekoäly. Puheentunnistuksen prosessissa tekoäly erottelee ja analysoi ääntä ja tunnistaa ja tulkitsee luonnollisen kielen ominaisuuksia sekä puheen kontekstia. Tämä prosessi on lähellä ihmisen tekemää ajatustyötä ja parantaa huomattavasti puheentunnistuksen lopputulosta.
Puheentunnistussovellus: Konkreettinen tuote tai palvelu, joka hyödyntää puheentunnistusteknologiaa tiettyyn käyttötarkoitukseen. Sovellukset voivat olla mobiili- tai desktop-ohjelmistoja. Näitä ovat esimerkiksi älypuhelimessa toimiva sovellus, joka muuntaa puheen tekstiviestiksi, tai virtuaaliassistentti, joka suorittaa käyttäjän puhekomentoja. Sovellukset rakennetaan usein hyödyntämällä olemassa olevia puheentunnistusjärjestelmiä tai -alustoja.
Prosodia, tunneilmaisut ja epäsäännöllinen rytmi– nämä kaikki kuuluvat erottamattomasti ihmispuheeseen.
Näiden elementtien ilmaiseminen litteraatiossa ei ole aina yksinkertaista. Litterointi on perimmiltään puheen välittämistä kirjoitettuun muotoon mahdollisimman autenttisesti.
Se puolestaan edellyttää puheen kontekstin ymmärrystä ja tulkintojen tekemistä. Puheentunnistusjärjestelmät hyödyntävät tekoälyn ominaisuuksia tekemään tätä tulkintaa, mutta uskaltaako sen lopputulokseen luottaa?
Suomen kielen erityispiirteisiin liittyvien haasteiden lisäksi automaattisessa litteroinnissa ongelmia voivat aiheuttaa myös äänitteisiin liittyvät epäselvyydet.
Puheen tunnistamista vaikeuttavat sekä rahisevat tai hiljaiset äänitteet että meluisa ympäristö ja useampi päällekkäin keskusteleva puhuja.
Tässä tekstissä käymme läpi teknisiä ja ympäristöllisiä haasteita, jotka tekevät manuaalisesta litteroinnista välttämättömyyden tietyissä tilanteissa.