litteroivat sormet ja tietoturvasymboleita

Puheesta tekstiksi turvallisesti: Tietosuojanäkökulmat litteroinnissa

  • by Sanna

Teksteissä käytetään useampia puheentunnistukseen liittyviä termejä. Voit tarkistaa kunkin termin merkityksen tekstin lopussa olevista termilaatikoista.


Puheentunnistusjärjestelmien käytön suurena haasteena on ollut salassa pidettävien tietojen ja henkilötietojen suojaaminen. Tarjolla on monia helposti käytettäviä työkaluja, mutta niiden käyttö ei välttämättä täytä EU:n tietosuoja-asetuksen vaatimuksia. Omalle koneelle ladattavat ohjelmat taas vaativat tietoteknistä ymmärrystä ja kapasiteettia käytettävältä koneelta. Puheentunnistusjärjestelmien käyttämiseen liittyvät tietosuojanäkökulmat on hyvä tiedostaa ja olla perillä käyttämänsä palvelun sisällöstä. Litteroitavat tallenteet sisältävät aina henkilötietoa, vaikka niissä ei sanottaisi yhtäkään tunnistetietoa, sillä jo henkilön ääni on henkilötieto.

Tutkijan vastuu

Varmista aina aineistonkeruun alussa, muodostuuko sinulle vastuu henkilötietorekisteriin ja henkilöiden informointiin liittyen. Voit tarkistaa Tietosuojavaltuutetun toimistosta, miten tietosuoja tulee huomioida tieteellisen tutkimuksen eri vaiheissa. Myös Tutkimuseettinen neuvottelukunta (TENK) ohjeistaa Hyvän tieteellisen käytännön (HTK) noudattamisessa. Jos sinulle muodostuu henkilötietojen kerääjänä eli esimerkiksi haastattelujen vetäjänä rekisterinpitäjän velvollisuuksia, sinun pitää huolehtia henkilötietojen suojaamisesta tietosuojalainsäädännön mukaisesti. Tämä vaikuttaa myös siihen, minkälaisia litterointipalveluita voit aineistollesi käyttää.

Verkossa olevat puheentunnistusjärjestelmät

Yksi tutkimuksen yleisistä tietosuojaperiaatteista on, että tietojen pitää pysyä ETA-alueella. Tämä on hyvä tarkistaa, jos haluat käyttää verkossa olevia puheentunnistuspalveluita. Monet palveluntarjoajat sijaitsevat Euroopan ulkopuolella, ja niiden käyttäminen todennäköisesti tarkoittaa, että aineistosi tiedot tallentuvat Euroopan ulkopuolelle. Sopimusehdoissa voi olla mainintoja tietojen luovuttamisesta kolmansille osapuolille myös muihin tarkoituksiin. Haluat varmasti myös varmistua siitä, miten tietoja käsitellään, käytetäänkö tietoja esimerkiksi järjestelmän kouluttamiseen ja milloin tiedot lopullisesti poistetaan.

Jos haluat varmistua henkilötietojen oikeasta käsittelystä palvelua valitessasi, ota huomioon seuraavat asiat:

  • • Valitse luotettava palveluntarjoaja.
  • • Huolehdi että palveluntarjoajalla on sopimukset kunnossa.
  • • Tarkasta tietojen käsittelyn ja tallentamisen sijainti.
  • • Muista tarkistaa tiedot myös alihankkijoiden ja mahdollisten alikäsittelijöiden suhteen.
  • • Ole myös itse valveutunut ja reagoi palveluntarjoajan suuntaan, jos havaitset ongelmia.

Tarjolla on myös omalle koneelle ladattavia puheentunnistusjärjestelmiä. Tämä on hyvä vaihtoehto silloin, kun haluat käsitellä aineistoasi rajatusti omalla koneellasi. Ennen kuin lähdet lataamaan ohjelmaa, on hyvä tietää, että lataamiseen ja asennukseen liittyvät prosessit voivat olla haastavia ilman aiempaa IT-kokemusta. Löydät netistä ohjeita lataukseen, mutta on tärkeää varautua mahdollisiin ongelmiin ja ehkä jopa harkita asiantuntijan apua, jos et ole varma osaamisestasi.

Litterointipalvelu apuna

Useimmiten paras ratkaisu on kääntyä kotimaisen litterointipalvelun puoleen, joka osaa yhdistää manuaalisen ja automaattisen litteroinnin parhaat puolet, ja tarjoaa asiakkaalle sopivimmat ratkaisut ilman monimutkaista valintaprosessia. Asiantunteva litterointipalvelu suojaa tietosi huolellisesti, noudattaa tietosuojalainsäädäntöä ja kansallisia ohjeistuksiamme ja takaa sinulle tutkimuksesi tulosten kannalta luotettavan lopputuloksen. Lisäksi se huolehtii kaikista tarvittavista sopimusasioista yhteistyössä kanssasi varmistaen sujuvan prosessin alusta loppuun.


Me Tutkimustiellä hyödynnämme parhaita puolia puheentunnistusteknologiasta, mutta kaikissa työn tuloksissa luotamme asiantuntijatyöhömme ja siksi jokaisen työn tekee meillä ihminen. Noudatamme toiminnassamme tietosuojalainsäädäntöä ja TENKin tutkimuseettisiä ohjeita. Esimerkiksi peruslitterointipalvelumme toteutetaan Suomessa ilman alihankintaa tai tietojen siirtoa kolmansille osapuolille. Litterointipalvelu kuuluu vastuullisesti tuotettuihin palveluihimme, joissa minimoimme jalanjälkeämme ja parannamme kädenjälkeä (lisätietoja vastuullisuudestamme).
Pyydä litterointitarjous!

Aiheeseen liittyviä termejä:


Manuaalinen litterointi: Äänitiedoston tai puheen manuaalista muuntamista tekstiksi. Ihminen kuuntelee äänitiedoston ja kirjoittaa sen sanat ylös.
Automaattinen litterointi: Prosessi, jossa tietokoneohjelma muuntaa automaattisesti äänitiedoston tekstiksi. Ihminen ei osallistu litteraation tuottamiseen, vaan litteraatio on tietokoneen tekemä.
Puheentunnistusteknologia: Tietotekniikan alue, joka mahdollistaa ihmisen puheen automaattisen tunnistamisen ja muuntamisen kirjoitetuksi tekstiksi tai toiminnoksi. Teknologia käyttää algoritmeja ja koneoppimismenetelmiä äänisignaalien analysointiin ymmärtääkseen puhuttua kieltä ja muuttaakseen sen digitaaliseen muotoon.
Puheentunnistusjärjestelmä: Laaja teknologinen infrastruktuuri tai alusta, joka sisältää tarvittavat laitteet, ohjelmistot ja algoritmit puheen tunnistamiseen ja prosessointiin. Kun puhutaan litterointiin soveltuvista järjestelmistä, käyttäjille on tarjolla sekä omalle koneelle ladattavia puheentunnistusjärjestelmiä että API-rajapintojen avulla järjestelmiä käyttäviä sovelluksia ja palveluita.
Tekoälypohjainen tai tekoälyä hyödyntävä puheentunnistusjärjestelmä: Puheentunnistusjärjestelmä, johon on integroitu tekoäly. Puheentunnistuksen prosessissa tekoäly erottelee ja analysoi ääntä ja tunnistaa ja tulkitsee luonnollisen kielen ominaisuuksia sekä puheen kontekstia. Tämä prosessi on lähellä ihmisen tekemää ajatustyötä ja parantaa huomattavasti puheentunnistuksen lopputulosta.
Puheentunnistussovellus: Konkreettinen tuote tai palvelu, joka hyödyntää puheentunnistusteknologiaa tiettyyn käyttötarkoitukseen. Sovellukset voivat olla mobiili- tai desktop-ohjelmistoja. Näitä ovat esimerkiksi älypuhelimessa toimiva sovellus, joka muuntaa puheen tekstiviestiksi, tai virtuaaliassistentti, joka suorittaa käyttäjän puhekomentoja. Sovellukset rakennetaan usein hyödyntämällä olemassa olevia puheentunnistusjärjestelmiä tai -alustoja.

Lue myös

kuulokkeet kirjan ympärillä

Räätälöity litterointi: Manuaalisen litteroinnin
mukautuvuus

  • by Sanna

Ihmisen kyky tulkita puhetta ja sen kontekstia mahdollistaa myös litteroinnin tekemisen tietyllä tyylillä, ilman että mitään oleellista menetetään. Manuaalisen litteroinnin parhaita puolia on se, että litteraatio voidaan räätälöidä tilaajan toiveiden mukaisesti ja erilaisten aineistojen erityispiirteet huomioiden. Tämä on mahdollista myös automaattisessa litteroinnissa, mutta se vaatii osaamista ja ymmärrystä tekoälyä hyödyntävien järjestelmien käytöstä ja ohjauksesta. Silloinkin on parasta, että ihminen tarkistaa vielä lopputuloksen.
Lue blogi

ryhmä ihmisiä keskustelee

Puheen syvempi merkitys: Manuaalisen litteroinnin arvo inhimillisessä kommunikaatiossa

  • by Sanna

Prosodia, tunneilmaisut ja epäsäännöllinen rytmi– nämä kaikki kuuluvat erottamattomasti ihmispuheeseen. Näiden elementtien ilmaiseminen litteraatiossa ei ole aina yksinkertaista. Litterointi on perimmiltään puheen välittämistä kirjoitettuun muotoon mahdollisimman autenttisesti. Se puolestaan edellyttää puheen kontekstin ymmärrystä ja tulkintojen tekemistä. Puheentunnistusjärjestelmät hyödyntävät tekoälyn ominaisuuksia tekemään tätä tulkintaa, mutta uskaltaako sen lopputulokseen luottaa?


Lue blogi