maandag 16 februari 2009

Opnieuw over spraakherkenning: de tweede kans

In één van mijn vorige blogs beloofde ik terug te komen op de vraag waarom spraakherkenning, in tegenstelling tot wat Ray Kurzweil in 1999 had voorspeld, in 2009 allerminst algemeen in gebruik is. Het heeft mij wat moeite gekost om het antwoord op die vraag bij elkaar te harken. Maar ik denk dat het mij redelijk gelukt is.

In eerste instantie moet opgemerkt worden dat de technologische voorspelling die Ray Kurzweil in 1999 heeft gedaan daadwerkelijk uitgekomen is. Spraakherkenning voor het creëren van tekst heeft (althans in Amerika) helemaal het niveau van accuratesse gehaald waardoor die software inderdaad algemeen in gebruik zou kunnen zijn. Maar een heel simpele waarheid is dat datgene dat kan soms domweg niet gebeurt. Dat heeft Kurzweil finaal over het hoofd gezien.

Overigens moet daarbij opgemerkt worden dat de Nederlandstalige versie van het belangrijkste en van de voor ons taalgebied enige spraakherkenner, met name Dragon NaturallySpeaking, minder goed functioneert dan de Amerikaanse versie. In die laatste versie zitten veel meer manuren ontwikkeling. Bovendien is de morfologie van het Engels aanzienlijk veel eenvoudiger dan die van het Nederlands. Dat evenwel terzijde.

Spraakherkenning is door de makers ervan altijd naar voren geschoven als ‘de meest natuurlijke interface tussen mens en machine’. Het is nog maar net de vraag of dat zo is. Is het zo natuurlijk om tegen een computer te praten met een beeldscherm voor je neus, headsetje op het hoofd, microfoon bij de mond? Mij lijkt intussen van niet. Een ander punt is dat het bijzonder vermoeiend is om de hele dag door tekst te schrijven met je stem. In Amerika is Dragon Systems, nu Nuance, destijds vervolgd door gebruikers die knobbeltjes hadden gekregen op hun stembanden.

Maar er is meer aan de hand. Een heel eenvoudige observatie leert dat computers, desktop en laptop computers, niet standaard uitgerust worden met een microfoon. Wie een computer koopt, krijgt daar een toetsenbord bij en een muis. Hij of zij koopt er misschien ook nog een webcam bij (met ingebouwde microfoon, dat wel). Maar een microfoon? Dat is toch een eerste vereiste. De makers van de software zullen tegensputteren: maar wij leveren de headsetjes zelf mee met de software. Dat is absoluut waar. En toch heeft het grote publiek afgehaakt.

In een recent geschreven artikel, dat verschenen is in Automatisering Gids, betoog ik dat spraakherkenning veel meer kans maakt om door te breken op de mobiele telefoon. Mijn vingers zijn er in de loop der jaren niet soepeler op geworden. Ik kan verduiveld goed blind typen. Maar niet op mijn BlackBerry. Het schrijven van e-mail op mijn BlackBerry is een crime. Maar een mobiele telefoon is standaard uitgerust met een microfoon. Anders was het geen telefoon. En guess what? Mensen zijn gewoon om in een telefoon te praten. Daar dient het kreng voor. Al die factoren samen zullen de overgang naar het gebruik van spraakherkenning voor het dicteren van e-mail en of SMS op een smartphone alleen maar makkelijker maken.

2 opmerkingen:

  1. mooi artikel! hoe weet je dat de spraakherkenning in het Engels beter werkt dan in het Nederlands? heb je dat zelf nog uitgeprobeerd? Ik schrijf zelfeen blog over spraakherkenning.

    BeantwoordenVerwijderen
  2. Beste Stijn,

    Dank voor het compliment. Ik weet dat spraak in het Engels beter werkt door een video van David Pogue op de website van de New York Times. Hij testte Dragon. De persdemonstratie in Amsterdam was dan weer om te huilen, zo slecht. Ik zal je mijn artikel daarover bezorgen.

    Hartelijke groet, Luc

    BeantwoordenVerwijderen