Nieuws:

Welkom, Gast. Alsjeblieft inloggen of registreren.
Heb je de activerings-mail niet ontvangen?

Auteur Topic: Spraak nodig voor spraakherkenning (Nederlands)  (gelezen 13809 keer)

RvK

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Gepost op: 2008/01/18, 19:28:33 »
Open source spraakherkenning begint langzaam maar zeker realiteit te worden. Een belangrijk struikelblok is wel dat voor de training van dergelijke software spraak nodig is (spraak die overeenkomt met een bekende tekst).

Zowel spraak als teksten zijn echter meestal auteursrechtelijk beschermt! Daarom wordt er bij VoxForge gewerkt aan het verzamelen van spraak (en de bijbehorende teksten) onder de GPL.

Hiermee kunnen dan programma's zoals Gnome-voice-control 'leren' hoe een taal klinkt. We zijn inmiddels ook begonnen met het inzamelen van Nederlandse spraak.

Iedereen die wil meehelpen met het mogelijk maken van spraakherkenning (in het Nederlands) wordt daarom ook van harte uitgenodigd om spraak te doneren via de website. Het enige dat je nodig hebt is een werkende microfoon en een browser met Java.

Doneer spraak voor spraakherkenning onder Linux

Offline vis

  • Lid
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #1 Gepost op: 2008/01/18, 20:44:26 »
Hier wil ik zeker wel een keer aan meehelpen. Hellaas ben ik vandaag ziek (verkouden) dus kan het beter niet nu doen. Maar volgende week, zal ik er eens naar kijken. "Vroeger" gebruikte ik wel eens Dragon Naturally Speaking, wil wel graag alternatief onder Linux.

RvK

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #2 Gepost op: 2008/01/19, 12:10:33 »
Citaat van: vis
Hellaas ben ik vandaag ziek (verkouden) dus kan het beter niet nu doen.
Wellicht goed om te weten dat het soort spraak dat we verzamelen bepaald hoe goed het model gaat werken. Veel diversiteit (veel sprekers en spreekstijlen) zorgt ervoor dat het model onder alle omstandigheden goed presteert.

Het uiteindelijke doel is sprekeronafhankelijke software. Dat betekent dat spraak van verkouden mensen ook bruikbaar is. Dan kun je later je open source huishoudrobot vragen om een warme melk voor je te halen als je verkouden in bed ligt!

De moeilijkste spraak om te verzamelen in de praktijk is spraak die spontaan is. Spraak op een voorleestoon is het makkelijkst, want daar neigt men naar als men een tekst voorleest.

Vraag jezelf dus af hoe je tegen je computer commando's wilt geven en probeer in die stijl de teksten in te spreken.

Ik zelf streef naar zo natuurlijk mogelijk, maar let er wel op dat er geen hele woorden verdwijnen (een -n aan het eind van een woord mag bijvoorbeeld best wegvallen, dat is normaal zelfs).

Alvast bedankt!
RvK

erikapekop

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #3 Gepost op: 2008/01/20, 14:13:08 »
Hallo mede Ubuntu-ers,

Bij deze wil ik jullie oproepen om je spraak te doneren.
Het zou geweldig zijn als er een spraakherkenningsprogramma komt wat onder Linux kan draaien.Nu moet ik nog geregeld overstappen op W....s, om Dragon Naturally Speaking te gebruiken.

Groet,
Erik

Offline Mij

  • Lid
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #4 Gepost op: 2008/02/03, 19:49:53 »
Citaat van: erikapekop
Hallo mede Ubuntu-ers,

Bij deze wil ik jullie oproepen om je spraak te doneren.
Het zou geweldig zijn als er een spraakherkenningsprogramma komt wat onder Linux kan draaien.Nu moet ik nog geregeld overstappen op W....s, om Dragon Naturally Speaking te gebruiken.

Groet,
Erik
ik ga ook eens lekker veel doneren!

Offline canti

  • Lid
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #5 Gepost op: 2008/02/04, 16:17:18 »
Ik ben zelf zwaar slechthorend, zozeer dat ik mijn gehoor nauwelijks kan gebruiken voor de verbale communicatie. Nu lees ik iets over spraakherkenning. Ik vraag me af of de nog op te zetten spraakherkenningsoftware niet gebruikt kan worden voor de omzetting van spraak in geschreven tekst. Dus als iemand in de microfoon praat, kan het dan in tekst omgezet worden zodat ik kan lezen wat er gesproken wordt. Als een soort tolk dus.

Ik weet dat zoiets om veel rekenkracht vraagt en hele snelle, krachtige computers. Misschien is het nog een stap te ver en gaat de software nog uit van de bekende teksten. Het zou voor mij en voor veel andere doven en zwaar slechthorenden echter meer dan geweldig zijn als de software een spraak kan omzetten in geschreven tekst!!

canti

Offline Mij

  • Lid
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #6 Gepost op: 2008/02/04, 17:29:24 »
Citaat van: canti
Ik ben zelf zwaar slechthorend, zozeer dat ik mijn gehoor nauwelijks kan gebruiken voor de verbale communicatie. Nu lees ik iets over spraakherkenning. Ik vraag me af of de nog op te zetten spraakherkenningsoftware niet gebruikt kan worden voor de omzetting van spraak in geschreven tekst. Dus als iemand in de microfoon praat, kan het dan in tekst omgezet worden zodat ik kan lezen wat er gesproken wordt. Als een soort tolk dus.

Ik weet dat zoiets om veel rekenkracht vraagt en hele snelle, krachtige computers. Misschien is het nog een stap te ver en gaat de software nog uit van de bekende teksten. Het zou voor mij en voor veel andere doven en zwaar slechthorenden echter meer dan geweldig zijn als de software een spraak kan omzetten in geschreven tekst!!

canti
over zoiets had ik nog niet eens nagedacht, maar dat zou inderdaad erg gaaf zijn.

RvK

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #7 Gepost op: 2008/02/04, 18:38:39 »
Dat is zeker geen al te wilde gedachte. Tot op zekere hoogte is dat zelfs precies waar we naar streven. Spraakherkenning die vlekkeloos werkt zelfs als verschillende sprekers verschillende stemmen hebben en de onderwerpen van het gesprek volledig uit de lucht komen vallen.

Daarvoor hebben we een akoestisch model nodig dat berekend is op basis van heel veel spraak van zoveel mogelijk mensen. Dat zorgt ervoor dat het akoestisch model dat je krijgt ‘sprekersonafhankelijk’ wordt.

Overigens kan het altijd gebeuren dat een aaneenschakeling van klanken op twee verschillende manieren te interpreteren valt. De uitkomst van de berekening met behulp van het akoestisch model levert dan bijvoorbeeld het volgende op:

Oplossing 1: Ge acht te eer (kans 70%)
Oplossing 2: Geachte heer (kans 30%)

Dit probleem los je op door de uitkomst van deze eerste stap te verbeteren in een tweede stap waarbij men gebruikmaakt van een taalmodel. Dat taalmodel geeft dan aan dat uitkomst 2 veel waarschijnlijker is dan uitkomst 1.

Om een taalmodel te maken heb je heel veel tekst nodig om te berekenen hoe waarschijnlijk allerlei combinaties in een bepaalde context zijn. Je kunt je dan nog voorstellen dat je voor spraakherkenning tijdens conversaties gebruik maakt van een taalmodel dat gebaseerd is op de tekst van conversaties.

Ook hier loop je trouwens tegen het probleem op dat de meeste teksten auteursrechtelijk beschermd zijn (en zijn ze dat niet dan zijn ze vaak te oud). Dat betekent dat we ook op zoek zijn naar recente teksten die mensen aan ons ter beschikking willen stellen onder de GPL. Ook hier geldt des te meer des te beter.

Ik denk persoonlijk dat hardware momenteel niet echt het grote probleem is. Goed werkende Nederlandse spraakherkenning onder Linux is gewoon mogelijk. We moeten er gewoon met z'n allen voor zorgen dat we beschikken over veel spraak en teksten onder open source-vriendelijke voorwaarden.

RvK

Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #8 Gepost op: 2008/02/04, 18:46:39 »
Wat voor type tekst bedoel je nou? Heb je behoefte aan gesproken of geschreven tekst?
Als je in de breedte groeit,||groei je dan ook in de diepte?

RvK

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #9 Gepost op: 2008/02/04, 19:02:48 »
We hebben behoefte aan (1) spraak en aan (2) geschreven teksten.

Met 1 kunnen we een akoestisch model maken en met 2 een taalmodel. Voorlopig maken we maar één taalmodel, want je hebt honderden (zo niet duizenden) pagina's tekst nodig voor een goed werkend taalmodel. Voorlopig hebben we nog te weinig, dus is het niet logisch om ons te beperken tot bijvoorbeeld brieven.

Met andere woorden alles is welkom!

spraak kun je doneren via deze link
Doneer spraak voor spraakherkenning onder Linux

Heb je teksten die je onder de GPL aan ons ter beschikking wilt/kunt stellen, laat me dit dan weten dan stuur ik mijn e-mailadres door.

Offline canti

  • Lid
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #10 Gepost op: 2008/02/04, 20:05:15 »
Mooi doel! Ik hoop dat het Gnome-project dat voor elkaar kan krijgen wat verschillende commerciële aanbieders van spraakherkeningsoftware tot nu toe niet voor elkaar kunnen krijgen: goede spraakherkenning die met verschillende stemmen zonder problemen overweg kunnen, ook als deze in spontane situaties uitgesproken zijn. En dat zonder training vooraf!

Ligt het echt niet aan hardware of zal het niet tegen softwaretechnische beperkingen aanlopen? Ligt het alleen maar aan gebrek aan stemmen en teksten? Er zijn zoveel stemmen en teksten, misschien heb je pas genoeg aan als half Nederland eraan meedoet. Eerlijk gezegd ben ik wel beetje sceptisch, ook omdat er ook grote bedrijven als Philips al veel onderzoeksgeld in de ontwikkeling van spraakherkenningsoftware hebben gestoken.

Ik wil het project toch de kans geven. Ik zou wel graag mijn stem willen lenen, maar omdat ik vanaf mijn geboorte ernstig slechthorend ben, is mijn stem enigszins moeilijk te verstaan. Ik wil dan ook iedereen oproepen mee te werken aan het project. Daarmee helpen jullie niet alleen auditieve gehandicapten, ook vele andere vormen van handicaps zoals motorische gehandicapten. Gnome en Ubuntu zetten samen met duizenden gebruikers zich in voor goed doel! Prachtig toch!

Succes!!

canti

RvK

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #11 Gepost op: 2008/02/05, 18:20:24 »
Bij VoxForge richten we ons met name op het verzamelen van spraak en tekst. Dat zorgt ervoor dat spraakherkenningsprojecten (zoals Gnome-voice-control) dit niet voor duizenden euro's moeten inkopen. Daardoor wordt het makkelijker om een spraakherkenningsproject te beginnen.

Aangezien meer concurrentie over het algemeen leidt tot meer keuze en meer kwaliteit denk ik dat het VoxForge-project sowieso alleen maar positief kan uitpakken.

Ik sluit niet uit dat het uiteindelijk een groot bedrijf is dat voor het eerst met een oplossing komt waar jij echt iets aan hebt. Maar misschien komt dat dan omdat het de hete adem in de nek voelt van allemaal kleine bedrijfjes/projecten (die gemakkelijker kunnen ontstaan dankzij het bestaan van open source spraak corpora).

Robin

Offline Mij

  • Lid
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #12 Gepost op: 2008/02/06, 11:38:44 »
Citaat van: RvK
Bij VoxForge richten we ons met name op het verzamelen van spraak en tekst. Dat zorgt ervoor dat spraakherkenningsprojecten (zoals Gnome-voice-control) dit niet voor duizenden euro's moeten inkopen. Daardoor wordt het makkelijker om een spraakherkenningsproject te beginnen.

Aangezien meer concurrentie over het algemeen leidt tot meer keuze en meer kwaliteit denk ik dat het VoxForge-project sowieso alleen maar positief kan uitpakken.

Ik sluit niet uit dat het uiteindelijk een groot bedrijf is dat voor het eerst met een oplossing komt waar jij echt iets aan hebt. Maar misschien komt dat dan omdat het de hete adem in de nek voelt van allemaal kleine bedrijfjes/projecten (die gemakkelijker kunnen ontstaan dankzij het bestaan van open source spraak corpora).

Robin
zijn de wikipedia audio bijdragen niet te gebruiken? deze zijn immers ook in GNU gelicenseerd? Er is vrij veel tegenwoordig, echter het is wel in ogg formaat en is dus wel gecomprimeerd, maar de kwaliteit van microfoons is meestal toch niet goed genoeg om het verschil te horen? Of mis ik iets? De tekst ervan moet natuurlijk wel uitgetypt worden.
Wikipedia als taalmodel gebruiken lijkt me ook heel goed, en OpenTaal is ook hard op weg met grammatica enzovoort.


RvK

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #14 Gepost op: 2008/02/06, 18:39:05 »
De GPL, de GNU Free Documentation License en de verschillende Creative Commons zijn in een aantal opzichten niet volledig uitwisselbaar. Dat betekent onder andere dat we wikipedia-teksten (GFPL) niet kunnen gebruiken om een taalmodel te maken onder de GPL (dat is in strijd met de GFPL).

Ditzelfde euvel kom je tegen bij spraak die onder een CC-licentie valt.

Eén nadeel van het gebruiken van geluidsfragmenten die zijn gecomprimeerd is dat je daarmee waarschijnlijk een akoestisch model creëert dat vooral goed is in het herkennen van gecomprimeerde spraak. Daarom proberen we om ongecomprimeerde spraak in te zamelen. we kunnen er dan altijd nog voor kiezen om al die spraak te comprimeren en een akoestisch model te maken specifiek voor het herkennen van gecomprimeerde spraak. Omgekeerd is dit helaas niet mogelijk. het uittypen is bovendien nogal een opgave!

De ontwikkelingen bij Opentaal houden we zeker in de gaten, maar grammatica-controle in een tekstverwerker werkt fundamenteel anders dan een taalmodel bij spraakherkenning. Voor spraakherkenning is het werken met een taalmodel een betere keuze, omdat dit veel sneller werkt.  Bovendien kan een taalmodel (mits gebaseerd op voldoende teksten) altijd zeggen welke oplossing het meest waarschijnlijk is, terwijl er niet voor iedere woordkeus een grammaticale regel doorslaggevend kan zijn (dat is ook moeilijker te kwantificeren).

Overigens zijn het wel allemaal goede suggesties!

RvK

Offline Mij

  • Lid
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #15 Gepost op: 2008/02/06, 22:14:56 »
ik zet het wel in mn handtekening om jullie te promoten!

Offline Mij

  • Lid
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #16 Gepost op: 2008/02/07, 12:09:01 »
Maar waarom kan je die inhoud dan niet gebruiken voor een product beter te maken.
Ik snap dat je die audio dan niet op je eigen site mag zetten en dan onder de GNU GPL herlicenseren. Maar voor het beter maken van software zou dit geen enkel probleem moeten zijn, als je het maar niet kopieert.
Maar voor dat taalmodel kan je toch wel in principe alle inhoud van het web gebruiken? Als je maar niet stukken kopieert en woorden uit hun context haalt is het goed. OpenTaal doet dat ook, ze gebruiken een woorden-oogster om aan hun woorden te komen.
Voor het verzamelen van geluid en tekst is dat natuurlijk wat anders.

RvK

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #17 Gepost op: 2008/02/07, 20:20:48 »
Het probleem zit hem erin dat zowel de GFDL en de GPL vereisen dat afgeleide werken onder dezelfde licentie vallen als het oorspronkelijke werk. Aangezien het taalmodel (dat we onder de GPL willen uitbrengen) het afgeleide werk is, moeten de oorspronkelijke teksten ook onder de GPL vallen. De teksten op wikipedia vallen echter onder de GFDL.

Je hebt wel een beetje gelijk, want je zou kunnen argumenteren dat een taalmodel geen afgeleid werk is maar zo ver afstaat van het origineel dat het een nieuw oorspronkelijk werk is. Daar zouden we echter wel risico mee nemen want misschien dat een rechter het daar niet mee eens zou zijn.

Het gevolg daarvan kan bovendien nooit zijn dat je - door ergens een taalmodel van te maken - de oorspronkelijke teksten onder een andere licentie uit kan brengen (onder de GPL zijn we verplicht om de broncode van het taalmodel vrij te geven).

We hebben voor de GPL gekozen omdat deze licentie ontwikkeld is voor software en goede garanties biedt om verbeteringen voor de open source gemeenschap ter beschikking te houden. Op de lange termijn is dat denken wij het best.

Goed idee van die handtekening!

erikapekop

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #18 Gepost op: 2008/02/13, 22:19:17 »
Dit word wel heel juridisch technisch.
Ik wil in dit verband even vertellen dat onder win...s het programma Draon Naturally Speaking bestaat en inmiddels erg  goed werkt. In 2003 was zoń 90% herkenning mogelijk nu zelfs veel meer, na training uiteraard.
Scansoft heeft in de leerfase teksten van schrijvers mogen gebruiken die je voorleest, waardoor de computer eea. kan instellen. Spraakherkenning is een heel complex gebeuren en vraagt inderdaad veel rekenkracht, maar winXP kon het met 512 mb en met servicepack 2 met 1 gig aan ram-geheugen. de geluidskaart en microfoon komen bij DNS heel precies.
Zie ook website van bv. intaal: http://www.intaal.nl/, vor meer info. Echt een bezoekje waard!

Spraakherkenning kan een hulpmiddel zijn voor mensen met rsi-klachten, maar mensen met andere handicaps kunnen hun voordeel ermee doen. Voor een aantal mensen met dyslectie is het een uitkomst.

Het heeft dus nut om om de regeltjes in te spreken!!!!!
Er bestaat ook een spraak groep: http://tech.groups.yahoo.com/group/Spraak/
Daar zijn uit alle lagen van de bevolking mensen lid van; ook mense die teksten schrijven. Misschien zijn die wel te porren om teksten beschikbaar te stellen.

Beste mede Ubuntu-ers: Spreekt in!

bedankt voor uw aandacht,
Erik

RvK

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #19 Gepost op: 2008/02/15, 13:28:41 »
Bedankt voor de tips Erik. Ik kende die Yahee-groep, maar had nog geen bericht gepost. Het wachten was aanvankelijk vooral op onze donatiepagina (daarvoor was doneren veel moeilijker en ik wilde niemand afschikken).

mbt hardware... ik heb ooit met 32 MB Freespeech van Philips gedraaid en dat hield mij bij als ik rustig sprak (rond de 90% nauwkeurigheid). Het verwerken van 2 uur trainingstekst duurde echter 10 uur oid (dus heb ik toen geupgrade naar 64 MB).

Dat onderstreept weer het belang van open source alternatieven. Die zijn vaak efficienter of er bestaan efficiente alternatieven (vergelijk XFCE met KDE of Gnome). Ik zou best spraakherkenning willen hebben op mijn mobiel (niet veel trager dan mijn oude pc) en dan niet alleen zo van `Bel Wim`, maar ik zie dat nog niet komen van de makers van DNS (en al helemaal niet als ik Linux op m`n mobiel draai).

Bedankt voor je donaties!

RvK

Offline Johan van Dijk

  • Administrator
    • johanvandijk
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #20 Gepost op: 2008/02/15, 15:31:27 »
Ik heb wat problemen met de donaties.
Het opnemen lijkt goed te gaan, maar het afspelen om te controleren werkt niet.
Zie de screenshots:




RvK

  • Gast
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #21 Gepost op: 2008/02/15, 18:16:48 »
Bedankt voor de poging. Ik post het probleem in het VoxForge-forum (heb zelf de Java-applet niet geschreven). Ik laat het weten als er een oplossing voor is. Het is wellicht handig om te weten welke versie van Java en ubuntu je gebruikt.

Offline Johan van Dijk

  • Administrator
    • johanvandijk
Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #22 Gepost op: 2008/02/15, 18:24:53 »
Ubuntu Gutsy Gibbon met de laatste updates.
java -version
java version "1.6.0_03"
Java(TM) SE Runtime Environment (build 1.6.0_03-b05)
Java HotSpot(TM) Client VM (build 1.6.0_03-b05, mixed mode, sharing)
Firefox:
Mozilla/5.0 (X11; U; Linux i686; nl; rv:1.8.1.12) Gecko/20080207 Ubuntu/7.10 (gutsy) Firefox/2.0.0.12


Spraak nodig voor spraakherkenning (Nederlands)
« Reactie #24 Gepost op: 2008/02/18, 23:09:12 »
Zou voor geschreven teksten het Gutenberg project ook te gebruiken zijn? Volgens mij is dat vrij van rechten.
Wie de gemakkelijkste weg niet zoekt is een luiaard. :)
Linux User #228066