@@AR @@08 De meest gestelde vragen over tekstherkenning Jeroen Baldewijns Wat heb ik nodig om aan tekstherkenning te doen? Een tekstherkenningssysteem bestaat, naast een computer met vergroting, spraak of braille, uit twee componenten: een scanner die een digitale foto van het document neemt en een tekstherkenningsprogramma dat deze foto analyseert en er een tekstdocument van maakt. Hoe nauwkeurig worden documenten herkend? De nauwkeurigheid waarmee de tekst herkend wordt, hangt in de eerste plaats af van het gescande document z‚lf. De papiersoort, de kwaliteit van de opdruk, de complexiteit van de pagina-opmaak en de grootte, de kleur en het contrast van de tekens zijn allemaal factoren die de nauwkeurigheid van de herkenning be‹nvloeden. Er kan dus slechts een oordeel geveld worden per type document. Beoordeel daarom de herkenningskwaliteit liefst op basis van een aantal documenten die in jouw specifieke situatie relevant zijn. Verwacht echter nooit 100% accuraatheid van de herkenning, want geen enkel product werkt volledig foutloos. Welke snelheid mag ik van het tekstherkenningsproces verwachten? De tijd die nodig is om, uitgaande van een vel papier, een verwerkbare tekst op het scherm te krijgen, bestaat uit de scantijd en de herkenningstijd. De scantijd wordt volledig bepaald door de scanner en zijn aanstuurprogramma. De herkenningstijd is in hoofdzaak afhankelijk van twee factoren: de snelheid van de computer en de complexiteit van het document (lettertypes, letterformaten, aanwezigheid van foto's, kolommen, kleurgebruik, etcetera). Bij de keuze van een tekstherkenningsprogramma verdient het in de meeste gevallen aanbeveling om de herkenningsnauwkeurigheid te laten primeren op de snelheid, tenzij je hoofdzakelijk documenten wil lezen die niet verder met de computer verwerkt moeten worden. Kan een tekstherkenningsprogramma ook handschrift herkennen? Er wordt nogal eens beweerd dat handschriftherkenning niet meer zo veraf is omdat er toch ook al zogenaamde "Pen-PC's" bestaan, waarbij de gebruiker met een pen op het computerscherm schrijft en de computer zijn handschrift herkent. Dit is echter alleen mogelijk voor het handschrift van ‚‚n enkele gebruiker en mits het intensief trainen van de computer. Er bestaat immers nog geen software die uiteenlopende handschriften van oneindig veel personen kan interpreteren en de kans dat dergelijke programmatuur er vlug zal zijn, lijkt uiterst klein. Kan een tekstherkenningsprogramma om het even welk lettertype interpreteren? Reeds jaren beschikken alle herkenningspakketten over de capaciteit om een zeer breed gamma lettertypes in verschillende formaten te herkennen. Bovendien beschikken de programma's over een aanleerfunctie. Als een teken ten gevolge van een onbekend lettertype verkeerd ge‹nterpreteerd werd, zal de lettertypekennis van het tekstherkenningsprogramma hiermee, na correctie van de gebruiker, verrijkt worden. Die zelfde letter zal de volgende keer wel correct herkend worden. Kan een tekstherkenningsprogramma met meerdere talen overweg? Strikt gezien kan je veronderstellen dat tekstherkenning taalonafhankelijk is. Een letter of cijfer is immers in de meeste talen identiek van vorm. Goede tekstherkenning is echter niet enkel gebaseerd op het analyseren van letter- en cijfervormen, maar baseert zich voor het herkennen van woorden en zinsdelen ook op woordenboeken en andere taalkundige modellen. Het is daarom uitermate belangrijk dat het tekstherkenningsprogramma voorzien is van de juiste taalmodules. De meest geavanceerde tekstherkenningsprogramma's slagen er zelfs in om de taal van het document te detecteren. Als in zo'n document dan meerdere talen voorkomen, wordt er automatisch van de ene naar de andere taalmodule geschakeld. Uit de literatuur blijkt dat de in Europa ontwikkelde herkenningspakketten op het gebied van taalondersteuning over het algemeen beter zijn dan Amerikaanse producten. Is ieder tekstherkenningsprogramma compatibel met mijn schermuitleesprogramma? Tot voor kort was het raadzaam te opteren voor tekstherkenningsprogramma's (onder DOS of Windows) waarvan de gebruikersinterface speciaal was aangepast voor gebruikers van een hulpmiddel. Nu Windows steeds beter toegankelijk wordt, zien we dat deze producten langzamerhand de baan moeten ruimen voor tekstherkenningsprogramma's uit de gewone computermarkt. De meeste hulpmiddelenleveranciers en -fabrikanten zijn op dit ogenblik bezig met het optimaliseren van hun schermuitleesprogramma's voor ‚‚n of meerdere standaard tekstherkenningspakketten. Zal het tekstherkenningsprogramma goed samenwerken met mijn toepassingsprogramma's? In de eerste plaats is het belangrijk dat het herkenningsprogramma diverse bestanden kan importeren (bijvoorbeeld een fax die via de modem is binnengelopen in PCX-formaat) en kan exporteren (bijvoorbeeld naar WordPerfect-, Word-, ASCII-, Excel- of HTML-formaat). De meeste pakketten bieden op dit vlak voldoende mogelijkheden. Een vrij recente trend bij een aantal tekstherkenningsprogramma's is dat ze vanuit een tekstverwerker of een andere toepassing kunnen opgeroepen worden. De herkende tekst komt dan meteen in het actieve document te staan. Welk type scanner is geschikt voor tekstherkenning? Er zijn drie scannertypes die voor tekstherkenning aangeprezen worden. De handscanner blijkt voor iemand met een visuele handicap niet bruikbaar. De doorvoerscanner is wel bruikbaar, maar kent de praktische beperking dat hij enkel losse vellen accepteert. De glasplaatscanner is vanuit functionele overwegingen het meest aangewezen toestel voor tekstherkenning. De scanner moet een resolutie van 300 … 400 dpi (beeldpunten per inch) halen. Scanners met hogere resoluties zijn weggegooid geld als het op tekstherkenning aankomt. Glasplaatscanners met een boekenrand kunnen nuttig zijn als er veel uit boeken gescand wordt, op voorwaarde dat dit in verhouding staat tot de (meestal hoge) meerkosten. Kan ik een scanner met tekstherkenningsprogramma gemakkelijk met mijn draagbare PC gebruiken? Ieder tekstherkenningsprogramma zal even goed op een draagbare als op een bureaucomputer werken. Voor de scanner geldt echter een ander verhaal. Die wordt meestal via een snelle SCSI-kaart aan de computer gekoppeld, maar zo'n kaart past enkel in een bureaucomputer. De oplossing kan er dan in bestaan om de scanner via een SCSI-adapter op de parallelle poort van de draagbare PC aan te sluiten. De laatste tijd komen er echter meer en meer scanners met een parallelle poort op de markt (zoals de ScanJet 5100 uit de test), die probleemloos op een draagbare PC aansluitbaar zijn. Bestaan er tekstherkenningssystemen die geen computer of computerkennis vereisen? Er bestaan inderdaad autonome systemen die een scanner, een tekstherkenningsprogramma en een spraaksynthesizer in ‚‚n compacte behuizing integreren en die zonder computerkennis via een eenvoudig toetsenbordje te bedienen zijn. Het aanbod van dergelijke toestellen met Nederlandse spraak is echter nog uiterst beperkt en de prijs ligt vrij hoog. Toch kan dit in sommige gevallen een uitstekend hulpmiddel zijn. Gebruik ik als slechtziende een tekstherkenningssysteem of eerder een TV-loep als leeshulpmiddel? Hoewel het antwoord op deze vraag voor een groot deel van de persoonlijke voorkeur zal afhangen, willen we toch een paar overwegingen meegeven. Over het algemeen is een TV-loep eenvoudiger in het gebruik en dus aan te bevelen als de te lezen tekst niet moet worden bewerkt. Bovendien is een TV- loep niet enkel een lees- maar ook een schrijfhulpmiddel. Tot slot pleit ook het prijsverschil in het voordeel van de TV-loep. De Cel Infovisie van Vlicht publiceert in dit verband een gratis tips-folder die een leidraad biedt bij de keuze van een tekstherkenningssysteem.