@@VT @@11 Vergelijkende test: Tekstherkenningsprogramma's Sylvia Pont en Gerrit Van den Breede 1. Inleiding In onze vorige test van tekstherkenningsprogramma's (OCR) in Infovisie Magazine van juni '96 toonden we al aan dat softwarematige tekstherkenningssystemen voor vele gehandicapten een groot gemak kunnen betekenen. De prijsdaling van aan hulpmiddelen aangepaste tekstherkenningsprogramma's heeft zich helaas niet veel verder doorgezet, terwijl de prijzen van niet aangepaste herkenningsprogramma's en scanners wel bleven dalen. Omwille van deze prijsdalingen en omdat Windows alsmaar toegankelijker wordt, hebben we in deze test niet enkel aangepaste herkenningspakketen bekeken, maar ook drie programma's die op de reguliere markt verkrijgbaar zijn. De gebruikersvriendelijkheid van deze reguliere programma's werd natuurlijk zwaar op de proef gesteld en tevens werd nagegaan of ze bruikbaar zijn in combinatie met hulpmiddelen. Het was helaas niet mogelijk om dit laatste uitvoerig te testen, maar we geven wel een idee van de toegankelijkheid van dergelijke programma's voor niet en slechtzienden. Een nieuwe ontwikkeling is de mogelijkheid tot herkenning van handgeschreven cijfers, die door enkele tekstherkenningsprogramma's geboden wordt. Dit lijkt misschien de eerste stap naar volwaardige handschriftherkenning, maar de herkenning van handgeschreven letters en woorden levert veel extra problemen op in vergelijking met de herkenning van handgeschreven cijfers en getallen. Zo bestaan handgeschreven getallen steeds uit los van elkaar geschreven cijfers terwijl handgeschreven woorden ook uit vast aan elkaar geschreven letters kunnen bestaan. Het loskoppelen van deze letters zal nodig zijn voor de herkenning en kan extra problemen opleveren. Een volwaardige handschriftherkenning is vanwege dergelijke moeilijkheden nog lang niet in zicht. 2. Geteste programma's en testmethodes We onderscheiden voor onze test drie soorten tekstherkenningsprogramma's: -Groep 1: Tekstherkenningsprogramma's die onder Windows draaien en waarvan de gebruikersinterface aangepast werd om het samenwerken met een beperkt aantal spraaksynthesizers en brailleleesregels mogelijk te maken. -Groep 2: Tekstherkenningsprogramma's die onder DOS draaien en speciaal aangepast zijn voor gebruik met alle spraaksynthesizers en brailleleesregels. -Groep 3: Tekstherkenningsprogramma's die onder Windows draaien, geen aanpassingen voor hulpmiddelen bieden en op de gewone markt te koop zijn. ========== Tabel: geteste tekstherkenningsprogramma's ========== Open Book Unbound (Groep 1) -Producent: Arkenstone -Herkenningstechnologie: WordScan -Technische fiche: pg 37 ---------- Cicero (Groep 1) -Producent: Dolphin Computer Access -Herkenningstechnologie: Recognita -Technische fiche: pg 35 ---------- Recognita Reader (Groep 2) -Producent: Recognita Corporation -Herkenningstechnologie: Recognita -Technische fiche: pg41 ---------- Recognita Plus (Groep 3) -Producent: Recognita Corporation -Herkenningstechnologie: Recognita -Technische fiche: pg40 ---------- OmniPage Pro (Groep 3) -Producent: Caere Corporation -Herkenningstechnologie: OmniPage -Technische fiche: pg 36 ---------- ReadIris (Groep 3) -Producent: Iris -Herkenningstechnologie: ReadIris -Technische fiche: pg 39 ========== In groep 2 horen ook het op TextBridge gebaseerde Reading AvantEdge en het op OmniPage gebaseerde Oscar (technische fiche op pagina 38) thuis. Beide pakketten zijn enkel nog in Belgi‰ verkrijgbaar en we hebben ze helaas niet in de praktijk kunnen testen. Aangezien deze producten de laatste jaren niet zo erg veranderd zijn, kunnen we verwijzen naar de testresultaten in Infovisie Magazine van juni 1996. Ten opzichte van de geteste versie (4.0a) is de nieuwste versie van Oscar (4.0b) sneller en accurater op een Pentium PC, werkt ze ook goed in een DOS-venster binnen Windows en is ze compatibel met 400 dpi scanners. Over Reading AvantEdge zijn geen nieuwigheden te melden. In groep 3 hoort ook TextBridge Pro thuis, een programma dat we ook niet konden testen, maar waarvan u een technische fiche vindt op pagina 42. Bij de test werden diverse testdocumenten gebruikt, die zodanig geselecteerd waren dat zoveel mogelijk aspecten van de tekstherkenning aangesproken werden. Zo waren ondermeer van de partij: een brief uit een laserprinter, een artikel uit een tijdschrift, een kleurrijke folder, een document met smalle kolommen, een faxbericht van slechte kwaliteit, een bankafschrift en een document met ingewikkelde wiskundige formules. Verder waren er ook documenten met een volledige set letters, cijfers, lees- en speciale tekens in diverse formaten en met diverse attributen (cursief, vetgedrukt, onderstreept, etcetera) en kleuren. De programma's zijn getest op twee verschillende computers en met twee verschillende scanners. Open Book Unbound, beide Recognita-versies en Cicero zijn getest op een 233 MHz Pentium PC met 32 Mbyte RAM-geheugen en met een op de SCSI- interface aangesloten Hewlett Packard ScanJet 5P. OmniPage Pro en ReadIris zijn getest op een 200 MHz Pentium PC met 32 Mbyte RAM-geheugen en een parallel aangesloten Hewlett Packard ScanJet 5100C. Deze laatste scanner is sinds april '98 op de markt als opvolger van de ScanJet 5P. Aangezien er verschillende PC's en scanners in deze test gebruikt zijn, was het onmogelijk om een exacte vergelijking van scan- en herkenningstijden te maken. Deze informatie moeten we u dan ook schuldig blijven. Verder moet nog opgemerkt worden dat de meeste herkenningsprogramma's nog niet beschikken over specifieke aanstuurprogramma's voor de ScanJet 5100C, wat een invloed kan hebben op de scantijden. Tot slot willen we hier nog enige aandacht besteden aan het zogenaamde precisiescanprogramma, dat met de ScanJet 5100C wordt meegeleverd en dat de ingescande documenten al voorbewerkt vooraleer ze in het tekstherkenningsprogramma worden ingevoerd. Deze voorbewerking vergt helaas wat tijd en is (voor zover wij dat konden ontdekken) niet uit te schakelen. Bij grafisch gebruik van gescande documenten kan deze voorbewerking winst opleveren wat betreft geheugengebruik, maar verder hebben wij geen opvallende voordelen kunnen ontdekken van deze tijdrovende tussenstap. 3. Basiskenmerken 3.1. Groep 1 Beide programma's uit groep 1 werden getest met de Juno spraaksynthesizer. *Open Book Unbound Dit programma, dat beschermd wordt door een veiligheidssleutel (dongle), ondersteunt diverse spraaksynthesizers en brailleleesregels. Het gebruikersniveau, dat het aantal opties in de menu's bepaalt, is instelbaar in drie gradaties: beginner, gevorderd of expert. De meeste menu-opties zijn ook via sneltoetsen bedienbaar. De gebruikersinterface is Nederlandstalig en Open Book voorziet in een hulpfunctie. Na de herkenning wordt automatisch begonnen met het voorlezen van de tekst. Het is mogelijk een bibliotheek van herkende documenten aan te leggen, die onderverdeeld en ingericht kan worden naar eigen inzicht. *Cicero Cicero is, als opvolger van Lexis, een eenvoudig herkenningsprogramma dat een Dolphin- of SSIL-compatibele spraaksynthesizer rechtstreeks aanstuurt. Dankzij de ge‹ntegreerde "Synthesizer Access Manager" (SAM) kan Cicero het gebruik van de spraaksynthesizer delen met andere programma's, zoals het Hal 95 schermuitleesprogramma. SAM is een softwaremodule die bepaalt welk programma op een bepaald moment een boodschap naar de spraaksynthesizer mag sturen, zodat meerdere toepassingen gelijktijdig gesproken boodschappen kunnen genereren. De bediening van Cicero verloopt via het toetsenbord. De gebruikersinterface is Engelstalig en er is een hulpfunctie aanwezig. Na de herkenning wordt automatisch begonnen met het voorlezen van de tekst. 3.2. Groep 2 *Recognita Reader Recognita Reader is de kampioen onder de tekstherkenningsprogramma's wat betreft het aantal herkende talen. Het is bovendien het enige product uit de test dat nog onder DOS loopt en dus tekstschermen genereert. Dit programma is bijgevolg compatibel met zowat iedere spraaksynthesizer of brailleleesregel. Recognita Reader heeft een Engelstalige gebruikersinterface die aangepast is aan de noden van visueel gehandicapten. Het programma is eenvoudig via het toetsenbord te bedienen. Er zijn permanent zowel een algemene als een contextafhankelijke hulpfunctie aanwezig. Na de herkenning kan je de tekst direct beginnen lezen. 3.3. Groep 3 *Recognita Plus Recognita Plus is qua aantal herkende talen even superieur als het broertje Recognita Reader. De gebruikersinterface is in het Engels uitgevoerd. De bediening van Recognita Plus gebeurt via afrolmenu's. De meeste menu-opties zijn ook activeerbaar via sneltoetsen of door op de knoppen van de knoppenbalken te klikken. In de zogenaamde "Text Viewer" kan het herkende document direct na de herkenning gelezen, bewerkt en nagekeken worden met behulp van woordenboeken. Recognita Plus biedt een hulpfunctie. De herkenningsmodule van Recognita Plus kan ook rechtstreeks vanuit een MS Office-toepassing of vanuit WordPerfect gebruikt worden. De herkende tekst komt dan direct in de actieve toepassing te staan. Hierbij kan de originele opmaak van een document behouden blijven. *OmniPage Pro Dit programma kent een Engelstalige gebruikersinterface en wordt zoals de meeste Windows-programma's via uitrolmenu's bediend. De meeste menu-opties zijn bovendien ook via sneltoetsen of via de knoppenbalken te activeren. OmniPage biedt ook een "Text Viewer" om de herkende teksten direct na de herkenning te lezen en te bewerken. In het programma is een hulpfunctie aanwezig. Net zoals bij Recognita Plus bestaat de mogelijkheid om de OmniPage herkenningsmodule rechtstreeks vanuit een MS Office-toepassing te gebruiken. De originele opmaak van documenten kan ook in dit geval behouden blijven. *ReadIris ReadIris is een programma van Belgische komaf en het enige uit deze groep met een Nederlandstalige gebruikersinterface. De bediening gebeurt via afrolmenu's. De meeste menu-opties zijn ook activeerbaar door het gebruik van sneltoetsen of via een aantal knoppen. Na het scannen start automatisch de herkenning van het document. ReadIris biedt zelf echter niet de mogelijkheid herkende tekst direct te lezen en te bewerken. Een hulpfunctie is aanwezig. Gebruik van de herkenningsmodule vanuit een MS Office-toepassing is ook hier mogelijk. Ook dit programma kan hierbij de originele opmaak van documenten behouden, maar tijdens de test lukte dit niet echt goed. 4. Beoordeling 4.1. Groep 1 *Open Book Unbound Pro -Nederlandstalige gebruikersinterface -gebruikersvriendelijk -zeer goede herkenning -direct lezen na herkenning -ondersteuning hulpmiddelen Contra -relatief langzaam Dit programma is zeer gebruikersvriendelijk en laat zich na een korte oefensessie blindelings bedienen. Lettergroottes van 6 tot 36 punten werden goed herkend, evenals cursieve, vette en onderstreepte tekst. Open Book kon als enige uit deze test ook goed overweg met slecht contrasterende tekst. Accenttekens en de speciale tekens van een gangbaar toetsenbord werden minder goed herkend. Open Book bleek de tekst van alle testdocumenten goed tot zeer goed te herkennen. *Cicero Pro -snel -gebruikersvriendelijk -direct lezen na herkenning Contra -herkenning iets minder goed Dit programma is zeer gebruikersvriendelijk en laat zich, net zoals Open Book, na een korte oefening blindelings bedienen. De mogelijkheden zijn wel iets beperkter dan bij Open Book. Cicero bleek lettergroottes van 6 tot 36 punten goed te herkennen, evenals de speciale tekens en cursieve, vetgedrukte en onderstreepte tekst. Accenttekens en tekst op een gekleurde achtergrond of met slecht contrast werden minder goed herkend. Ook documenten met tekst in kolommen met weinig tussenruimte bleken problematisch, evenals onze fax en het bankafschrift. De herkenning van de overige testdocumenten verliep echter goed en snel. 4.2. Groep 2 *Recognita Reader Pro -snel -gebruikersvriendelijk -direct lezen na herkenning -ondersteuning hulpmiddelen -veel herkende talen Contra -herkenning van accenttekens Ook voor dit aangepaste DOS-programma kunnen we concluderen dat het gebruikersvriendelijk en na wat oefenen blindelings bedienbaar is. Letters tussen 6 en 36 punten worden goed herkend. Ons testdocument met een volledige tekenset en diverse attributen leverde problemen op. In dit programma moet een codetabel worden ingesteld die bij de herkenning gebruikt wordt. De herkenning blijkt erg gevoelig te zijn voor deze instelling. Als te veel tekens niet herkend worden als behorende tot de ingestelde codetabel, wordt de herkenning onderbroken en een foutmelding gegeven. Uiteindelijk is het ons toch gelukt om alle testdocumenten te scannen en te laten herkennen. Hieruit bleek dat dit programma de speciale tekens, cursieve, vette en onderstreepte tekst goed herkent. Accenttekens leverden problemen op, evenals tekst op een gekleurde achtergrond of tekst met een slecht contrast. 4.3.1. Groep 3 De herkenningssnelheid en -kwaliteit beoordelen we hieronder per product. Aan de bruikbaarheid van deze reguliere programma's in combinatie met hulpmiddelen besteden we aan het eind van dit stukje een aparte paragraaf. *Recognita Plus Pro -zeer goede herkenning -snelheids/nauwkeurigheidsniveaus -direct lezen en bewerken na herkenning -veel herkende talen -gebruik vanuit Office en WP Contra -primair grafisch geori‰nteerd Recognita Plus biedt bij de herkenning een scala van vijf verschillende snelheids- en nauwkeurigheidsniveau's. Aan het ene uiterste primeert dus de snelheid en aan het andere de nauwkeurigheid. We hebben de scan- en herkenningstijden met deze uiterste niveau's gemeten. De snelste instelling leverde vaak een tijdwinst in de orde van vijf seconden op. De herkenningskwaliteit van de testdocumenten was, zoals verwacht, enigszins beter bij gebruik van de nauwkeurigste instelling. Deze betere resultaten vielen alleen in extreme gevallen op. Bij het maximale nauwkeurigheidsniveau werden tekens tot 48 punten herkend, bij het snelste niveau letters tot 36 punten. Verder trad het opmerkelijke effect op dat letters zonder schreef vanaf 7 punten goed herkend werden, terwijl letters met schreef reeds vanaf 6 punten goed werden herkend. Voor het overige was de herkenning bijzonder goed en zelfs van de wiskundige formules wist Recognita Plus nog iets te maken dat enigszins op het origineel leek. De opmaak van de documenten bleef zeer goed behouden. *OmniPage Pro Pro -goede herkenning -direct lezen en bewerken na herkenning -gebruik vanuit MS Office Contra -primair grafisch geori‰nteerd De herkenningskwaliteit van dit programma is goed. Ons testdocument met de volledige tekenset en diverse attributen werd globaal gezien even goed herkend als bij Recognita. Schreefloze letters van 5 tot 48 punten worden door OmniPage goed herkend; letters met schreef worden echter pas vanaf een grootte van 7 punten goed herkend. De herkenningskwaliteit verslechterde enigszins voor documenten met een gekleurde achtergrond of documenten met een slecht contrast. Net zoals de meeste andere tekstherkenningsprogramma's kon OmniPage niet goed overweg met de wiskundige formules. De originele opmaak van de documenten bleef goed behouden, behalve bij enige documenten waarin kolommen voorkwamen. *ReadIris Pro -Nederlandstalige gebruikersinterface -gebruik vanuit MS Office Contra -geen automatische detectie van pagina-ori‰ntatie -erg gevoelig voor instellingen -primair grafisch geori‰nteerd ReadIris is het enige programma in deze groep met een Nederlandstalige interface. De herkenningskwaliteit was echter iets minder goed dan in het geval van OmniPage. De documenten met volledige tekensets leverden hier en daar wat problemen op en ook met onderstreepte tekst bleek ReadIris moeite te hebben. Teksten met een slecht contrast werden zeer slecht herkend, maar teksten op een gekleurde achtergrond bleken daarentegen geen grote problemen op te leveren. Verder bleek dit programma erg gevoelig te zijn voor de instellingen. Het bestandsformaat bleek in sommige gevallen tot vreemde verschijnselen qua opmaak te leiden. Het behouden van de originele documentopmaak leverde sowieso vaak problemen op. Automatische detectie van de pagina- ori‰ntatie bleek niet mogelijk, wat volgens ons een groot gemis is. Tot besluit trachten we een antwoord te geven op de vraag die visueel gehandicapten zich zullen stellen: "In hoeverre is het mogelijk om herkenningsprogramma's van de reguliere markt te gebruiken in combinatie met hulpmiddelen?". We hebben voor de programma's uit groep 3 bekeken of ze enerzijds goed samenwerken met een vergrotingsprogramma met spraakondersteuning (ZoomText Xtra Level 2 en een Apollo spraaksynthesizer) en of ze het anderzijds ook goed doen met een schermuitleesprogramma voor spraakweergave (Hal 95 met een Apollo spraaksynthesizer). Hierbij werd nagegaan of de combinatie van de verschillende programma's stabiel was, of de hulpmiddelen de gebeurtenissen op het scherm goed volgden en of de informatie op het scherm op een functionele manier werd uitgelezen. Deze aspecten werden gecontroleerd voor drie fases in het proces: het scannen, het herkennen en het lezen van het tekstdocument. Voor wat betreft het gebruik van vergroting met spraakondersteuning kunnen we concluderen dat de resultaten zeer goed waren. In alle gevallen bleek deze combinatie goed werkbaar en stabiel. Voor slechtziende mensen die met ZoomText Xtra werken hebben we dus de verheugende mededeling dat de regulier verkrijgbare programma's uit groep 3 goede mogelijkheden bieden voor het lezen van documenten via dit hulpmiddel. Met de huidige versies van OmniPage Pro en Recognita Plus is het mogelijk om direct na het scannen en herkennen, de teksten te lezen en te bewerken in de zogenaamde "Text Viewer". ReadIris biedt deze mogelijkheid niet. Maar zelfs als zo'n "Text Viewer" ontbreekt, kan je terugvallen op de "Document Reader" van ZoomText Xtra die vergelijkbare leesmogelijkheden biedt, wat volgens ons een zeer positief punt is. De samenwerking van reguliere tekstherkenningsprogramma's met een schermuitleesprogramma bleek daarentegen niet altijd even goed werkbaar. De combinatie van ReadIris en Hal 95 bleek niet stabiel te zijn. De combinaties van dit schermuitleesprogramma met OmniPage Pro of met Recognita Plus waren wel stabiel. Tijdens het scannen en herkennen worden de gebeurtenissen echter vaak niet voldoende gevolgd en uitgelezen. Het lezen van de herkende tekst met Hal 95 liep regelmatig spaak doordat de focus van dit programma niet meer te verplaatsen was. Het rechtstreeks scannen vanuit Word, wat met zowel OmniPage Pro als Recognita Plus mogelijk is, biedt eerder mogelijkheden in combinatie met spraakuitvoer. Dit kan een methode zijn om ingescande documenten vlot te lezen en te bewerken. Maar tijdens onze test kwamen we ook hier nog regelmatig probleempjes tegen die vooral te maken hadden met de manier waarop het scherm werd uitgelezen: soms werd te veel en soms dan weer te weinig informatie uitgelezen. Volledigheidshalve merken we op dat een aantal hulpmiddelenleveranciers druk doende zijn om een regulier tekstherkenningsprogramma uit te testen in combinatie met hun schermuitleesprogramma's. Met behulp van profielen of andere kleine aanpassingen trachten ze die programma's nauwkeurig af te stemmen op gebruik met een regulier tekstherkenningsprogramma. 5. Besluit Na vergelijking van deze test met onze voorgaande test van tekstherkenningsprogramma's kunnen we verheugd concluderen dat er voor slechtziende mensen nieuwe mogelijkheden ontstaan door het gebruik van de courant verkrijgbare programma's OmniPage Pro en Recognita Plus, die in combinatie met vergroting (met eventueel spraakondersteuning) zeer goede mogelijkheden bieden om documenten te lezen. Verder lijkt het er op dat binnen niet al te lange tijd ook mogelijkheden ontstaan om deze producten vlot te laten samenwerken met schermuitleesprogramma's voor braille en spraak. Hierbij zal de mogelijkheid tot het direct scannen vanuit de tekstverwerker waarschijnlijk snel een re‰le optie worden. Buitenbeentje: de IrisPen De IrisPen is een penvormige scanner die door de gebruiker tegen een gelijkmatige snelheid over een regel tekst bewogen moet worden. De op die manier gescande tekstregels worden vervolgens door het ReadIris-programma herkend. Sterke punten van deze IrisPen zijn de herkenning van handgeschreven cijfers en de mogelijkheid om de herkende tekst te laten uitspreken. Een groot probleem van dit soort scannertjes is echter dat de pen in een redelijk rechte lijn over een regel tekst bewogen moet worden. Hoewel dit toestel in het verleden reeds als hulpmiddel werd aangeprezen lijkt de IrisPen ons daarom niet geschikt voor slechtzienden en blinden. Omdat de tekst regel voor regel gescand moet worden, deugt de pen daarenboven zeker niet voor het scannen van grote hoeveelheden tekst. ========== Verklaring terminologie ========== -OCR: staat voor Optical Character Recognition en betekent herkenning door de computer van gescande documenten. -glasplaatscanner (flatbed scanner): scanner waarbij het in te scannen document op een glasplaat gelegd wordt, zoals dat bij een kopieermachine het geval is. -scanresolutie: de mate van detail waarmee de scanner het document aftast; dit wordt uitgedrukt in beeldpunten per inch. De vereiste resolutie voor tekstherkenning ligt rond de 300 … 400 dpi (dit zijn ongeveer 12 punten per mm). -dpi: staat voor dots per inch (aantal punten per inch) en is de eenheid waarmee de scanresolutie weergegeven wordt. -SCSI: staat voor Small Computer System Interface en is een snelle parallelle verbinding waarop veel scanners aangesloten worden om gegevens door te sturen naar de PC. -SSIL: staat voor Speech Synthesizer Interface Library en is een door Arkenstone ontwikkelde standaard die een interface vormt tussen het schermuitleesprogramma enerzijds en de spraaksynthesizer of spraaksyntheseprogramma anderzijds. -codetabel (code page): verzameling van 256 tekens (letters, cijfers, leestekens, etcetera) die door het besturingssysteem van de computer gehanteerd wordt om tekst op het scherm te brengen. -veiligheidssleutel (dongle): tussenstuk dat op de parallelpoort geplaatst en toegang geeft tot erdoor beschermde programmatuur. -schreef: dwarsstreepje of verdikking op het uiteinde van de lijnen waaruit letters opgebouwd zijn; hierdoor ontstaat een visueel 'afgebakende' letter. Lettertypes met een schreef worden doorgaans veel gebruikt in kranten en tijdschriften. ========== Geraadpleegde literatuur: -"Het grote scanneroverzicht, met 23 geteste scanners en een schat aan achtergrondinformatie", Computer!totaal, oktober 1997 -"Tot in de puntjes: PCM werpt zijn licht op 15 flatbed scanners", PCM, maart 1997 -"OmniPage Pro 8.0", Computer!totaal, maart 1998 -"Nieuwe blik op oude teksten: PCM test 3 OCR-programma's", PCM, april 1996 -"De bijziendheid van software", Data News, 27 maart 1998