@@ 102ea012.txt -p12- Vergelijkende test: tekstherkenningsprogramma's Roderik Erens en Peter Melman 1. Inleiding Steeds meer visueel gehandicapten ontdekken het gemak van een tekstherkenningssysteem. Vooral door de prijsdaling van de vlakbedscanners en van de tekstherkenningsprogrammatuur (of OCR- programma's) zien we dat een tekstherkenningssysteem in de thuissituatie voor velen tot de mogelijkheden gaat behoren. Met de komst van de 486-computer en van de Pentium hebben de huidige softwarematige systemen de OCR-hardware volledig verdrongen. Een ontwikkeling waar iedereen naar uitkijkt is het herkennen van handschrift. Het lijkt er echter op dat er nog veel onderzoek nodig is vooraleer tekstherkenningsprogramma's tot handschriftherkenning in staat zijn. We hebben enkel de OCR-software getest die aangepast is voor slechtziende en blinde mensen. In Belgi‰ en Nederland zijn dat de volgende produkten: Braudi Bureau van Data Braille Service, Lexis van Dolphin Systems, Oscar van TeleSensory, Open Book Unbound van Arkenstone, Recognita van Recognita Corporation en Reading AdvantEdge van Xerox Imaging Systems. Twee in Belgi‰ verkrijgbare programma's, LeseFix en TechniPage, werden niet getest omdat ze gebaseerd zijn op dezelfde OCR-module als respectievelijk Open Book Unbound en Braudi Bureau en daarom qua prestaties met deze produkten vergelijkbaar moeten zijn. Het type processor en de hoeveelheid RAM- geheugen zijn bepalend voor de snelheid waarmee de tekstherkenning plaatsvindt. Alle programma's zijn getest op een 66 MHz 486 DX2 PC met 8 Mbyte RAM-geheugen, met een op de SCSI-interface aangesloten Hewlett Packard ScanJet 4P. Dit is een vlakbed kleurenscanner die een scanresolutie van 300 dpi haalt. Als testdocumenten werd hetzelfde materiaal gebruikt als in de vorige testen (IM 7,3 van september '93 en IM 7,4 van december '93). Hieraan zijn enkele documenten toegevoegd, zoals een met de faxmodem ontvangen faxbestand. In de test hebben we zoveel mogelijk gebruik gemaakt van de standaardinstellingen van de OCR-programma's. 2. Algemene gegevens Aangepaste OCR-programmatuur is gebaseerd op standaard tekstherkenningsprogramma's zoals WordScan (Open Book Unbound), OmniPage (Oscar, Braudi Bureau), Recognita (Lexis, Recognita) en TextBridge (Reading AdvantEdge). Sommige van de geteste OCR-pakketten vereisen MS-DOS als besturingssysteem, andere MS- Windows. De MS-DOS geori‰nteerde software ondersteunt in principe alle leesregels, spraaksynthesizers en vergrotingsprogramma's die onder MS-DOS werken. Het uitlezen van de schermen die deze OCR- software genereert, gebeurt via het gewone aanstuurprogramma van het hulpmiddel waarmee men gewend is te werken. Tekstherkenningsprogramma's die onder MS- Windows draaien sturen zelf het hulpmiddel aan. Meestal wordt slechts een beperkt aantal leesregels en spraaksynthesizers door de OCR- software ondersteund. In dit geval zal het hulpmiddel op een andere manier bediend moeten worden. Soms kunnen bijvoorbeeld de duim- en cursor-routingtoetsen niet meer gebruikt worden. De in de tabel opgesomde systeemvereisten zijn overgenomen uit de documentatie van de leverancier. Het gaat om minimale vereisten en de ervaring leert ons dat voor een vlotte herkenning een 486 PC met 8 Mbyte RAM-geheugen noodzakelijk is. Alle geteste tekstherkenningsprogramma's zijn in principe eenvoudig te bedienen via een menu (waarvan de taal instelbaar is) en toetscombinaties. ========== TABEL 1: Algemene gegevens ========== Geteste versie -Braudi Bureau: 1.1 -Lexis: 2.01 -Reading AdvantEdge: 1.31 -Recognita: 2.0 -Open Book Unbound: 1.23 -Oscar: 4.0A ---------- Leverancier Nederland: -Lexis: CIG -Reading AdvantEdge: Tieman -Recognita: Tieman -Open Book Unbound: CIG, Alva -Oscar: Lameris [1] ---------- Prijs Nederland (exclusief BTW): -Lexis: 1.050 NLG -Reading AdvantEdge: 2.465 NLG -Recognita: 1.995 NLG -Open Book Unbound: 2.100 NLG -Oscar: 3.735 NLG ---------- Leverancier Belgi‰: -Braudi Bureau: Data Braille Service -Lexis: Brailleliga -Reading AdvantEdge: Sensotec -Recognita: Diff€rences -Open Book Unbound: Access Systems,' t Harlekijntje -Oscar: Brailleliga, 't Harlekijntje ---------- Prijs Belgi‰ (exclusief BTW): -Braudi Bureau: 43.000 BEF -Lexis: Geen gegevens -Reading AdvantEdge: 43.388 BEF -Recognita: 28.800 BEF -Open Book Unbound: Geen gegevens -Oscar: 40.903 BEF ---------- Door de leverancier geadviseerde scanner: -Braudi Bureau: HP ScanJet 4P -Lexis: HP ScanJet 4P -Reading AdvantEdge: HP ScanJet 4P, Kurzweil -Recognita: HP ScanJet 4P -Open Book Unbound: HP ScanJet 4P -Oscar: HP ScanJet 4P ---------- Ondersteunde hulpmiddelen: -Braudi Bureau: Braudi, Apollo II, Juno -Lexis: Apollo II, Juno -Reading AdvantEdge: Diverse [2] -Recognita: Diverse [2] -Open Book Unbound: Apollo II, Juno, ABT, PortaBraille, PBC, QBB -Oscar: Diverse [2] ---------- Vereist besturingssysteem: -Braudi Bureau: Windows 3.x -Lexis: Windows 3.x -Reading AdvantEdge: MS-DOS 3.1 of hoger -Recognita: MS-DOS 3.1 of hoger -Open Book Unbound: Windows 3.x -Oscar: MS-DOS 3.1 of hoger ---------- Minimale systeemvereisten: -Braudi Bureau: 386 Processor en 4 Mbyte RAM -Lexis: 386 Processor en 4 Mbyte RAM -Reading AdvantEdge: 386 Processor en 8 Mbyte RAM -Recognita: 286 Processor en 2 Mbyte RAM -Open Book Unbound: 386 Processor en 4 Mbyte RAM -Oscar: 386 Processor en 4 Mbyte RAM ---------- Talen interface instelbaar: -Braudi Bureau: Ned, Frans -Lexis: Ned, Eng -Reading AdvantEdge: Ned, Eng, Frans -Recognita: Eng, Frans -Open Book Unbound: Ned, Eng, Frans -Oscar: Ned, Eng, Frans ---------- Permanente hulpfunctie: -Braudi Bureau: Nee -Lexis: Ja -Reading AdvantEdge: Ja -Recognita: Ja -Open Book Unbound: Ja -Oscar: Ja ---------- Leesvormen handleiding: -Braudi Bureau: Zwart, braille, diskette -Lexis: Zwart, diskette -Reading AdvantEdge: Zwart, diskette -Recognita: Zwart -Open Book Unbound: Zwart, diskette, cassette -Oscar: Zwart, diskette, cassette ========== [1] Enkel bij Lameris zijn installatie en een dag instructie in de prijs begrepen. [2] Alle hulpmiddelen die onder MS-DOS werken kunnen doorgaans probleemloos gebruikt worden met deze programmatuur. 3. Scannen en herkennen Een nadeel van een kleurenscanner ten opzichte van een monochrome scanner is dat een automatische contrastregeling ontbreekt. Hierdoor kan de nauwkeurigheid van de herkenning bij de nieuwe HP ScanJet 4P lager uitvallen dan bij de oudere monochrome modellen zoals de ScanJet IIP of IIIP. De ScanJet 4P is een vrij groot apparaat. Het oppervlak van de glasplaat is ongeveer een kwart groter dan het A4-formaat, waardoor een opengeslagen boek er ruimschoots op past. Optioneel is voor de ScanJet 4P een papiertoevoermechanisme verkrijgbaar. De scanner maakt in feite een digitale foto van het document. Een aantal OCR-pakketten bieden de mogelijkheid deze digitale opname als grafisch bestand op te slaan. Meestal zal de herkenning direct na het scannen starten. Allereerst worden alle afbeeldingen tussen de tekst uitgehaald. Om tot een optimale tekstherkenning te komen moet de juiste herkenningstaal ge‹nstalleerd zijn. Dit is een bestand met lettercombinaties en woorden die veel voorkomen in een bepaalde taal. De programmatuur gebruikt dit bestand om de kans op een correcte herkenning te vergroten. De nauwkeurigheid kan de gebruiker nog verder verbeteren door het aanleggen van een persoonlijke woordenlijst. Onherkenbare tekens worden vaak met een symbool gemarkeerd (miskleunmarkering) zodat de gebruiker ze kan terugvinden en handmatig verbeteren. Om als visueel gehandicapte vlot met de OCR- software te kunnen werken is het belangrijk dat men amper instellingen hoeft te veranderen en dat alles zoveel mogelijk automatisch gebeurt. Vooral het automatisch detecteren van de pagina-ori‰ntatie is onmisbaar. Men moet er zich dan niet over bekommeren in welke richting het document bedrukt is. Mocht er toevallig een blanco pagina op de scanner liggen, dan is het handig als dit gemeld wordt. Bij documenten met kolommen is het belangrijk dat men kan kiezen of de herkende tekst mooi onder elkaar (voor doorlopende tekst) of terug in kolommen (voor tabellen) gezet moet worden. Automatische herkenning van het drukwerktype is nuttig voor wie vaak matrixdruk moet scannen. Sommige programma's bieden de mogelijkheid om, in combinatie met een papierlader, tweezijdig bedrukte documenten te scannen. Nadat de eerste zijde van de documenten gescand is, draait de gebruiker het stapeltje papier om en kan de andere zijde gescand worden. Het programma zorgt er dan voor dat even en oneven pagina's netjes in de juiste volgorde gezet worden. Een andere optie waar steeds meer vraag naar komt is het herkennen van een faxbestand. Een faxbericht dat via een faxmodem op de computer binnenloopt is niet direct leesbaar met een hulpmiddel omdat het als grafisch bestand wordt opgeslagen. Met een aantal van de geteste programma's kan de tekst van zo'n grafisch faxbestand herkend worden. Meestal zal men een document na de herkenning direct willen lezen. De meeste pakketten beschikken over zo'n "direct lezen" optie. Alleen bij Recognita kan de gescande tekst pas gelezen worden nadat een tekstverwerker is opgestart. Het starten van een tekstverwerker of een ander toepassingsprogramma vanuit de OCR-software is bij diverse produkten mogelijk. Hierdoor kan men de tekst corrigeren zonder dat het OCR-programma moet worden be‰indigd. Braudi Bureau en Oscar bieden bovendien de mogelijkheid om tijdens het lezen van een document woorden te verbeteren zonder dat daarvoor naar een tekstverwerker hoeft overgeschakeld te worden. Tot slot is het nuttig als het tekstherkenningsprogramma de mogelijkheid biedt om de herkende tekst te bewaren in het bestandsformaat van de door u gebruikte toepassingsprogramma's (tekstverwerker, rekenblad, databank). ========== TABEL 2: Mogelijkheden ========== Scannen tot grafisch bestand: -Braudi Bureau: Nee -Lexis: Nee -Reading AdvantEdge: Ja -Recognita: Ja -Open Book Unbound: Ja -Oscar: Ja ---------- Aantal herkenningstalen: -Braudi Bureau: 11 -Lexis: 2 -Reading AdvantEdge: 4 -Recognita: 80 -Open Book Unbound: 13 -Oscar: 11 ---------- Persoonlijke woordenlijst: -Braudi Bureau: Nee -Lexis: Nee -Reading AdvantEdge: Ja -Recognita: Nee -Open Book Unbound: Nee -Oscar: Ja ---------- Miskleunmarkering: -Braudi Bureau: Nee -Lexis: Nee -Reading AdvantEdge: Ja -Recognita: Ja -Open Book Unbound: Ja -Oscar: Ja ---------- Automatische detectie pagina-oriƒntatie: -Braudi Bureau: Ja -Lexis: Ja -Reading AdvantEdge: Ja -Recognita: Nee -Open Book Unbound: Ja -Oscar: Ja ---------- Melding bij blanco pagina: -Braudi Bureau: Ja -Lexis: Ja -Reading AdvantEdge: Ja -Recognita: Nee -Open Book Unbound: Nee -Oscar: Ja ---------- Automatisch selecteren drukwerktype: -Braudi Bureau: Nee -Lexis: Nee -Reading AdvantEdge: Nee -Recognita: Nee -Open Book Unbound: Nee -Oscar: Ja ---------- Scannen tweezijdig bedrukte pagina: -Braudi Bureau: Nee -Lexis: Nee -Reading AdvantEdge: Nee -Recognita: Nee -Open Book Unbound: Ja -Oscar: Ja ---------- Herkennen van faxbestanden: -Braudi Bureau: Nee -Lexis: Nee -Reading AdvantEdge: Ja -Recognita: Ja -Open Book Unbound: Ja -Oscar: Ja ---------- Direct lezen: -Braudi Bureau: Ja -Lexis: Ja -Reading AdvantEdge: Ja -Recognita: Nee -Open Book Unbound: Ja -Oscar: Ja ---------- Applicatie starten vanuit OCR-software: -Braudi Bureau: Nee [3] -Lexis: Ja -Reading AdvantEdge: Ja [4] -Recognita: Ja -Open Book Unbound: Ja -Oscar: Ja ---------- Bewaren als diverse bestandsformaten: -Braudi Bureau: Nee -Lexis: Nee -Reading AdvantEdge: Ja -Recognita: Ja -Open Book Unbound: Ja -Oscar: Ja [5] ========== [3] De gebruiker beschikt wel over diverse bureau-accessoires, waaronder een notitieblok. [4] Er kunnen vier verschillende toepassingen gestart worden. [5] Oscar kan zodanig ingesteld worden dat dit automatisch gebeurt. 4. Prestaties Bij elk testdocument hebben we de tijd gemeten die nodig is voor het scannen en herkennen. Daarna werd de nauwkeurigheid van de tekstherkenning gecontroleerd door de herkende tekst te vergelijken met het origineel. 4.1. Benodigde tijd Allereerst werd de tijd gemeten die nodig is om de tekstherkenningsprogramma's op te starten. De programma's die onder MS-DOS werken zijn binnen tien seconden klaar voor gebruik. De pakketten onder MS-Windows hebben aanzienlijk meer tijd nodig: ongeveer anderhalve minuut. Dit komt vooral doordat eerst MS-Windows gestart moet worden en pas daarna de OCR- programmatuur. Het herkennen van een eenvoudig document gaat vlot op een 486 PC met 8 Mbyte RAM-geheugen. Meestal duurt de hele procedure (scannen en herkenning) rond de 30 seconden, waaronder steeds 20 seconden voor de scanner. Met een snellere computer en meer RAM-geheugen is dus amper nog snelheidswinst te behalen. Een moeilijk document met bijvoorbeeld veel afbeeldingen en tekst in kolommen neemt ongeveer 50 seconden in beslag. De herkenning van een grafisch faxbestand gaat meestal vlot omdat direct met herkennen kan begonnen worden. ========== TABEL 3: Scan- en herkenningstijden ========== Opstarten programma: -Braudi Bureau: 1 minuut 55 seconden -Lexis: 1 minuut 30 seconden -Reading AdvantEdge: 10 seconden -Recognita: 5 seconden -Open Book Unbound: 1 minuut 30 seconden -Oscar: 10 seconden ---------- Eenvoudig document: -Braudi Bureau: 25 seconden -Lexis: 30 seconden -Reading AdvantEdge: 30 seconden -Recognita: 25 seconden -Open Book Unbound: 40 seconden -Oscar: 25 seconden ---------- Moeilijk document: -Braudi Bureau: 45 seconden -Lexis: 50 seconden -Reading AdvantEdge: 1 minuut 5 seconden -Recognita: 40 seconden -Open Book Unbound: 1 minuut 20 seconden -Oscar: 35 seconden ---------- Grafisch faxbestand: -Braudi Bureau: Niet van toepassing -Lexis: Niet van toepassing -Reading AdvantEdge: 40 seconden -Recognita: 15 seconden -Open Book Unbound: 45 seconden -Oscar: 15 seconden ========== 4.2. Nauwkeurigheid De nauwkeurigheid van de herkenning is voor alle pakketten zeer goed. Bij de meeste documenten worden slechts een paar tekens niet of foutief herkend. Een gekleurde ondergrond of een afbeelding op de achtergrond hebben amper invloed. Ook vet gedrukte, onderstreepte of cursief gedrukte teksten worden zonder problemen herkend. Door het grote glasplaatoppervlak van de ScanJet 4P geeft de herkenning bij een opengeslagen boek weinig problemen. Slechts enkele letters vlakbij de plooi van het boek werden niet of foutief herkend. Verschillen tussen de herkenningsprogramma's treden op zodra de tekst in kolommen gedrukt is. Dan blijkt dat Recognita de grootste moeite heeft om de kolommen als doorlopende tekst te presenteren. Hierdoor ontstaat een onleesbaar geheel van door elkaar geklutste zinnen. Het behoud van kolommen (nuttig in tabellen) geeft echter bij geen enkel pakket problemen. Opvallend zijn de grote verschillen die ontstaan zodra een document scheef op de scanner wordt gelegd. De herkenning van de letters gebeurt correct, maar sommige woorden en afzonderlijke letters worden een regel te hoog of te laag geplaatst. Bij twee geteste pakketten werd het document daardoor moeilijk leesbaar. Bij faxbestanden moet men geen al te hoge verwachtingen hebben. Het blijkt dat de kwaliteit van een via de faxmodem ontvangen fax behoorlijk tegenvalt. De tekst staat vaak wat scheef en de letters zijn niet haarscherp. Dit komt doordat de meeste faxapparaten het document aftasten met een resolutie van 200 dpi of zelfs minder. Bovendien voegt de telefoonverbinding extra ruis toe aan het verstuurde faxbericht. Men moet behoorlijk experimenteren met de instellingen van de herkenningssoftware om een optimaal resultaat te halen, en dan nog wordt ongeveer 10 procent van de tekst foutief herkend. Bij de herkenning van speciale tekens zijn er duidelijke verschillen tussen de diverse pakketten merkbaar. De belangrijkste wiskundige symbolen worden redelijk tot goed herkend, maar bij het herkennen van accenttekens (zoals  , ‹, –, ‚,...) treden belangrijke verschillen op. Tot slot hebben we de herkenningsprogramma's getest met een document waarin verschillende lettergroottes, lettertypes en diverse attributen (vet, onderstreept en cursief) voorkomen. De resultaten waren zeer wisselend en meestal bleef er maar weinig over van de oorspronkelijke opmaak, lettertypes en attributen. In de tabel wordt het bereik weergegeven van de lettergroottes die nog herkend werden. ========== TABEL 4: Nauwkeurigheid ========== Tekst op gekleurde ondergrond: -Braudi Bureau: Goed -Lexis: Goed -Reading AdvantEdge: Goed -Recognita: Goed -Open Book Unbound: Goed -Oscar: Goed ---------- Tekst met afbeelding op achtergrond: -Braudi Bureau: Goed -Lexis: Goed -Reading AdvantEdge: Goed -Recognita: Goed -Open Book Unbound: Goed -Oscar: Goed ---------- Tekst met attributen: -Braudi Bureau: Goed -Lexis: Goed -Reading AdvantEdge: Goed -Recognita: Goed -Open Book Unbound: Goed -Oscar: Goed ---------- Opengeslagen boek: -Braudi Bureau: Goed -Lexis: Goed -Reading AdvantEdge: Goed -Recognita: Slecht [6] -Open Book Unbound: Goed -Oscar: Goed ---------- Kolommen onder elkaar zetten: -Braudi Bureau: Matig -Lexis: Matig -Reading AdvantEdge: Goed -Recognita: Slecht -Open Book Unbound: Goed -Oscar: Goed ---------- Kolommen behouden: -Braudi Bureau: Goed -Lexis: Goed -Reading AdvantEdge: Goed -Recognita: Goed -Open Book Unbound: Goed -Oscar: Goed ---------- Document iets scheef: -Braudi Bureau: Goed -Lexis: Slecht -Reading AdvantEdge: Goed -Recognita: Slecht -Open Book Unbound: Slecht -Oscar: Goed ---------- Faxbestand: -Braudi Bureau: Niet van toepassing -Lexis: Niet van toepassing -Reading AdvantEdge: Matig -Recognita: Goed -Open Book Unbound: Matig -Oscar: Matig ---------- Wiskundige tekens: -Braudi Bureau: Goed -Lexis: Goed -Reading AdvantEdge: Matig -Recognita: Goed -Open Book Unbound: Matig -Oscar: Goed ---------- Accenttekens: juiste letter: -Braudi Bureau: Matig -Lexis: Matig -Reading AdvantEdge: Goed -Recognita: Goed -Open Book Unbound: Matig -Oscar: Goed ---------- Accenttekens: juist accent: -Braudi Bureau: Slecht -Lexis: Slecht -Reading AdvantEdge: Matig -Recognita: Goed -Open Book Unbound: Matig -Oscar: Matig ---------- Bewaren opmaak en attributen -Braudi Bureau: Niet van toepassing -Lexis: Niet van toepassing -Reading AdvantEdge: Slecht -Recognita: Matig -Open Book Unbound: Slecht -Oscar: Goed ---------- Lettergrootte: -Braudi Bureau: 6 tot 48 punten -Lexis: 6 tot 36 punten -Reading AdvantEdge: 7 tot 48 punten -Recognita: 6 tot 36 punten -Open Book Unbound: 6 tot 36 punten -Oscar: 6 tot 48 punten ========== [6] Het herkennen van een opengeslagen boek verliep slecht omdat Recognita niet in staat was de twee kolommen onder mekaar te plaatsen. 5. Beoordeling 5.1. Braudi Bureau Braudi Bureau is een compleet pakket dat naast een OCR-gedeelte ook een notitieblokje, een rekenmachine, een agenda en nog meer handige bureau-accessoires bevat. We beperken ons in deze test tot het herkenningsgedeelte. Braudi Bureau draait onder MS-Windows en stuurt direct de Braudi braille/spraakcombinatie aan. De menu's en mededelingen die op het scherm verschijnen worden allemaal voorgelezen en op de leesregel getoond. Jammer is dat er geen stoptoets is om de spraak te onderbreken. Een beperkt aantal scaninstellingen kan via het menu veranderd worden. Het blijkt echter dat de standaardinstellingen voldoende zijn voor het scannen van de meeste documenten. Na de herkenning wordt automatisch gestart met het voorlezen. Handig is dat het herkende document in het notitieblokje geladen wordt zodat direct wijzigingen in de tekst kunnen worden gemaakt. 5.2. Lexis Lexis is een eenvoudig tekstherkenningsprogramma dat de Apollo II of Juno spraaksynthesizer aanstuurt vanuit MS- Windows. De bediening gebeurt via de functietoetsen van de computer. Met behulp van de Tab-toets wordt voorgelezen welke functies deze toetsen hebben. Via een menu zijn een beperkt aantal scaninstellingen te wijzigen. Lexis beschikt over automatische detectie van de pagina-ori‰ntatie, iets dat ook voor een eenvoudig OCR-programma een minimum vereiste is. Het onder elkaar plaatsen van kolommen gaat redelijk. De bediening van dit pakket is duidelijk en de spraakondersteuning is volledig. Na de herkenning wordt automatisch gestart met het voorlezen. Lexis is een pakket dat voldoende mogelijkheden biedt voor alledaags gebruik. 5.3. Reading AdvantEdge Reading AdvantEdge draait onder MS-DOS en is met de meeste brailleleesregels, spraaksynthesizers of vergrotingssystemen goed te bedienen. Via de menu's zijn enorm veel instellingen te wijzigen. Doordat die menu's zeer uitgebreid zijn, moet er soms flink gezocht worden naar de instelling die men wil veranderen. De automatische detectie van de pagina-ori‰ntatie en van de kolommen werkt prima. De nauwkeurigheid waarmee diverse documenten herkend worden is hoog. Een goede Nederlandstalige handleiding en een complete permanente hulpfunctie zorgen ervoor dat je snel met het programma overweg kan. Behalve de HP scanners ondersteunt Reading AdvantEdge ook de Kurzweil scanners, waaronder een model dat speciaal ontwikkeld werd voor het scannen van boeken. 5.4. Recognita Wie zich Recognita aanschaft, ontvangt drie versies: een versie voor MS-Windows, een grafische MS-DOS-versie en de zogeheten Auge- module. Dit is een tekstgeori‰nteerde DOS- versie die ontwikkeld werd voor mensen met een visuele handicap. Er is een schril contrast tussen de handleidingen voor de ziende en de niet-ziende gebruiker. In het eerste geval gaat het om ongeveer 300 pagina's, terwijl de blinden genoegen moeten nemen met 6 bladzijden en dus zeer beknopte informatie. Daarenboven beschikken zij slechts over een beperkte permanente hulpfunctie. Recognita mist belangrijke mogelijkheden zoals automatische detectie van de pagina-ori‰ntatie. Ook het automatisch rangschikken van tekst in kolommen gaat niet goed. Een sterk punt is dan weer het enorme aantal herkenningstalen dat Recognita aankan. Als het aankomt op het herkennen van speciale tekens dan steekt dit pakket met kop en schouders boven de andere uit. De bediening van Recognita is duidelijk. Herkende tekst kan niet direct gelezen worden. Er moet eerst een tekstverwerker opgestart worden. Dit kan rechtstreeks vanuit het OCR-programma gebeuren. 5.5. Open Book Unbound Dit programma heeft een aangepaste interface die onder MS-Windows werkt en een aantal spraaksynthesizers (zoals de Apollo II en de Juno) en brailleleesregels (zoals de PortaBraille-modellen van Tieman, de Alva leesregels en de QBB- en PBC-leesregels van Quattron Techniek) ondersteunt. De menu's kunnen op drie gebruikersniveau's (beginner, gevorderde of expert) worden ingesteld naarmate men meer eisen aan de herkenning stelt. Deze menu's zijn duidelijk en de meeste opties zijn snel te vinden. De nauwkeurigheid van de herkenning is goed. De snelheid ligt duidelijk lager dan bij de andere pakketten. Na de herkenning wordt automatisch gestart met het voorlezen. Het is ook mogelijk om een bibliotheek van gescand materiaal aan te leggen. De handleiding en de permanente hulpfunctie zijn zeer volledig, waardoor men snel met deze programmatuur uit de voeten kan. 5.6. Oscar Oscar is een DOS-programma. Zoals het bij TeleSensory de gewoonte is, zijn de handleiding en de permanente hulpfunctie zeer volledig. Van al de geteste programma's biedt Oscar de meeste mogelijkheden. Of het document nu wat scheef ligt of in kolommen staat, Oscar heeft er geen problemen mee. De herkenning gebeurt zeer nauwkeurig en snel. Daarbij valt op dat zij bij moeilijke documenten amper meer tijd in beslag neemt dan bij eenvoudige. De menu's zijn duidelijk en logisch ingedeeld. Met geen van de geteste hulpmiddelen vormde de bediening van Oscar een probleem. Direct na het herkennen kan de gebruiker met het lezen beginnen. Tijdens het lezen kunnen correcties in de tekst worden aangebracht. Ook is het mogelijk om een herkende tekst automatisch naar een bepaald formaat te converteren en het daarbij horende toepassingsprogramma automatisch te laten starten. 6. Conclusie Voor het scannen van eenvoudige brieven zijn deze tekstherkenningsprogramma's qua nauwkeurigheid niet van mekaar te onderscheiden. Gaan we echter kijken naar het herkennen van gecompliceerde documenten, dan valt Recognita af omdat de kolomdetectie slecht werkt. Qua gebruiksgemak scoort dit pakket ook minder omdat de automatische detektie van de pagina-ori‰ntatie ontbreekt. Wat de bediening betreft, is er een groot onderscheid tussen de pakketten die onder MS- DOS of onder MS-Windows werken. Vooral wie met een leesregel werkt, moet beide mogelijkheden goed tegen elkaar afwegen. Voor wie een eenvoudig herkenningspakket zoekt, bieden Braudi Bureau en Lexis voldoende mogelijkheden. Wie echter hoge eisen stelt, zal met Reading AdvantEdge, Open Book Unbound en Oscar een heel eind uit de voeten kunnen. Wat de nauwkeurigheid van herkennen betreft (ook voor moeilijke documenten) ontlopen deze pakketten elkaar vrijwel niet. Oscar biedt daarbij net iets meer mogelijkheden en is ook het snelst. ========== Verklaring Terminologie ========== -OCR: deze afkorting staat voor "Optical Character Recognition" en betekent herkenning van tekens die via optische weg (door middel van een scanner) in de computer ingebracht werden. -vlakbedscanner: scanner waarbij het in te scannen document op een glazen plaat wordt gelegd. -scanresolutie: de mate van detail waarmee de scanner het document aftast. -dpi: deze afkorting staat voor dots per inch (punten per inch) en is de eenheid waarmee de scanresolutie weergegeven wordt; de gemiddelde resolutie voor tekstherkenning ligt rond de 300 dpi (dit is 12 punten per millimeter). -SCSI: deze afkorting staat voor "Small Computer System Interface" en is een parallelle poort die door de meeste scanners (ook door de ScanJet 4P uit de test) gebruikt wordt om de verbinding met de computer tot stand te brengen. -faxmodem: modem die naast de gewone communicatiemogelijkheden ook de mogelijkheid biedt faxberichten te versturen en te ontvangen. -faxbestand: een via de faxmodem op de computer binnengelopen faxbericht, dat op de harde schijf bewaard wordt onder de vorm van een grafisch bestand. -matrixdruk: resultaat van een door een matrixprinter afgedrukt document waarbij de letters opgebouwd zijn door duidelijk zichtbare puntjes. -pagina-ori‰ntatie: de richting waarin de tekst op een document afgedrukt is (portrait of landscape). ==========