U bent hier:

Tekstherkenning voor onderweg

Geschreven door Jeroen Baldewijns op in de categorie OCR.

Jeroen Baldewijns, Jos Verhaegh
Blindenzorg Licht en Liefde vzw


Het is alweer een paar jaar geleden dat Kurzweil en het Amerikaanse NFB de krachten bundelden en de wereld verbaasden met een mobiel alternatief voor het klassieke voorleestoestel. knfbReader heette het nieuwe pocketformaat voorleesapparaat. Het Wintelplatform (een klassieke pc) werd vervangen door een Symbiansmartphone, waarvan de ingebouwde camera een alternatief bood voor de klassieke glasplaatscanner.

Inmiddels bleek de processor van zo’n smartphone krachtig genoeg om een volwaardig tekstherkenningsprogramma te draaien. Een taak waarvoor pakweg twintig jaar geleden zelfs de processor van een pc niet ten volle op berekend was (waardoor tekstherkenning toen op een hardwarematige uitbreidingskaart met eigen processor werd geleverd).
Anno 2011 scannen en OCR’en we gewoon even op de trein of in de supermarkt.

Welkom in het smartphonetijdperk dat elke dag weer nieuwe mogelijkheden biedt.

We geven in dit artikel een stand van zaken en trachten ook nog even in de toekomst te kijken.

Oplossingen voor Symbiansmartphones

Gedurende een paar jaren had de knfbReader, als bedenker van deze nieuwe hulpmiddelensoort, geen directe concurrentie. Dat is nu stilaan aan het veranderen, er zijn kapers op de kust. Wij bekijken de toestellen die hier bij ons op de markt de kop opstaken. Naast de knfbReader zijn dit MagniLink Go en TextScout. Maar je kunt er donder op zeggen dat deze lijst snel langer zal worden. Een vergelijkende test is dit niet, want sommige producten vonden we daarvoor wat te nieuw.

Vooraleer we van wal steken, nog dit: van de meeste van deze producten kun je een demoversie krijgen om het product eens uit te proberen. Bij gebruik van de demo beschik je echter niet over de polarisatiefilters die bij de volledige versies van deze producten geleverd worden. Daardoor kan de kwaliteit van de foto’s bij sommige gsm-types minder optimaal zijn. De demo’s kunnen eventueel minder goed presteren door dit gebrek. Hou daar rekening mee bij het beoordelen van zo’n demo.

knfbReader (knfb Reading Technology, Verenigde Staten)

KNFB reading

De knfbReader is, zoals gezegd, de pionier onder de mobiele leesoplossingen. Het is een toepassing die op een gsm draait. Op de compatibiliteitslijst treffen we een twaalftal Nokia-gsm’s aan. Intussen heeft knfb Reading Technology een heuse Reader Mobileproductlijn uitgebouwd, met vier mobiele leestoestellen:

  • kReader Mobile Basic: leestoepassing voor gebruikers met een leesbeperking omwille van taal- of leerproblemen, geleverd met één taal voor de spraaksynthese
  • kReader Mobile: leestoepassing voor gebruikers met een leesbeperking omwille van taal- of leerproblemen, geleverd met drie talen voor de spraaksynthese
  • knfbReader Mobile Basic: leestoepassing voor blinde en slechtziende gebruikers, geleverd met één taal voor de spraaksynthese
  • knfbReader Mobile: leestoepassing voor blinde en slechtziende gebruikers, geleverd met drie talen voor de spraaksynthese

We spitsen ons verder toe op de knfbReader Mobile (Basic). Met dit product hebben we inmiddels heel wat ervaring kunnen opdoen.
KnfbReader is erg sterk in het blind nemen van de foto van een document. De functie ‘beeldbereikrapport’ geeft aan welke randen van het document al dan niet zichtbaar zijn en of je de camera al dan niet loodrecht boven het document houdt. Op die manier kom je als gebruiker te weten of je de positie van de camera moet wijzigen om een zo optimaal mogelijke foto te nemen. Bovendien wordt het nemen van de foto door knfbReader begeleid door geluidstoontjes die aangeven of je correct handelt. Na het nemen van de foto start de software automatisch de herkenning op. Zodra er voldoende tekst herkend is, start het voorlezen. Dit terwijl het herkenningsproces nog aan de gang is. Tijdens het voorlezen van de tekst beschik je over een aantal navigeerfuncties. Je kunt naar het begin of eind van de tekst gaan, je kunt naar het volgende of vorige scherm gaan en je kunt een woord laten spellen.

Verder zijn er ook een aantal extra functies. Je kunt herkende documenten voor later gebruik bewaren in het geheugen van de smartphone. Je kunt zelfs een document laten vertalen naar een andere taal. Dat is dan natuurlijk wel een geautomatiseerde vertaling en die is nooit zo goed als een menselijke vertaling.

Sinds de nieuwste versie (v 6.4) zijn daar nog bijgekomen: een kleurdetectiefunctie, de mogelijkheid om via het programmaatje Notes de herkende tekst op een bluetooth-brailleleesregel te lezen, instelmogelijkheden voor de schermkleuren van tekst en achtergrond, …

Zoals dat hoort bij een hulpmiddel kun je ook alle belangrijke functies via sneltoetsen oproepen.

knfbReader heeft geen extra schermuitleesprogramma nodig om te kunnen werken, maar is wel compatibel met Talks en Mobile Speak, die het mogelijk maken om ook de andere functies van de smartphone te gebruiken.

knfbReader en kReader worden bij ons verkocht door Sensotec.

MagniLink Go (Low Vision International, Zweden)

Magnilink GO

Net zoals knfbReader is MagniLink Go een tekstherkenningsprogramma voor Symbiangsm’s. Op de compatibiliteitslijst vinden we een tiental Nokiasmartphones. Nog meer dan de knfbReader mikt MagniLink Go ook op visueel lezen (met vergroting) naast voorlezen (met synthetische spraak).

MagniLink Go werkt met drie gebruiksmodi. Na het starten van de toepassing kom je in de live-beeldmodus. Hier kun je de camera positioneren om de foto te maken. Je kunt deze ook gebruiken als digitaal vergrootglas om in te zoomen op het beeld om op die manier het document visueel te verkennen. Je kunt ook instellingen zoals het contrast en de kleuren van het beeld aanpassen. Uiteindelijk neem je vanuit deze modus de foto.

Vervolgens kom je in de stilstaand-beeldmodus waar je de foto kunt controleren alvorens hem naar de herkenningssoftware te sturen. Ook hier kun je weer gaan in/uitzoomen en contrast– en kleurinstellingen wijzigen. Uiteindelijk ga je vanuit deze modus de foto doorzenden naar de tekstherkenner.

Na de herkenning van de tekst kom je in de tekstbeeldmodus, waar je het document kunt laten voorlezen. Ten behoeve van de voorleesfunctie wordt MagniLink Go met een kwalitatief hoogstaande Nederlandstalige stem van Acapela geleverd.

Daarnaast biedt MagniLink Go een aantal extra’s. Zo kun je een document bewaren voor later gebruik. Verder kun je een document ook op diverse manieren naar buitenuit sturen: doormailen naar je pc, via bluetooth naar een ander apparaat doorsluizen, in een sms (beperkt in lengte) of mms versturen. MagniLink Go kan desgewenst naast andere hulpmiddelen zoals Talks of Mobile Speak worden geïnstalleerd.

Zoals dat hoort bij een hulpmiddel kun je ook alle belangrijke functies via sneltoetsen oproepen.

MagniLink Go wordt bij ons verkocht door LVI België.

TextScout (Elumo, Duitsland)

Elumo

Ook TextScout is een programma voor Symbiansmartphones. Het werkt op een tiental Nokiamodellen.

Het werkingsprincipe is totaal verschillend van de eerder besproken producten. De tekstherkenning gebeurt namelijk niet op de smartphone zelf, maar door de server van de producent in Duitsland. De foto die je van een document maakt, wordt via het gsm-netwerk doorgestuurd naar een externe server. Deze voert de tekstherkenning uit op de ontvangen foto en stuurt het resultaat in tekstvorm terug naar je gsm, die hem vervolgens kan voorlezen. Dit houdt ook een gebruikskost in die de eerder beschreven toepassingen niet hebben: de verbindingskost die je smartphone moet maken om de foto door te sturen en om het resulterende tekstdocument te ontvangen. Dit is iets om bij de aanschaf zeker rekening mee te houden!

Het blind fotograferen van een A4-document, wordt door TextScout begeleid aan de hand van geluidstonen. Er zijn signalen die de positionering van het document in het beeld aangeven en er is een geluidssignaal dat het nemen van de foto bevestigt. Als je deze positioneringshulp als slechtziende niet nodig hebt, kun je die achterwege laten en de foto visueel nemen. Om zeker te zijn van een scherp beeld detecteert, TextScout de bewegingen die de gsm maakt en wacht tot deze volledig stilgehouden wordt om de foto te nemen. Na het nemen van de foto geeft TextScout wat feedback over de bruikbaarheid van de foto. Als het beeld te donker is, de tekst te klein is, de tekst ondersteboven ligt (wat geen obstakel hoeft te vormen) of de camera schuin gehouden wordt, krijg je hiervan een melding. Vervolgens verloopt de communicatie met de OCR-server in Duitsland volledig automatisch. Als gebruiker moet je gewoon even geduldig afwachten tot het resultaat is toegekomen, waarna de herkende tekst automatisch wordt voorgelezen.

Tijdens het lezen van een herkend document heb je een aantal navigeermogelijkheden. Je kunt de weergave uiteraard pauzeren en hervatten. Met de indexfunctie kun je het begin van elke paragraaf laten voorlezen en daarna snel naar de gewenste paragraaf springen. Verder kun je ook zin- en woordniveau navigeren. Tot slot kun je tekst laten spellen.
Verder biedt TextScout nog heel wat extra functies. Zo kun je herkende documenten opslaan voor later gebruik. Je beschikt over een infofunctie om dingen zoals de leesmodekwaliteit of de batterijstand op te roepen.

TextScout wordt met zijn eigen stem geleverd, je hebt dus geen bijkomend uitleesprogramma, zoals Talks of Mobile Speak (waarmee het wel compatibel is), nodig. Je kunt desgewenst de stem van Talks of Mobile Speak gebruiken voor het lezen van gescande documenten, maar dan boet je in aan leesmogelijkheden. Je kunt meerdere talen voor de spraak installeren. In dat geval is TextScout in staat de taak van het te lezen document te achterhalen en naar de juiste spraaktaal om te schakelen.

Zoals dat hoort bij een hulpmiddel kun je ook alle belangrijke functies via sneltoetsen oproepen.

Een laatste leuk extraatje voor computergebruikers is MyScout. Dit is een gratis webtoepassing op de website van de producent, die je verschillende extra functies biedt. Hier krijg je bijvoorbeeld de mogelijkheid om aan te geven dat het resultaat van een herkenning ook naar je mailadres moet gestuurd worden. Je beschikt verder ook over een webruimte waar je documenten kunt opslaan.

TextScout wordt bij ons verkocht door Integra.

Oplossingen voor de iPhone

De Nokia Symbian is niet de enige smartphone die geschikt is voor tekstherkenning. Android (het smartphonebesturingssysteem van Google), de Blackberry, Windows Mobile, … zijn ook interessante platforms voor scan- en leestoepassingen. Ook hiervoor gaan we in de toekomst ongetwijfeld dergelijke toepassingen zien verschijnen. Voor de iPhone zijn we al zover. Er zijn tientallen Apps (zo noemen de kleine en doorgaans spotgoedkope programmaatjes die je op je iPhone kunt installeren) voor tekstherkenning beschikbaar. Het ene al beter dan het andere. Het ene al goedkoper dan het andere. We testten er een aantal voor u uit.

SayText

Logo Saytext

SayText is, in tegenstelling tot de andere Apps die we behandelen, een toepassing die speciaal ontwikkeld is voor mensen met een visusbeperking. De App heeft een Engelstalige interface. Volgens de instellingen herkent de SayText alleen Engelse en Duitse tekst, maar bij ons werkt het ook prima met een Nederlands document. Het hulpscherm geeft stap voor stap aan hoe je het best een foto kunt nemen voor een optimaal resultaat. Leuk is dat je makkelijk blind een foto kunt nemen. Dat werkt zo: je legt de iPhone op het te fotograferen document, je drukt op de fotoknop en je beweegt de iPhone langzaam naar boven. Zodra SayText het volledige document ‘ziet’ geeft die een pieptoon. Als SayText vervolgens oordeelt dat je de iPhone voldoende stil houdt, maakt hij de foto en start direct daarna het herkenningsproces. Je kunt de herkende tekst bewerken en als extraatje ook doormailen. Tekst bewaren in SayText is niet mogelijk.

De bruikbaarheid met VoiceOver is zeer goed, maar dat is dan ook de missie van dit product. Alle bedieningsknoppen zijn gelabeld. De herkende tekst wordt na het herkenningsproces niet automatisch voorgelezen door VoiceOver. Je moet hier zelf de opdracht toe geven.

We merkten hier duidelijk een beter herkenningskwaliteit bij de iPhone 4, die een veel betere camera heeft dan de iPhone 3GS.

De App werd ontwikkeld door Norfello Oy, is bruikbaar vanaf iOS 3.1 en is gratis.

ocrNow! Lite

ocrNow! Lite

ocrNow! Lite is een App die het internet nodig heeft voor het herkennen van tekst. Deze App biedt de mogelijkheid om een foto te nemen en hem door te sturen naar een server. Deze past de herkenning toe en stuurt het resultaat naar je mailadres. Deze mail kun je dan weer met het mailprogramma op je iPhone gaan lezen. ocrNow! Lite werkt met de Finereader engine, wat de goede resultaten verklaart. De interface van de App is in het Engels. Bij de opties staan ook een groot aantal handige tips om het gebruik van de App te doen slagen.

De bruikbaarheid met VoiceOver is zeer goed. Alle knoppen zijn gelabeld. Het resultaat van de herkenning kan gewoon vanuit de Mail-App met VoiceOver gelezen worden.

ocrNow! Lite doet dus wat we ervan verwachten, maar het is toch net iets minder handig dan de andere OCR-Apps: je moet online zijn om het te kunnen gebruiken en je hebt een tweede App (Mail) nodig om het resultaat te kunnen lezen.

De App werd ontwikkeld door Wordcraft International Limited, is bruikbaar vanaf iOS 2.1 en is gratis voor tien documenten. Daarna ben je verplicht om de betalende versie te kopen en die is best prijzig: 10,99 euro.

ScanCam

ScanCam

ScanCam is een rechttoe rechtaan-App die de mogelijkheid biedt om een foto te nemen van een document, deze door een herkenner te halen en het tekstresultaat op het scherm te zetten. Als je de herkenningstaal (keuze uit Engels, Nederlands, Frans, Duits, Spaans en Italiaans) correct instelt, is het herkende resultaat zeer bevredigend. De interface van de App is Engels. Hou er wel rekening mee dat je een horizontaal georiënteerde foto moet nemen en dat kolomherkenning niet voorzien is.

Als extraatje kunt je de herkende tekst direct naar een mailtje of naar het klembord kopiëren. Een handig extraatje, want een document binnen ScanCam bewaren is niet mogelijk. Handig is ook het hulpscherm dat uitgebreid tips geeft voor het nemen van de foto.

De bruikbaarheid met VoiceOver is zeer goed. Alle bedieningsknoppen zijn gelabeld. De herkende tekst wordt automatisch voorgelezen zodra die op het scherm komt.

Deze App werd ontwikkeld door Senstic, is bruikbaar vanaf iOS 3.0 en kost 0,79 euro.

DocScanner

DocScanner

DocScanner is een bijzonder uitgebreide scan- en OCR-App. Je hebt diverse inputmogelijkheden: een foto nemen van een document of een foto van een document uit je fotobibliotheek. En je hebt vele outputkanalen: de tekst laten voorlezen, het document bewaren binnen DocScanner, het document als pdf of jpeg mailen, het document in tekstformaat naar het EverNotenotitieblokje sturen, het document draadloos delen met anderen, de foto in je fotobibliotheek bewaren, het document op een onlinedienst zetten, … Er zijn ook erg veel instellingsmogelijkheden om de fotokwaliteit bij te sturen. Over herkenningstalen vinden we niets, maar het herkennen van Nederlandse tekst werkt zeer behoorlijk.

Kortom: zelden zoveel veel functionaliteit gekregen voor 79 eurocent, maar wel enkel geschikt voor doorwinterde iPhonegebruikers die het onderste uit de kan willen.

De bruikbaarheid met VoiceOver is redelijk maar kan beter. De meeste bedieningsknoppen zijn gelabeld, maar we komen ook ongelabelde knoppen tegen. Bovendien zijn er soms ook schuifknoppen en die laten zich moeilijker bedienen met spraak. De herkende tekst wordt voorgelezen wanneer je daar naartoe navigeert. DocScanner bevat echter zoveel mogelijkheden en instellingen dat het met VoiceOver niet steeds eenvoudig is om de weg te vinden doorheen de vele schermen.

Deze App werd ontwikkeld door Norfello Oy, is bruikbaar vanaf iOS 3.1 en kost 0,79 euro.

OCRTool

OCRTool

OCRTool is een App die meteen duidelijk maakt dat het om tekstherkenning gaat. De interface is wederom in het Engels maar je kunt onderin het scherm aangeven in welke taal de herkenning aan de slag moet. Je hebt keuze uit liefst 32 talen. Het resultaat is redelijk, maar je moet wel zelf rekening houden met documentranden en schaduwen, die herkenning stokken in de wielen steken. Een goede foto is dus noodzakelijk. Maar als blinde gebruiker kun je moeilijk de uitsnijopties gebruiken die een goede foto moeten garanderen. Dit maakt het extra lastig om een goede foto te krijgen.

Als extraatjes kan OCRTool tekst automatisch laten vertalen of  kun je tekst naar het klembord verplaatsen, mailen of op een later tijdstip terug opvragen in de App zelf. Ook is het mogelijk om de herkenning te laten gebeuren op de achtergrond, zodat je iets anders kunt doen op de iPhone terwijl je wacht op de herkenning.

Een nadeel aan de App is dat je een gedeeld scherm blijft houden na herkenning. Hierdoor wordt het zeer moeilijk om de tekst met VoiceOver te laten voorlezen. De knoppen daarentegen zijn gelabeld, waardoor de App wel bruikbaar is. We hebben dus nogal gemengde gevoelens bij de bruikbaarheid.

De App werd ontwikkeld door Masanori Kanda, is bruikbaar vanaf iOS 3.0 en kost 3,99 euro.

Perfect OCR

Perfect OCR

De naam van de App Perfect OCR doet de beste resultaten vermoeden, maar dat is helaas niet zo. Het programma geeft aan dat je het beste resultaat krijgt als je eerst drie foto’s maakt met ‘SureScan’. Dit zorgt er inderdaad voor dat hinderlijke schaduweffecten worden weg gefilterd, maar geeft niet het verhoopte uitmuntende resultaat. Een enkele keer scannen en daarop herkenning toepassen geeft ongeveer hetzelfde resultaat. Spijtig is dat je eerst enkele ontoegankelijke correctiemogelijkheden moet doorlopen alvorens je het resultaat kunt gaan lezen. Maar ook voor zienden zijn deze corrigeerfuncties geen meerwaarde, omdat ze de herkenning niet of nauwelijks verbeteren. Als extraatje kun je met Perfect OCR een herkend document mailen.

VoiceOver is te gebruiken voor de meest gebruikte knoppen. Deze zijn dan ook gelabeld. Een aantal knoppen bij de ‘Preview’ vensters zijn niet duidelijk gelabeld en daardoor ook niet bruikbaar.

De App werd ontwikkeld door Tania Sulimov, is bruikbaar vanaf iOS 3.0 en kost 2,99 euro.

En de anderen?

De Nokia Symbian gsm’s en de iPhone zijn niet de enige smartphones die in principe geschikt zijn voor tekstherkenning. Android (het smartphone besturingssysteem van Google), de Blackberry OS, Windows Phone, Palm webOS, … zijn ook interessante platforms voor scan- en leestoepassingen. Ook hiervoor gaan we in de toekomst wellicht dergelijke toepassingen zien verschijnen.

Zeker Android dat, tegen een hels tempo, het vuur aan de schenen van de iPhone legt, zal snel bijbenen. We zagen al een paar scan-Apps op de Android Market (onlinewinkel voor Android toepassingen), maar we wachten nog op een degelijke screen reader die dat platform vlot toegankelijk maakt voor hulpmiddelengebruikers.

Conclusie

Dat de technologie rond tekstherkenning in de afgelopen decennia een hoge vlucht genomen heeft, daarbij geholpen door de als maar krachtiger hardware die in een steeds kleiner formaat beschikbaar komt, mag duidelijk zijn. En dat we, nu het tijdperk van mobiele ict-toepassingen pas écht goed van de grond komt, nog een hele evolutie mogen verwachten is al even zonneklaar.

Toch moeten we alles in zijn juiste context plaatsen. De draagbare OCR-toepassingen zullen de klassieke voorleestoestellen voorlopig nog lang niet doen vergeten. Beide hebben ze momenteel hun plaats in het hulpmiddelenlandschap omdat ze qua functionele mogelijkheden en beperkingen toch wel heel erg verschillen van elkaar.

Verder is het ook duidelijk dat een smartphone met tekstherkenning niet voor iedereen weggelegd is. Je hebt er duidelijk meer technische en praktische vaardigheden voor nodig dan voor de bediening van een voorleestoestel.

De opkomst van goedkope Apps juichen we toe, maar ook hier moeten we stellen dat de besproken iPhone Apps nog lang niet op het niveau staan van knfbReader en zijn rechtstreekse concurrenten. Je kunt dat van een product van een paar euro’s ook niet zomaar verwachten. Toch denken we dat de commerciële toepassingen op hun hoede zullen moeten zijn voor de nakende concurrentieslag.

Tot slot is het ‘blind fotograferen’ met een gsm een vaardigheid die niet iedereen even gemakkelijk onder de knie zal krijgen. De hulp die je smartphone hierbij biedt, is erg belangrijk. Naast de drie Symbianleestoepassingen, is er voor de iPhone Apps slechts één product dat hier aandacht aan besteedt, net zoals het ook enkel dat ene product is dat aankondigt dat het speciaal voor de doelgroep is gemaakt. Assistentie bij het blind fotograferen is een aspect waarvan we verwachten dat het de komende jaren zeker nog wordt verfijnd.