Diffiniad
Mae adnabod testun yn cyfeirio at adnabod cymeriadau testun mewn delweddau neu ddogfennau wedi'u sganio. Mae'n cynnwys adnabod printiedig ac ysgrifenedig â llaw.
Diben
Y pwrpas yw gwneud testun mewn fformatau gweledol yn hygyrch ac yn chwiliadwy.
Pwysigrwydd
- Yn galluogi digideiddio archifau.
- Hanfodol ar gyfer hygyrchedd ac awtomeiddio.
- Mae cywirdeb yn dibynnu ar ansawdd y ddelwedd.
- Yn gysylltiedig â thechnolegau OCR.
Sut Mae'n Gwaith
- Cipio dogfennau wedi'u sganio neu eu ffotograffio.
- Prosesu delweddau ymlaen llaw i wella eglurder.
- Canfod rhanbarthau testun.
- Cymhwyso modelau cydnabyddiaeth.
- Allbynnu testun y gellir ei ddarllen gan beiriant.
Enghreifftiau (Y Byd Go Iawn)
- Google Lens: yn adnabod testun mewn lluniau.
- ABBYY FineReader: yn digideiddio dogfennau wedi'u sganio.
- Tesseract OCR: peiriant adnabod testun ffynhonnell agored.
Cyfeiriadau / Darllen Pellach
- Smith, R. “Trosolwg o’r Peiriant OCR Tesseract.” ICDAR.
- Safon ISO/IEC 15938-4.
- Trafodion IEEE ar Ddadansoddi Patrymau a Deallusrwydd Peirianyddol.