Cydnabod Testun

Cydnabod Testun

Diffiniad

Mae adnabod testun yn cyfeirio at adnabod cymeriadau testun mewn delweddau neu ddogfennau wedi'u sganio. Mae'n cynnwys adnabod printiedig ac ysgrifenedig â llaw.

Diben

Y pwrpas yw gwneud testun mewn fformatau gweledol yn hygyrch ac yn chwiliadwy.

Pwysigrwydd

  • Yn galluogi digideiddio archifau.
  • Hanfodol ar gyfer hygyrchedd ac awtomeiddio.
  • Mae cywirdeb yn dibynnu ar ansawdd y ddelwedd.
  • Yn gysylltiedig â thechnolegau OCR.

Sut Mae'n Gwaith

  1. Cipio dogfennau wedi'u sganio neu eu ffotograffio.
  2. Prosesu delweddau ymlaen llaw i wella eglurder.
  3. Canfod rhanbarthau testun.
  4. Cymhwyso modelau cydnabyddiaeth.
  5. Allbynnu testun y gellir ei ddarllen gan beiriant.

Enghreifftiau (Y Byd Go Iawn)

  • Google Lens: yn adnabod testun mewn lluniau.
  • ABBYY FineReader: yn digideiddio dogfennau wedi'u sganio.
  • Tesseract OCR: peiriant adnabod testun ffynhonnell agored.

Cyfeiriadau / Darllen Pellach

  • Smith, R. “Trosolwg o’r Peiriant OCR Tesseract.” ICDAR.
  • Safon ISO/IEC 15938-4.
  • Trafodion IEEE ar Ddadansoddi Patrymau a Deallusrwydd Peirianyddol.

Dywedwch wrthym sut y gallwn helpu gyda'ch menter AI nesaf.