Cydnabod Endid a Enwyd (NER)

Diffiniad

Mae Adnabod Endidau Enwol (NER) yn dasg NLP sy'n nodi ac yn dosbarthu endidau mewn testun, fel pobl, sefydliadau, lleoliadau, dyddiadau, neu gynhyrchion.

Diben

Y pwrpas yw strwythuro testun heb ei strwythuro trwy echdynnu endidau allweddol. Mae'n cefnogi chwilio, echdynnu gwybodaeth, ac adeiladu graff gwybodaeth.

Pwysigrwydd

  • Hanfodion ar gyfer adfer gwybodaeth a phibellau NLP.
  • Mae gwallau'n lledaenu i gymwysiadau i lawr yr afon.
  • Mae NER penodol i'r parth (e.e., meddygol, cyfreithiol) yn gofyn am setiau data personol.
  • Yn gysylltiedig â thasgau fel cysylltu endidau ac echdynnu perthnasoedd.

Sut Mae'n Gwaith

  1. Casglu a rhagbrosesu testun.
  2. Anodiwch setiau data gyda chategorïau endid.
  3. Hyfforddi modelau ar enghreifftiau wedi'u labelu (CRFs, trawsnewidyddion).
  4. Rhagfynegi endidau mewn testun anweledig.
  5. Dilysu cywirdeb gyda data prawf.

Enghreifftiau (Y Byd Go Iawn)

  • spaCy: llyfrgell NLP ffynhonnell agored gyda NER adeiledig.
  • Stanford CoreNLP: yn darparu offer adnabod endidau â enwau.
  • NLP Ariannol: yn tynnu enwau cwmnïau o adroddiadau.

Cyfeiriadau / Darllen Pellach

Dywedwch wrthym sut y gallwn helpu gyda'ch menter AI nesaf.