Diffiniad
Mae Adnabod Endidau Enwol (NER) yn dasg NLP sy'n nodi ac yn dosbarthu endidau mewn testun, fel pobl, sefydliadau, lleoliadau, dyddiadau, neu gynhyrchion.
Diben
Y pwrpas yw strwythuro testun heb ei strwythuro trwy echdynnu endidau allweddol. Mae'n cefnogi chwilio, echdynnu gwybodaeth, ac adeiladu graff gwybodaeth.
Pwysigrwydd
- Hanfodion ar gyfer adfer gwybodaeth a phibellau NLP.
- Mae gwallau'n lledaenu i gymwysiadau i lawr yr afon.
- Mae NER penodol i'r parth (e.e., meddygol, cyfreithiol) yn gofyn am setiau data personol.
- Yn gysylltiedig â thasgau fel cysylltu endidau ac echdynnu perthnasoedd.
Sut Mae'n Gwaith
- Casglu a rhagbrosesu testun.
- Anodiwch setiau data gyda chategorïau endid.
- Hyfforddi modelau ar enghreifftiau wedi'u labelu (CRFs, trawsnewidyddion).
- Rhagfynegi endidau mewn testun anweledig.
- Dilysu cywirdeb gyda data prawf.
Enghreifftiau (Y Byd Go Iawn)
- spaCy: llyfrgell NLP ffynhonnell agored gyda NER adeiledig.
- Stanford CoreNLP: yn darparu offer adnabod endidau â enwau.
- NLP Ariannol: yn tynnu enwau cwmnïau o adroddiadau.
Cyfeiriadau / Darllen Pellach
- Jurafsky a Martin. Prosesu Lleferydd ac Iaith. Stanford.
- Lample et al. “Pensaernïaeth Niwral ar gyfer Adnabod Endidau Enwol.” ACL.
- Modelau NER Trawsnewidyddion Wyneb Cofleidio.
- Beth yw Adnabod Endid Enwol (NER)