Anodi Data – NER

Anodi Cydnabod Endid a Enwyd (NER) ar gyfer NLP Clinigol

Anodiad Ner

Data testun clinigol anodedig a Safon Aur i hyfforddi/datblygu NLP clinigol i adeiladu fersiwn nesaf API Gofal Iechyd

Mae pwysigrwydd Prosesu Iaith Naturiol (NLP) clinigol wedi cael ei gydnabod yn gynyddol dros y blynyddoedd diwethaf ac mae wedi arwain at ddatblygiadau trawsnewidiol. Mae NLP clinigol yn galluogi cyfrifiaduron i ddeall yr ystyr cyfoethog sydd wrth wraidd dadansoddiad ysgrifenedig meddyg o glaf. Gall NLP clinigol gael achosion defnydd lluosog yn amrywio o ddadansoddeg iechyd y boblogaeth i welliant mewn dogfennaeth glinigol i adnabod lleferydd i baru treialon clinigol ac ati.

Er mwyn datblygu a hyfforddi unrhyw fodelau NLP clinigol, mae angen setiau data cywir, diduedd, ac wedi'u hanodi'n dda, mewn cyfeintiau enfawr. Mae data Safonol Aur ac amrywiol yn helpu i wella cywirdeb ac adalw peiriannau NLP.

Cyfrol

Nifer y Dogfennau a Anodir
10
Nifer y Tudalennau a Anodir
10 +
Hyd y Prosiect
< 1 mis

Heriau

Roedd y cleient yn edrych ymlaen at hyfforddi a datblygu eu Llwyfan Prosesu Iaith Naturiol (NLP) gyda mathau newydd o endid a hefyd adnabod y berthynas rhwng gwahanol fathau. At hynny, roeddent yn gwerthuso gwerthwyr a oedd yn cynnig cywirdeb uchel, yn cydymffurfio â chyfreithiau lleol ac a oedd â'r wybodaeth feddygol ofynnol i anodi set fawr o ddata.

Y dasg oedd labelu ac anodi hyd at 20,000 o Gofnodion wedi'u Labelu gan gynnwys hyd at 15,000 o Gofnodion wedi'u Labelu o ddata cofnodion iechyd electronig cleifion mewnol ac allanol (EHR) a hyd at 5,000 o Gofnodion wedi'u Labelu o ddyfarniadau meddygol wedi'u trawsgrifio, wedi'u dosbarthu'n gyfartal ar draws (1) tarddiad daearyddol a (2) XNUMX) arbenigeddau meddygol sydd ar gael.

Felly, i grynhoi’r heriau:

  • Trefnu data clinigol heterogenaidd i hyfforddi Platfform NLP
  • Nodi'r berthynas rhwng endidau gwahanol i gael gwybodaeth hanfodol
  • Y gallu ac arbenigedd i labelu / anodi set eang o ddogfennau clinigol cymhleth
  • Cadw rheolaeth ar gostau i labelu / anodi swm mawr o ddata i hyfforddi NLP clinigol o fewn yr amserlen a bennwyd
  • Anodi endidau yn y set ddata glinigol sy'n cynnwys 75% EHR a 25% o gofnodion Dictation.
  • Dat-adnabod Data ar adeg ei gyflwyno

Heriau Eraill mewn Dealltwriaeth Iaith Naturiol

Amwysedd

Mae geiriau'n unigryw ond gallant fod â gwahanol ystyron yn dibynnu ar y cyd-destun gan arwain at amwysedd ar y lefelau geirfaol, cystrawennol a semantig.

Cyfystyron

Gallwn fynegi'r un syniad gyda thermau gwahanol sydd hefyd yn gyfystyron: mae mawr a mawr yn golygu'r un peth wrth ddisgrifio gwrthrych.

Craiddaeth

Gelwir y broses o ddod o hyd i bob ymadrodd sy'n cyfeirio at yr un endid mewn testun yn gydraniad craiddedd.

Personoliaeth, Bwriad, Emosiynau

Yn dibynnu ar bersonoliaeth y siaradwr, efallai y bydd eu bwriad a'u hemosiynau yn cael eu mynegi'n wahanol am yr un syniad.

Ateb

Mae llawer iawn o ddata a gwybodaeth feddygol ar gael, ar ffurf dogfennau meddygol, ond mae'n bennaf mewn fformat anstrwythuredig. Gydag Anodi endid Meddygol / Anodi Endid a Enwir (NER), roedd Shaip yn gallu trosi data anstrwythuredig i fformat strwythuredig trwy anodi gwybodaeth ddefnyddiol o fathau amrywiol o gofnodion clinigol. Unwaith y nodwyd yr endidau, cafodd y berthynas rhyngddynt hefyd ei mapio i nodi gwybodaeth hanfodol.

Cwmpas y Gwaith: Anodi Sôn am Endid Gofal Iechyd

9 Mathau o Endidau

  • Cyflwr Meddygol
  • Gweithdrefn Feddygol
  • Strwythur Anatomegol
  • Meddygaeth
  • Dyfais feddygol
  • Mesur Corff
  • Cam-drin Sylweddau
  • Data labordy
  • Swyddogaeth y corff

17 Addasydd

  • Addaswyr Meddyginiaeth: Cryfder, Uned, Dos, O, Amlder, Llwybr, Hyd, Statws
  • Addaswyr Mesur Corff: Gwerth, Uned, Canlyniad
  • Addaswyr Gweithdrefn: Dull
    • Addasydd data labordy: Gwerth Lab, Uned Labordy, Canlyniad Labordy
  • Difrifoldeb
  • Canlyniad gweithdrefn

27 Perthynas a Statws Claf

Canlyniad

Byddai'r data anodedig yn cael ei ddefnyddio i ddatblygu a hyfforddi Platfform NLP clinigol Cleient, a fyddai'n cael ei ymgorffori yn fersiwn nesaf eu API Gofal Iechyd. Y buddion a ddeilliodd i'r cleient oedd:

  • Roedd y data sydd wedi'i labelu/anodi yn bodloni canllawiau anodi data safonol y Cleient.
  • Defnyddiwyd setiau data heterogenaidd i hyfforddi'r Platfform NLP ar gyfer mwy o gywirdeb.
  • Perthynas rhwng endidau gwahanol, hy Strwythur corff anatomegol <> Dyfais Feddygol, Cyflwr Meddygol <> Dyfais Feddygol, Cyflwr Meddygol <> Meddyginiaeth, Cyflwr Meddygol <> Nodwyd gweithdrefn i ddeillio gwybodaeth feddygol hanfodol.
  • Roedd y set eang o ddata a oedd wedi'i labelu/anodi hefyd wedi'u dad-nodi ar adeg eu cyflwyno.

Datblygodd ein cydweithrediad â Shaip yn sylweddol ein prosiect mewn Technoleg Amgylchynol ac AI Sgwrsio o fewn gofal iechyd. Darparodd eu harbenigedd wrth greu a thrawsgrifio deialogau gofal iechyd synthetig sylfaen gadarn, gan arddangos potensial data synthetig i oresgyn heriau rheoleiddio. Gyda Shaip, fe wnaethom lywio’r rhwystrau hyn ac rydym bellach gam yn nes at wireddu ein gweledigaeth o atebion gofal iechyd greddfol.

Aur-5-seren

Cyflymwch eich AI Sgwrsio
datblygu cymwysiadau 100%