Astudiaeth Achos: Trwyddedu Set Ddata Meddygol

Trawsnewid Gofal Pediatrig ac OB-GYN Trwy Hyfforddiant Curadu ac Anodi Data Cywir

Datgloi Grym Data Meddygol: Curadu Data Cynhwysfawr, Dad-adnabod, ICD-10 CM, ac Anodi ar gyfer Hyfforddiant Model AI Superior.

Trwyddedu setiau data meddygol

Trosolwg o'r Prosiect

Bu Shaip mewn partneriaeth â chwmni AI gofal iechyd blaenllaw i guradu ac anodi setiau data meddygol o ansawdd uchel heb eu nodi ar gyfer hyfforddi modelau NLP uwch. Roedd y prosiect yn canolbwyntio ar arbenigeddau Pediatrig ac OB-GYN, gan gyflwyno cofnodion cleifion allanol wedi'u hanodi â chodau CM ICD-10 trwy fframwaith API cadarn.

Strwythurwyd y set ddata i hwyluso hyfforddiant AI ar ddogfennaeth gofal iechyd y byd go iawn, gan wella gallu model i ddeall naratifau clinigol.

Trwyddedu setiau data meddygol

Ystadegau Allweddol

Tudalennau 750 / ~300 o gofnodion cleifion allanol

375 tudalen Pediatreg

375 tudalen OB-GYN

Anodiadau cod meddygol ICD-10 CM 2023

Cwmpas y Prosiect

Math Set Ddata Arbenigedd Cyfrol Metadata wedi'i Gipio Nodiadau
Nodiadau Meddygol Pediatrics 375 tudalen (~150 cofnod) Enw Ffeil, Arbenigedd,
Math o Ddogfen, Dosbarth Claf (Cleifion Allanol)
Yn cynnwys adrannau Asesiad / Cynllun
OB-GYN 375 tudalen (~150 cofnod)
Anodiadau ICD-10 CM (2023) Set Ddata Llawn Mapio Cod trwy API Mae dilysu cod gan godwyr y tu allan i'r cwmpas

Heriau

Cyflwynodd y prosiect sawl her hollbwysig a oedd yn gofyn am gynllunio a gweithredu manwl:

1. Casglu Data Arbenigedd-Benodol

Roedd dod o hyd i gofnodion cleifion allanol o ansawdd uchel yn unig o arbenigeddau Pediatrig ac OB-GYN yn heriol. Roedd angen i bob dogfen gynnwys adrannau clinigol allweddol fel Asesu a Chynllunio i gefnogi anodiadau cywir.

2. Dad-adnabod PHI cynhwysfawr

Roedd sicrhau bod yr holl wybodaeth bersonol adnabyddadwy (PII) yn cael ei dileu'n llwyr wrth gynnal y cyd-destun meddygol yn hanfodol ar gyfer cydymffurfio â HIPAA. Roedd hyn yn gofyn am adolygiadau manwl i atal unrhyw achosion o dorri preifatrwydd.

3. Anodi cymhleth ICD-10 CM

Roedd cymhwyso codau ICD-10 CM (2023) manwl gywir trwy API yn gymhleth oherwydd arddulliau naratif amrywiol a therminoleg feddygol. Roedd cysondeb a chywirdeb codio yn hanfodol i sicrhau hyfforddiant model AI dibynadwy.

4. Cywirdeb a Chysondeb Metadata

Roedd casglu a dilysu metadata fel arbenigedd, math o ddogfen, a dosbarth claf heb anghysondebau yn hanfodol. Gallai unrhyw ddiffyg cyfatebiaeth effeithio ar hyfforddiant model a defnyddioldeb data.

5. Hidlo Cleifion Allanol Caeth

Roedd sicrhau bod yr holl gofnodion yn rhai cleifion allanol yn gymhleth iawn, gan y gallai llawer o ddogfennau clinigol gynnwys dosbarthiadau cleifion cymysg neu adrannau anghyflawn.

6. Safonau Sicrwydd Ansawdd a Chywirdeb

Roedd cyrraedd y trothwy cywirdeb o 90% yn gofyn am adolygiadau aml-lefel i ddileu dyblygiadau, dilysu aliniad arbenigedd, a sicrhau dad-adnabod — gyda darpariaethau ar gyfer ail-weithio pan fo angen.

Ateb

Trwyddedu Data Cynhwysfawr ac Anodi

  • Cofnodion cleifion allanol pediatrig a OB-GYN trwyddedig
  • Sicrhau cynnwys adrannau hollbwysig: Prif Gŵyn, Hanes, ROS, Asesiad, Cynllun
  • Anodiad ICD-10 CM yn seiliedig ar API (fersiwn 2023)

Dad-adnabod a Chydymffurfio

  • Wedi disodli PHI gyda dalfannau (PERSON_NAME, DATE, LOCATION, ac ati)
  • Sicrhau cydymffurfiaeth â safonau preifatrwydd data gofal iechyd

Tagio Metadata

  • Metadata manwl a gasglwyd fesul ffeil:
    • Ffeil Enw
    • Arbenigedd (Pediatreg neu OB-GYN)
    • Math o Ddogfen (Dilyn i Fyny, H&P, Ymgynghori)
    • Dosbarth Claf (Cleifion Allanol yn Unig)

Rheoli Ansawdd

  • Asesiadau ansawdd trwyadl gyda:
    • Dim cofnodion dyblyg
    • Dilysu paru arbenigol
    • Gwiriad claf allanol yn unig
    • Gwiriad cysondeb metadata
  • Amnewid neu gywiro cofnodion o dan y trothwy cywirdeb o 90%.

Canlyniad

Cyflwynodd Shaip set ddata nodiadau meddygol strwythuredig ac anodedig a alluogodd y cleient i:

  • Hyfforddwch fodelau AI ar gyfer rhagfynegiad cod CM ICD-10 cywir
  • Gwella galluoedd NLP mewn senarios gofal iechyd yn y byd go iawn
  • Cynnal cydymffurfiaeth â safonau preifatrwydd a rheoleiddio
  • Modelau AI gofal iechyd ar raddfa eang ar draws parthau pediatreg a OB-GYN

Roedd dull strwythuredig Shaip o guradu ac anodi setiau data yn rhagori ar ein disgwyliadau. Mae cywirdeb, dad-adnabod, a thrachywiredd metadata wedi cryfhau ein piblinell hyfforddi model AI yn sylweddol.

Aur-5-seren