Diffiniad
Trawsgrifio sain yw'r broses o drosi iaith lafar yn destun ysgrifenedig. Mae'n creu data testun strwythuredig o recordiadau lleferydd crai.
Diben
Y pwrpas yw gwneud lleferydd yn chwiliadwy, yn ddadansoddadwy, ac yn ddefnyddiadwy ar gyfer tasgau prosesu iaith naturiol. Fe'i defnyddir yn helaeth mewn hygyrchedd, cyfryngau, a dadansoddeg busnes.
Pwysigrwydd
- Yn galluogi gwasanaethau capsiynau caeedig a hygyrchedd.
- Yn darparu mewnbwn testunol ar gyfer hyfforddi modelau NLP.
- Mae ansawdd yn dibynnu ar gywirdeb y trosi lleferydd i destun.
- Yn sensitif i sŵn cefndir, acenion, ac ansawdd recordio.
Sut Mae'n Gwaith
- Recordio neu fewnforio ffeiliau sain.
- Rhannwch yr araith yn unedau llai.
- Defnyddiwch adnabod lleferydd awtomataidd (ASR) neu drawsgrifiad â llaw.
- Cywiro a dilysu testun am gywirdeb.
- Storiwch drawsgrifiadau gyda stampiau amser neu fetaddata os oes angen.
Enghreifftiau (Y Byd Go Iawn)
- Rev: gwasanaeth trawsgrifio ar gyfer y cyfryngau a busnes.
- Otter.ai: Trawsgrifio cyfarfodydd amser real yn seiliedig ar ddeallusrwydd artiffisial.
- YouTube: yn cynhyrchu capsiynau gan ddefnyddio modelau ASR.
Cyfeiriadau / Darllen Pellach
- Adnabod Lleferydd Awtomatig — NIST.
- ISO/IEC 15938-4: Disgrifiad o Gynnwys Amlgyfrwng — ISO.
- Prosesu Iaith a Lleferydd — Jurafsky a Martin, Stanford.