Dadansoddi Emosiwn Lleferydd a Teimlad
Galluogi Canolfannau Galwadau Doethach gyda Mewnwelediadau a Yrrir gan AI
Defnyddio arbenigedd Shaip mewn casglu data sain ac anodi i wella emosiwn amser real a chanfod teimladau ar gyfer gwell gwasanaeth cwsmeriaid.
Dadansoddi Teimladau Lleferydd a Teimlad Awtomataidd
Ymunodd y Cleient â Shaip i ddatblygu model dadansoddi emosiwn a theimlad lleferydd awtomataidd ar gyfer canolfannau galwadau. Roedd y prosiect yn cynnwys casglu ac anodi 250 awr o ddata sain canolfan alwadau ar draws pedair tafodiaith Saesneg - UDA, y DU, Awstralia ac Indiaidd. Galluogodd hyn i'r cleient wella eu modelau AI ar gyfer canfod emosiynau fel Hapus, Niwtral, a Angry, a theimlad fel Anfodlon a Bodlon mewn rhyngweithiadau cwsmeriaid amser real.
Goresgynodd y prosiect heriau megis canfod coegni, hydoedd sain amrywiol, a chiwiau llafar cynnil o anfodlonrwydd, gan sicrhau canlyniadau manwl gywir a graddadwy.
Ystadegau Allweddol
Data sain canolfan alwadau wedi'i gasglu a'i anodi ar draws 4 tafodiaith Saesneg
250 Hrs
Nifer yr Ieithoedd
Saesneg UDA, Saesneg y DU, Saesneg Awstralia a Saesneg Indiaidd
Defnyddiwch Achosion
Dadansoddi Teimladau Lleferydd a Teimlad Awtomataidd
Cwmpas y Prosiect
Casglu ac anodi 250 awr o ddata sain canolfan alwadau mewn pedair tafodiaith Saesneg:
- Saesneg UDA (30%)
- Saesneg y DU (30%)
- Saesneg Awstralia (20%)
- Saesneg Indiaidd (20%)
Mewn Cwmpas
Mae’r prosiect yn cynnwys tair rhan:
- Data sain gydag endidau penodol, gan gynnwys metadata.
- Ffeiliau wedi'u trawsgrifio cyfatebol gyda manylion segmentu a stampio amser.
- Anodiadau emosiwn a theimlad:
- Emosiwn Sain: Hapus, Niwtral, Angry
- Teimlad Trawsgrifio: Eithriadol Anfodlon, Anfodlon, Niwtral, Bodlon, Eithriadol Bodlon
Heriau
Amrywiaeth Tafodieithoedd
Gall fod yn heriol sicrhau bod y data sain yn cynrychioli'r tafodieithoedd a nodir yn gywir (UDA, DU, Awstralia ac Indiaidd). Gall gwahanol ranbarthau o fewn y categorïau hyn ddefnyddio geirfa, acenion ac ynganiad amrywiol.
Gofyniad Arbenigedd
Mae anodi sain a thrawsgrifiadau ar gyfer emosiwn a theimlad yn gofyn am anodyddion hyfforddedig sy'n gyfarwydd â naws ddiwylliannol a chynildeb ieithyddol pob tafodiaith.
Cymhlethdod Emosiynau a Teimladau
Nid yw emosiwn sain a theimlad trawsgrifio bob amser yn cyd-fynd. Er enghraifft, gall person swnio'n ddig ond mewn gwirionedd yn mynegi boddhad. Ee, mae angen anodi emosiwn a theimlad yn gywir wrth drin sgyrsiau coegni mewn ymadroddion coeglyd fel "O, bendigedig, person arall sy'n methu datrys fy mhroblem".
Ansawdd sain
Gall ansawdd y recordiadau sain amrywio, gan effeithio ar gywirdeb trawsgrifio a chanfod emosiwn. Gall sŵn cefndir, sgyrsiau gorgyffwrdd, ac offer recordio amrywiol achosi heriau sylweddol.
Cipio'n Gywir
Anfodlonrwydd trwy giwiau geiriol fel anadlu allan trwm neu arwyddion eraill o rwystredigaeth.
Ateb
Gan ddefnyddio technegau prosesu iaith naturiol uwch (NLP), gweithredwyd yr atebion canlynol:
Casglu data
- 250 awr o ddata sain wedi'i rannu'n gwotâu sy'n benodol i dafodiaith.
- Saesneg UDA (30% neu 75 awr)
- Saesneg y DU (30% neu 75 awr)
- Saesneg Awstralia (20% neu 50 awr)
- Saesneg Indiaidd (20% neu 50 awr)
- Defnyddwyr acen brodorol o'r Unol Daleithiau, y DU, Awstralia ac India.
- Samplau lleferydd sy'n cynnwys tonau amrywiol, gyda ffocws arbennig ar achosion lle mae emosiwn llais yn ddig a theimlad testun yn Anfodlon neu'n Anfodlon Eithriadol.
Dosbarthiad Testun/Anodiad
- Anodi emosiynau a theimladau yn seiliedig ar gategorïau penodol:
- Emosiwn Sain: Hapus, Niwtral, Angry.
- Teimlad Trawsgrifio: Hynod Anfodlon, Anfodlon, Niwtral, Bodlon, Eithriadol Fodlon.
- Roedd pob segment sain yn cynnwys un emosiwn cynradd yn unig.
- Cymhwyswyd segmentau oedi amrywiol (o 2 i 30 eiliad) o fewn sgyrsiau.
- Roedd y fformat trawsgrifio yn dilyn allbwn JSON, gan gynnwys gwybodaeth siaradwr chwith a dde, tagiau teimlad, a theimlad segment terfynol.
Sicrwydd ansawdd
Cywirdeb Trawsgrifio:
- Sicrhau bod 250 awr o sain yn cael eu darparu gydag o leiaf:
- 90% Cywirdeb Cyfradd Gwallau Trawsgrifio (TER).
- 95% Cywirdeb Cyfradd Adnabod Geiriau (WER).
Proses QA:
- Cynhaliwyd archwiliadau rheolaidd o samplau a ddewiswyd ar hap o'r set ddata.
- Defnyddio offer awtomataidd i fesur TER a WER ar draws y set ddata.
- Sicrhaodd adolygiad llaw o'r adrannau a amlygwyd bod y trothwyon cywirdeb yn cael eu bodloni.
Y Canlyniad
Bydd y data hyfforddi yn cefnogi datblygiad model canfod teimladau a theimladau awtomataidd, gan ddarparu:
- Canfod emosiwn amser real mewn rhyngweithiadau canolfan alwadau.
- Trin achosion cymhleth yn fwy effeithiol, fel coegni neu anfodlonrwydd.
- Scalability ar gyfer prosiectau yn y dyfodol, gan addasu'n hawdd i fwy o ddata a mwy o ieithoedd.
Cyflawniadau
- 250 awr o ffeiliau sain (mewn fformat WAV PCM 8 kHz, mono)
- Ffeiliau trawsgrifio (gyda segmentiad, tagiau sentiment, a dynodwyr siaradwr)
- Metadata (hyd sain, manylion siaradwr, ac ati)
Mae partneru â Shaip ar gyfer ein prosiect data canolfan alwadau wedi bod yn foment hollbwysig wrth ddatblygu ein datrysiadau AI. Bu eu tîm yn casglu ac yn anodi 250 awr o ddata sain ar draws pedair tafodiaith Saesneg allweddol - UDA, y DU, Awstralia ac India - gan sicrhau'r ansawdd a'r manwl gywirdeb uchaf. Fe wnaeth y sylw i naws ieithyddol ar draws y rhanbarthau hyn wella cywirdeb ein modelau adnabod lleferydd yn sylweddol. Yn ogystal, mae arbenigedd Shaip wrth drin prosiectau anodi data cymhleth wedi bod yn allweddol i'n helpu i adeiladu modelau dibynadwy sy'n cydymffurfio ar raddfa fawr.

