Casglu Data Ar Gyfer AI Sgwrsio

Sut i Ddull at Gasglu Data ar gyfer AI Sgwrsio

Heddiw, mae gennym ni rai robotiaid siarad fel chatbots, cynorthwywyr rhithwir, a mwy yn ein cartrefi, systemau ceir, dyfeisiau cludadwy, datrysiadau awtomeiddio cartref, ac ati. Mae'r dyfeisiau hyn yn gwrando'n union ar yr hyn rydyn ni'n ei ddweud a sut rydyn ni'n dweud ac yn adfer canlyniadau neu'n cyflawni tasgau penodol. .

Ac os ydych chi wedi bod yn defnyddio cynorthwyydd fel Siri neu Alexa, byddech hefyd yn sylweddoli eu bod yn dod yn quirkier erbyn y dydd. Mae eu hymatebion yn ffraeth, maen nhw'n siarad yn ôl, maen nhw'n snisin, yn rhoi canmoliaeth yn ôl ac yn ymddwyn yn fwy tebyg i bobl na rhai o'r cydweithwyr rydych chi'n eu hadnabod. Nid ydym yn cellwair. Yn ôl PwC, Nid oedd 27% o'r defnyddwyr a ryngweithiodd â'u cyswllt gwasanaeth cwsmeriaid diweddar yn gwybod a oeddent yn siarad â bod dynol neu chatbot.

Mae datblygu systemau a dyfeisiau sgwrsio mor gymhleth yn gymhleth iawn ac yn frawychus. Mae'n gêm bêl wahanol yn gyfan gwbl gyda dulliau datblygu gwahanol. Dyna pam roeddem yn meddwl y dylem ei ddadelfennu ar eich cyfer er mwyn ei ddeall yn haws. Felly, os ydych chi am ddatblygu injan AI sgyrsiol neu gynorthwyydd rhithwir, bydd y canllaw hwn yn eich helpu i gael eglurder.

Arwyddocâd AI Sgwrsio

Wrth i dechnoleg ddod yn agwedd fwy annatod o'n bywydau ar ffurf dyfeisiau a systemau mwy newydd, mae angen gwthio rhwystrau, torri confensiynau a meddwl am ffyrdd newydd o ryngweithio â nhw. O ddefnyddio perifferolion cysylltiedig fel llygoden a bysellfwrdd yn unig, gwnaethom newid i badiau llygoden a oedd yn cynnig mwy o gyfleustra. Yna fe wnaethom symud i sgriniau cyffwrdd a oedd yn cynnig cyfleustra pellach wrth fwydo mewnbynnau a chyflawni tasgau.

Gyda dyfeisiau'n dod yn estyniadau ohonom ein hunain, rydym bellach yn datgloi cyfrwng newydd o orchymyn trwy lais. Nid oes angen i ni hyd yn oed fod yn agos at ddyfais i'w weithredu. Y cyfan sy'n rhaid i ni ei wneud yw defnyddio ein llais i'w ddatgloi a gorchymyn ein mewnbynnau. O ystafell gyfagos, wrth yrru, wrth ddefnyddio dyfais arall ar yr un pryd, mae AI sgyrsiol yn cyflawni ein tasgau arfaethedig yn ddi-dor. Felly ble rydyn ni'n dechrau - mae'r cyfan yn dechrau gyda data lleferydd o ansawdd uchel i hyfforddi modelau ML.

Hanfodion Casglu Data Hyfforddiant Lleferydd

Mae casglu ac anodi data hyfforddi AI ar gyfer AI sgyrsiol yn wahanol iawn. Mae yna dunelli o gymhlethdodau ynghlwm â ​​gorchmynion dynol ac mae'n rhaid gweithredu mesurau amrywiol i sicrhau bod pob agwedd yn cael ei chynnwys ar gyfer canlyniadau effeithiol. Gadewch i ni edrych ar beth yw rhai o hanfodion data lleferydd.

Deall Iaith Naturiol (NLU)

Er mwyn i chatbots a chynorthwywyr rhithwir ddeall ac ymateb i'r hyn rydyn ni'n ei anfon at destun neu ei orchymyn, proses o'r enw NLU yn cael ei weithredu. Mae'n sefyll am Deall Iaith Naturiol ac mae'n cynnwys tri chysyniad technoleg i ddehongli a phrosesu mathau mewnbwn amrywiol.

  • Fwriad

    Mae'r cyfan yn dechrau gyda bwriad. Beth mae defnyddiwr penodol yn ceisio ei gyfleu, ei gyfathrebu neu ei gyflawni trwy orchymyn? A yw'r defnyddiwr yn chwilio am wybodaeth? A ydyn nhw'n aros am ddiweddariadau ar gyfer gweithred? A ydyn nhw'n gorchymyn cyfarwyddyd i'r system weithredu? Sut maen nhw'n ei orchymyn? Ai trwy gwestiwn neu gais? Mae'r holl agweddau hyn yn helpu peiriannau i ddeall a dosbarthu bwriadau a dibenion i gynnig ymatebion aerglos yn eu tro.

  • Casgliad Utterance

    Mae gwahaniaeth rhwng y gorchymyn, "Ble mae'r peiriant ATM agosaf?" a'r gorchymyn, "Dewch o hyd i beiriant ATM cyfagos i mi." Nawr byddai bodau dynol yn cydnabod bod y ddau yn golygu'r un peth ond mae'n rhaid egluro peiriannau gyda'r gwahaniaeth hwn. Maent yr un peth o ran bwriad ond mae sut mae'r bwriad wedi'i lunio yn hollol wahanol.

    Mae casglu Utterance yn ymwneud â diffinio a mapio gwahanol ymadroddion ac ymadroddion tuag at nodau penodol ar gyfer cyflawni tasgau ac ymatebion yn union. Yn dechnegol, mae arbenigwyr anodi data yn gweithio ar ddata lleferydd neu ddata testun i helpu peiriannau i wahaniaethu rhwng hyn.

  • Echdynnu Endid

    Mae gan bob brawddeg eiriau neu ymadroddion penodol sy'n dwyn pwysau wedi'u pwysleisio a'r pwyslais hwn sy'n arwain at ddehongliad o gyd-destun a phwrpas. Mae angen i beiriannau, fel y systemau anhyblyg ydyn nhw, gael eu bwydo â llwy o'r fath endidau. Er enghraifft, ”Ble alla i ddod o hyd i dannau o fy ngitâr ger 6th Avenue?”

    Os ydych chi'n mireinio'r frawddeg, yn dod o hyd i endid un, mae llinynnau'n ddau, mae'r gitâr yn dri a'r 6ed rhodfa yw 4. Mae'r endidau hyn yn cael eu clymu gyda'i gilydd gan beiriannau i adfer canlyniadau priodol ac er mwyn i hyn ddigwydd, mae arbenigwyr yn gweithio ar yr ôl-benwythnos.

Setiau Data Llais / Lleferydd / Sain Oddi ar y Silff i Hyfforddi Eich Model AI Sgwrsio'n Gyflymach

Dylunio Deialogau Ar gyfer AI Sgwrsio

Nod AI yn bennaf fu dyblygu ymddygiad dynol trwy ystumiau, gweithredoedd ac ymatebion. Mae gan y meddwl dynol ymwybodol y gallu cynhenid ​​i ddeall cyd-destun, bwriad, tôn, emosiynau a ffactorau eraill ac ymateb yn unol â hynny. Ond sut y gall peiriannau wahaniaethu'r agweddau hyn? 

Dylunio deialogau ar gyfer sgyrsiol AI yn gymhleth iawn ac yn bwysicach fyth, yn eithaf amhosibl cyflwyno model cyffredinol. Mae gan bob unigolyn ffordd wahanol o feddwl, siarad ac ymateb. Hyd yn oed mewn ymatebion, rydyn ni i gyd yn cyfleu ein meddyliau yn unigryw. Felly, mae'n rhaid i beiriannau wrando ac ymateb yn unol â hynny. 

Fodd bynnag, nid yw hyn yn llyfn hefyd. Pan fydd bodau dynol yn siarad, mae ffactorau fel acenion, ynganiad, ethnigrwydd, iaith a mwy yn dod i mewn ac nid yw'n hawdd i beiriannau gamddeall a chamddehongli geiriau ac ymateb yn ôl. Gall peiriannau ddeall gair penodol mewn myrdd o ffyrdd pan fydd yn cael ei bennu gan Indiaidd, Prydeiniwr, Americanwr a Mecsicanaidd. Mae yna dunelli o rwystrau iaith yn dod i rym a'r ffordd fwyaf ymarferol o feddwl am system ymateb yw trwy raglennu gweledol sy'n seiliedig ar siart llif. 

Trwy flociau pwrpasol ar gyfer gall ystumiau, ymatebion, a sbardunau, awduron ac arbenigwyr helpu peiriannau i ddatblygu cymeriad. Mae hyn yn debycach i beiriant algorithm ei ddefnyddio i feddwl am yr ymatebion cywir. Pan fydd mewnbwn yn cael ei fwydo, mae'r wybodaeth yn llifo trwy ffactorau cyfatebol, gan arwain at yr ymateb cywir i beiriannau ei gyflenwi. 

Dial D Am Amrywiaeth

Fel y soniasom, mae rhyngweithiadau dynol yn unigryw iawn. Daw pobl ledled y byd o wahanol gefndiroedd, cefndiroedd, cenedligrwydd, demograffeg, ethnigrwydd, acenion, ynganiad, ynganiad, a mwy. 

Er mwyn i bot sgwrsio neu system fod yn gyffredinol weithredol, rhaid ei hyfforddi gyda data hyfforddi mor amrywiol â phosibl. Er enghraifft, os yw model wedi'i hyfforddi gyda data lleferydd un iaith neu ethnigrwydd penodol yn unig, byddai acen newydd yn drysu'r system ac yn ei gorfodi i sicrhau canlyniadau anghywir. Nid yw hyn yn destun embaras i berchnogion busnes yn unig ond yn sarhaus i ddefnyddwyr hefyd. 

Dyna pam y dylai'r cam datblygu gynnwys data hyfforddi AI o gronfa gyfoethog o setiau data amrywiol sy'n cynnwys pobl o bob cefndir posibl. Po fwyaf o acenion ac ethnigrwydd y mae eich system yn eu deall, y mwyaf cyffredinol fyddai hi. Ar ben hynny, yr hyn a fyddai’n cythruddo defnyddwyr yn fwy yw nid adalw gwybodaeth yn anghywir ond methu â deall eu mewnbynnau yn y lle cyntaf. 

Dylai dileu rhagfarn fod yn flaenoriaeth allweddol ac un ffordd y gallai cwmnïau wneud hyn yw trwy ddewis data torfol. Pan fyddwch yn torfoli'ch data lleferydd neu'ch data testun, rydych chi'n caniatáu i bobl o bob cwr o'r byd gyfrannu at eich gofynion, gan wneud eich cronfa ddata yn iach yn unig (Darllenwch ein blog deall buddion a gwendidau data allanol i weithwyr crowdsource). Nawr, bydd eich model yn deall gwahanol acenion ac ynganiadau ac yn ymateb yn unol â hynny. 

Y Ffordd Ymlaen

Mae datblygu AI sgyrsiol mor anodd â magu baban. Yr unig wahaniaeth yw y byddai'r baban yn tyfu yn y pen draw i ddeall pethau a gwella cyfathrebu'n annibynnol. Dyma'r peiriannau y mae angen eu gwthio'n gyson. Mae sawl her yn y gofod hwn ar hyn o bryd a dylem gydnabod y ffaith bod gennym rai o'r systemau AI sgyrsiol mwyaf chwyldroadol sy'n deillio o'r heriau hyn. Gadewch i ni aros i weld beth sydd gan y dyfodol i'n chatbots cymdogaeth gyfeillgar a'n rhith-gynorthwywyr. Yn y cyfamser, os ydych chi'n bwriadu datblygu AI sgyrsiol fel Google Home ar gyfer eich busnes, estyn allan atom ni am eich data hyfforddi AI a'ch anghenion anodi.

Cyfran Gymdeithasol