Maint y Farchnad: Mewn llai nag 20 mlynedd, mae technoleg adnabod llais wedi tyfu'n aruthrol. Ond beth sydd gan y dyfodol? Yn 2020, roedd y farchnad technoleg adnabod llais byd-eang tua $10.7 biliwn. Rhagwelir y bydd yn codi i $27.16 biliwn erbyn 2026 gan dyfu ar CAGR o 16.8% rhwng 2021 a 2026.
Beth yw Cydnabod Llais a Pam mae Cydnabod Llais yn bwysig?
Mae adnabod llais, a elwir fel arall yn gydnabyddiaeth siaradwr, yn rhaglen feddalwedd sydd wedi'i hyfforddi i adnabod, dadgodio, gwahaniaethu a dilysu llais person yn seiliedig ar eu print llais unigryw.
Mae'r rhaglen yn gwerthuso biometreg llais person trwy sganio ei leferydd a'i baru â'r hyn sydd ei angen gorchymyn llais. Mae'n gweithio trwy ddadansoddi'n fanwl amlder, traw, acen, goslef a straen y siaradwr.
Tra bod y termau 'adnabod llais a 'adnabod lleferydd yn cael eu defnyddio yn gyfnewidiol, nid ydynt yr un peth. Mae adnabod llais yn nodi'r siaradwr, tra bod y algorithm adnabod lleferydd yn ymdrin ag adnabod y gair llafar.
Mae adnabyddiaeth llais wedi cynyddu'n aruthrol dros yr ychydig flynyddoedd diwethaf. Cynorthwywyr deallus fel Amazon Echo, Cynorthwyydd Google, Apple Siri, a Microsoft Cortana perfformio ceisiadau di-law fel gweithredu dyfeisiau, ysgrifennu nodiadau heb ddefnyddio bysellfyrddau, perfformio gorchmynion, a mwy.
Sut Mae Cydnabod Llais yn Gweithio?
Mewnbwn Sain: Mae'r broses yn dechrau gyda dal y mewnbwn sain gan ddefnyddio meicroffon.
Rhagbrosesu: Mae'r signal sain yn cael ei lanhau trwy gael gwared â sŵn a normaleiddio'r gyfaint.
Echdynnu Nodwedd: Mae'r system yn dadansoddi'r sain i dynnu nodweddion allweddol megis traw, tôn, ac amlder.
Cydnabyddiaeth Patrwm: Mae'r nodweddion a dynnwyd yn cael eu cymharu â phatrymau lleferydd hysbys sy'n cael eu storio mewn cronfa ddata.
Prosesu Iaith: Mae'r patrymau cydnabyddedig yn cael eu trosi'n destun, ac mae algorithmau prosesu iaith naturiol (NLP) yn dehongli'r ystyr.
Cydnabod Llais – Manteision ac Anfanteision
Manteision Cydnabod Llais | Anfanteision Cydnabod Llais |
Mae adnabod llais yn caniatáu amldasgio a chysur di-dwylo. | Er bod technoleg adnabod llais yn gwella o dipyn i beth, nid yw'n gwbl ddi-wall. |
Mae siarad a rhoi gorchmynion llais yn llawer cyflymach na theipio. | Sŵn cefndir yn gallu ymyrryd â gweithrediad ac effeithio ar ddibynadwyedd y system. |
Mae'r achosion defnydd o adnabod llais yn ehangu gyda dysgu peiriant a niwral dwfn rhwydweithiau. | Mae preifatrwydd y data a gofnodwyd yn destun pryder. |
Hanes Teyrnasiad Llais?
Mae technoleg adnabod llais wedi dod yn bell ers ei sefydlu yn y 1950au pan nad oedd systemau cynnar ond yn gallu adnabod set gyfyngedig o ddigidau llafar. Cafwyd datblygiadau sylweddol yn y 1960au gyda “Blwch Esgidiau” IBM yn gallu deall 16 gair, ac yn y 1970au pan ehangodd ymchwil a ariannwyd gan DARPA adnabyddiaeth geirfa i 1,000 o eiriau. Yn y 1980au cyflwynwyd Modelau Markov Cudd (HMMs), a oedd yn gwella cywirdeb yn fawr.
Roedd y 1990au yn drobwynt gyda lansiad Dragon NaturallySpeaking, gan alluogi arddywediad mwy ymarferol i gyfrifiaduron. Daeth y 2000au a'r 2010au â chydnabyddiaeth llais i'r brif ffrwd, gyda dyfodiad ffonau smart a chynorthwywyr deallus fel Apple's Siri, Google Assistant, ac Amazon Alexa. Mae'r datblygiadau hyn, sy'n cael eu gyrru gan ddysgu dwfn ac AI, wedi gwneud adnabod llais yn rhan annatod o dechnoleg bob dydd, gan wella rhyngweithio a hygyrchedd defnyddwyr.
Cydnabod Llais yn erbyn Cydnabod Lleferydd
Dyma dabl sy'n crynhoi'r gwahaniaethau rhwng adnabod llais ac adnabod lleferydd:
Agwedd | Cydnabod Llais | Cydnabyddiaeth Araith |
Diben | Yn adnabod ac yn dilysu'r siaradwr | Yn adnabod ac yn trawsgrifio geiriau llafar |
Sut Mae'n Gwaith | Yn dadansoddi nodweddion lleisiol unigryw fel traw, amledd, ac acen i gydweddu'r llais â phrint llais hysbys | Yn defnyddio algorithmau i drosi iaith lafar yn destun ysgrifenedig, gan ganolbwyntio ar ddeall cynnwys yr araith |
Defnyddiwch Achosion | Systemau diogelwch, profiadau defnyddwyr personol, dilysu biometrig | Cynorthwywyr rhithwir, meddalwedd arddweud, gwasanaethau trawsgrifio, systemau gorchymyn a rheoli |
Ffocws | Pwy sy'n siarad | Beth sy'n cael ei ddweud |
Technolegau Enghreifftiol | - Cynorthwywyr Llais: Fe'i defnyddir ar gyfer ymatebion personol a thasgau amrywiol - gwirio'r tywydd neu gadw lle. - Galwad Di-dwylo: Yn caniatáu i ddefnyddwyr wneud galwadau i gysylltiadau penodol yn ddi-law. - Biometreg Llais: Defnyddir mewn gwasanaethau ariannol ar gyfer dilysu defnyddwyr yn ddiogel. - Dewis Llais: Wedi'i gyflogi mewn warysau i helpu gweithwyr i gwblhau tasgau heb ddwylo. | - Cymryd Nodiadau / Ysgrifennu: Mae llwyfannau fel peiriant lleferydd-i-destun Google a Siri yn galluogi cyfieithu llais-i-destun, a ddefnyddir yn gyffredin mewn apiau fel Apple's Notes. - Rheoli Llais: Mae'n caniatáu i ddefnyddwyr reoli dyfeisiau trwy orchmynion llais, megis cyfeirio system infotainment car. – Cynorthwyo’r Anabl: Mae'n cynorthwyo'r byddar, y trwm eu clyw, a'r rhai ag anableddau trwy awto-deitlo, dictaffonau, a chyfnewid testun. |
Cydnabod Llais Defnyddio achosion
Mae gan dechnoleg adnabod llais ystod eang o gymwysiadau ar draws gwahanol feysydd. Dyma rai achosion defnydd allweddol:
- Diogelwch a Dilysu:
- Dilysu Biometrig: Defnyddir mewn ffonau smart a dyfeisiau eraill i ddatgloi sgriniau a gwirio hunaniaeth defnyddiwr.
- Mynediad Rheoli: Yn sicrhau mynediad i adeiladau, mannau diogel, a gwybodaeth gyfrinachol trwy gydnabod personél awdurdodedig.
- Profiad Defnyddiwr Personol:
- Cynorthwywyr Rhithwir: Yn addasu ymatebion a gweithredoedd yn seiliedig ar lais y defnyddiwr, gan ddarparu rhyngweithio mwy personol.
- Dyfeisiau Cartrefi Clyfar: Yn cydnabod lleisiau gwahanol aelodau'r teulu i deilwra gosodiadau a dewisiadau ar gyfer pob unigolyn.
- Gwasanaeth cwsmer:
- Canolfannau Galw: Yn adnabod cwsmeriaid yn ôl eu llais, gan alluogi gwasanaeth personol a lleihau'r angen am wirio hunaniaeth ailadroddus.
- Bancio: Yn gwirio cwsmeriaid yn ystod trafodion bancio ffôn ar gyfer gwasanaeth diogel ac effeithlon.
- Gofal Iechyd:
- Dilysiad Claf: Yn cadarnhau hunaniaeth claf mewn gwasanaethau teleiechyd a chofnodion iechyd electronig.
- Biometreg Llais ar gyfer Monitro: Yn monitro cleifion â chyflyrau fel iselder ysbryd trwy ddadansoddi newidiadau mewn patrymau llais.
- Cynorthwy-ydd Rhithwir y Meddyg: Yn trosi lleferydd meddyg i nodiadau testun gan ganiatáu i'r meddyg weld a dadansoddi mwy o gleifion yn ystod y dydd.
- Diwydiant Ceir :
- Systemau Mewn Car: Yn cydnabod llais y gyrrwr i addasu dewisiadau, llywio mynediad, a rheoli systemau infotainment heb fewnbwn llaw.
Profiad di-law: Ateb galwadau ffôn, newid y gân, ateb negeseuon neu gael cyfeiriad heb orfod gadael y llyw; mae hyn nid yn unig yn cynyddu diogelwch ar y ffordd ond hefyd yn cynnig profiad gyrru gwell.
- Cyfreithiol a Fforensig:
- Adnabod Llais: Defnyddir mewn ymchwiliadau cyfreithiol i adnabod siaradwyr mewn recordiadau sain.
- Gwyliadwriaeth Diogelwch: Gwella mesurau diogelwch trwy adnabod unigolion trwy systemau llais mewn gwyliadwriaeth.
- Adloniant:
- Hapchwarae: Yn personoli profiadau hapchwarae trwy adnabod lleisiau chwaraewyr.
- Dyfeisiau Cyfryngau: Yn nodi defnyddwyr i addasu argymhellion cynnwys a phroffiliau ar ddyfeisiau ffrydio.
- Telathrebu:
- Cyfathrebu Diogel: Yn sicrhau sianeli cyfathrebu diogel trwy wirio hunaniaeth cyfranogwyr mewn galwadau cyfrinachol.
Enghraifft o Dechnoleg Adnabod Llais
- Afal Siri: Dychmygwch gael ffrind ffraeth, gwybodus yn eich poced, bob amser yn barod i helpu. Dyna Siri i chi. P'un a ydych chi'n rhuthro i gyfarfod ac angen anfon neges destun cyflym, neu os ydych chi'n ddwfn yn eich penelin mewn toes cwci ac angen gosod amserydd, mae Siri yno, yn adnabod eich llais ac yn ymateb gyda chyffyrddiad o bersonoliaeth. Mae fel cael cynorthwyydd personol sy'n eich adnabod mor dda, gallant bron â gorffen eich brawddegau.
- Amazon Alexa: Llun yn cerdded i mewn i'ch cartref ar ôl diwrnod hir ac yn dweud, "Alexa, rydw i adref." Yn sydyn, mae eich hoff restr chwarae ymlacio yn dechrau chwarae, mae'r goleuadau'n pylu i'ch hoff leoliad gyda'r nos, ac mae Alexa yn eich atgoffa am y sioe honno rydych chi wedi bod yn bwriadu ei gwylio. Mae fel bod eich cartref yn rhoi cwtsh personol, cysurus i chi bob tro y byddwch yn dychwelyd.
- Cynorthwyydd Google: Meddyliwch am Google Assistant fel eich cyfaill gwybodus. P'un a ydych chi'n pendroni am y tywydd, angen setlo dadl gyfeillgar, neu eisiau rheoli eich cartref craff, mae yno, gan gydnabod eich llais a theilwra ei ymatebion ar eich cyfer chi yn unig. Mae fel cael ffrind hynod smart sydd bob amser yn gyffrous i helpu a byth yn blino ar eich cwestiynau.
- Naws Draig Yn Siarad yn Naturiol: Dychmygwch allu arllwys eich meddyliau ar bapur mor gyflym ag y gallwch eu siarad. Dyna hud Dragon NaturallySpeaking. I nofelydd sy'n llunio'i werthwr gorau nesaf neu feddyg yn diweddaru cofnodion cleifion, mae fel cael trawsgrifiwr hynod-effeithlon, di-flino sy'n deall pob gair, acen, a naws yn eich llais. Nid dim ond teipio ydyw - mae'n rhyddhau eich meddyliau.
- Microsoft Cortana: Mae Cortana fel cael trefnydd personol sydd bob amser un cam ar y blaen. Dychmygwch eich hun ar fore dydd Llun prysur, ac mae Cortana yn canu i mewn: “Yn seiliedig ar eich llais, rydych chi'n swnio braidd dan straen. A gaf i aildrefnu eich cyfarfodydd llai brys ar gyfer yn ddiweddarach yr wythnos hon?” Nid yw'n ymwneud â rheoli eich amserlen yn unig; mae'n ymwneud â chael cynghreiriad digidol sy'n deall y naws yn eich llais ac yn helpu i wneud eich diwrnod yn llyfnach.
Mae cydnabod y siaradwr yn ei gwneud hi'n haws i fusnesau ddarparu profiad llais wedi'i deilwra'n llawn. Wrth i fwy a mwy o ddyfeisiadau llais-alluogi gyrraedd ein cartrefi, bydd adnabod llais yn gam i wella ymgysylltiad a boddhad cwsmeriaid.
Adnabod siaradwr yw adnabod a dilysu hunaniaeth person yn seiliedig ar nodweddion llais. Mae adnabod llais yn gweithio ar yr egwyddor na all unrhyw ddau unigolyn swnio'r un peth oherwydd y gwahaniaethau ym maint eu laryncs, siâp eu llwybr llais, ac eraill.
Mae dibynadwyedd a chywirdeb y system adnabod llais neu leferydd yn dibynnu ar y math o hyfforddiant, profion, a chronfa ddata a ddefnyddir. Os oes gennych chi syniad buddugol ar gyfer meddalwedd adnabod llais, cysylltwch â Shaip ar gyfer eich anghenion hyfforddi data.
Gallwch gaffael cronfa ddata llais ddilys, ddiogel ac o'r ansawdd uchaf y gellir ei defnyddio i hyfforddi neu brofi eich dysgu peiriant a modelau prosesu iaith naturiol.
Cwestiynau a Ofynnir yn Aml (COA)
1. Beth yw adnabod llais?
Mae adnabod llais, a elwir hefyd yn gydnabyddiaeth siaradwr, yn dechnoleg sy'n nodi ac yn dilysu unigolion yn seiliedig ar eu nodweddion llais unigryw.
2. Sut mae adnabod llais yn wahanol i adnabod lleferydd?
Mae adnabod llais yn nodi pwy sy'n siarad, tra bod adnabod lleferydd yn canolbwyntio ar yr hyn sy'n cael ei ddweud. Mae adnabod llais yn dadansoddi biometreg lleisiol, tra bod adnabod lleferydd yn trosi geiriau llafar yn destun.
3. Beth yw prif gymwysiadau adnabod llais?
Mae cymwysiadau allweddol yn cynnwys diogelwch a dilysu, profiadau defnyddwyr personol, gwasanaeth cwsmeriaid, gofal iechyd, systemau modurol, defnyddiau cyfreithiol a fforensig, ac adloniant.
4. A yw adnabod llais yn ddiogel at ddibenion dilysu?
Gall adnabod llais fod yn hynod ddiogel, ond fel unrhyw system fiometrig, nid yw'n anffaeledig. Fe'i defnyddir yn aml fel rhan o ddilysu aml-ffactor ar gyfer gwell diogelwch.
5. Beth yw rhai enghreifftiau poblogaidd o dechnoleg adnabod llais?
Mae enghreifftiau poblogaidd yn cynnwys Siri Apple, Amazon Alexa, Cynorthwyydd Google, Microsoft Cortana, a Nuance Dragon NaturallySpeaking.
6. Sut mae adnabod llais yn effeithio ar breifatrwydd?
Mae pryderon preifatrwydd yn bodoli ynghylch casglu a storio data llais. Mae'n bwysig i gwmnïau fod yn dryloyw am eu harferion data a chynnig rheolaethau defnyddwyr.
7. A all adnabod llais weithio mewn sawl iaith?
Ydy, mae llawer o systemau adnabod llais wedi'u cynllunio i weithio ar draws sawl iaith ac acenion.