Cydnabod Lleferydd yn Awtomatig

Cydnabod Lleferydd Awtomatig (ASR): Popeth y mae angen i Ddechreuwr ei Wybod (yn 2024)

Mae technoleg Adnabod Lleferydd Awtomatig wedi bod yno ers cryn amser ond daeth yn amlwg yn ddiweddar ar ôl i'w ddefnydd ddod yn gyffredin mewn amrywiol gymwysiadau ffôn clyfar fel Siri a Alexa. Mae'r cymwysiadau ffôn clyfar hyn sy'n seiliedig ar AI wedi dangos pŵer ASR wrth symleiddio tasgau bob dydd i bob un ohonom.

Yn ogystal, wrth i wahanol fertigol diwydiant symud ymhellach tuag at awtomeiddio, mae'r angen sylfaenol am ASR yn destun ymchwydd. Felly, gadewch inni ddeall hyn yn wych technoleg adnabod lleferydd yn fanwl a pham y caiff ei ystyried yn un o'r technolegau mwyaf hanfodol ar gyfer y dyfodol.

Hanes Byr o Dechnoleg ASR

Cyn symud ymlaen ac archwilio potensial Cydnabod Lleferydd Awtomatig, gadewch inni yn gyntaf edrych ar ei esblygiad.

1950s

Yn y 1950au, creodd Bell Labs adnabyddydd lleferydd rhithwir o'r enw 'Audrey' a allai nodi'r rhifau rhwng 1-9 wrth gael eu siarad gan un llais.

1960s

Ym 1952, lansiodd IBM ei system adnabod llais gyntaf, 'Shoebox,' a allai ddeall a gwahaniaethu rhwng un ar bymtheg o eiriau Saesneg.

1970s

Datblygodd Prifysgol Carnegie Mellon yn y flwyddyn 1976 system 'Harpy' a allai adnabod dros 1000 o eiriau.

1990s

Ar ôl 40 mlynedd, mae Bell Technologies eto wedi torri tir newydd yn y diwydiant gyda'i systemau IVR deialu a allai bennu lleferydd dynol.

2000s

Creodd Google feddalwedd lleferydd uwch gyda chyfradd cywirdeb o 80%, gan ei wneud yn boblogaidd ledled y byd.

2010s

Daeth y degawd diwethaf yn gyfnod euraidd i ASR, gydag Amazon ac Apple yn lansio eu meddalwedd lleferydd cyntaf erioed yn seiliedig ar AI, Alexa a Siri.

Gan symud ymlaen at 2010, mae ASR yn esblygu'n aruthrol ac yn dod yn fwyfwy cyffredin a chywir. Heddiw, Amazon, Google, ac Apple yw'r arweinwyr amlycaf mewn technoleg ASR.

[ Darllenwch hefyd: Y Canllaw Cyflawn i AI Sgyrsiol ]

Sut Mae Cydnabod Llais yn Gweithio?

Mae Adnabod Lleferydd Awtomatig yn dechnoleg eithaf datblygedig sy'n anodd iawn ei dylunio a'i datblygu. Mae miloedd o ieithoedd ledled y byd gyda thafodieithoedd ac acenion amrywiol, felly mae'n anodd datblygu meddalwedd sy'n gallu deall y cyfan.

Mae ASR yn defnyddio cysyniadau prosesu iaith naturiol a dysgu peirianyddol ar gyfer ei ddatblygiad. Trwy ymgorffori nifer o fecanweithiau dysgu iaith yn y meddalwedd, mae datblygwyr yn sicrhau cywirdeb ac effeithlonrwydd meddalwedd adnabod lleferydd.

Dyma rai o’r camau sylfaenol a ddefnyddiwyd wrth ddatblygu meddalwedd Adnabod Lleferydd Awtomatig:

  • Trosglwyddo Llais i Signal Trydanol: Mae dirgryniadau llais person yn cael eu dal gan ddefnyddio meicroffon a'u trosglwyddo i mewn i signal trydanol tonnau.
  • Trawsnewid Signal Trydanol yn Ddigidol: Mae'r signal trydan yn cael ei drawsnewid ymhellach yn signal digidol gan ddefnyddio dyfeisiau corfforol fel cerdyn sain.
  • Cofrestru Ffonemau i'r Meddalwedd: Yna mae'r meddalwedd adnabod lleferydd yn archwilio'r signal digidol ac yn cofrestru ffonemau i wahaniaethu rhwng y geiriau a ddaliwyd.
  • Ail-greu ffonemau i eiriau: Ar ôl prosesu'r signal digidol yn gyfan gwbl a chofrestru'r holl ffonemau, caiff geiriau eu hail-greu, a ffurfir brawddegau.

Er mwyn cyflawni'r cywirdeb a fwriadwyd, mae'r meddalwedd yn defnyddio'r dull dadansoddi trigram, sy'n dibynnu ar ddefnyddio tri gair a ddefnyddir yn aml trwy gronfa ddata benodol. Mae meddalwedd ASR yn dechnoleg eithriadol sy'n torri i lawr unrhyw batrwm sain, yn dadansoddi'r synau, ac yn trawsgrifio'r seiniau hynny a gasglwyd yn destun a geiriau ystyrlon.

[ Darllenwch hefyd: Beth yw Technoleg Lleferydd-i-Destun a Sut Mae'n Gweithio]

Enghreifftiau Byd Go Iawn o ASR

Enghreifftiau byd go iawn o asr

Mae Adnabod Lleferydd Awtomatig yn dechnoleg wych sydd wedi dod yn boblogaidd ac yn werthfawr iawn heddiw. Mae ei amlygrwydd uchel oherwydd ei fod yn galluogi defnyddwyr i gwblhau tasgau lluosog yn gyflym gan ddefnyddio rheolaeth ddi-dwylo. Y cynhyrchion mwyaf poblogaidd sy'n defnyddio technoleg adnabod lleferydd yw:

  • Cynorthwy-ydd Google
    Wedi'i ddatblygu yn 2016, Cynorthwyydd Google yw'r feddalwedd sgwrsio orau heddiw, gyda'r gyfradd gywirdeb uchaf o dros 95% yn Saesneg yr UD. Yn fras, fe'i defnyddir gan gannoedd o filiynau o bobl ledled y byd.
  • Apple Siri
    Siri yw'r enghraifft glasurol o argaeledd ASR mewn dros 30 o wledydd a 21 o ieithoedd yn fyd-eang. Siri yw'r system sgwrsio gyntaf i chwyldroi'r defnydd o dechnoleg lleferydd-i-destun.
  • Amazon Alexa
    Mae Alexa wedi dod yn enw cyfarwydd a dyfais heddiw, gyda chyfrif defnyddwyr amcangyfrifedig o dros 100 miliwn o bobl ledled y byd.

Archwilio Mwy o Achosion Defnydd ar gyfer Technoleg Adnabod Lleferydd

Ar wahân i ddefnyddio'r dechnoleg ASR mewn meddalwedd sy'n seiliedig ar sgwrsio, mae yna achosion defnydd eraill o'r dechnoleg eithriadol hon. Dyma ychydig ohonyn nhw:

  • Adnabod Lleferydd Cerbyd

    Adnabod lleferydd cerbyd Heddiw, mae gennym y moethusrwydd o ddweud wrth ein car pwy i'w ffonio, pa gân i'w chwarae, a ble i osod y cyrchfan. Mae hyn i gyd wedi dod yn bosibl oherwydd technoleg lleferydd-i-destun. Mae hwn yn gam aruthrol yn agwedd diogelwch eich profiad gyrru. Trwy ddileu'r angen i ryngweithio'n gorfforol â'r sgrin, mae defnyddio ASR yn atal colli sylw a allai arwain at ddamwain.

  • Gwasanaethau Trawsgrifio

    Gwasanaethau trawsgrifio Mae technoleg ASR wedi symleiddio'r broses drawsgrifio, gan alluogi trosi cynnwys llafar yn gyflym ac yn gywir yn destun ysgrifenedig. Mae hyn wedi bod yn amhrisiadwy i ddiwydiannau fel newyddiaduraeth, y sectorau cyfreithiol a meddygol, lle mae trawsgrifiadau cywir ac amserol yn hanfodol.

 

  • Canolfannau Galwadau a Chymorth i Gwsmeriaid

    Canolfannau galwadau a chymorth i gwsmeriaid Mae canolfannau galwadau wedi cofleidio systemau ASR i drawsgrifio rhyngweithiadau cwsmeriaid, gan ganiatáu ar gyfer olrhain, dadansoddi a rheoli ansawdd yn well. Trwy drosi sgyrsiau llafar yn destun, mae ASR yn galluogi asiantau a rheolwyr canolfan alwadau i adolygu rhyngweithiadau cwsmeriaid a chael mewnwelediadau gwerthfawr i wella eu gwasanaethau.

  • Dysgu Iaith

    Dysgu iaith Mae technoleg ASR wedi chwyldroi dysgu iaith trwy ddarparu adborth amser real ar ynganu a sgiliau iaith lafar. Mae hyn yn galluogi dysgwyr i fireinio eu patrymau lleferydd, derbyn cywiriadau ar unwaith, a gwella eu rhuglder mewn modd mwy effeithlon.

  • Hygyrchedd i'r rhai â Nam Clyw

    Hygyrchedd i'r rhai â nam ar eu clyw Mae systemau ASR wedi bod yn allweddol wrth chwalu rhwystrau cyfathrebu ar gyfer unigolion â nam ar eu clyw. Trwy drosi iaith lafar yn destun ysgrifenedig, mae technoleg ASR yn darparu gwasanaethau capsiynau amser real, gan wneud cynnwys sain yn fwy hygyrch i gynulleidfa ehangach.

  • Biometreg Llais a Diogelwch

    Biometreg llais a diogelwch Gellir defnyddio nodweddion unigryw llais unigolyn fel ffurf o ddilysu biometrig. Mae technoleg ASR yn chwarae rhan hanfodol mewn systemau biometrig llais, gan gynnig haen ychwanegol o ddiogelwch ar gyfer adnabod personol a rheoli mynediad.

 

Beth Sydd gan y Dyfodol ar gyfer Technoleg ASR?

Gyda datblygiad AI a dysgu peiriannau, disgwylir i dechnoleg Adnabod Lleferydd Awtomatig ddod yn fwy cywir, yn gyflymach ac yn fwy naturiol. Yn ogystal, mae technoleg ASR yn debygol o ddod yn gyffredin mewn gwasanaeth cwsmeriaid, addysg, gofal iechyd, a mwy. Ar gyfer sefydliadau, rhaid i ddatblygu atebion busnes wedi'u teilwra'n seiliedig ar ASR fod y targed nesaf.

Cael Help ar gyfer Eich Prosiectau Seiliedig ar ASR gan Arbenigwyr Shaip

Cyfran Gymdeithasol