Cydnabod Lleferydd yn Awtomatig

Deall Proses Casglu Data Sain ar gyfer Adnabod Lleferydd Awtomatig

Mae systemau Adnabod Lleferydd Awtomatig a chynorthwywyr rhithwir fel Siri, Alexa, a Cortana wedi dod yn rhannau cyffredin o'n bywydau. Mae ein dibyniaeth arnynt yn cynyddu'n sylweddol wrth iddynt ddod yn ddoethach. O droi ein goleuadau ymlaen i wneud galwadau i newid sianeli teledu, rydym yn trosoledd y technolegau clyfar hyn i gwblhau tasgau cyffredin.

Fodd bynnag, a ydych erioed wedi meddwl sut mae'r systemau adnabod lleferydd hyn yn gweithio?

Wel, bydd y blog hwn yn eich addysgu ar rai o hanfodion Cydnabod Lleferydd Awtomatig. Hefyd, byddwn yn archwilio ei waith a sut mae cynorthwywyr rhithwir swyddogaethol fel Siri yn cael eu hadeiladu.

Beth yw Adnabod Lleferydd Awtomatig?

Mae Cydnabod Lleferydd Awtomatig (ASR) yn feddalwedd sy'n galluogi'r system gyfrifiadurol i drosi lleferydd dynol yn destun, gan drosoli deallusrwydd artiffisial lluosog ac algorithmau dysgu peiriant.

Ar ôl trosi a dadansoddi'r gorchymyn a roddir, mae'r cyfrifiadur yn ymateb gydag allbwn priodol i'r defnyddiwr. Cyflwynwyd ASR gyntaf yn 1962, ac ers hynny, mae wedi bod yn gwella ei weithrediadau yn barhaus ac yn cael sylw mawr oherwydd cymwysiadau poblogaidd fel Alexa a Siri.

Oeddech chi'n gwybod bod Cydnabod Lleferydd Awtomatig hefyd yn cael ei adnabod fel Darllenydd Lleferydd-i-Destun? Darllenwch fwy amdano yn y blog hwn! 

Beth yw'r Broses ar gyfer Casglu Lleferydd ar gyfer Hyfforddi Modelau ASR?

Speech collection process

Nod casglu lleferydd yw casglu sawl recordiad sampl o feysydd lluosog a ddefnyddir i fwydo a hyfforddi modelau ASR. Mae system ASR yn darparu'r effeithlonrwydd uchaf pan fydd setiau data mawr o leferydd a sain yn cael eu casglu a'u darparu i'w system.

Er mwyn gweithio'n ddi-dor, rhaid i'r setiau data lleferydd a gasglwyd gynnwys yr holl ddemograffeg, ieithoedd, acenion a thafodieithoedd targed. Mae'r broses ganlynol yn dangos sut i hyfforddi'r model dysgu peiriant mewn sawl cam:

  • Dechreuwch trwy Adeiladu Matrics Demograffig

    Yn bennaf oll mae'n casglu'r data ar gyfer gwahanol ddemograffeg megis lleoliad, rhyw, iaith, oedran ac acenion. Hefyd, sicrhewch eich bod yn dal amrywiaeth o synau amgylcheddol fel sŵn stryd, sŵn ystafell aros, sŵn swyddfa gyhoeddus, ac ati.

  • Casglu a Thrawsgrifio'r Data Lleferydd

    Y cam nesaf yw casglu samplau sain a lleferydd dynol yn seiliedig ar wahanol leoliadau daearyddol i hyfforddi eich model ASR. Mae’n gam pwysig ac yn gofyn i arbenigwyr dynol berfformio geiriau hir a byr er mwyn cael gwir deimlad y frawddeg ac ailadrodd yr un brawddegau mewn gwahanol acenion a thafodieithoedd.

  • Creu Set Prawf ar Wahân

    Unwaith y byddwch wedi casglu'r testun trawsgrifiedig, y cam nesaf yw ei baru â data sain cyfatebol. Yna, segmentwch y data ymhellach a chynnwys un datganiad ohonynt. Nawr, o'r parau data segmentiedig, gallwch dynnu data ar hap o set i'w brofi ymhellach.

  • Hyfforddwch eich Model Iaith ASR

    Po fwyaf o wybodaeth sydd gan eich setiau data, y gorau y byddai eich model wedi'i hyfforddi mewn AI yn perfformio. Felly, cynhyrchwch amrywiadau lluosog o destun ac areithiau a gofnodwyd gennych yn gynharach. Aralleirio'r un brawddegau gan ddefnyddio gwahanol nodiannau lleferydd.

  • Gwerthuswch yr Allbwn ac yn olaf, Ailadroddwch

    Yn olaf, yn mesur allbwn eich model ASR i drwsio ei berfformiad. Profwch y model yn erbyn set prawf i bennu ei effeithlonrwydd. Yn addas, defnyddiwch eich model ASR mewn dolen adborth i gynhyrchu'r allbwn dymunol a thrwsio unrhyw fylchau.

[Darllenwch hefyd: Trosolwg Cynhwysfawr o Adnabod Lleferydd Awtomatig]

Beth yw'r Achosion Defnydd Gwahanol o Adnabod Lleferydd?

Mae technoleg adnabod lleferydd yn gyffredin iawn mewn llawer o ddiwydiannau heddiw. Mae rhai diwydiannau sy'n defnyddio'r dechnoleg aruthrol hon fel a ganlyn:

  • Diwydiant bwyd Diwydiant Bwyd: Mae cewri bwyd fel Wendy's a McDonald's ar fin gwella eu profiadau cwsmeriaid gan ddefnyddio ASR. Mewn llawer o'u siopau, maent wedi defnyddio modelau ASR cwbl weithredol i gymryd archebion, a'u trosglwyddo ymhellach i'r adran goginio i wneud archeb y cwsmer yn barod.

     

  • telathrebu Telathrebu: Vodafone yw un o'r darparwyr telathrebu mwyaf yn y byd. Mae wedi dylunio ei wasanaethau gofal cwsmeriaid a chyfnewid ffôn gan ddefnyddio modelau ASR sy'n eich arwain i ddatrys gwahanol ymholiadau ac ailgyfeirio'ch galwadau i adrannau pryderus.

     

  • Teithio a chludiant Teithio a Chludiant: Mae Google Android Auto neu Apple CarPlay wedi dod yn gyffredin. Mae'r rhan fwyaf o bobl yn eu defnyddio i actifadu systemau llywio, anfon negeseuon, neu newid rhestri chwarae cerddoriaeth. Fodd bynnag, gyda datblygiadau technolegol, mae systemau o'r fath yn dod yn fwy mireinio.
    Mae Cynorthwy-ydd Personol Deallus BMW a lansiwyd yn ei Gyfres BMW 3 yn llawer callach na chynorthwywyr llais rheolaidd. Gall alluogi gyrwyr i ddod o hyd i wybodaeth sy'n ymwneud â char a gweithredu'r car gan ddefnyddio gorchmynion llais.
  • cyfryngau ac adloniantCyfryngau ac Adloniant: Mae diwydiant y cyfryngau, hefyd, yn defnyddio ASR mewn llawer o'i brosiectau. Mae Youtube wedi lansio cynorthwyydd seiliedig ar AI sy'n cynhyrchu auto-capsiynau byw. Wrth i chi siarad ar y sgrin, bydd y cynorthwyydd yn darparu'r is-deitlau i wneud y fideo yn hygyrch i grŵp mwy o ddefnyddwyr Youtube.

 

[Darllenwch hefyd: Beth yw Technoleg Lleferydd-i-Destun a Sut Mae'n Gweithio]

Sut Gall Shaip Helpu?

Shaip yw un o'r gwasanaethau hyfforddi AI mwyaf blaenllaw sy'n meddu ar arbenigedd mewn sawl maes AI ac ML. Gallant eich helpu i adeiladu eich set ddata eich hun y gellid ei defnyddio ar gyfer gwahanol gymwysiadau a phrosiectau.

Dyma rai o’r gwasanaethau a ddarperir gan Shaip:

  • Adnabod Lleferydd Awtomataidd (ASR)
  • Casgliad Lleferydd wedi'i Sgriptio
  • Trawsgreu
  • Casgliad Lleferydd Digymell
  • Casgliad Llefaru / Geiriau Deffro,
  • Testun-i-leferydd (TTS)

Gallwch ddefnyddio'r gwasanaethau hyn i gael y canlyniadau gorau ar gyfer eich prosiectau seiliedig ar AI. Dysgwch fwy am y gwasanaethau hyn trwy estyn allan i'n tîm arbenigol heddiw!

Cyfran Gymdeithasol