Data Hyfforddiant Adnabod Lleferydd

Data Hyfforddiant Adnabod Lleferydd - Mathau, casglu data a chymwysiadau

Os ydych chi'n defnyddio Siri, Alexa, Cortana, Amazon Echo, neu eraill fel rhan o'ch bywydau bob dydd, byddech chi'n derbyn hynny Cydnabyddiaeth lleferydd wedi dod yn rhan hollbresennol o'n bywydau. Rhain wedi'i bweru gan ddeallusrwydd artiffisial mae cynorthwywyr llais yn trosi ymholiadau llafar defnyddwyr yn destun, yn dehongli ac yn deall yr hyn y mae'r defnyddiwr yn ei ddweud i ddod o hyd i ymateb priodol.

Mae angen casglu data o safon i ddatblygu modelau lleferydd, adnabod dibynadwy. Ond, yn datblygu meddalwedd adnabod lleferydd Nid yw'n dasg syml - yn union oherwydd ei bod yn anodd trawsgrifio lleferydd dynol yn ei holl gymhlethdod, megis rhythm, acen, traw ac eglurder. A, pan fyddwch chi'n ychwanegu emosiynau at y cymysgedd cymhleth hwn, mae'n dod yn her.

Beth yw Adnabod Lleferydd?

Adnabyddiaeth lleferydd yw gallu meddalwedd i adnabod a phrosesu lleferydd dynol i mewn i destun. Er y gall y gwahaniaeth rhwng adnabod llais ac adnabod lleferydd ymddangos yn oddrychol i lawer, mae rhai gwahaniaethau sylfaenol rhwng y ddau.

Er bod adnabod lleferydd a llais yn rhan o'r dechnoleg cynorthwyydd llais, maent yn cyflawni dwy swyddogaeth wahanol. Mae adnabod lleferydd yn gwneud trawsgrifiadau awtomatig o leferydd dynol a gorchmynion i mewn i destun, tra bod adnabod llais yn delio ag adnabod llais y siaradwr yn unig.

Mathau o Adnabyddiaeth Lleferydd

Cyn i ni neidio i mewn mathau adnabod lleferydd, gadewch i ni edrych yn fyr ar ddata adnabod lleferydd.

Mae data adnabod lleferydd yn gasgliad o recordiadau sain lleferydd dynol a thrawsgrifio testun sy'n helpu i hyfforddi systemau dysgu peiriant ar gyfer adnabod llais.

Mae'r recordiadau sain a thrawsgrifiadau'n cael eu mewnbynnu i'r system ML fel y gellir hyfforddi'r algorithm i adnabod naws lleferydd a deall ei ystyr.

Er bod yna lawer o leoedd lle gallwch chi gael setiau data wedi'u rhag-becynnu am ddim, mae'n well eu cael setiau data wedi'u haddasu ar gyfer eich prosiectau. Gallwch ddewis maint y casgliad, gofynion sain a siaradwr, a'r iaith trwy gael set ddata wedi'i theilwra.

Sbectrwm Data Lleferydd

Data lleferydd Mae sbectrwm yn nodi ansawdd a thraw lleferydd yn amrywio o naturiol i annaturiol.

  • Data adnabod lleferydd wedi'i sgriptio

    Fel y mae'r enw'n ei awgrymu, mae lleferydd wedi'i sgriptio yn ffurf reoledig o ddata. Mae'r siaradwyr yn cofnodi ymadroddion penodol o destun parod. Defnyddir y rhain yn nodweddiadol ar gyfer cyflwyno gorchmynion, gan bwysleisio sut mae'r gair neu ymadrodd a ddywedir yn hytrach na'r hyn a ddywedir.

    Gellir defnyddio adnabyddiaeth lleferydd wedi'i sgriptio wrth ddatblygu cynorthwyydd llais a ddylai godi gorchmynion a gyhoeddir gan ddefnyddio acenion siaradwr amrywiol.

  • Adnabod lleferydd ar sail Senario

    Mewn araith yn seiliedig ar senario, gofynnir i'r siaradwr ddychmygu senario a mater penodol a gorchymyn llais yn seiliedig ar y senario. Fel hyn, y canlyniad yw casgliad o orchmynion llais nad ydynt wedi'u sgriptio ond yn cael eu rheoli.

    Mae angen data lleferydd yn seiliedig ar senario ar ddatblygwyr sy'n edrych i ddatblygu dyfais sy'n deall lleferydd bob dydd gyda'i arlliwiau amrywiol. Er enghraifft, gofyn am gyfarwyddiadau i fynd i'r Cwt Pizza agosaf gan ddefnyddio amrywiaeth o gwestiynau.

  • Cydnabod Lleferydd Naturiol

    Ar ddiwedd y sbectrwm lleferydd mae lleferydd sy'n ddigymell, yn naturiol, heb ei reoli mewn unrhyw fodd. Mae'r siaradwr yn siarad yn rhydd gan ddefnyddio ei naws sgyrsiol naturiol, iaith, traw, a thenor.

    Os ydych chi eisiau hyfforddi cymhwysiad sy'n seiliedig ar ML ar adnabod lleferydd aml-seinydd, yna rhaglen heb ei sgriptio neu araith sgyrsiol set ddata yn ddefnyddiol.

Cydrannau Casglu Data ar gyfer Prosiectau Lleferydd

Casglu data lleferydd Mae cyfres o gamau sy'n ymwneud â chasglu data lleferydd yn sicrhau bod y data a gesglir o ansawdd ac yn helpu i hyfforddi modelau AI o ansawdd uchel.

Deall ymatebion defnyddwyr gofynnol

Dechreuwch trwy ddeall yr ymatebion defnyddwyr gofynnol ar gyfer y model. I ddatblygu model adnabod lleferydd, dylech gasglu data sy'n cynrychioli'n agos y cynnwys sydd ei angen arnoch. Casglu data o ryngweithiadau byd go iawn i ddeall rhyngweithiadau ac ymatebion defnyddwyr. Os ydych chi'n adeiladu cynorthwyydd sgwrsio seiliedig ar AI, edrychwch ar y logiau sgwrsio, recordiadau galwadau, ymatebion blwch deialog sgwrsio i greu set ddata.

Craffu ar yr iaith parth-benodol

Mae angen cynnwys generig a pharth-benodol arnoch ar gyfer set ddata adnabod lleferydd. Unwaith y byddwch wedi casglu data lleferydd generig, dylech hidlo'r data a gwahanu'r generig a'r data penodol.

Er enghraifft, gall cwsmeriaid alw i mewn i ofyn am apwyntiad i wirio am glawcoma mewn canolfan gofal llygaid. Mae gofyn am apwyntiad yn derm cyffredinol iawn, ond mae glawcoma yn faes-benodol.

Ar ben hynny, wrth hyfforddi model ML adnabod lleferydd, gwnewch yn siŵr eich bod chi'n ei hyfforddi i nodi ymadroddion yn hytrach nag yn unigol geiriau cydnabyddedig.

Cofnodi Lleferydd Dynol

Ar ôl casglu data o'r ddau gam blaenorol, byddai'r cam nesaf yn golygu cael bodau dynol i gofnodi'r datganiadau a gasglwyd.

Mae'n hanfodol cadw hyd delfrydol y sgript. Gallai gofyn i bobl ddarllen mwy na 15 munud o destun fod yn wrthgynhyrchiol. Cynnal bwlch o 2 – 3 eiliad o leiaf rhwng pob datganiad a gofnodwyd.

Gadewch i'r recordiad fod yn ddeinamig

Adeiladwch ystorfa araith o wahanol bobl, gan siarad acenion, arddulliau a gofnodwyd o dan wahanol amgylchiadau, dyfeisiau ac amgylcheddau. Os yw'r mwyafrif o ddefnyddwyr y dyfodol yn mynd i ddefnyddio'r llinell dir, dylai fod gan eich cronfa ddata casgliad lleferydd gynrychiolaeth sylweddol sy'n cyfateb i'r gofyniad hwnnw.

Cymell amrywiaeth o ran cofnodi Lleferydd

Unwaith y bydd yr amgylchedd targed wedi'i sefydlu, gofynnwch i'ch gwrthrychau casglu data ddarllen y sgript a baratowyd o dan amgylchedd tebyg. Gofynnwch i'r pynciau beidio â phoeni am y camgymeriadau a chadwch y dehongliad mor naturiol â phosib. Y syniad yw cael grŵp mawr o bobl yn recordio'r sgript yn yr un amgylchedd.

Adysgrifiwch yr Areithiau

Unwaith y byddwch wedi recordio'r sgript gan ddefnyddio pynciau lluosog (gyda chamgymeriadau), dylech fwrw ymlaen â'r trawsgrifiad. Cadwch y camgymeriadau yn gyfan, gan y byddai hyn yn eich helpu i gyflawni dynameg ac amrywiaeth yn y data a gasglwyd.

Yn hytrach na chael bodau dynol yn trawsgrifio'r testun cyfan gair am air, gallwch ddefnyddio peiriant lleferydd-i-destun i wneud y trawsgrifio. Fodd bynnag, rydym hefyd yn awgrymu eich bod yn cyflogi trawsgrifwyr dynol i gywiro camgymeriadau.

Datblygu Set brawf

Mae datblygu set brawf yn hollbwysig gan ei fod yn rhedwr blaen i'r model iaith.

Gwnewch bâr o'r araith a'r testun cyfatebol a'u gwneud yn segmentau.

Ar ôl casglu'r elfennau a gasglwyd, tynnwch samplu o 20%, sy'n ffurfio'r set brawf. Nid dyma'r set hyfforddi, ond bydd y data hwn a echdynnwyd yn rhoi gwybod i chi os yw'r model hyfforddedig yn trawsgrifio sain nad yw wedi'i hyfforddi arno.

Adeiladu model a mesur hyfforddiant iaith

Nawr adeiladwch y model iaith adnabod lleferydd gan ddefnyddio'r datganiadau parth-benodol ac amrywiadau ychwanegol os oes angen. Unwaith y byddwch wedi hyfforddi'r model, dylech ddechrau ei fesur.

Cymerwch y model hyfforddi (gyda 80% o segmentau sain dethol) a phrofwch ef yn erbyn y set prawf (set ddata 20% wedi'i dynnu) i wirio am ragfynegiadau a dibynadwyedd. Gwiriwch am gamgymeriadau, patrymau, a chanolbwyntiwch ar ffactorau amgylcheddol y gellir eu trwsio.

Achosion neu Gymwysiadau Defnydd Posibl

Achos defnydd adnabod lleferydd

Cymhwysiad Llais, Offer Clyfar, Lleferydd i destun, Cefnogaeth i Gwsmeriaid, Arddywediad Cynnwys, Cymhwysiad Diogelwch, Cerbydau Ymreolaethol, Cymryd nodiadau ar gyfer gofal iechyd.

Mae adnabod lleferydd yn agor byd o bosibiliadau, ac mae mabwysiadu cymwysiadau llais defnyddwyr wedi cynyddu dros y blynyddoedd.

Mae rhai o'r cymwysiadau cyffredin o technoleg adnabod lleferydd yn cynnwys:

  1. Cais Chwiliad Llais

    Yn ôl Google, tua 20% o'r chwiliadau a gynhelir ar ap Google yw llais. Wyth biliwn o bobl rhagwelir y byddant yn defnyddio cynorthwywyr llais erbyn 2023, cynnydd sydyn o'r 6.4 biliwn a ragwelir yn 2022.

    Mae mabwysiadu chwiliad llais wedi cynyddu'n sylweddol dros y blynyddoedd, a rhagwelir y bydd y duedd hon yn parhau. Mae defnyddwyr yn dibynnu ar chwiliad llais i chwilio ymholiadau, prynu cynnyrch, lleoli busnesau, dod o hyd i fusnesau lleol, a mwy.

  2. Dyfeisiau Cartref / Offer Smart

    Mae technoleg adnabod llais yn cael ei defnyddio i ddarparu gorchmynion llais i ddyfeisiau smart cartref fel setiau teledu, goleuadau ac offer eraill. 66% o ddefnyddwyr yn y DU, yr Unol Daleithiau, a'r Almaen dywedodd eu bod yn defnyddio cynorthwywyr llais wrth ddefnyddio dyfeisiau clyfar a siaradwyr.

  3. Araith i'r testun

    Mae cymwysiadau llais-i-destun yn cael eu defnyddio i gynorthwyo gyda chyfrifiadura am ddim wrth deipio e-byst, dogfennau, adroddiadau ac eraill. Araith i'r testun yn dileu'r amser i deipio dogfennau, ysgrifennu llyfrau a phost, fideos isdeitlo, a chyfieithu testun.

  4. Cymorth i Gwsmeriaid

    Defnyddir cymwysiadau adnabod lleferydd yn bennaf mewn gwasanaeth cwsmeriaid a chymorth. Mae system adnabod lleferydd yn helpu i ddarparu datrysiadau gwasanaeth cwsmeriaid 24/7 am gost fforddiadwy gyda nifer gyfyngedig o gynrychiolwyr.

  5. Arddywediad Cynnwys

    Mae arddweud cynnwys yn un arall casyn defnydd adnabod lleferydd sy'n helpu myfyrwyr ac academyddion i ysgrifennu cynnwys helaeth mewn ffracsiwn o amser. Mae'n eithaf defnyddiol i fyfyrwyr sydd dan anfantais oherwydd dallineb neu broblemau golwg.

  6. Cais diogelwch

    Defnyddir cydnabyddiaeth llais yn helaeth at ddibenion diogelwch a dilysu trwy nodi nodweddion llais unigryw. Yn lle bod y person yn nodi ei hun gan ddefnyddio gwybodaeth bersonol wedi'i dwyn neu ei chamddefnyddio, mae biometreg llais yn cynyddu diogelwch.

    At hynny, mae cydnabyddiaeth llais at ddibenion diogelwch wedi gwella lefelau boddhad cwsmeriaid fel y mae'n dileu'r broses mewngofnodi estynedig a dyblygu credadwy.

  7. Gorchmynion llais ar gyfer cerbydau

    Bellach mae gan gerbydau, ceir yn bennaf, nodwedd adnabod llais gyffredin i wella diogelwch gyrru. Mae'n helpu'r gyrwyr i ganolbwyntio ar yrru trwy dderbyn gorchmynion llais syml fel dewis gorsafoedd radio, gwneud galwadau, neu leihau'r cyfaint.

  8. Cymryd nodiadau ar gyfer gofal iechyd

    Mae meddalwedd trawsgrifio meddygol a adeiladwyd gan ddefnyddio algorithmau adnabod lleferydd yn dal nodiadau llais, gorchmynion, diagnosisau a symptomau meddygon yn hawdd. Mae cymryd nodiadau meddygol yn cynyddu ansawdd a brys yn y diwydiant gofal iechyd.

A oes gennych chi brosiect adnabod lleferydd mewn golwg a all drawsnewid eich busnes? Y cyfan y gallai fod ei angen arnoch yw set ddata adnabod lleferydd wedi'i theilwra.

Mae angen hyfforddi meddalwedd adnabod lleferydd sy'n seiliedig ar AI ar setiau data dibynadwy ar algorithmau dysgu peirianyddol i integreiddio cystrawen, gramadeg, strwythur brawddegau, emosiynau, a naws lleferydd dynol. Yn bwysicaf oll, dylai'r feddalwedd ddysgu ac ymateb yn barhaus - gan dyfu gyda phob rhyngweithiad.

Yn Shaip, rydym yn darparu setiau data adnabod lleferydd wedi'u teilwra'n gyfan gwbl ar gyfer amrywiol brosiectau dysgu peiriannau. Gyda Shaip, mae gennych fynediad i'r data hyfforddi wedi'i deilwra o'r ansawdd uchaf y gellir ei ddefnyddio i adeiladu a marchnata system adnabod lleferydd ddibynadwy. Cysylltwch â'n harbenigwyr i gael dealltwriaeth gynhwysfawr o'n cynigion.

[Darllenwch hefyd: Y Canllaw Cyflawn i AI Sgyrsiol]

Cyfran Gymdeithasol