Gwasanaethau Casglu Data Lleferydd yr ymddiriedir ynddynt fwyaf ar gyfer eich AI
Hyfforddwch eich modelau NLP, VAs, prototeipiau TTS, a mwy gyda data sgwrsio o safon, gyda'n gwasanaethau casglu data sain a lleferydd
Darganfod piblinellau data sain heb dagfeydd.
Cleientiaid dan Sylw
Pam mae angen Set Ddata Hyfforddiant Lleferydd ar gyfer Prosesu Iaith Naturiol?
Ydych chi erioed wedi sylwi ar VA eich ffôn clyfar, hy Siri, Bixby, neu unrhyw beth arall, yn rhyngweithio? Y ffordd y maent yn ateb pob cwestiwn ac yn dadansoddi ac yn cyflwyno canlyniadau yn unol â'ch gofynion!
Wel, er cymaint y mae'r cynorthwywyr gwirfoddol hyn yn ein cynddeiriogi, mae angen hyfforddi'r adnoddau a'r rhaglenni deallus hyn yn gynyddol i allu ymateb, yr un mor gywir. Dyma'r rheswm pam y dylech ystyried anfon gwaith casglu data lleferydd/sain a llais i gwmnïau casglu data arbenigol, sydd ag arbenigedd proffesiynol ym maes dilysu.
Mae buddsoddi mewn casglu data sain yn paratoi eich NLP honedig i ddarparu ar gyfer cynulleidfa amlieithog. Nid yn unig hynny, mae casglu data lleferydd ar gyfer NLP, pan fydd arbenigwr yn ei drin, hyd yn oed yn cymryd casglu yn y maes, dadansoddi semantig, a thrawsgrifio sain i ystyriaeth. Gyda datrysiadau casglu data lleferydd proffesiynol, gallwch:
- Caffael setiau data sain o ansawdd uchel i wella cywirdeb
- Targedu gosod senarios amrywiol
- Casglu data hyfforddiant AI amlieithog
- Graddiwch eich model ML i weddu i ddemograffeg a fertigol amrywiol
Gwasanaethau Casglu Data Sain / Llais Proffesiynol ar gyfer NLP
Unrhyw bwnc. Unrhyw senario.
Mae systemau deallus NLP yn unrhyw beth ond generig. Yn dibynnu ar ymarferoldeb y rhaglen, efallai y bydd yn rhaid i chi ganolbwyntio ar wasanaethau data sain gofodol ac amlieithog, y gellir eu cynnig gan gwmnïau casglu data llais / sain honedig yn unig. Dyma lle mae Shaip yn dod i mewn i'r cynllun pethau fel darparwr gwasanaeth cysylltu data dibynadwy iawn sy'n ymfalchïo mewn gwneud y gwaith codi trwm ar gyfer eich AIs, yn ôl pob sôn, sy'n ddeallus.
Yn Shaip, mae ein prif ffocws ar fodelau bwydo gyda'r nifer uchaf posibl o samplau lleferydd wedi'u teilwra, yn yr amser lleiaf posibl. Gyda ni ar fwrdd y llong, gallwch chi ddisgwyl:
- Casglu data sain / llais wedi'i guradu ar gyfer NLP
- Rhaglenni wedi'u teilwra sy'n ymateb yn unol ag achosion defnydd penodol
- Gwneud mwyngloddio set ddata sain yn barod
- Prosesu data awtomataidd sy'n benodol i batrwm
- Y lefel uchaf bosibl o benodoldeb parth
- Amser cyflymach i farchnata gyda modelau AI carlam
Ein Harbenigedd
Alinio Data Sain i Baratoi Modelau NLP Clyfar
Mae Shaip yn cynnig gwasanaethau casglu data lleferydd / sain o'r dechrau i'r diwedd mewn dros 100+ o ieithoedd i alluogi technolegau sy'n galluogi llais i ddarparu ar gyfer set amrywiol o gynulleidfaoedd ledled y byd. Gallwn weithio ar brosiectau o unrhyw gwmpas a maint; o drwyddedu setiau data sain presennol oddi ar y silff, i reoli casglu data sain wedi'i deilwra, i drawsgrifio sain ac anodi. Ni waeth pa mor fawr yw'ch prosiect casglu data lleferydd, gallwn addasu'r gwasanaethau casglu sain i weddu i'ch anghenion i adeiladu setiau data NLP o ansawdd uchel sy'n targedu tafodieithoedd, tonau ac ieithoedd. Dewiswch o'n hystod eang o setiau data lleferydd ac adnoddau casglu data sain, ar gyfer setiau deallus sy'n galluogi llais.
Casgliad Lleferydd Monolog
Ymdrin â gofynion ar sail lleferydd sy'n ymwneud â siaradwr annibynnol ar gyfer eich prototeipiau Testun-i-Gyflymder a'ch gofynion trawsgrifio-benodol gyda bwydo prydlon wedi'i sgriptio, trwy ffeiliau un sianel.
Araith Deialog
Dull Casglu
Sefydlu Cynorthwywyr Rhithiol deallus, chatbots cyflymder-benodol, a modelau Cydnabod Lleferydd Awtomatig gydag amlygiad amlieithog trwy ffeiliau sianel ddeuol ac adnoddau wedi'u trawsgrifio.
Data Acwstig
Dull Casglu
Gallwn recordio data sain o ansawdd stiwdio yn broffesiynol, boed yn fwytai, swyddfeydd, neu gartrefi neu o amrywiol amgylcheddau ac ieithoedd, trwy ein rhwydwaith fyd-eang o gydweithredwyr, wrth gwmpasu ystod acwstig ehangach.
Casgliad Iaith Naturiol
Hyfforddi setiau masnachol craff i nodi ymadroddion cwsmeriaid sydd â gwahanol eiriau gydag ystyr tebyg, ar gyfer gwneud yr AIs yn fwy ymreolaethol mewn amser
Digidol / Rhithiol
Cynorthwywyr
Canolbwyntiwch ar adeiladu eich Cynorthwyydd Rhithiol sydd ar ddod trwy hyfforddi modelau gyda chafeatau lleferydd dynol, amlygiad amlieithog, dadansoddiad cyd-destunol, ac NLU.
Cydnabod Lleferydd yn Awtomatig (ASR)
Gwella cywirdeb eich systemau adnabod llais awtomatig (ASR) trwy gael mynediad at setiau data lleferydd/sain amrywiol o'r radd flaenaf, o amrywiaeth eang o ddemograffeg.
Data Hyfforddiant Lleferydd/Sain amlieithog
Mae ein gweithwyr iaith proffesiynol medrus iawn ledled y byd, yn cynnig data hyfforddiant sain/lleferydd amlieithog mewn sawl iaith a thafodiaith gan gynnwys Arabeg, Daneg, Tsieinëeg, Affricaneg, Singapôr, Seland Newydd, Hebraeg, Indoneseg, Gwyddeleg, Corëeg, Maleieg, Pwyleg, Albanaidd, Swedeg. , Ffrangeg, Almaeneg, Fietnameg, Thai, Eidaleg, Sbaeneg a mwy.
Testun-i-Araith
(TTS)
Er mwyn cynnig profiad gwell i ddefnyddwyr gyda TTS, mae datblygu system i swnio'n naturiol yn hollbwysig. Adeiladu model testun-i-leferydd (TTS) amlieithog gyda chymorth ein gweithlu byd-eang, sy'n eich helpu i gasglu data lleferydd mewn 150+ o ieithoedd a thafodieithoedd i wella'ch modelau AI o reolaethau yn y car i chatbots ac atebion dysgu gydag uchel- data sain o ansawdd.
Rhesymau dros ddewis Shaip fel eich Partner Casglu Data Lleferydd Dibynadwy
Pobl
Timau pwrpasol a hyfforddedig:
- 30,000+ o gydweithredwyr ar gyfer Creu Data, Labelu a SA
- Tîm Rheoli Prosiect Credentialed
- Tîm Datblygu Cynnyrch Profiadol
- Tîm Cyrchu ac Ymuno Pyllau Talent
Proses
Sicrheir effeithlonrwydd proses uchaf gyda:
- Proses Porth Llwyfan 6 Sigma cadarn
- Tîm ymroddedig o 6 gwregys du Sigma - Perchnogion prosesau allweddol a chydymffurfiaeth ag ansawdd
- Dolen Gwelliant ac Adborth Parhaus
Llwyfan
Mae'r platfform patent yn cynnig buddion:
- Llwyfan o'r dechrau i'r diwedd ar y we
- Ansawdd Impeccable
- TAT cyflymach
- Dosbarthu Di-dor
Pobl
Timau pwrpasol a hyfforddedig:
- 30,000+ o gydweithredwyr ar gyfer Creu Data, Labelu a SA
- Tîm Rheoli Prosiect Credentialed
- Tîm Datblygu Cynnyrch Profiadol
- Tîm Cyrchu ac Ymuno Pyllau Talent
Proses
Sicrheir effeithlonrwydd proses uchaf gyda:
- Proses Porth Llwyfan 6 Sigma cadarn
- Tîm ymroddedig o 6 gwregys du Sigma - Perchnogion prosesau allweddol a chydymffurfiaeth ag ansawdd
- Dolen Gwelliant ac Adborth Parhaus
Llwyfan
Mae'r platfform patent yn cynnig buddion:
- Llwyfan o'r dechrau i'r diwedd ar y we
- Ansawdd Impeccable
- TAT cyflymach
- Dosbarthu Di-dor
Iaith: Setiau Data Sain a Gasglwyd
Setiau Data Lleferydd / Sain Oddi ar y Silff
manylion | ID Corpws (Unigryw) | Keyword | Set Ddata Iaith | Cod iaith | Cyfradd Sampl | Math Set Ddata | Cyfanswm Oriau Sain | Disgrifiad Byr | Disgrifiad Set Ddata | Sianel Sain | Llwyfan Recordio | WER (%) | Fformat Sain | Fformat Trawsgrifio | Defnyddiwch Achos | Nifer y Siaradwyr | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
cy_US_CC_8 | Cynhenid Americanaidd Affricanaidd | Cynhenid Americanaidd Affricanaidd | en_US | 8 kHz | Canolfan alwadau | 211 | Data canolfan alwadau brodorol Affricanaidd-Americanaidd | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 612, Gwryw: 1242, ac Anhysbys: 12 | Cysylltu | |
cy_US_MA_16 | Cynhenid Americanaidd Affricanaidd | Cynhenid Americanaidd Affricanaidd | en_US | 16 kHz | Sain Cyfryngau | 154 | Data Cyfryngau brodorol Affricanaidd-Americanaidd | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 151, Gwryw: 150, ac Anhysbys: 10 | Cysylltu | |
Affricaneg_GC_8 | Affricaneg | Affricaneg | af_ZA | 8 kHz | Sgwrs Gyffredinol | 368 | Data Sgwrs Gyffredinol Affrica | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Ystod) - 15-60 munud, Afrikaans a siaredir yn Affrica | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 502, Gwryw: 390, ac Anhysbys: 2 | Cysylltu | |
Affricaneg_MA_16 | Affricaneg | Affricaneg | af_ZA | 16 kHz | Sain Cyfryngau | 658 | Ffeiliau Cyfryngau Affrica | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 750, Gwryw: 1278, ac Anhysbys: 52 | Cysylltu | |
Arabeg_GC_8 | Arabeg | Arabeg | ar_AE | 8 kHz | Sgwrs Gyffredinol | 292 | Data Sgwrs Gyffredinol Arabeg | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Ystod) - 15-60 munud, Arabeg o wledydd y Gwlff | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 171, Gwryw: 534, ac Anhysbys: 1 | Cysylltu | |
Arabeg_SM_48 | Arabeg | Arabeg | ar-SA | 48 kHz | Monolog Sgriptiedig | 1,947 | Monolog Sgriptiedig Arabeg | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 838 Gwryw 1209 Anhysbys 78 | Cysylltu | |
Asameg_CC_8 | Asameg | Asameg (ar y gweill) | fel | Canolfan alwadau | 60 | Asameg (Mewn Piblinell) data Canolfan Alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Asameg_GC | Asameg | Asameg (ar y gweill) | fel | Sgwrs Gyffredinol | 100 | Asamese (Ar y gweill) Data Sgwrs Gyffredinol | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Asameg_MA | Asameg | Asameg (ar y gweill) | fel | Sain Cyfryngau | 40 | Asameg (Mewn Piblinell) Data sain cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Bengali_CC_8 | bengali | Bengaleg (ar y gweill) | bn_IN | Canolfan alwadau | 60 | Bengali (Mewn Piblinell) data Canolfan Alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Bengali_GC | bengali | Bengaleg (ar y gweill) | bn_IN | Sgwrs Gyffredinol | 100 | Bengali (Ar y gweill) Data Sgwrs Gyffredinol | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Bengali_MA | bengali | Bengaleg (ar y gweill) | bn_IN | Sain Cyfryngau | 40 | Bengali (Mewn Pib) Data sain y cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Boston_CC_8 | Saesneg Boston | Saesneg Boston | en_US | 8 kHz | Canolfan alwadau | 177 | Data canolfan alwadau Boston | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 605, Gwryw: 711, ac Anhysbys: 0 | Cysylltu | |
Boston_GC_8 | Saesneg Boston | Saesneg Boston | en_US | 8 kHz | Sgwrs Gyffredinol | 32 | Data Sgwrs Gyffredinol Boston | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 53, Gwryw: 83, ac Anhysbys: 0 | Cysylltu | |
Boston_MA_16 | Saesneg Boston | Saesneg Boston | en_US | 16 kHz | Sain Cyfryngau | 93 | Data sain Boston Media | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 43, Gwryw: 181, ac Anhysbys: 2 | Cysylltu | |
Canada_SM_48 | Ffrangeg Canada | Ffrangeg Canada | fr-CA | 48 kHz | Monolog Sgriptiedig | 1,222 | Ffrangeg Canada | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 974 Gwryw 631 Anhysbys 1 | Cysylltu | |
Tsieinëeg_CC_8 | Saesneg Tsieineaidd | Saesneg Tsieineaidd | en_US | 8 kHz | Canolfan alwadau | 169 | Data canolfan alwadau Tsieineaidd | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 1790, Gwryw: 523 ac Anhysbys: 13 | Cysylltu | |
Tsieinëeg_MA_16 | Saesneg Tsieineaidd | Saesneg Tsieineaidd | en_US | 16 kHz | Sain Cyfryngau | 249 | Data sain Cyfryngau Tsieineaidd | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 126, Gwryw: 346 ac Anhysbys: 6 | Cysylltu | |
Tsieinëeg Symleiddiedig_SM_48 | Simplified Tseiniaidd | Simplified Tseiniaidd | zh-CN | 48 kHz | Monolog Sgriptiedig | 2,762 | Simplified Tseiniaidd | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1920 Gwryw 1535 Anhysbys 270 | Cysylltu | |
Tsieinëeg Traddodiadol_SM_48 | Tseiniaidd Traddodiadol | Tseiniaidd Traddodiadol | zh-TW | 48 kHz | Monolog Sgriptiedig | 1,028 | Tseiniaidd Traddodiadol | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1069 Gwryw 262 Anhysbys 3 | Cysylltu | |
Daneg_GC_8 | Daneg | Daneg | da_DK | 8 kHz | Sgwrs Gyffredinol | 372 | Data Sgwrs Gyffredinol Daneg | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 311, Gwryw: 417, Anhysbys: 0 | Cysylltu | |
Daneg_MA_16 | Daneg | Daneg | da_DK | 16 kHz | Sain Cyfryngau | 664 | Data sain Danish Media | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw: 369, Gwryw: 864, Anhysbys: 27 | Cysylltu | |
Daneg_SM_48 | Daneg | Daneg | da-DK | 48 kHz | Monolog Sgriptiedig | 2,579 | Monolog Sgriptiedig Daneg | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad, Daneg o Ddenmarc | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1551 Gwryw 1233 Anhysbys 42 | Cysylltu | |
Saesneg Deep South_CC_8 | De Dwfn Lloegr | De Dwfn Lloegr | en_US | 8 kHz | Canolfan alwadau | 151 | Data canolfan alwadau Saesneg Deep South | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 221 , Gwryw 1004 , Anhysbys 7 | Cysylltu | |
Saesneg Deep South_GC_8 | De Dwfn Lloegr | De Dwfn Lloegr | en_US | 8 kHz | Sgwrs Gyffredinol | 56 | Data Sgwrs Gyffredinol Deep South Saesneg | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 99, Gwryw 31, Anhysbys 0 | Cysylltu | |
Saesneg De Deep_MA_16 | De Dwfn Lloegr | De Dwfn Lloegr | en_US | 16 kHz | Sain Cyfryngau | 266 | Data sain Saesneg Deep South Media | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 204, Gwryw 356, Anhysbys 21 | Cysylltu | |
Almaeneg_CC_8 | Almaeneg | Almaeneg | de-De | 8 kHz | Canolfan alwadau | 64 | Data canolfan alwadau Almaeneg | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Mono | Desktop | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 478 Gwryw 1440 Anhysbys 0 | Cysylltu | ||
Almaeneg_IVR_8 | Almaeneg | Almaeneg | de-De | 8 kHz | IVR | 200 | Data IVR Almaeneg | Dynol i Peiriant. Math o lif IVR lle mae anogwr TTS (ee ”Sut gallaf eich helpu”) ac yna ymateb dynol digymell | Mono | Desktop | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 10115 Gwryw 8750 Anhysbys 0 | Cysylltu | ||
Gwjarati_CC_8 | gujarati | Gwjarati (ar y gweill) | gu_IN | Canolfan alwadau | 60 | Gujarati (Mewn Piblinell) data Canolfan Alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Gwjarati_GC | gujarati | Gwjarati (ar y gweill) | gu_IN | Sgwrs Gyffredinol | 100 | Gujarati (Ar y gweill) Data Sgwrs Gyffredinol | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Gwjarati_MA | gujarati | Gwjarati (ar y gweill) | gu_IN | Sain Cyfryngau | 40 | Gwjarati (Mewn Piblinell) Data sain y cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Hebraeg_Sgwrs Gyffredinol_8 | Hebraeg | Hebraeg | ef_IL | 8 kHz | Sgwrs Gyffredinol | 399 | Data Sgwrs Gyffredinol Hebraeg | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, Hebraeg yn Israel | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 414 , Gwryw 399 , Anhysbys 1 | Cysylltu | |
Hebraeg_MA_16 | Hebraeg | Hebraeg | ef_IL | 16 kHz | Sain Cyfryngau | 427 | Data sain y Cyfryngau Hebraeg | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 361 , Gwryw 513 , Anhysbys 13 | Cysylltu | |
Hindi_MA_16 | hindi | hindi | hi_IN | 16 kHz | Sain Cyfryngau | 219 | Data sain Cyfryngau Hindi | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 83 , Gwryw 309 , Anhysbys 0 | Cysylltu | |
Hindi_SM_48 | hindi | hindi | hi-IN | 48 kHz | Monolog Sgriptiedig | 2,867 | Monolog Sgriptiedig Hindi | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1977 Gwryw 1864 Anhysbys 147 | Cysylltu | |
HIGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Canolfan alwadau | 208 | HIGLISH Data canolfan alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 822, Gwryw 1262 , Anhysbys 0 | Cysylltu | |
HIGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Sain Cyfryngau | 216 | HIGLISH Data sain cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 75, Gwryw 380, Anhysbys 0 | Cysylltu | |
Sbaenaidd_CC_8 | Saesneg Sbaenaidd | Saesneg Sbaenaidd | en_US | 8 kHz | Canolfan alwadau | 212 | Data canolfan alwadau Sbaenaidd | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 822, Gwryw 1262, Anhysbys 0 | Cysylltu | |
Sbaenaidd_MA_16 | Saesneg Sbaenaidd | Saesneg Sbaenaidd | en_US | 16 kHz | Sain Cyfryngau | 155 | Sain Cyfryngau Galwadau Sbaenaidd | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 140, Gwryw 219, Anhysbys 5 | Cysylltu | |
Indoneseg_GC_8 | indonesian | indonesian | mi wnes i | 8 kHz | Sgwrs Gyffredinol | 496 | data Sgwrs Gyffredinol Indonesia | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, Bahasa Indonesian | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 524, Gwryw 454, Anhysbys 2 | Cysylltu | |
Indoneseg_MA_16 | indonesian | indonesian | mi wnes i | 16 kHz | Sain Cyfryngau | 643 | Data sain Cyfryngau Indonesia | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 746, Gwryw 1507, Anhysbys 129 | Cysylltu | |
Gwyddel_GC_8 | Gwyddeleg | Gwyddeleg | cy_IE | 8 kHz | Sgwrs Gyffredinol | 192 | Data Sgwrs Gyffredinol Iwerddon | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 213 , Gwryw 153 , Anhysbys 0 | Cysylltu | |
Japaneaidd_SM_48 | Siapan | Siapan | ja-JP | 48 kHz | Monolog Sgriptiedig | 2,335 | Monolog Sgriptiedig Japaneaidd | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1460 Gwryw 1221 Anhysbys 194 | Cysylltu | |
Kannada_CC_8 | kannada | Kannada (ar y gweill) | kn_IN | Canolfan alwadau | 60 | Kannada (Mewn Piblinell) data Canolfan Alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Kannada_GC | kannada | Kannada (ar y gweill) | kn_IN | Sgwrs Gyffredinol | 100 | Kannada (Ar y gweill) Data Sgwrs Gyffredinol | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Kannada_MA | kannada | Kannada (ar y gweill) | kn_IN | Sain Cyfryngau | 40 | Kannada (Ar y gweill) Data sain y cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Corëeg_CC_8 | Corea | Corea | ko_KR | 8 kHz | Canolfan alwadau | 107 | Data canolfan alwadau Corea | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1086, Gwryw 210, Anhysbys 4 | Cysylltu | |
Corëeg_MA_16 | Corea | Corea | ko_KR | 16 kHz | Sain Cyfryngau | 204 | Data sain cyfryngau Corea | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 70 Gwryw 303, Anhysbys 25 | Cysylltu | |
Corëeg_SM_48 | Corea | Corea | ko-KR | 48 kHz | Monolog Sgriptiedig | 1,955 | Monolog Sgriptio Corea | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1195 Gwryw 1134 Anhysbys 122 | Cysylltu | |
Maleieg_GC_8 | malay | malay | ms_MY | 8 kHz | Sgwrs Gyffredinol | 266 | Data Sgwrs Gyffredinol Maleieg | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Ystod) - 15-60 munud, Maleieg ym Malaysia | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 316, Gwryw 176 , Anhysbys 0 | Cysylltu | |
Maleieg_MA_16 | malay | malay | ms_MY | 16 kHz | Sain Cyfryngau | 344 | Data sain Cyfryngau Malay | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 236, Gwryw 626, Anhysbys 47 | Cysylltu | |
Malayalam_CC_8 | Malayalam | Malayalam (ar y gweill) | ml_IN | Canolfan alwadau | 60 | Malayalam (Mewn Piblinell) Data Canolfan Alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Malayalam_GC | Malayalam | Malayalam (ar y gweill) | ml_IN | Sgwrs Gyffredinol | 100 | Malayalam (Ar y gweill) Data Sgwrs Gyffredinol | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Malayalam_MA | Malayalam | Malayalam (ar y gweill) | ml_IN | Sain Cyfryngau | 40 | Malayalam (Mewn Piblinell) Data sain y cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Marathi_CC_8 | Marathi | Marathi (ar y gweill) | mr_IN | Canolfan alwadau | 60 | Marathi (Ar y gweill) data Canolfan Alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Marathi_GC | Marathi | Marathi (ar y gweill) | mr_IN | Sgwrs Gyffredinol | 100 | Marathi (Ar y gweill) Data Sgwrs Gyffredinol | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Marathi_MA | Marathi | Marathi (ar y gweill) | mr_IN | Sain Cyfryngau | 40 | Marathi (Ar y gweill) Data sain y cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Mecsicanaidd_SM_48 | Sbaeneg (Mecsico) | Sbaeneg (Mecsico) | es-MX | 48 kHz | Monolog Sgriptiedig | 1,492 | Monolog Sgriptiedig Sbaeneg o Fecsico | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1016 Gwryw 1069 Anhysbys 95 | Cysylltu | |
Iseldiroedd_SM_48 | Iseldireg | Iseldireg | NL-NL | 48 kHz | Monolog Sgriptiedig | 1,205 | Monolog Sgriptiedig Iseldireg | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1285 Gwryw 531 Anhysbys 3 | Cysylltu | |
Efrog Newydd Saesneg_CC_8 | Saesneg Efrog Newydd | Saesneg Efrog Newydd | en_US | 8 kHz | Canolfan alwadau | 103 | Data canolfan alwadau Saesneg Efrog Newydd | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 610, Gwryw 532, Anhysbys 0 | Cysylltu | |
Efrog Newydd Saesneg_GC_8 | Saesneg Efrog Newydd | Saesneg Efrog Newydd | en_US | 8 kHz | Sgwrs Gyffredinol | 107 | Data Sgwrs Gyffredinol Saesneg Efrog Newydd | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 118, Gwryw 114, Anhysbys 0 | Cysylltu | |
Efrog Newydd Saesneg_MA_16 | Saesneg Efrog Newydd | Saesneg Efrog Newydd | en_US | 16 kHz | Sain Cyfryngau | 140 | Data sain Cyfryngau Saesneg Efrog Newydd | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 66, Gwryw 230, Anhysbys 11 | Cysylltu | |
Seland Newydd_GC_8 | Saesneg Seland Newydd | Saesneg Seland Newydd | cy_NZ | 8 kHz | Sgwrs Gyffredinol | 148 | Data Sgwrs Gyffredinol Saesneg Seland Newydd | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 167, gwryw 121, Anhysbys 4 | Cysylltu | |
Seland Newydd_MA_16 | Saesneg Seland Newydd | Saesneg Seland Newydd | cy_NZ | 16 kHz | Sain Cyfryngau | 400 | Sain Cyfryngau Saesneg Seland Newydd | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 367, gwryw 678, Anhysbys 26 | Cysylltu | |
Oriya_CC_8 | Oriya | Oriya (ar y gweill) | neu_IN | Canolfan alwadau | 60 | Data Canolfan Alwadau Oriya (Mewn Piblinell). | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Oriya_GC | Oriya | Oriya (ar y gweill) | neu_IN | Sgwrs Gyffredinol | 100 | Data Sgwrs Gyffredinol Oriya (Ar y gweill). | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Oriya_MA | Oriya | Oriya (ar y gweill) | neu_IN | Sain Cyfryngau | 40 | Oriya (Mewn Piblinell) Data sain y cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Pwyleg_MA_16 | Pwyleg | Pwyleg | pl_PL | 16 kHz | Sain Cyfryngau | 269 | Sain Cyfryngau Pwyleg | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 173 Gwryw 354 Anhysbys 6 | Cysylltu | |
Pwyleg Gwlad Pwyl_SM_48 | Pwyleg (Gwlad Pwyl) | Pwyleg (Gwlad Pwyl) | pl-PL | 48 kHz | Monolog Sgriptiedig | 1,482 | Pwyleg Gwlad Pwyl - Monolog Sgriptiedig | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1324 Gwryw 701 Anhysbys 24 | Cysylltu | |
Pwnjabeg_CC_8 | Punjabi | Pwnjabi (ar y gweill) | Punjabi | Canolfan alwadau | 60 | Pwnjabi (Mewn Piblinell) data Canolfan Alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Pwnjabi_GC | Punjabi | Pwnjabi (ar y gweill) | Punjabi | Sgwrs Gyffredinol | 100 | Pwnjabi (Ar y gweill) Data Sgwrs Gyffredinol | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Pwnjabi_MA | Punjabi | Pwnjabi (ar y gweill) | Punjabi | Sain Cyfryngau | 40 | Pwnjabi (Mewn Piblinell) Data sain y cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Rwsieg_SM_48 | Rwsieg | Rwsieg | ru-RU | 48 kHz | Monolog Sgriptiedig | 2,398 | Monolog Sgriptiedig Rwsieg | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1689 Gwryw 1937 Anhysbys 214 | Cysylltu | |
Albanaidd_GC_8 | Albanaidd (Acen Saesneg) | Albanaidd (Acen Saesneg) | cy_AB | 8 kHz | Sgwrs Gyffredinol | 292 | Data Sgwrs Gyffredinol yr Alban | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 285 , Gwryw 260 , Anhysbys 3 | Cysylltu | |
Singapôr_CC_8 | Saesneg Singapôr | Saesneg Singapôr | cy_SG | 8 kHz | Canolfan alwadau | 218 | Data Canolfan Alwadau Singapore | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 2139 , Gwryw 884 , Anhysbys 21 | Cysylltu | |
Singapôr_MA_16 | Saesneg Singapôr | Saesneg Singapôr | cy_SG | 16 kHz | Sain Cyfryngau | 247 | Data sain Singapore Media | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 160, Gwryw 455, Anhysbys 37 | Cysylltu | |
Saesneg De Affrica_CC_8 | Saesneg De Affrica | Saesneg De Affrica | cy_ZA | 8 kHz | Canolfan alwadau | 261 | Data Canolfan Alwadau Saesneg De Affrica | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1274 , Gwryw 935 , Anhysbys 1 | Cysylltu | |
Saesneg De Affrica_MA_16 | Saesneg De Affrica | Saesneg De Affrica | cy_ZA | 16 kHz | Sain Cyfryngau | 251 | Data sain Cyfryngau Saesneg De Affrica | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 235, Gwryw 432, Anhysbys 36 | Cysylltu | |
Swahili_CC_8 | swahili | swahili | sw_KE | 8 kHz | Canolfan alwadau | 230 | Data Canolfan Alwadau Swahili | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 611, Gwryw 833, Anhysbys 0 | Cysylltu | |
Swahili_MA_16 | swahili | swahili | sw_KE | 16 kHz | Sain Cyfryngau | 265 | Data sain cyfryngau Swahili | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 118, Gwryw 493, Anhysbys 25 | Cysylltu | |
Swedeg_CC_8 | Swedeg | Swedeg | sv_SE | 8 kHz | Canolfan alwadau | 250 | Data Canolfan Alwadau Sweden | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1581, gwryw 727, Anhysbys 2 | Cysylltu | |
Swedeg_MA_16 | Swedeg | Swedeg | sv_SE | 16 kHz | Sain Cyfryngau | 278 | Swedish Media data sain | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 195, gwryw 500, Anhysbys 21 | Cysylltu | |
Tamil_CC_8 | tamil | Tamil (ar y gweill) | ta_IN | Canolfan alwadau | 60 | Tamil (Ar y gweill) data Canolfan Alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Tamil_GC | tamil | Tamil (ar y gweill) | ta_IN | Sgwrs Gyffredinol | 100 | Tamil (Ar y gweill) Data Sgwrs Gyffredinol | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Tamil_MA | tamil | Tamil (ar y gweill) | ta_IN | Sain Cyfryngau | 40 | Tamil (Ar y gweill) Data sain y cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Sgwrs Gyffredinol | 553 | Data Sgwrs Gyffredinol Telugu | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 574 , Gwryw 564 , Anhysbys 0 | Cysylltu | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Sain Cyfryngau | 648 | Data sain Cyfryngau Telugu | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 207, Gwryw 963, Anhysbys 2 | Cysylltu | |
Telugu_CC_8 | telugu | Telugu (ar y gweill) | te_IN | Canolfan alwadau | 30 | Telugu (Mewn Piblinell) Data Canolfan Alwadau | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Telugu_GC | telugu | Telugu (ar y gweill) | te_IN | Sgwrs Gyffredinol | 50 | Telugu (Ar y gweill) Data Sgwrs Gyffredinol | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Telugu_MA | telugu | Telugu (ar y gweill) | te_IN | Sain Cyfryngau | 20 | Telugu (Mewn Piblinell) Data sain y cyfryngau | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Cysylltu | ||||
Thai_GC_8 | thai | thai | th_TH | 8 kHz | Sgwrs Gyffredinol | 183 | Sgwrs Gyffredinol Thai | Sgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Ystod) - 15-60 munud, Cywair anffurfiol a ddefnyddir rhwng ffrindiau | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 338, Gwryw 96, Anhysbys 8 | Cysylltu | |
Thai_MA_8 | thai | thai | th_TH | 16 kHz | Sain Cyfryngau | 173 | Sain Cyfryngau Thai | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 143, Gwryw 502, Anhysbys 26 | Cysylltu | |
Twrci Twrci_SM_48 | Twrci Twrci | Twrci Twrci | tr-TR | 48 kHz | Monolog Sgriptiedig | 2,027 | Twrci Twrci | Recordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad | Mono | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 1561 Gwryw 1241 Anhysbys 31 | Cysylltu | |
Fietnameg_GC_8 | Fietnameg | Fietnameg | vi_VN | 8 kHz | Sgwrs Gyffredinol | 295 | Data Sgwrs Gyffredinol Fietnam | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, Gogledd (ee, Hanoi), Canol, a De (ee, Dinas Ho Chi Minh). | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Menyw 400, gwryw 380, Anhysbys 2 | Cysylltu | |
Fietnameg_MA_16 | Fietnameg | Fietnameg | vi_VN | 16 kHz | Sain Cyfryngau | 257 | Data sain Cyfryngau Fietnam | Trwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munud | Mono | Cyrchu Gwe | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Menyw 249, gwryw 200, Anhysbys 45 | Cysylltu | |
Cymraeg_GC_8 | Cymraeg (Acen Saesneg) | Cymraeg (Acen Saesneg) | cy_WL | 8 kHz | Sgwrs Gyffredinol | 278 | Data Sgwrs Gyffredinol Gymraeg | Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, | Ddeuol | Desktop | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Benyw 270, Gwryw 324, Anhysbys 0 | Cysylltu | |
DU Saesneg_WW_16 | Saesneg y DU | Saesneg y DU | cy_uk | 16 kHz | Wake Word | 200 Siaradwr | Wake Word Saesneg DU | casglu data ymadroddion allweddol
| 1 sianel | Symudol App | 5.0 | wav | .json | ASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith | Rhyw: 50% gwrywaidd, 50% benywaidd, +/- 10%. | Cysylltu |
Gwasanaethau a Gynigir
Nid yw casglu data sain arbenigol yn ymarferol ar gyfer setiau AI cynhwysfawr. Yn Shaip, gallwch hyd yn oed ystyried y gwasanaethau canlynol i wneud modelau mewn ffordd yn fwy eang na'r arfer:
Casglu Data Testun
Gwasanaethau
Gwir werth gwasanaethau casglu data gwybyddol Shaip yw ei fod yn rhoi’r allwedd i sefydliadau ddatgloi gwybodaeth feirniadol a geir o fewn data anstrwythuredig
Gwasanaethau Casglu Data Delwedd
Gwnewch yn siŵr bod eich model gweledigaeth gyfrifiadurol yn nodi pob delwedd yn gywir, er mwyn hyfforddi modelau AI nesaf-gen y dyfodol yn ddi-dor
Gwasanaethau Casglu Data Fideo
Nawr canolbwyntiwch ar weledigaeth gyfrifiadurol ynghyd â NLP ar gyfer hyfforddi'ch modelau i nodi gwrthrychau, unigolion, ataliadau ac elfennau gweledol eraill i berffeithrwydd
Adnoddau a Argymhellir
Cynnig
Anodi Sain ar gyfer AIs Deallus
Mae gwasanaethau anodi sain wedi bod yn un o gryfderau Shaip ers y dechrau. Datblygu, hyfforddi a gwella AI sgyrsiol, chatbots a pheiriannau adnabod lleferydd gyda'n gwasanaethau anodi sain o'r radd flaenaf.
Canllaw Prynwr
Canllaw i Brynwyr: Canllaw Cyflawn i AI Sgyrsiol
Mae'r chatbot y buoch chi'n sgwrsio ag ef yn rhedeg ar system AI sgyrsiol ddatblygedig sy'n cael ei hyfforddi, ei phrofi a'i hadeiladu gan ddefnyddio tunnell o setiau data adnabod lleferydd.
Catalog Data
Catalog Data Lleferydd Oddi ar y Silff a Thrwyddedu
Mae amrywiaeth eang o gymwysiadau cyffredin ar gyfer data lleferydd mewn prosiectau AI. Rydym yn cynnig llawer iawn o ddata o ansawdd uchel i chi yn barod ar gyfer eich adnabod llais.
Eisiau adeiladu eich set ddata sain eich hun?
Cysylltwch â'n harbenigwr casglu data lleferydd mewnol i sefydlu ystorfa sain sy'n gweddu orau i'ch gofynion
Cwestiynau a Ofynnir yn Aml (COA)
Mae Casglu Data Lleferydd ar gyfer Model ML yn cyfeirio at y broses o gasglu recordiadau sain o iaith lafar. Mae'r casgliad hwn yn helpu i hyfforddi a mireinio algorithmau dysgu peirianyddol, yn enwedig y rhai sy'n canolbwyntio ar ddeall a phrosesu lleisiau dynol.
Wrth anelu at gasglu data sain ar gyfer Adnabod Lleferydd Awtomatig (ASR), dylech ddechrau trwy ddiffinio anghenion penodol eich prosiect, gan gynnwys yr iaith a ddymunir, yr acen, a'r math o leferydd. Ar ôl gosod y paramedrau hyn, sicrhewch eich bod yn cael yr holl ganiatâd angenrheidiol i barchu preifatrwydd defnyddwyr. Yna, defnyddiwch ddyfeisiau neu feddalwedd recordio priodol i ddal samplau sain clir. Dylai pob recordiad gael ei anodi'n fanwl gyda'i drawsgrifiad neu fetadata perthnasol arall a'i storio'n systematig er mwyn cael mynediad diymdrech.
Mae set ddata lleferydd mewn dysgu peirianyddol yn hollbwysig ar gyfer hyfforddi, profi a dilysu modelau sydd wedi'u teilwra i adnabod, trawsgrifio neu ddehongli iaith lafar. Mae setiau data o'r fath yn paratoi'r ffordd ar gyfer myrdd o gymwysiadau, o gynorthwywyr llais a gwasanaethau trawsgrifio i fiometreg llais.
Er mwyn casglu data manwl gywir o ieithoedd ac acenion amrywiol, mae cydweithio â siaradwyr brodorol o'r cefndiroedd ieithyddol dymunol yn hanfodol. Anelwch at sampl amrywiol a chynrychioliadol i gwmpasu sbectrwm eang o arlliwiau demograffig. Defnyddio offer recordio safonol mewn amgylcheddau unffurf i sicrhau cysondeb sain. Ac yn bwysig, anodwch bob darn o ddata gyda thrawsgrifiadau manwl a metadata, gan ddynodi'r iaith a'r acen benodol.