Gwasanaethau Casglu Data Lleferydd yr ymddiriedir ynddynt fwyaf ar gyfer eich AI

Hyfforddwch eich modelau NLP, VAs, prototeipiau TTS, a mwy gyda data sgwrsio o safon, gyda'n gwasanaethau casglu data sain a lleferydd

Casglu data sain

Darganfod piblinellau data sain heb dagfeydd

Cleientiaid dan Sylw

Gwasanaethau Casglu Data Sain / Llais Proffesiynol

Unrhyw bwnc. Unrhyw senario.

Yn Shaip, ein harbenigedd yw creu setiau data lleferydd o ansawdd uchel sydd wedi'u cynllunio ar gyfer gofynion AI/ML amrywiol. Rydym yn cynnig ystod eang o ieithoedd ac yn cofnodi mewn lleoliadau amrywiol gan wneud ein setiau data yn gynhwysfawr ac yn addasadwy. OMae eich ffocws ar fwydo modelau gyda'r swm uchaf o ddata lleferydd wedi'i deilwra, yn yr amser lleiaf posibl. Gyda ni ar fwrdd y llong, gallwch ddisgwyl: 

Casgliad lleferydd
  • Curadu data sain / llais amlieithog o ansawdd uchel i wella cywirdeb
  • Lefel uchaf posibl o benodolrwydd parth i target senario amrywiol setup
  •  Graddiwch eich model ML i weddu i ddemograffeg a fertigol amrywiol
  • Amgylcheddau Cofnodi: Ansawdd Stiwdio, yn cynnwys sain grisial-glir gydag ychydig iawn o sŵn cefndir, a Amgylcheddau Naturiol, lle mae recordiadau'n ymgorffori synau amgylchynol i ddynwared sefyllfaoedd yn y byd go iawn.

100 +

gwledydd

55K +

Oriau o Ddata Lleferydd

250 +

prosiectau

60 +

Ieithoedd (100+ o dafodieithoedd)

8 / 16 / 44 / 48 kHz

Cyfradd Samplu

Ein Harbenigedd

Alinio Data Sain i Fodelau NLP Doethach

Mae Shaip yn cynnig gwasanaethau casglu data lleferydd / sain o'r dechrau i'r diwedd mewn dros 100+ o ieithoedd i alluogi technolegau sy'n galluogi llais i ddarparu ar gyfer set amrywiol o gynulleidfaoedd ledled y byd. Gallwn weithio ar brosiectau o unrhyw gwmpas a maint; o drwyddedu setiau data sain presennol oddi ar y silff, i reoli casglu data sain wedi'i deilwra, i drawsgrifio sain ac anodi. Ni waeth pa mor fawr yw'ch prosiect casglu data lleferydd, gallwn addasu'r gwasanaethau casglu sain i weddu i'ch anghenion i adeiladu setiau data NLP o ansawdd uchel sy'n targedu tafodieithoedd, tonau ac ieithoedd. Dewiswch o'n hystod eang o setiau data lleferydd ac adnoddau casglu data sain, ar gyfer setiau deallus sy'n galluogi llais.

Araith monolog

Casgliad Lleferydd Monolog

Mae'n canolbwyntio ar brosesu lleferydd gan un siaradwr. Defnyddiwch anogwyr wedi'u sgriptio i fwydo i mewn i ffeiliau sain un sianel, gan sicrhau cipio patrymau lleferydd unigryw, tonau a naws sy'n benodol i'r unigolyn hwnnw.

Araith dialog

Araith Deialog
Dull Casglu

Rhyngweithio dau berson, gan ailadrodd sgyrsiau a deialogau byd go iawn gydag amlygiad amlieithog trwy ffeiliau sianel ddeuol ac adnoddau wedi'u trawsgrifio.

Sgyrsiau aml-blaid

Grŵp / Muti-parti
Sgwrs

Trafodaethau aml-berson, gan ddal deinameg grŵp, gorgyffwrdd, a thonau amrywiol er mwyn hyfforddi modelau lleferydd yn gywir.

Iaith naturiol

Casgliad Iaith Naturiol

Hyfforddi AIs i nodi ymadroddion neu ddeffro geiriau ag ystyron tebyg gan ddefnyddio ymadroddion amrywiol, cyfoethog a dilys ar gyfer prosesu a deall iaith naturiol uwch.

Araith acwstig

Data Acwstig
Dull Casglu

Gallwn recordio data sain o ansawdd stiwdio yn broffesiynol, boed yn fwytai, swyddfeydd, neu gartrefi neu o amgylcheddau ac ieithoedd amrywiol, gan gwmpasu ystod acwstig ehangach (setiau Data Sain Cynhwysfawr).

Adnabod lleferydd yn awtomatig

Cydnabod Lleferydd yn Awtomatig (ASR)

Gwella cywirdeb eich systemau adnabod llais awtomatig (ASR) trwy gael mynediad at setiau data lleferydd/sain amrywiol o'r radd flaenaf, o amrywiaeth eang o ddemograffeg.

Iaith naturiol

Data Hyfforddiant Lleferydd/Sain amlieithog

Mae ein gweithwyr iaith proffesiynol medrus, ar draws y byd yn cynnig data sain/lleferydd amlieithog mewn ieithoedd a thafodieithoedd amrywiol. Mae'r ymdrech hon yn meithrin cyfathrebu byd-eang ac yn pontio rhwystrau iaith, gan gyfrannu at atebion AI mwy cynhwysol ac effeithiol.

Cynorthwywyr rhithwir digidol

Testun-i-Araith
(TTS)

Adeiladu model amlieithog testun-i-leferydd (TTS) gyda chymorth ein gweithlu byd-eang, sy'n eich helpu i gasglu data lleferydd mewn 150+ o ieithoedd a thafodieithoedd i wella'ch modelau AI o reolaethau yn y car i chatbots ac atebion dysgu gydag uchel- data sain o ansawdd.

Recordiadau canolfan alwadau

Ffoniwch y Ganolfan
Recordiadau

Cyfnewidiadau gwirioneddol rhwng asiantau a chleientiaid, gan gefnogi nifer o ieithoedd fel Sbaeneg, Almaeneg, Saesneg Americanaidd, Bengaleg, Japaneaidd, Tsieinëeg a Hindi.

Straeon Llwyddiant

Setiau data AI sgwrsio gyda dros 3k awr o ddata ar draws 8 iaith

Gan edrych i adeiladu platfform amlieithog ar gyfer ieithoedd Indiaidd, bu'r cleient yn gweithio mewn partneriaeth â Shaip i gasglu, segmentu a thrawsgrifio setiau data mawr mewn sawl iaith Indiaidd. Byddai hyn yn helpu i ddatblygu modelau lleferydd effeithiol a allai bweru platfform newydd arloesol y cleient.

Problem: Dros 3,000 awr o ddata sain wedi'i gasglu mewn 8 iaith Indiaidd, wedi'i segmentu a'i drawsgrifio i ddatblygu adnabyddiaeth lleferydd awtomatig.

Ateb: Fe wnaethom ddarparu casglu data, segmentu, trawsgrifio, a danfon ffeiliau JSON gyda metadata. Casglwyd 3000 awr o ddata sain mewn 8 iaith Indiaidd ar raddfa fawr ar gyfer prosiect technoleg lleferydd y cleient.

Astudiaeth achos casglu data lleferydd

Rhesymau dros ddewis Shaip fel eich Partner Casglu Data Lleferydd Dibynadwy

Pobl

Pobl

Timau pwrpasol a hyfforddedig:

  • 30,000+ o gydweithredwyr ar gyfer Creu Data, Labelu a SA
  • Tîm Rheoli Prosiect Credentialed
  • Tîm Datblygu Cynnyrch Profiadol
  • Tîm Cyrchu ac Ymuno Pyllau Talent
Proses

Proses

Sicrheir effeithlonrwydd proses uchaf gyda:

  • Proses Porth Llwyfan 6 Sigma cadarn
  • Tîm ymroddedig o 6 gwregys du Sigma - Perchnogion prosesau allweddol a chydymffurfiaeth ag ansawdd
  • Dolen Gwelliant ac Adborth Parhaus
Llwyfan

Llwyfan

Mae'r platfform patent yn cynnig buddion:

  • Llwyfan o'r dechrau i'r diwedd ar y we
  • Ansawdd Impeccable
  • TAT cyflymach
  • Dosbarthu Di-dor

Setiau Data Lleferydd / Sain Oddi ar y Silff

manylionSet Ddata IaithCyfradd SamplMath Set DdataCyfanswm Oriau SainDisgrifiad ByrDisgrifiad Set DdataSianel SainLlwyfan RecordioWER (%)Fformat SainFformat TrawsgrifioDefnyddiwch AchosNifer y SiaradwyrCTA
lleferyddcy_US_CC_8Cynhenid ​​Americanaidd AffricanaiddCynhenid ​​Americanaidd Affricanaidden_US8 kHzCanolfan alwadau211Data canolfan alwadau brodorol Affricanaidd-AmericanaiddSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 612, Gwryw: 1242, ac Anhysbys: 12
lleferyddcy_US_MA_16Cynhenid ​​Americanaidd AffricanaiddCynhenid ​​Americanaidd Affricanaidden_US16 kHzSain Cyfryngau154Data Cyfryngau brodorol Affricanaidd-AmericanaiddTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 151, Gwryw: 150, ac Anhysbys: 10
lleferyddAffricaneg_GC_8AffricanegAffricanegaf_ZA8 kHzSgwrs Gyffredinol368Data Sgwrs Gyffredinol AffricaSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Ystod) - 15-60 munud, Afrikaans a siaredir yn AffricaDdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 502, Gwryw: 390, ac Anhysbys: 2
lleferyddAffricaneg_MA_16AffricanegAffricanegaf_ZA16 kHzSain Cyfryngau658Ffeiliau Cyfryngau AffricaTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 750, Gwryw: 1278, ac Anhysbys: 52
lleferyddArabeg_GC_8ArabegArabegar_AE8 kHzSgwrs Gyffredinol292Data Sgwrs Gyffredinol ArabegSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Ystod) - 15-60 munud, Arabeg o wledydd y GwlffDdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 171, Gwryw: 534, ac Anhysbys: 1
lleferyddArabeg_SM_48ArabegArabegar-SA48 kHzMonolog Sgriptiedig1,947Monolog Sgriptiedig ArabegRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 838 Gwryw 1209 Anhysbys 78
lleferyddAsameg_CC_8AsamegAsameg (ar y gweill) felCanolfan alwadau60Asameg (Mewn Piblinell) data Canolfan AlwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddAsameg_GCAsamegAsameg (ar y gweill) felSgwrs Gyffredinol100Asamese (Ar y gweill) Data Sgwrs GyffredinolSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddAsameg_MAAsamegAsameg (ar y gweill) felSain Cyfryngau40Asameg (Mewn Piblinell) Data sain cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddBengali_CC_8bengaliBengaleg (ar y gweill) bn_INCanolfan alwadau60Bengali (Mewn Piblinell) data Canolfan AlwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddBengali_GCbengaliBengaleg (ar y gweill) bn_INSgwrs Gyffredinol100Bengali (Ar y gweill) Data Sgwrs GyffredinolSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddBengali_MAbengaliBengaleg (ar y gweill) bn_INSain Cyfryngau40Bengali (Mewn Pib) Data sain y cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddBoston_CC_8Saesneg BostonSaesneg Bostonen_US8 kHzCanolfan alwadau177Data canolfan alwadau BostonSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 605, Gwryw: 711, ac Anhysbys: 0
lleferyddBoston_GC_8Saesneg BostonSaesneg Bostonen_US8 kHzSgwrs Gyffredinol32Data Sgwrs Gyffredinol BostonSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 53, Gwryw: 83, ac Anhysbys: 0
lleferyddBoston_MA_16Saesneg BostonSaesneg Bostonen_US16 kHzSain Cyfryngau93Data sain Boston MediaTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 43, Gwryw: 181, ac Anhysbys: 2
lleferyddCanada_SM_48Ffrangeg CanadaFfrangeg Canadafr-CA48 kHzMonolog Sgriptiedig1,222Ffrangeg CanadaRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 974 Gwryw 631 Anhysbys 1
lleferyddTsieinëeg_CC_8Saesneg TsieineaiddSaesneg Tsieineaidden_US8 kHzCanolfan alwadau169Data canolfan alwadau TsieineaiddSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 1790, Gwryw: 523 ac Anhysbys: 13
lleferyddTsieinëeg_MA_16Saesneg TsieineaiddSaesneg Tsieineaidden_US16 kHzSain Cyfryngau249Data sain Cyfryngau TsieineaiddTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 126, Gwryw: 346 ac Anhysbys: 6
lleferyddTsieinëeg Symleiddiedig_SM_48Simplified TseiniaiddSimplified Tseiniaiddzh-CN48 kHzMonolog Sgriptiedig2,762Simplified TseiniaiddRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1920 Gwryw 1535 Anhysbys 270
lleferyddTsieinëeg Traddodiadol_SM_48Tseiniaidd TraddodiadolTseiniaidd Traddodiadolzh-TW48 kHzMonolog Sgriptiedig1,028Tseiniaidd TraddodiadolRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1069 Gwryw 262 Anhysbys 3
lleferyddDaneg_GC_8DanegDanegda_DK8 kHzSgwrs Gyffredinol372Data Sgwrs Gyffredinol DanegSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 311, Gwryw: 417, Anhysbys: 0
lleferyddDaneg_MA_16DanegDanegda_DK16 kHzSain Cyfryngau664Data sain Danish MediaTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw: 369, Gwryw: 864, Anhysbys: 27
lleferyddDaneg_SM_48DanegDanegda-DK48 kHzMonolog Sgriptiedig2,579Monolog Sgriptiedig DanegRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliad, Daneg o DdenmarcMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1551 Gwryw 1233 Anhysbys 42
lleferyddSaesneg Deep South_CC_8De Dwfn LloegrDe Dwfn Lloegren_US8 kHzCanolfan alwadau151Data canolfan alwadau Saesneg Deep SouthSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 221 , Gwryw 1004 , Anhysbys 7
lleferyddSaesneg Deep South_GC_8De Dwfn LloegrDe Dwfn Lloegren_US8 kHzSgwrs Gyffredinol56Data Sgwrs Gyffredinol Deep South SaesnegSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 99, Gwryw 31, Anhysbys 0
lleferyddSaesneg De Deep_MA_16De Dwfn LloegrDe Dwfn Lloegren_US16 kHzSain Cyfryngau266Data sain Saesneg Deep South MediaTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 204, Gwryw 356, Anhysbys 21
lleferyddAlmaeneg_CC_8AlmaenegAlmaenegde-De8 kHzCanolfan alwadau64Data canolfan alwadau Almaeneg Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,MonoDesktopwav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 478 Gwryw 1440 Anhysbys 0
lleferyddAlmaeneg_IVR_8AlmaenegAlmaenegde-De8 kHz IVR200Data IVR AlmaenegDynol i Peiriant. Math o lif IVR lle mae anogwr TTS (ee ”Sut gallaf eich helpu”) ac yna ymateb dynol digymellMonoDesktopwav .jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith Benyw 10115 Gwryw 8750 Anhysbys 0
lleferyddGwjarati_CC_8gujaratiGwjarati (ar y gweill) gu_INCanolfan alwadau60Gujarati (Mewn Piblinell) data Canolfan AlwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddGwjarati_GCgujaratiGwjarati (ar y gweill) gu_INSgwrs Gyffredinol100Gujarati (Ar y gweill) Data Sgwrs GyffredinolSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddGwjarati_MAgujaratiGwjarati (ar y gweill) gu_INSain Cyfryngau40Gwjarati (Mewn Piblinell) Data sain y cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddHebraeg_Sgwrs Gyffredinol_8HebraegHebraegef_IL8 kHzSgwrs Gyffredinol399Data Sgwrs Gyffredinol HebraegSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, Hebraeg yn IsraelDdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 414 , Gwryw 399 , Anhysbys 1
lleferyddHebraeg_MA_16HebraegHebraegef_IL16 kHzSain Cyfryngau427Data sain y Cyfryngau HebraegTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 361 , Gwryw 513 , Anhysbys 13
lleferyddHindi_MA_16hindihindihi_IN16 kHzSain Cyfryngau219Data sain Cyfryngau HindiTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 83 , Gwryw 309 , Anhysbys 0
lleferyddHindi_SM_48hindihindihi-IN48 kHzMonolog Sgriptiedig2,867Monolog Sgriptiedig HindiRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1977 Gwryw 1864 Anhysbys 147
lleferyddHIGLISH_CC_8HinglishHinglishhg_IN8 kHzCanolfan alwadau208HIGLISH Data canolfan alwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 822, Gwryw 1262 , Anhysbys 0
lleferyddHIGLISH_MA_16HinglishHinglishhg_IN16 kHzSain Cyfryngau216HIGLISH Data sain cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 75, Gwryw 380, Anhysbys 0
lleferyddSbaenaidd_CC_8Saesneg SbaenaiddSaesneg Sbaenaidden_US8 kHzCanolfan alwadau212Data canolfan alwadau SbaenaiddSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 822, Gwryw 1262, Anhysbys 0
lleferyddSbaenaidd_MA_16Saesneg SbaenaiddSaesneg Sbaenaidden_US16 kHzSain Cyfryngau155Sain Cyfryngau Galwadau SbaenaiddTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 140, Gwryw 219, Anhysbys 5
lleferyddIndoneseg_GC_8indonesianindonesianmi wnes i8 kHzSgwrs Gyffredinol496data Sgwrs Gyffredinol IndonesiaSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, Bahasa IndonesianDdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 524, Gwryw 454, Anhysbys 2
lleferyddIndoneseg_MA_16indonesianindonesianmi wnes i16 kHzSain Cyfryngau643Data sain Cyfryngau IndonesiaTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 746, Gwryw 1507, Anhysbys 129
lleferyddGwyddel_GC_8GwyddelegGwyddelegcy_IE8 kHzSgwrs Gyffredinol192Data Sgwrs Gyffredinol IwerddonSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 213 , Gwryw 153 , Anhysbys 0
lleferyddJapaneaidd_SM_48SiapanSiapanja-JP48 kHzMonolog Sgriptiedig2,335Monolog Sgriptiedig JapaneaiddRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1460 Gwryw 1221 Anhysbys 194
lleferyddKannada_CC_8kannadaKannada (ar y gweill) kn_INCanolfan alwadau60Kannada (Mewn Piblinell) data Canolfan AlwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddKannada_GCkannadaKannada (ar y gweill) kn_INSgwrs Gyffredinol100Kannada (Ar y gweill) Data Sgwrs GyffredinolSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddKannada_MAkannadaKannada (ar y gweill) kn_INSain Cyfryngau40Kannada (Ar y gweill) Data sain y cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddCorëeg_CC_8CoreaCoreako_KR8 kHzCanolfan alwadau107Data canolfan alwadau CoreaSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1086, Gwryw 210, Anhysbys 4
lleferyddCorëeg_MA_16CoreaCoreako_KR16 kHzSain Cyfryngau204Data sain cyfryngau CoreaTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 70 Gwryw 303, Anhysbys 25
lleferyddCorëeg_SM_48CoreaCoreako-KR48 kHzMonolog Sgriptiedig1,955Monolog Sgriptio CoreaRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1195 Gwryw 1134 Anhysbys 122
lleferyddMaleieg_GC_8malaymalayms_MY8 kHzSgwrs Gyffredinol266Data Sgwrs Gyffredinol MaleiegSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Ystod) - 15-60 munud, Maleieg ym MalaysiaDdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 316, Gwryw 176 , Anhysbys 0
lleferyddMaleieg_MA_16malaymalayms_MY16 kHzSain Cyfryngau344Data sain Cyfryngau MalayTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 236, Gwryw 626, Anhysbys 47
lleferyddMalayalam_CC_8MalayalamMalayalam (ar y gweill) ml_INCanolfan alwadau60Malayalam (Mewn Piblinell) Data Canolfan AlwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddMalayalam_GCMalayalamMalayalam (ar y gweill) ml_INSgwrs Gyffredinol100Malayalam (Ar y gweill) Data Sgwrs GyffredinolSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddMalayalam_MAMalayalamMalayalam (ar y gweill) ml_INSain Cyfryngau40Malayalam (Mewn Piblinell) Data sain y cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddMarathi_CC_8MarathiMarathi (ar y gweill) mr_INCanolfan alwadau60Marathi (Ar y gweill) data Canolfan AlwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddMarathi_GCMarathiMarathi (ar y gweill) mr_INSgwrs Gyffredinol100Marathi (Ar y gweill) Data Sgwrs GyffredinolSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddMarathi_MAMarathiMarathi (ar y gweill) mr_INSain Cyfryngau40Marathi (Ar y gweill) Data sain y cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddMecsicanaidd_SM_48Sbaeneg (Mecsico)Sbaeneg (Mecsico)es-MX48 kHzMonolog Sgriptiedig1,492Monolog Sgriptiedig Sbaeneg o FecsicoRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1016 Gwryw 1069 Anhysbys 95
lleferyddIseldiroedd_SM_48IseldiregIseldiregNL-NL48 kHzMonolog Sgriptiedig1,205Monolog Sgriptiedig IseldiregRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1285 Gwryw 531 Anhysbys 3
lleferyddEfrog Newydd Saesneg_CC_8Saesneg Efrog NewyddSaesneg Efrog Newydden_US8 kHzCanolfan alwadau103Data canolfan alwadau Saesneg Efrog NewyddSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 610, Gwryw 532, Anhysbys 0
lleferyddEfrog Newydd Saesneg_GC_8Saesneg Efrog NewyddSaesneg Efrog Newydden_US8 kHzSgwrs Gyffredinol107Data Sgwrs Gyffredinol Saesneg Efrog NewyddSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 118, Gwryw 114, Anhysbys 0
lleferyddEfrog Newydd Saesneg_MA_16Saesneg Efrog NewyddSaesneg Efrog Newydden_US16 kHzSain Cyfryngau140Data sain Cyfryngau Saesneg Efrog NewyddTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 66, Gwryw 230, Anhysbys 11
lleferyddSeland Newydd_GC_8Saesneg Seland Newydd Saesneg Seland Newydd cy_NZ8 kHzSgwrs Gyffredinol148Data Sgwrs Gyffredinol Saesneg Seland NewyddSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 167, gwryw 121, Anhysbys 4
lleferyddSeland Newydd_MA_16Saesneg Seland Newydd Saesneg Seland Newydd cy_NZ16 kHzSain Cyfryngau400Sain Cyfryngau Saesneg Seland NewyddTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 367, gwryw 678, Anhysbys 26
lleferyddOriya_CC_8OriyaOriya (ar y gweill) neu_INCanolfan alwadau60Data Canolfan Alwadau Oriya (Mewn Piblinell).Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddOriya_GCOriyaOriya (ar y gweill) neu_INSgwrs Gyffredinol100Data Sgwrs Gyffredinol Oriya (Ar y gweill).Sgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddOriya_MAOriyaOriya (ar y gweill) neu_INSain Cyfryngau40Oriya (Mewn Piblinell) Data sain y cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddPwyleg_MA_16PwylegPwylegpl_PL16 kHzSain Cyfryngau269Sain Cyfryngau PwylegTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 173 Gwryw 354 Anhysbys 6
lleferyddPwyleg Gwlad Pwyl_SM_48Pwyleg (Gwlad Pwyl)Pwyleg (Gwlad Pwyl)pl-PL48 kHzMonolog Sgriptiedig1,482Pwyleg Gwlad Pwyl - Monolog SgriptiedigRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1324 Gwryw 701 Anhysbys 24
lleferyddPwnjabeg_CC_8PunjabiPwnjabi (ar y gweill) PunjabiCanolfan alwadau60Pwnjabi (Mewn Piblinell) data Canolfan AlwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddPwnjabi_GCPunjabiPwnjabi (ar y gweill) PunjabiSgwrs Gyffredinol100Pwnjabi (Ar y gweill) Data Sgwrs GyffredinolSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddPwnjabi_MAPunjabiPwnjabi (ar y gweill) Punjabi Sain Cyfryngau40Pwnjabi (Mewn Piblinell) Data sain y cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddRwsieg_SM_48RwsiegRwsiegru-RU48 kHzMonolog Sgriptiedig2,398Monolog Sgriptiedig RwsiegRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1689 Gwryw 1937 Anhysbys 214
lleferyddAlbanaidd_GC_8Albanaidd (Acen Saesneg)Albanaidd (Acen Saesneg)cy_AB8 kHzSgwrs Gyffredinol292Data Sgwrs Gyffredinol yr AlbanSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 285 , Gwryw 260 , Anhysbys 3
lleferyddSingapôr_CC_8Saesneg SingapôrSaesneg Singapôrcy_SG8 kHzCanolfan alwadau218Data Canolfan Alwadau SingaporeSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 2139 , Gwryw 884 , Anhysbys 21
lleferyddSingapôr_MA_16Saesneg SingapôrSaesneg Singapôrcy_SG16 kHzSain Cyfryngau247Data sain Singapore MediaTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 160, Gwryw 455, Anhysbys 37
lleferyddSaesneg De Affrica_CC_8Saesneg De AffricaSaesneg De Affricacy_ZA8 kHzCanolfan alwadau261Data Canolfan Alwadau Saesneg De AffricaSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1274 , Gwryw 935 , Anhysbys 1
lleferyddSaesneg De Affrica_MA_16Saesneg De AffricaSaesneg De Affricacy_ZA16 kHzSain Cyfryngau251Data sain Cyfryngau Saesneg De AffricaTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 235, Gwryw 432, Anhysbys 36
lleferyddSwahili_CC_8swahiliswahilisw_KE8 kHzCanolfan alwadau230Data Canolfan Alwadau SwahiliSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 611, Gwryw 833, Anhysbys 0
lleferyddSwahili_MA_16swahiliswahilisw_KE16 kHzSain Cyfryngau265Data sain cyfryngau SwahiliTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 118, Gwryw 493, Anhysbys 25
lleferyddSwedeg_CC_8SwedegSwedegsv_SE8 kHzCanolfan alwadau250Data Canolfan Alwadau SwedenSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1581, gwryw 727, Anhysbys 2
lleferyddSwedeg_MA_16SwedegSwedegsv_SE16 kHzSain Cyfryngau278Swedish Media data sainTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 195, gwryw 500, Anhysbys 21
lleferyddTamil_CC_8tamilTamil (ar y gweill) ta_INCanolfan alwadau60Tamil (Ar y gweill) data Canolfan AlwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddTamil_GCtamilTamil (ar y gweill) ta_INSgwrs Gyffredinol100Tamil (Ar y gweill) Data Sgwrs GyffredinolSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddTamil_MAtamil Tamil (ar y gweill) ta_INSain Cyfryngau40Tamil (Ar y gweill) Data sain y cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddTelugu_GC_8telugutelugute_IN8 kHzSgwrs Gyffredinol553Data Sgwrs Gyffredinol TeluguSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Amrediad) - 15-60 munud, DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 574 , Gwryw 564 , Anhysbys 0
lleferyddTelugu_MA_16telugutelugute_IN16 kHzSain Cyfryngau648Data sain Cyfryngau TeluguTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 207, Gwryw 963, Anhysbys 2
lleferyddTelugu_CC_8teluguTelugu (ar y gweill) te_INCanolfan alwadau30Telugu (Mewn Piblinell) Data Canolfan AlwadauSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddTelugu_GCteluguTelugu (ar y gweill) te_INSgwrs Gyffredinol50Telugu (Ar y gweill) Data Sgwrs GyffredinolSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,Desktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddTelugu_MAteluguTelugu (ar y gweill) te_INSain Cyfryngau20Telugu (Mewn Piblinell) Data sain y cyfryngauTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu Iaith
lleferyddThai_GC_8thaithaith_TH8 kHzSgwrs Gyffredinol183Sgwrs Gyffredinol ThaiSgwrs ffôn heb ei sgriptio rhwng dau berson. Tua. Hyd Sain (Ystod) - 15-60 munud, Cywair anffurfiol a ddefnyddir rhwng ffrindiauDdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 338, Gwryw 96, Anhysbys 8
lleferyddThai_MA_8thaithaith_TH16 kHzSain Cyfryngau173Sain Cyfryngau ThaiTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 143, Gwryw 502, Anhysbys 26
lleferyddTwrci Twrci_SM_48Twrci TwrciTwrci Twrcitr-TR48 kHzMonolog Sgriptiedig2,027Twrci TwrciRecordiadau uniaith, sy'n tueddu i ddisgyn yn yr ystod 5 i 30 eiliadMonoSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 1561 Gwryw 1241 Anhysbys 31
lleferyddFietnameg_GC_8FietnamegFietnamegvi_VN8 kHzSgwrs Gyffredinol295Data Sgwrs Gyffredinol FietnamSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud, Gogledd (ee, Hanoi), Canol, a De (ee, Dinas Ho Chi Minh).DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithMenyw 400, gwryw 380, Anhysbys 2
lleferyddFietnameg_MA_16FietnamegFietnamegvi_VN16 kHzSain Cyfryngau257Data sain Cyfryngau FietnamTrwyddedadwy Ffeiliau sain/fideo parth cyhoeddus fel cyfweliadau, podlediadau ac ati - 1 i 5 o bobl. Tua. Hyd Sain (Amrediad) 15-60 munudMonoCyrchu Gwe5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithMenyw 249, gwryw 200, Anhysbys 45
lleferyddCymraeg_GC_8Cymraeg (Acen Saesneg)Cymraeg (Acen Saesneg)cy_WL8 kHzSgwrs Gyffredinol278Data Sgwrs Gyffredinol GymraegSgwrs teleffonig synthetig heb ei sgriptio rhwng "asiant" a "cwsmer", Tua. Hyd Sain (Amrediad) 5-15 Munud,DdeuolDesktop5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithBenyw 270, Gwryw 324, Anhysbys 0
lleferyddDU Saesneg_WW_16Saesneg y DUSaesneg y DUcy_uk16 kHzWake Word200 SiaradwrWake Word Saesneg DUcasglu data ymadroddion allweddol
  • siaradwyr 200
  • 4 ymadrodd allweddol unigryw fesul siaradwr
  • 25-30 recordiad o ymadroddion bysell wedi'u hailadrodd fesul ymadrodd allweddol unigryw
  • 25-30 o ffeiliau sain fesul ymadrodd allweddol unigryw
  • Cyfanswm o 120 o ymadroddion a gofnodwyd fesul siaradwr
1 sianelSymudol App5.0wav.jsonASR, Cynorthwy-ydd Rhithwir, Chatbot, AI Sgwrsio, Dadansoddeg Lleferydd, TTS, Modelu IaithRhyw: 50% gwrywaidd, 50% benywaidd, +/- 10%.

Gwasanaethau a Gynigir

Nid yw casglu data sain arbenigol yn ymarferol ar gyfer setiau AI cynhwysfawr. Yn Shaip, gallwch hyd yn oed ystyried y gwasanaethau canlynol i wneud modelau mewn ffordd yn fwy eang na'r arfer:

Casglu data testun

Casglu Data Testun
Gwasanaethau

Gwir werth gwasanaethau casglu data gwybyddol Shaip yw ei fod yn rhoi’r allwedd i sefydliadau ddatgloi gwybodaeth feirniadol a geir o fewn data anstrwythuredig

Casglu data delwedd

Gwasanaethau Casglu Data Delwedd

Gwnewch yn siŵr bod eich model gweledigaeth gyfrifiadurol yn nodi pob delwedd yn gywir, er mwyn hyfforddi modelau AI nesaf-gen y dyfodol yn ddi-dor

Casglu data fideo

Gwasanaethau Casglu Data Fideo

Nawr canolbwyntiwch ar weledigaeth gyfrifiadurol ynghyd â NLP ar gyfer hyfforddi'ch modelau i nodi gwrthrychau, unigolion, ataliadau ac elfennau gweledol eraill i berffeithrwydd

Shaip cysylltwch â ni

Eisiau adeiladu eich set ddata sain eich hun?

Cysylltwch â'n harbenigwr casglu data lleferydd mewnol i sefydlu ystorfa sain sy'n gweddu orau i'ch gofynion

  • Trwy gofrestru, rwy'n cytuno â Shaip Polisi preifatrwydd ac Telerau Gwasanaeth a rhoi fy nghaniatâd i dderbyn cyfathrebiad marchnata B2B gan Shaip.

Mae Casglu Data Lleferydd ar gyfer Model ML yn cyfeirio at y broses o gasglu recordiadau sain o iaith lafar. Mae'r casgliad hwn yn helpu i hyfforddi a mireinio algorithmau dysgu peirianyddol, yn enwedig y rhai sy'n canolbwyntio ar ddeall a phrosesu lleisiau dynol.

Wrth anelu at gasglu data sain ar gyfer Adnabod Lleferydd Awtomatig (ASR), dylech ddechrau trwy ddiffinio anghenion penodol eich prosiect, gan gynnwys yr iaith a ddymunir, yr acen, a'r math o leferydd. Ar ôl gosod y paramedrau hyn, sicrhewch eich bod yn cael yr holl ganiatâd angenrheidiol i barchu preifatrwydd defnyddwyr. Yna, defnyddiwch ddyfeisiau neu feddalwedd recordio priodol i ddal samplau sain clir. Dylai pob recordiad gael ei anodi'n fanwl gyda'i drawsgrifiad neu fetadata perthnasol arall a'i storio'n systematig er mwyn cael mynediad diymdrech.

Mae set ddata lleferydd mewn dysgu peirianyddol yn hollbwysig ar gyfer hyfforddi, profi a dilysu modelau sydd wedi'u teilwra i adnabod, trawsgrifio neu ddehongli iaith lafar. Mae setiau data o'r fath yn paratoi'r ffordd ar gyfer myrdd o gymwysiadau, o gynorthwywyr llais a gwasanaethau trawsgrifio i fiometreg llais.

Er mwyn casglu data manwl gywir o ieithoedd ac acenion amrywiol, mae cydweithio â siaradwyr brodorol o'r cefndiroedd ieithyddol dymunol yn hanfodol. Anelwch at sampl amrywiol a chynrychioliadol i gwmpasu sbectrwm eang o arlliwiau demograffig. Defnyddio offer recordio safonol mewn amgylcheddau unffurf i sicrhau cysondeb sain. Ac yn bwysig, anodwch bob darn o ddata gyda thrawsgrifiadau manwl a metadata, gan ddynodi'r iaith a'r acen benodol.