Set Ddata Iaith Arabeg a Thai a Fietnameg a Hindi a Saesneg a Tsieineaidd
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 150k
Anodi: Ydy
Disgrifiad: Set Ddata Iaith Arabeg a Thai a Fietnameg a Hindi a Saesneg a Tsieineaidd
Set Ddata Testun Arabeg
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 1k
Anodi: Ydy
Disgrifiad: Mae'r Set Data Testun Arabeg yn cynnwys casgliad o samplau testun wedi'u hysgrifennu mewn Arabeg. Mae'n cynnwys gwahanol fathau o gynnwys, megis erthyglau newyddion, postiadau cyfryngau cymdeithasol, llenyddiaeth, a deialog, sy'n rhychwantu gwahanol bynciau ac arddulliau ysgrifennu. Defnyddir y set ddata hon ar gyfer tasgau megis prosesu iaith naturiol (NLP), dosbarthu testun, dadansoddi teimladau, a chyfieithu peirianyddol mewn cymwysiadau iaith Arabeg.
Set Ddata Iaith Tsieinëeg a Saesneg a Tibetaidd ac Uyghur
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 38k
Anodi: Ydy
Disgrifiad: Set Ddata Iaith Tsieinëeg a Saesneg a Tibetaidd ac Uyghur
Set Ddata Bwydlen Tsieineaidd a Saesneg
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 60k
Anodi: Ydy
Disgrifiad: Mae Set Ddata Bwydlenni Tsieineaidd a Saesneg yn cynnwys delweddau neu samplau testun o fwydlenni bwytai sy'n cynnwys ieithoedd Tsieineaidd a Saesneg. Mae'n cynnwys ffontiau, gosodiadau, a strwythurau bwydlenni amrywiol, gan gyflwyno enwau, disgrifiadau a phrisiau prydau dwyieithog. Mae'r set ddata hon yn ddefnyddiol ar gyfer tasgau fel adnabod nodau optegol (OCR), cyfieithu peirianyddol, a digideiddio bwydlenni mewn gosodiadau amlieithog.
Set Ddata Cyfansoddiad Llawysgrifen Tsieineaidd
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 3k
Anodi: Ydy
Disgrifiad: Mae Set Ddata Cyfansoddi Llawysgrifen Tsieineaidd yn cynnwys samplau o destun Tsieineaidd mewn llawysgrifen, gan gynnwys cyfansoddiadau, traethodau, a thestun ffurf hir arall. Mae'n cynnwys amrywiol arddulliau llawysgrifen a lefelau cymhlethdod, ac fe'i defnyddir ar gyfer tasgau megis adnabod llawysgrifen, dadansoddi testun, a hyfforddiant model dysgu peiriant.
Set Ddata prydlon WIFI Tsieineaidd
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 1k
Anodi: Ydy
Disgrifiad: Mae Set Ddata Prydlon WIFI Tsieineaidd yn cynnwys samplau testun a geir mewn anogwyr WIFI a sgriniau mewngofnodi a ysgrifennwyd yn Tsieinëeg. Yn nodweddiadol mae'n cynnwys anogwyr, cyfarwyddiadau a negeseuon gwall amrywiol sy'n ymwneud â chysylltu â rhwydweithiau WIFI neu eu rheoli. Defnyddir y set ddata hon ar gyfer tasgau fel adnabod testun, prosesu iaith naturiol, a gwella rhyngwynebau defnyddwyr ar gyfer cysylltedd rhwydwaith.
Set Ddata Llawysgrifen Saesneg a Tsieinëeg
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 12k
Anodi: Ydy
Disgrifiad: Mae Set Ddata Llawysgrifen Saesneg a Tsieinëeg yn cynnwys samplau mewn llawysgrifen yn Saesneg a Tsieinëeg, gan arddangos gwahanol arddulliau ysgrifennu a chymhlethdodau cymeriad. Fe'i defnyddir yn nodweddiadol ar gyfer hyfforddi a gwerthuso modelau adnabod llawysgrifen, cefnogi dadansoddiad testun amlieithog, ac ymchwil cysylltiedig arall. Mae'r set ddata yn cynnwys ystod amrywiol o nodau, digidau, geiriau a brawddegau yn y ddwy iaith.
Set Ddata Arwyddion Siopa Saesneg a Tsieineaidd
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 30k
Anodi: Ydy
Disgrifiad: Mae Set Ddata Arwyddion Siopa Saesneg a Tsieineaidd yn cynnwys delweddau o arwyddion siop sy'n cynnwys testun Saesneg a Tsieineaidd. Mae'n dal amrywiol elfennau arwyddion megis enwau siopau, hysbysebion, hyrwyddiadau, a chyfarwyddiadau, wedi'u harddangos mewn ffontiau, arddulliau a fformatau amrywiol. Defnyddir y set ddata hon ar gyfer tasgau fel canfod ac adnabod testun, deall golygfa amlieithog, a gwella modelau golwg cyfrifiadurol ar gyfer dehongli arwyddion dwyieithog.
Set Ddata Testun Ongl Arbennig Saesneg a Tsieineaidd
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 50k
Anodi: Ydy
Disgrifiad: Mae Set Ddata Testun Ongl Arbennig Saesneg a Tsieineaidd yn cynnwys delweddau o destun sy'n cael eu harddangos ar wahanol onglau a chyfeiriadedd yn Saesneg a Tsieinëeg. Mae'n cynnwys testun o ffynonellau fel arwyddion, hysbysebion, a dogfennau nad ydynt yn cael eu cyflwyno mewn fformatau llorweddol safonol. Defnyddir y set ddata hon ar gyfer hyfforddi a gwerthuso modelau canfod ac adnabod testun, yn enwedig y rhai sy'n gallu trin testun mewn cyfeiriadau a safbwyntiau anhraddodiadol.
Set Ddata Dewislen Saesneg
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 20k
Anodi: Ydy
Disgrifiad: Mae Set Ddata Dewislen Saesneg yn cynnwys delweddau neu samplau testun o fwydlenni bwytai a ysgrifennwyd yn Saesneg. Mae'n cynnwys amrywiaeth o ffontiau, cynlluniau, ac arddulliau fformatio, gyda chynnwys yn amrywio o enwau prydau i ddisgrifiadau a phrisiau. Defnyddir y set ddata hon yn aml ar gyfer tasgau fel adnabod nodau optegol (OCR), echdynnu testun, a digideiddio bwydlenni mewn cymwysiadau sy'n ymwneud â bwyd.
Set Ddata Testun Golygfeydd Saesneg
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 33k
Anodi: Ydy
Disgrifiad: Mae Set Ddata Testun Scenes Saesneg yn cynnwys delweddau sy'n cynnwys golygfeydd naturiol gyda thestun Saesneg wedi'i fewnosod. Mae'r testun yn ymddangos mewn gwahanol ffurfiau, megis arwyddion, hysbysfyrddau, a phosteri, yn aml mewn ffontiau, meintiau a chyfeiriadau amrywiol. Defnyddir y set ddata hon yn gyffredin ar gyfer hyfforddi a phrofi modelau mewn tasgau canfod testun, adnabod, a deall golygfa.
Set Ddata Testun Llawysgrifen
Defnyddiwch Achos: Dogfen AI
Fformat: HEIC (delweddau) a .mov (fideos)
Cyfrif: 94053
Anodi: Na
Disgrifiad: Lluniau Byw gyda thestun Llawysgrifen ar gyfer Japaneaidd, Corëeg a Rwsieg
Dyfais Recordio: Camera iPhone ac iPad
Cyflwr Recordio: - Goleuadau / Disgleirdeb Ymosodol - Fflach Camera Ymlaen - Golau Lliw - Golau Isel, Dim Fflach Camera - Arferol
Set Ddata Iaith Japaneaidd a Corea
Blwch rhwymo + Testun
Defnyddiwch Achos: OCR
Fformat: delwedd
Cyfrif: 40k
Anodi: Ydy
Disgrifiad: Mae Set Ddata Iaith Japaneaidd a Corea yn cynnwys samplau testun yn Japaneaidd a Chorëeg. Mae'n cynnwys amrywiaeth o gynnwys megis brawddegau, ymadroddion, a geiriau, gan gwmpasu cyd-destunau ac arddulliau amrywiol. Defnyddir y set ddata hon ar gyfer tasgau fel prosesu iaith naturiol (NLP), cyfieithu peirianyddol, a dadansoddi testun mewn cymwysiadau amlieithog.