Set Ddata Iaith Arabeg a Thai a Fietnameg a Hindi a Saesneg a Tsieineaidd

Blwch rhwymo + Testun

Set Ddata Iaith Arabeg a Thai a Fietnameg a Hindi a Saesneg a Tsieineaidd

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 150k

Anodi: Ydy

X

Disgrifiad: Set Ddata Iaith Arabeg a Thai a Fietnameg a Hindi a Saesneg a Tsieineaidd

Set Ddata Testun Arabeg

Blwch rhwymo + Testun

Set Ddata Testun Arabeg

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 1k

Anodi: Ydy

X

Disgrifiad: Mae'r Set Data Testun Arabeg yn cynnwys casgliad o samplau testun wedi'u hysgrifennu mewn Arabeg. Mae'n cynnwys gwahanol fathau o gynnwys, megis erthyglau newyddion, postiadau cyfryngau cymdeithasol, llenyddiaeth, a deialog, sy'n rhychwantu gwahanol bynciau ac arddulliau ysgrifennu. Defnyddir y set ddata hon ar gyfer tasgau megis prosesu iaith naturiol (NLP), dosbarthu testun, dadansoddi teimladau, a chyfieithu peirianyddol mewn cymwysiadau iaith Arabeg.

Set Ddata Iaith Tsieinëeg a Saesneg a Tibetaidd ac Uyghur

Blwch rhwymo + Testun

Set Ddata Iaith Tsieinëeg a Saesneg a Tibetaidd ac Uyghur

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 38k

Anodi: Ydy

X

Disgrifiad: Set Ddata Iaith Tsieinëeg a Saesneg a Tibetaidd ac Uyghur

Set Ddata Bwydlen Tsieineaidd a Saesneg

Blwch rhwymo + Testun

Set Ddata Bwydlen Tsieineaidd a Saesneg

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 60k

Anodi: Ydy

X

Disgrifiad: Mae Set Ddata Bwydlenni Tsieineaidd a Saesneg yn cynnwys delweddau neu samplau testun o fwydlenni bwytai sy'n cynnwys ieithoedd Tsieineaidd a Saesneg. Mae'n cynnwys ffontiau, gosodiadau, a strwythurau bwydlenni amrywiol, gan gyflwyno enwau, disgrifiadau a phrisiau prydau dwyieithog. Mae'r set ddata hon yn ddefnyddiol ar gyfer tasgau fel adnabod nodau optegol (OCR), cyfieithu peirianyddol, a digideiddio bwydlenni mewn gosodiadau amlieithog.

Set Ddata Cyfansoddiad Llawysgrifen Tsieineaidd

Blwch rhwymo + Testun

Set Ddata Cyfansoddiad Llawysgrifen Tsieineaidd

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 3k

Anodi: Ydy

X

Disgrifiad: Mae Set Ddata Cyfansoddi Llawysgrifen Tsieineaidd yn cynnwys samplau o destun Tsieineaidd mewn llawysgrifen, gan gynnwys cyfansoddiadau, traethodau, a thestun ffurf hir arall. Mae'n cynnwys amrywiol arddulliau llawysgrifen a lefelau cymhlethdod, ac fe'i defnyddir ar gyfer tasgau megis adnabod llawysgrifen, dadansoddi testun, a hyfforddiant model dysgu peiriant.

Set Ddata prydlon WIFI Tsieineaidd

Blwch rhwymo + Testun

Set Ddata prydlon WIFI Tsieineaidd

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 1k

Anodi: Ydy

X

Disgrifiad: Mae Set Ddata Prydlon WIFI Tsieineaidd yn cynnwys samplau testun a geir mewn anogwyr WIFI a sgriniau mewngofnodi a ysgrifennwyd yn Tsieinëeg. Yn nodweddiadol mae'n cynnwys anogwyr, cyfarwyddiadau a negeseuon gwall amrywiol sy'n ymwneud â chysylltu â rhwydweithiau WIFI neu eu rheoli. Defnyddir y set ddata hon ar gyfer tasgau fel adnabod testun, prosesu iaith naturiol, a gwella rhyngwynebau defnyddwyr ar gyfer cysylltedd rhwydwaith.

Set Ddata Llawysgrifen Saesneg a Tsieinëeg

Blwch rhwymo + Testun

Set Ddata Llawysgrifen Saesneg a Tsieinëeg

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 12k

Anodi: Ydy

X

Disgrifiad: Mae Set Ddata Llawysgrifen Saesneg a Tsieinëeg yn cynnwys samplau mewn llawysgrifen yn Saesneg a Tsieinëeg, gan arddangos gwahanol arddulliau ysgrifennu a chymhlethdodau cymeriad. Fe'i defnyddir yn nodweddiadol ar gyfer hyfforddi a gwerthuso modelau adnabod llawysgrifen, cefnogi dadansoddiad testun amlieithog, ac ymchwil cysylltiedig arall. Mae'r set ddata yn cynnwys ystod amrywiol o nodau, digidau, geiriau a brawddegau yn y ddwy iaith.

Set Ddata Arwyddion Siopa Saesneg a Tsieineaidd

Blwch rhwymo + Testun

Set Ddata Arwyddion Siopa Saesneg a Tsieineaidd

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 30k

Anodi: Ydy

X

Disgrifiad: Mae Set Ddata Arwyddion Siopa Saesneg a Tsieineaidd yn cynnwys delweddau o arwyddion siop sy'n cynnwys testun Saesneg a Tsieineaidd. Mae'n dal amrywiol elfennau arwyddion megis enwau siopau, hysbysebion, hyrwyddiadau, a chyfarwyddiadau, wedi'u harddangos mewn ffontiau, arddulliau a fformatau amrywiol. Defnyddir y set ddata hon ar gyfer tasgau fel canfod ac adnabod testun, deall golygfa amlieithog, a gwella modelau golwg cyfrifiadurol ar gyfer dehongli arwyddion dwyieithog.

Set Ddata Testun Ongl Arbennig Saesneg a Tsieineaidd

Blwch rhwymo + Testun

Set Ddata Testun Ongl Arbennig Saesneg a Tsieineaidd

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 50k

Anodi: Ydy

X

Disgrifiad: Mae Set Ddata Testun Ongl Arbennig Saesneg a Tsieineaidd yn cynnwys delweddau o destun sy'n cael eu harddangos ar wahanol onglau a chyfeiriadedd yn Saesneg a Tsieinëeg. Mae'n cynnwys testun o ffynonellau fel arwyddion, hysbysebion, a dogfennau nad ydynt yn cael eu cyflwyno mewn fformatau llorweddol safonol. Defnyddir y set ddata hon ar gyfer hyfforddi a gwerthuso modelau canfod ac adnabod testun, yn enwedig y rhai sy'n gallu trin testun mewn cyfeiriadau a safbwyntiau anhraddodiadol.

Set Ddata Dewislen Saesneg

Blwch rhwymo + Testun

Set Ddata Dewislen Saesneg

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 20k

Anodi: Ydy

X

Disgrifiad: Mae Set Ddata Dewislen Saesneg yn cynnwys delweddau neu samplau testun o fwydlenni bwytai a ysgrifennwyd yn Saesneg. Mae'n cynnwys amrywiaeth o ffontiau, cynlluniau, ac arddulliau fformatio, gyda chynnwys yn amrywio o enwau prydau i ddisgrifiadau a phrisiau. Defnyddir y set ddata hon yn aml ar gyfer tasgau fel adnabod nodau optegol (OCR), echdynnu testun, a digideiddio bwydlenni mewn cymwysiadau sy'n ymwneud â bwyd.

Set Ddata Testun Golygfeydd Saesneg

Blwch rhwymo + Testun

Set Ddata Testun Golygfeydd Saesneg

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 33k

Anodi: Ydy

X

Disgrifiad: Mae Set Ddata Testun Scenes Saesneg yn cynnwys delweddau sy'n cynnwys golygfeydd naturiol gyda thestun Saesneg wedi'i fewnosod. Mae'r testun yn ymddangos mewn gwahanol ffurfiau, megis arwyddion, hysbysfyrddau, a phosteri, yn aml mewn ffontiau, meintiau a chyfeiriadau amrywiol. Defnyddir y set ddata hon yn gyffredin ar gyfer hyfforddi a phrofi modelau mewn tasgau canfod testun, adnabod, a deall golygfa.

Set Ddata Testun Llawysgrifen

Set Ddata Testun Llawysgrifen

Defnyddiwch Achos: Dogfen AI

Fformat: HEIC (delweddau) a .mov (fideos)

Cyfrif: 94053

Anodi: Na

X

Disgrifiad: Lluniau Byw gyda thestun Llawysgrifen ar gyfer Japaneaidd, Corëeg a Rwsieg

Dyfais Recordio: Camera iPhone ac iPad

Cyflwr Recordio: - Goleuadau / Disgleirdeb Ymosodol - Fflach Camera Ymlaen - Golau Lliw - Golau Isel, Dim Fflach Camera - Arferol

Set Ddata Iaith Japaneaidd a Corea

Blwch rhwymo + Testun

Set Ddata Iaith Japaneaidd a Corea

Defnyddiwch Achos: OCR

Fformat: delwedd

Cyfrif: 40k

Anodi: Ydy

X

Disgrifiad: Mae Set Ddata Iaith Japaneaidd a Corea yn cynnwys samplau testun yn Japaneaidd a Chorëeg. Mae'n cynnwys amrywiaeth o gynnwys megis brawddegau, ymadroddion, a geiriau, gan gwmpasu cyd-destunau ac arddulliau amrywiol. Defnyddir y set ddata hon ar gyfer tasgau fel prosesu iaith naturiol (NLP), cyfieithu peirianyddol, a dadansoddi testun mewn cymwysiadau amlieithog.