Gweledigaeth Cyfrifiadurol

22+ o Setiau Data Ffynhonnell Agored a Geisir Mwyaf ar gyfer Golwg Cyfrifiadurol

Mae algorithm AI cystal â'r data rydych chi'n ei fwydo.

Nid yw'n ddatganiad beiddgar nac anghonfensiynol. Gallai AI fod wedi ymddangos braidd yn bell ychydig ddegawdau yn ôl, ond mae Deallusrwydd Artiffisial a Dysgu Peiriannau wedi dod yn bell iawn ers hynny.

Gweledigaeth gyfrifiadurol helpu cyfrifiaduron i ddeall a dehongli labeli a delweddau. Pan fyddwch chi'n hyfforddi'ch cyfrifiadur gan ddefnyddio'r math cywir o ddelweddau, gall ennill y gallu i ganfod, deall ac adnabod nodweddion wyneb amrywiol, canfod afiechydon, gyrru cerbydau ymreolaethol, a hefyd arbed bywydau trwy ddefnyddio sganio organau aml-ddimensiwn.

Rhagwelir y bydd y Farchnad Gweledigaeth Cyfrifiadurol yn cyrraedd $ 144.46 Billiwn erbyn 2028 o $7.04 biliwn cymedrol yn 2020, gan dyfu ar CAGR o 45.64% rhwng 2021 a 2028.

Rhai o'r achosion defnydd o olwg cyfrifiadurol yw:

  • Delweddu meddygol
  • Cerbyd ymreolaethol
  • Adnabod wynebau a gwrthrychau
  • Adnabod nam
  • Canfod golygfa

Mae adroddiadau set ddata delwedd rydych chi'n bwydo ac yn hyfforddi eich Dysgu Peiriannau Mae tasgau gweledigaeth gyfrifiadurol yn hanfodol i lwyddiant eich prosiect AI. Mae'n eithaf anodd cael set ddata o ansawdd. Yn dibynnu ar gymhlethdod eich prosiect, gallai gymryd unrhyw le rhwng ychydig ddyddiau i ychydig wythnosau i gael setiau data dibynadwy a pherthnasol at ddibenion gweledigaeth gyfrifiadurol.

Yma, rydyn ni'n darparu ystod (wedi'u categoreiddio er hwylustod i chi) o setiau data ffynhonnell agored y gallwch eu defnyddio ar unwaith.

Rhestr Gynhwysfawr o Setiau Data Gweledigaeth Cyfrifiadurol

Cyffredinol:

  1. DelweddNet (Dolen)

    Mae ImageNet yn set ddata a ddefnyddir yn eang, ac mae'n dod ag 1.2 miliwn o ddelweddau rhyfeddol wedi'u categoreiddio i 1000 o gategorïau. Mae'r set ddata hon wedi'i threfnu yn unol â hierarchaeth WorldNet ac wedi'i chategoreiddio'n dair rhan - y data hyfforddi, labeli delwedd, a data dilysu.

  2. Cineteg 700 (Dolen)

    Mae Kinetics 700 yn set ddata enfawr o ansawdd uchel gyda mwy na 650,000 o glipiau o 700 o wahanol ddosbarthiadau gweithredu dynol. Mae gan bob un o'r gweithredoedd dosbarth tua 700 o glipiau fideo. Mae gan y clipiau yn y set ddata ryngweithiadau dynol-gwrthrych a dynol-dynol, sy'n profi i fod yn eithaf defnyddiol wrth adnabod gweithredoedd dynol mewn fideos.

  3. CIFAR-10 (Dolen)

    CIFAR 10 yw un o'r setiau data cyfrifiadurol mwyaf sy'n cynnwys 60000 o ddelweddau lliw 32 x 32 sy'n cynrychioli deg dosbarth gwahanol. Mae gan bob dosbarth tua 6000 o ddelweddau a ddefnyddir i hyfforddi algorithmau golwg cyfrifiadurol a dysgu peirianyddol.

Cydnabyddiaeth Wyneb:

cydnabyddiaeth wyneb

  1. Wynebau wedi'u Labelu yn y Gwyllt (Dolen)

    Mae Labeled Faced in the Wild yn set ddata enfawr sy'n cynnwys mwy na 13,230 o ddelweddau o bron i 5,750 o bobl a ganfuwyd o'r rhyngrwyd. Mae'r set ddata hon o wynebau wedi'i chynllunio i'w gwneud hi'n haws astudio canfod wynebau heb gyfyngiad.

  2. Wyneb Gwe CASIA (Dolen)

    Mae CASIA Web face yn set ddata sydd wedi'i dylunio'n dda sy'n helpu dysgu peirianyddol ac ymchwil wyddonol ar adnabod wynebau heb gyfyngiad. Gyda mwy na 494,000 o ddelweddau o bron i 10,000 o hunaniaethau go iawn, mae'n ddelfrydol ar gyfer tasgau adnabod a gwirio wynebau.

  3. Set Ddata Wynebau UMD (Dolen)

    Mae UMD yn wynebu set ddata wedi'i hanodi'n dda sy'n cynnwys dwy ran - delweddau llonydd a fframiau fideo. Mae gan y set ddata fwy na 367,800 o anodiadau wyneb a 3.7 miliwn o fframiau fideo anodedig o bynciau.

Cydnabod Llawysgrifen:

  1. Cronfa Ddata MNIST (Dolen)

    Mae MNIST yn gronfa ddata sy'n cynnwys samplau o ddigidau mewn llawysgrifen o 0 i 9, ac mae ganddi 60,000 a 10,000 o ddelweddau hyfforddi a phrofi. Wedi'i ryddhau ym 1999, mae MNIST yn ei gwneud hi'n haws profi systemau prosesu delweddau yn Deep Learning.

  2. Set Ddata Cymeriadau Artiffisial (Dolen)

    Mae Set Ddata Cymeriadau Artiffisial, fel mae'r enw'n awgrymu, yn ddata artiffisial sy'n disgrifio strwythur yr iaith Saesneg mewn deg prif lythyren. Mae'n dod gyda mwy na 6000 o ddelweddau.

Gadewch i ni drafod eich gofyniad Data Hyfforddi AI heddiw.

Canfod Gwrthrychau:

  1. MS COCO (Dolen)

    Set ddata canfod gwrthrychau a chapsiynau yw MS COCO neu Common Objects in Context.

    Mae ganddo fwy na 328,000 o ddelweddau gyda chanfod pwyntiau allweddol, canfod aml-wrthrychau, capsiynau, ac anodiadau masg segmentu. Mae'n dod ag 80 categori gwrthrych a phum capsiwn fesul delwedd.

  2. LSUN(Dolen)

    Mae gan LSUN, sy'n fyr ar gyfer Deall Golygfa ar Raddfa Fawr, fwy na miliwn o ddelweddau wedi'u labelu mewn 20 categori gwrthrych a 10 golygfa. Mae gan rai categorïau bron i 300,000 o ddelweddau, gyda 300 o ddelweddau yn benodol i'w dilysu a 1000 o ddelweddau ar gyfer data prawf.

  3. Gwrthrychau Cartref(Dolen)

    Mae set ddata Home Objects yn cynnwys delweddau anodedig o wrthrychau ar hap o amgylch y tŷ – cegin, ystafell fyw, ac ystafell ymolchi. Mae gan y set ddata hon hefyd ychydig o fideos anodedig a 398 o luniau heb eu hanodi wedi'u cynllunio i'w profi.

Modurol:

  1. Set ddata dinaswedd (Dolen)

    Cityscape yw'r set ddata i fynd iddo wrth chwilio am ddilyniannau fideo amrywiol wedi'u recordio o olygfeydd stryd sawl dyfyniad. Cafodd y delweddau hyn eu dal dros gyfnod hir ac mewn gwahanol amodau tywydd a golau. Mae'r anodiadau ar gyfer 30 dosbarth o ddelweddau wedi'u rhannu'n wyth categori gwahanol.

  2. Gyriant Dwfn Barkley (Dolen)

    Mae Barkley DeepDrive wedi'i gynllunio'n benodol ar gyfer hyfforddiant cerbydau ymreolaethol, ac mae ganddo fwy na 100 mil o ddilyniannau fideo anodedig. Mae'n un o'r data hyfforddi mwyaf defnyddiol ar gyfer cerbydau ymreolaethol oherwydd y ffyrdd newidiol a'r amodau gyrru.

  3. Mapilari (Dolen)

    Mae gan Mapillary dros 750 miliwn o olygfeydd stryd ac arwyddion traffig ledled y byd, sy'n ddefnyddiol iawn wrth hyfforddi modelau canfyddiad gweledol mewn dysgu peiriant ac algorithmau AI. Mae'n caniatáu ichi ddatblygu cerbydau ymreolaethol sy'n darparu ar gyfer gwahanol amodau goleuo a thywydd a golygfannau.

Delweddu Meddygol:

  1. Set Ddata Ymchwil Agored Covid-19 (Dolen)

    Mae gan y set ddata wreiddiol hon tua 6500 o segmentiadau ysgyfaint picsel-polygonaidd am belydr-x brest AP/PA. Yn ogystal, mae 517 o ddelweddau o belydrau-x cleifion Covid-19 gyda thagiau yn cynnwys enw, lleoliad, manylion derbyn, canlyniad, a mwy ar gael.

  2. Cronfa Ddata NIH o 100,000 o belydrau-X o'r frest (Dolen)

    Mae cronfa ddata NIH yn un o'r setiau data helaethaf sydd ar gael i'r cyhoedd sy'n cynnwys 100,000 o ddelweddau pelydr-x o'r frest a data cysylltiedig sy'n ddefnyddiol ar gyfer y gymuned wyddonol ac ymchwil. Mae ganddo hyd yn oed ddelweddau o gleifion â chyflyrau ysgyfaint datblygedig.

  3. Atlas Patholeg Ddigidol (Dolen)

    Mae Atlas Patholeg Ddigidol yn cynnig sawl delwedd glytiau histopatholegol, mwy na 17,000 i gyd, o bron i 100 o sleidiau anodedig o wahanol organau. Mae'r set ddata hon yn ddefnyddiol wrth ddatblygu meddalwedd cyfrifiadur golwg ac adnabod patrymau.

Cydnabod golygfa:

Scene recognition

  1. Cydnabod Golygfa Dan Do. (Dolen)

    Mae Cydnabod Golygfa Dan Do yn set ddata hynod gategoraidd gyda bron i 15620 o ddelweddau o wrthrychau a golygfeydd dan do i'w defnyddio mewn dysgu peirianyddol a hyfforddiant data. Mae'n dod gyda dros 65 o gategorïau, ac mae gan bob categori o leiaf 100 o ddelweddau.

  2. xGolwg (Dolen)

    Fel un o'r setiau data mwyaf adnabyddus sydd ar gael yn gyhoeddus, mae xView yn cynnwys tunnell o ddelweddau uwchben anodedig o olygfeydd cymhleth a mawr amrywiol. Gyda thua 60 o ddosbarthiadau a mwy na miliwn o achosion gwrthrych, pwrpas y set ddata hon yw darparu gwell rhyddhad trychineb gan ddefnyddio delweddau lloeren.

  3. lleoedd (Dolen)

    Mae gan Lleoedd, set ddata a gyfrannwyd gan MIT, dros 1.8 miliwn o ddelweddau o 365 o wahanol gategorïau golygfa. Mae tua 50 o ddelweddau ym mhob un o'r categorïau hyn i'w dilysu a 900 o ddelweddau i'w profi. Mae dysgu nodweddion golygfa dwfn i sefydlu adnabyddiaeth golygfa neu dasgau adnabod gweledol yn bosibl.

Adloniant:

  1. Set ddata IMDB WIKI (Dolen)

    IMDB - Wiki yw un o'r cronfeydd data cyhoeddus mwyaf poblogaidd o wynebau wedi'u labelu'n ddigonol gydag oedran, rhyw ac enwau. Mae ganddo hefyd tua 20 mil o wynebau o enwogion a 62 mil o Wicipedia.

  2. Wynebau Celeb (Dolen)

    Mae Celeb Faces yn gronfa ddata ar raddfa fawr gyda 200,000 o ddelweddau anodedig o enwogion. Daw'r delweddau â sŵn cefndir ac maent yn peri amrywiadau, gan eu gwneud yn werthfawr ar gyfer setiau prawf hyfforddi mewn tasgau gweledigaeth gyfrifiadurol. Mae'n fuddiol iawn sicrhau cywirdeb uwch mewn adnabod wynebau, golygu, lleoleiddio rhannau wyneb, a mwy.

Nawr bod gennych chi restr enfawr o setiau data delwedd ffynhonnell agored i danio'ch peiriannau deallusrwydd artiffisial. Mae canlyniad eich modelau AI a dysgu peiriant yn dibynnu'n bennaf ar ansawdd y setiau data rydych chi'n eu bwydo a'u hyfforddi arnyn nhw. Os ydych chi am i'ch model AI gyflwyno rhagfynegiadau cywir, mae angen setiau data o ansawdd sydd wedi'u hagregu, eu tagio a'u labelu i berffeithrwydd. Er mwyn ehangu llwyddiant eich system weledigaeth gyfrifiadurol, rhaid i chi ddefnyddio cronfeydd data delwedd o ansawdd sy'n berthnasol i weledigaeth eich prosiect. Os ydych chi'n chwilio am fwy o setiau data o'r fath Cliciwch Yma

Cyfran Gymdeithasol

Efallai yr hoffech