Adeiladu Set Data Delweddau Wyneb o'r tu allan i'r UE/DU gydag Amrywiaeth Cynnydd Oedran

Corpws delweddau wynebau wedi'u gwahanu yn ôl amser gyda 1,205 o gyfranogwyr i gryfhau tegwch a chadernid ar gyfer modelau gweledigaeth gyfrifiadurol.

Set ddata delweddau wyneb gydag amrywiaeth o gynnydd oedran

Trosolwg o'r Prosiect

Roedd cwmni technoleg byd-eang sy'n adeiladu deallusrwydd artiffisial sy'n canolbwyntio ar wynebau ar gyfer diogelwch, personoli a phrofiadau hunaniaeth yn chwilio am set ddata o'r tu allan i'r UE/DU gyda lluniau wedi'u gwahanu rhwng amseroedd i leihau rhagfarn a gwella gwydnwch modelau ar draws oedran, amgylchedd ac ategolion.

Partnerodd y cleient â Shaip i casglu, curadu a dilysu corff mawr o ddelweddau wyneb lle mae pob cyfranogwr yn cyfrannu lluniau diweddar a hŷn. Y nod oedd amgodio dilyniant oedran naturiol wrth orfodi tarddiad llym o'r tu allan i'r UE/DU a chyflawni cwota rhyw/oedran cytbwys.

Set ddata delweddau wyneb gydag amrywiaeth o gynnydd oedran

Ystadegau Allweddol

cyfranogwyr

 1,205 (Y tu allan i'r UE/DU yn unig, rhyw 50/50 ±10–15%)

 Cymysgedd Oedran

 40% (10–29), 40% (30–49), 20% (50+) Goddefgarwch ±10–15%

Cwmpas

De/De-ddwyrain Asia, Gogledd a Gogledd/Dwyrain Affrica, Singapore, De America

Llinell Amser

Wythnos 19

Heriau

Cyfyngiad daearyddol

Ffynonellau'n gyfan gwbl o boblogaethau nad ydynt yn rhan o'r UE/DU gan osgoi delweddau sy'n tarddu o'r UE/DU sy'n teithio.

Cwotâu cytbwys ar raddfa fawr

Yn taro 1,205 o gyfranogwyr gyda goddefiannau rhyw ac oedran tynn.

Tystiolaeth wedi'i gwahanu gan amser

Sicrhau bod pob dogfen adnabod yn cynnwys lluniau diweddar a hanesyddol, wedi'u halinio i fandiau oedran.

Ansawdd gweithredol

Gorfodi maint lleiaf delwedd/wyneb, amrywiaeth, a therfynau dyblygu heb arafu'r trwybwn.

Ateb

1. Paneli Gwledydd a Rheolaethau Tarddiad

Rydym yn sefydlu podiau cyrchu lefel gwlad ar draws rhanbarthau targed a phartneriaid hyfforddedig ar rheolau tarddiad (Y tu allan i'r UE/DU yn unig). Sgrinio lluniau am risgiau tarddiad teithio gan ddefnyddio ciwiau metadata (blwyddyn, marcwyr lleoliad) ynghyd ag ardystiadau cyflwynwyr, gan leihau gollyngiadau o'r UE/DU cyn gwirio ansawdd. Mae hyn yn adlewyrchu arfer profedig Shaip o lwytho gwiriadau risg ymlaen llaw i amddiffyn trwybwn i lawr yr afon.

2. Dyluniad Cipio Dilyniant Oedran

Yn hytrach na “gofyn am 20 o ddelweddau,” fe wnaethon ni gynllunio llif cyflwyno dau drac a arweiniodd y cyfranogwyr i:

  • Trac A (Diweddar): lluniau o'r ddwy flynedd ddiwethaf;
  • Trac B (Hanesyddol): lluniau hŷn wedi'u halinio â band oedran y cyfranogwr adeg eu cyflwyno (e.e., ffenestri 2–10/15/20 mlynedd).

Rhoddodd y porth wthiad i ddefnyddwyr gydag enghreifftiau (dan do/awyr agored, onglau, ategolion) i ysgogi amrywiaeth heb or-fanylu.

3. Trefniadaeth Amrywiaeth a Rheiliau Gwarchod Cwota

A dangosfwrdd cwota amser real cofrestriadau wedi'u monitro gan rhyw, band oedran, a daearyddiaeth, gan oedi'r cymeriant unwaith y byddai haen wedi cyrraedd y terfynau a gynlluniwyd. Roedd hyn yn atal ailweithio yn hwyr yn y cylch ac yn adlewyrchu dull safonol Shaip o cofrestru haenedig + cloeon allan a ddefnyddiwyd mewn setiau data biometrig blaenorol i gynnal cynrychiolaeth gytbwys.

4. Piblinell Ansawdd (Dyn yn y Ddolen + Gwiriadau Rhagarweiniol Awtomataidd)

  • Gatiau awtomataidd: canfod wynebau + trothwyon maint lleiaf, gwiriadau aneglur/sŵn sylfaenol, a chlystyru ar yr un diwrnod i nodi dyblygiadau posibl yn gynnar.
  • Haenau sicrhau ansawdd dynol: adolygwyr lefel delwedd wedi'u dilysu unigrywiaeth pwnc (cyfranogwr cynradd yn unig), amrywiaeth olygfa/ongl, a dim hidlwyr harddu; Gwiriodd archwilwyr CQA sypiau ar hap cyn eu derbyn. sicrhau ansawdd aml-haen yn adlewyrchu rhaglenni data biometrig cyhoeddedig Shaip.

5. Cydymffurfiaeth a Chaniatâd

ymrestru ≥20 mlynedd gyda chaniatâd wedi'i lofnodi; derbynnir achosion o dan 20 gyda chaniatâd gwarcheidwad yn unig. Fe wnaethon ni gofnodi presenoldeb caniatâd mewn metadata ac alinio rhestrau gwirio adolygwyr i cymhwysedd + caniatâd meysydd, gan sicrhau archwiliadwyedd.

6. Metaddata ac Olrhainadwyedd

Fe wnaethon ni ddanfon metadata lefel cyfranogwr a delwedd (cysylltiadau adnabod, demograffeg, cenedligrwydd/preswylfa, blwyddyn y llun, dyddiad cyflwyno, ac ati) ac enwau meysydd safonol i symleiddio labelu a gwerthuso i lawr yr afonMae hyn yn dilyn arfer gorau Shaip o tagio metadata cyfoethog ar gyfer setiau data biometrig.

7. Cyflwyno Graddol i Raddfa De-Risg

An Cynllun 8 swp dechreuodd gyda a Calibradiad 10 cyfranogwr set, ac yna graddio i fyny dan reolaeth. Roedd adborth cleientiaid ar ôl swp 1 yn llywio mân newidiadau rubric, yna cynyddodd y cyfrolau mewn cyfrannau rhagweladwy i gyrraedd Cyfranogwyr 1,205 mewn ~19 wythnos.

Cwmpas y Prosiect

dimensiwn Yr hyn a Gyflawnwyd gennym
Poblogaeth 1,205 o gyfranogwyr o'r tu allan i'r UE/DU gyda bandiau rhyw ac oedran cytbwys.
Cynnwys ≥20 o ddelweddau fesul cyfranogwr: diweddar + hanesyddol i amgodio dilyniant oedran; golygfeydd, onglau ac ategolion amrywiol.
Gweithrediadau Ansawdd Gwiriadau ymlaen llaw awtomataidd + sicrhau ansawdd aml-haen dynol (rheolaethau dyblygu; unigrywiaeth pwnc; gwrthod hidlo).
Cydymffurfio Dilysu tarddiad o'r tu allan i'r UE/DU; llywodraethu caniatâd a dilysu cymhwysedd.
metadata Priodoleddau cyfranogwr + delwedd ar gyfer olrheiniadwyedd a gwerthuso ML i lawr yr afon.
Cyflawni 8 swp fesul cam, gan ddechrau gyda graddnodi yna danfoniad cyflwr cyson i'r targed terfynol.

Y Canlyniad

  • Corpws cytbwys, parod i'w archwilio: Cwotâu demograffig wedi'u bodloni o fewn y goddefiant; Rhaid gorfodi tarddiad nad yw'n dod o'r UE/DU ar draws pob delwedd ar gyfer hyfforddiant cydymffurfiol.
  • Amrywioldeb parod i fodelu: Mae delweddau wedi'u gwahanu gan amser, amgylcheddau/onglau amrywiol, a sylw ategolion yn cefnogi profion cadernid a dadansoddi rhagfarn.
  • Rhagweladwyedd gweithredol: Lleihaodd y cyflwyniad cyntaf o galibreiddio + rheiliau gwarchod cwota ailwaith a diogelu'r amserlen i'r targed llawn o 1,205 o gyfranogwyr.
  • Effeithlonrwydd i lawr yr afon: Byrhaodd metadata cyfoethog a hylendid ffeiliau cyson y llwybr i adeiladu anodi a meincnodau, gan ddilyn llyfrau chwarae set ddata biometrig Shaip.

Trodd Shaip grynodeb set ddata wynebau cymhleth o'r tu allan i'r UE/DU yn gorff cytbwys, parod i'w archwilio. Rhoddodd eu dyluniad dilyniant oedran a'u sicrhau ansawdd haenog ddata glân ac amrywiol i'n tîm CV y ​​gallem ymddiried ynddo—heb risg amserlen.

Aur-5-seren