Astudiaeth Achos ar Fodel Cydnabod Wyneb

Set Ddata Fideo Gwrth-Spoofing ar gyfer Modelau AI Canfod Twyll

Darganfyddwch sut y cyflwynodd Shaip 25,000 o setiau data fideo gwrth-spoofing o ansawdd uchel yn cynnwys senarios ymosod go iawn ac ailchwarae i hyfforddi modelau AI ar gyfer canfod twyll.

Casglu data fideo gwrth-spoofing

Trosolwg o'r Prosiect

Bu Shaip mewn partneriaeth â chwmni diogelwch AI blaenllaw i ddarparu set ddata fideo gwrth-spoofing o ansawdd uchel, wedi'i gynllunio i wella hyfforddiant model AI ar gyfer canfod twyll. Roedd y set ddata yn cynnwys 25,000 o fideos yn dal senarios ymosodiad real ac ailchwarae, gan sicrhau data hyfforddi cadarn ar gyfer modelau gwrth-spoofing.

Mae pob un o'r Cyfranogwyr 12,500 wedi cyfrannu dau fideo - un go iawn ac un ymosodiad ailchwarae - wedi'u recordio yn cydraniad 720p neu uwch gyda chyfradd ffrâm o 26 FPS ac uwch.

Nod y prosiect oedd cyflawni setiau data dilys ac amrywiol a fyddai'n galluogi modelau AI i wahaniaethu'n effeithiol rhwng fideos biometrig real a ffug, a thrwy hynny leihau risgiau twyll mewn systemau dilysu biometrig.

Casglu data fideo gwrth-spoofing

Ystadegau Allweddol

25,000 cyfanswm fideos (12,500 fideos go iawn, 12,500 ailchwarae fideos ymosodiad)

12,500 unigryw
cyfranogwyr

5 grŵp ethnig
a gynrychiolir yn y set ddata

Cyflwyno fesul cam: 4 sypiau o 6,250 o fideos yr un

Priodoleddau metadata: 12 paramedrau allweddol ar gyfer gwell defnyddioldeb set ddata

Sgôp Set Ddata Fiometrig Gwrth-Spoofing

Curadu Set Ddata: Roedd y prosiect yn canolbwyntio ar ddarparu setiau data fideo gwrth-spoofing o ansawdd uchel yn cynnwys go iawn ac ailchwarae fideos ymosodiad. Roedd agweddau allweddol yn cynnwys:

  • Cyfranogwyr 12,500 cyfrannu dau fideo yr un (1 go iawn, 1 spoofed).
  • Amrywiaeth mewn dyfeisiau recordio i wella hyblygrwydd y model.
  • Cynrychiolaeth ethnig gytbwys i sicrhau cynwysoldeb set ddata.

Casgliad Metadata: Roedd pob fideo yn cyd-fynd 12 priodoledd metadata i wella defnyddioldeb set ddata.

Heriau Casglu Data Fideo

Cynrychiolaeth Gyfartal

Cynnal dosbarthiad data cytbwys o ran ethnigrwydd wrth ddod o hyd i fideos o ansawdd uchel.

Rheoli Ansawdd

Sicrhau bod pob cyfranogwr yn cyfrannu un fideo ymosodiad real ac un ailchwarae i gynnal cywirdeb set ddata.

Cysondeb Technegol

Cadw at ganllawiau llym ar gyfer FPS (≥ 26), cydraniad (≥ 720p), a chywirdeb stamp amser (+/- 0.5ms).

Sut Fe Ddarfuom Ni

Darparodd Shaip set ddata strwythuredig o ansawdd uchel i fodloni gofynion y prosiect. Roedd yr ateb yn cynnwys:

Curadu Set Ddata a Rheoli Ansawdd

  • Fideos 25,000 casglu ar draws Cyfnodau 4 i sicrhau llif data cyson a strwythuredig, gan osgoi tagfeydd.
  • Proses ddilysu drylwyr i sicrhau cydymffurfiaeth â FPS, datrysiad, a chywirdeb metadata. Cafodd pob fideo wiriadau ansawdd lluosog cyn eu derbyn yn derfynol.
  • Tagio metadata cynhwysfawr gyda 12 priodoledd:
  • ID ffeil/Enw
  • Math o Ymosodiad (Go iawn / Ailchwarae)
  • ID Person
  • Datrys Fideo
  • Fideo Hyd
  • Ethnigrwydd y Pwnc
  • Rhyw y Pwnc
  • P'un a yw Fideo yn Wreiddiol neu'n Spoofed
  • Enw Dyfais / Model
  • Person sy'n Siarad neu Ddim
  • Amser Dechrau Stamp Amser
  • Amser Gorffen Stamp Amser
  • Dosbarthiad Grŵp Ethnig Cytbwys: Cafodd y set ddata ei churadu'n fanwl er mwyn cynnal cynrychiolaeth ethnig gytbwys. Mae'r dosbarthiad yn cynnwys poblogaethau Sbaenaidd (33%), De Asiaidd (21%), Cawcasws (20%), Affricanaidd (15%), a Dwyrain Asia a'r Dwyrain Canol (pob un yn cynnwys hyd at 6%).
  • Dim cofnodion dyblyg cynnal unigrywiaeth y set ddata ac atal rhagfarnau mewn hyfforddiant AI.
  • Dewis cyfranogwyr amrywiol yn ethnig i greu set ddata sy'n adlewyrchu amrywiadau defnyddwyr y byd go iawn, gan wella addasrwydd a thegwch modelau AI.
  • Amrywiad dyfais recordio cynnwys modelau ffôn clyfar lluosog, camerâu, ac amodau goleuo i wella cadernid y model yn erbyn gwahanol leoliadau amgylcheddol.

Canlyniad

Roedd y set ddata fideo gwrth-spoofing amrywiol o ansawdd uchel a ddarparwyd gan Shaip wedi galluogi'r cleient i hyfforddi modelau AI i wahaniaethu'n gywir rhwng fideos go iawn a rhai ffug mewn amrywiol senarios dilysu biometrig. Cyfrannodd y set ddata at:

Canfod Twyll

Gwell perfformiad AI wrth ganfod ymosodiadau biometrig twyllodrus.

Data Hyfforddiant Amrywiol

Cryfhau gallu'r model i adnabod ymosodiadau ailchwarae ar draws gwahanol ethnigrwydd, dyfeisiau ac amodau amgylcheddol.

Scalability

Mae'r set ddata yn sylfaen ar gyfer gwelliannau ac ehangiadau model gwrth-spoofing yn y dyfodol.

Mae set ddata Shaip wedi bod yn allweddol wrth wella ein modelau gwrth-spoofing a yrrir gan AI. Darparodd amrywiaeth, ansawdd a metadata strwythuredig sylfaen gref ar gyfer gwella prosesau canfod twyll mewn systemau dilysu biometrig.

Aur-5-seren