Astudiaeth Achos ar Fodel Cydnabod Wyneb
Set Ddata Fideo Gwrth-Spoofing ar gyfer Modelau AI Canfod Twyll
Darganfyddwch sut y cyflwynodd Shaip 25,000 o setiau data fideo gwrth-spoofing o ansawdd uchel yn cynnwys senarios ymosod go iawn ac ailchwarae i hyfforddi modelau AI ar gyfer canfod twyll.
Trosolwg o'r Prosiect
Bu Shaip mewn partneriaeth â chwmni diogelwch AI blaenllaw i ddarparu set ddata fideo gwrth-spoofing o ansawdd uchel, wedi'i gynllunio i wella hyfforddiant model AI ar gyfer canfod twyll. Roedd y set ddata yn cynnwys 25,000 o fideos yn dal senarios ymosodiad real ac ailchwarae, gan sicrhau data hyfforddi cadarn ar gyfer modelau gwrth-spoofing.
Mae pob un o'r Cyfranogwyr 12,500 wedi cyfrannu dau fideo - un go iawn ac un ymosodiad ailchwarae - wedi'u recordio yn cydraniad 720p neu uwch gyda chyfradd ffrâm o 26 FPS ac uwch.
Nod y prosiect oedd cyflawni setiau data dilys ac amrywiol a fyddai'n galluogi modelau AI i wahaniaethu'n effeithiol rhwng fideos biometrig real a ffug, a thrwy hynny leihau risgiau twyll mewn systemau dilysu biometrig.
Ystadegau Allweddol
25,000 cyfanswm fideos (12,500 fideos go iawn, 12,500 ailchwarae fideos ymosodiad)
12,500 unigryw
cyfranogwyr
5 grŵp ethnig
a gynrychiolir yn y set ddata
Cyflwyno fesul cam: 4 sypiau o 6,250 o fideos yr un
Priodoleddau metadata: 12 paramedrau allweddol ar gyfer gwell defnyddioldeb set ddata
Sgôp Set Ddata Fiometrig Gwrth-Spoofing
Curadu Set Ddata: Roedd y prosiect yn canolbwyntio ar ddarparu setiau data fideo gwrth-spoofing o ansawdd uchel yn cynnwys go iawn ac ailchwarae fideos ymosodiad. Roedd agweddau allweddol yn cynnwys:
- Cyfranogwyr 12,500 cyfrannu dau fideo yr un (1 go iawn, 1 spoofed).
- Amrywiaeth mewn dyfeisiau recordio i wella hyblygrwydd y model.
- Cynrychiolaeth ethnig gytbwys i sicrhau cynwysoldeb set ddata.
Casgliad Metadata: Roedd pob fideo yn cyd-fynd 12 priodoledd metadata i wella defnyddioldeb set ddata.
Heriau Casglu Data Fideo
Cynrychiolaeth Gyfartal
Cynnal dosbarthiad data cytbwys o ran ethnigrwydd wrth ddod o hyd i fideos o ansawdd uchel.
Rheoli Ansawdd
Sicrhau bod pob cyfranogwr yn cyfrannu un fideo ymosodiad real ac un ailchwarae i gynnal cywirdeb set ddata.
Cysondeb Technegol
Cadw at ganllawiau llym ar gyfer FPS (≥ 26), cydraniad (≥ 720p), a chywirdeb stamp amser (+/- 0.5ms).
Sut Fe Ddarfuom Ni
Darparodd Shaip set ddata strwythuredig o ansawdd uchel i fodloni gofynion y prosiect. Roedd yr ateb yn cynnwys:
Curadu Set Ddata a Rheoli Ansawdd
- Fideos 25,000 casglu ar draws Cyfnodau 4 i sicrhau llif data cyson a strwythuredig, gan osgoi tagfeydd.
- Proses ddilysu drylwyr i sicrhau cydymffurfiaeth â FPS, datrysiad, a chywirdeb metadata. Cafodd pob fideo wiriadau ansawdd lluosog cyn eu derbyn yn derfynol.
- Tagio metadata cynhwysfawr gyda 12 priodoledd:
- ID ffeil/Enw
- Math o Ymosodiad (Go iawn / Ailchwarae)
- ID Person
- Datrys Fideo
- Fideo Hyd
- Ethnigrwydd y Pwnc
- Rhyw y Pwnc
- P'un a yw Fideo yn Wreiddiol neu'n Spoofed
- Enw Dyfais / Model
- Person sy'n Siarad neu Ddim
- Amser Dechrau Stamp Amser
- Amser Gorffen Stamp Amser
- Dosbarthiad Grŵp Ethnig Cytbwys: Cafodd y set ddata ei churadu'n fanwl er mwyn cynnal cynrychiolaeth ethnig gytbwys. Mae'r dosbarthiad yn cynnwys poblogaethau Sbaenaidd (33%), De Asiaidd (21%), Cawcasws (20%), Affricanaidd (15%), a Dwyrain Asia a'r Dwyrain Canol (pob un yn cynnwys hyd at 6%).
- Dim cofnodion dyblyg cynnal unigrywiaeth y set ddata ac atal rhagfarnau mewn hyfforddiant AI.
- Dewis cyfranogwyr amrywiol yn ethnig i greu set ddata sy'n adlewyrchu amrywiadau defnyddwyr y byd go iawn, gan wella addasrwydd a thegwch modelau AI.
- Amrywiad dyfais recordio cynnwys modelau ffôn clyfar lluosog, camerâu, ac amodau goleuo i wella cadernid y model yn erbyn gwahanol leoliadau amgylcheddol.
Canlyniad
Roedd y set ddata fideo gwrth-spoofing amrywiol o ansawdd uchel a ddarparwyd gan Shaip wedi galluogi'r cleient i hyfforddi modelau AI i wahaniaethu'n gywir rhwng fideos go iawn a rhai ffug mewn amrywiol senarios dilysu biometrig. Cyfrannodd y set ddata at:
Canfod Twyll
Gwell perfformiad AI wrth ganfod ymosodiadau biometrig twyllodrus.
Data Hyfforddiant Amrywiol
Cryfhau gallu'r model i adnabod ymosodiadau ailchwarae ar draws gwahanol ethnigrwydd, dyfeisiau ac amodau amgylcheddol.
Scalability
Mae'r set ddata yn sylfaen ar gyfer gwelliannau ac ehangiadau model gwrth-spoofing yn y dyfodol.
Mae set ddata Shaip wedi bod yn allweddol wrth wella ein modelau gwrth-spoofing a yrrir gan AI. Darparodd amrywiaeth, ansawdd a metadata strwythuredig sylfaen gref ar gyfer gwella prosesau canfod twyll mewn systemau dilysu biometrig.