Effaith Amrywiaeth ar ddata hyfforddiant

Data Hyfforddiant AI Amrywiol ar gyfer Cynwysoldeb a dileu Tuedd

Mae gan Ddeallusrwydd Artiffisial a Data Mawr y potensial i ddod o hyd i atebion i broblemau byd-eang wrth flaenoriaethu materion lleol a thrawsnewid y byd mewn llawer o ffyrdd dwys. Mae AI yn dod ag atebion i bawb - ac ym mhob lleoliad, o gartrefi i weithleoedd. cyfrifiaduron AI, gyda Dysgu peiriant hyfforddiant, yn gallu efelychu ymddygiad deallus a sgyrsiau mewn modd awtomataidd ond personol.

Ac eto, mae AI yn wynebu problem cynhwysiant ac mae'n aml yn rhagfarnllyd. Yn ffodus, canolbwyntio ar moeseg deallusrwydd artiffisial yn gallu cyflwyno posibiliadau mwy newydd o ran arallgyfeirio a chynhwysiant trwy ddileu rhagfarn anymwybodol trwy ddata hyfforddi amrywiol.

Pwysigrwydd amrywiaeth mewn data hyfforddi AI

Ai training data diversity Mae amrywiaeth ac ansawdd data hyfforddi yn gysylltiedig gan fod y naill yn effeithio ar y llall ac yn effeithio ar ganlyniad y datrysiad AI. Mae llwyddiant yr ateb AI yn dibynnu ar y data amrywiol mae'n cael ei hyfforddi ar. Mae amrywiaeth data yn atal yr AI rhag gorffitio – sy’n golygu mai dim ond perfformio neu ddysgu o’r data a ddefnyddir i hyfforddi y mae’r model yn ei wneud. Gyda gorffitio, ni all y model AI ddarparu canlyniadau pan gaiff ei brofi ar ddata nas defnyddiwyd mewn hyfforddiant.

Cyflwr presennol hyfforddiant AI data

Byddai anghydraddoldeb neu ddiffyg amrywiaeth mewn data yn arwain at atebion AI annheg, anfoesegol ac anghynhwysol a allai ddyfnhau gwahaniaethu. Ond sut a pham mae amrywiaeth mewn data yn gysylltiedig ag atebion AI?

Mae cynrychiolaeth anghyfartal o bob dosbarth yn arwain at gam-adnabod wynebau - un achos pwysig ar y pryd yw Google Photos a oedd yn dosbarthu cwpl du fel 'gorilod.' Ac mae Meta yn annog defnyddiwr sy'n gwylio fideo o ddynion du a hoffai'r defnyddiwr 'barhau i wylio fideos o primatiaid.'

Er enghraifft, gallai dosbarthiad anghywir neu amhriodol o leiafrifoedd ethnig neu hiliol, yn enwedig mewn chatbots, arwain at ragfarn mewn systemau hyfforddi AI. Yn ôl adroddiad 2019 ar Systemau Gwahaniaethu - Rhyw, Hil, Pŵer mewn AI, mae mwy nag 80% o athrawon AI yn ddynion; Dim ond 15% a 10% ar Google yw ymchwilwyr AI benywaidd ar FB.

Effaith Data Hyfforddiant Amrywiol ar Berfformiad AI

Effaith amrywiaeth ar ddata hyfforddi Gall gadael grwpiau a chymunedau penodol allan o gynrychiolaeth data arwain at algorithmau sgiw.

Mae gogwydd data yn aml yn cael ei gyflwyno'n ddamweiniol i'r systemau data - trwy dansamplu rhai hiliau neu grwpiau penodol. Pan fydd systemau adnabod wynebau'n cael eu hyfforddi ar wynebau amrywiol, mae'n helpu'r model i nodi nodweddion penodol, megis lleoliad organau wyneb ac amrywiadau lliw.

Canlyniad arall cael amledd anghytbwys o labeli yw y gallai'r system ystyried lleiafrif fel anghysondeb o dan bwysau i gynhyrchu allbwn o fewn amser byr.

Gadewch i ni drafod eich gofyniad Data Hyfforddi AI heddiw.

Sicrhau Amrywiaeth mewn Data Hyfforddiant AI

Ar yr ochr fflip, mae cynhyrchu set ddata amrywiol hefyd yn her. Gallai'r diffyg data ar rai dosbarthiadau arwain at dangynrychiolaeth. Gellir ei liniaru trwy wneud y timau datblygwyr AI yn fwy amrywiol o ran sgiliau, ethnigrwydd, hil, rhyw, disgyblaeth, a mwy. Ar ben hynny, Y ffordd ddelfrydol o fynd i'r afael â phroblemau amrywiaeth data mewn AI yw mynd i'r afael ag ef o'r cychwyn cyntaf yn hytrach na cheisio trwsio'r hyn a wneir - gan drwytho amrywiaeth yn y cam casglu data a churadu.

Waeth beth fo'r hype o amgylch AI, mae'n dal i ddibynnu ar y data sy'n cael ei gasglu, ei ddewis a'i hyfforddi gan fodau dynol. Bydd y rhagfarn gynhenid ​​mewn bodau dynol yn adlewyrchu yn y data a gesglir ganddynt, ac mae'r gogwydd anymwybodol hwn yn ymledu i'r modelau ML hefyd. 

Camau ar gyfer casglu a churadu data hyfforddi amrywiol

Training data diversity inclusion

Amrywiaeth data gellir ei gyflawni trwy:

  • Ychwanegwch fwy o ddata o ddosbarthiadau heb gynrychiolaeth ddigonol yn feddylgar a dangoswch eich modelau i bwyntiau data amrywiol. 
  • Trwy gasglu data o wahanol ffynonellau data. 
  • Trwy ychwanegu at ddata neu drin setiau data yn artiffisial i gynyddu/cynnwys pwyntiau data newydd sy'n amlwg yn wahanol i'r pwyntiau data gwreiddiol. 
  • Wrth logi ymgeiswyr ar gyfer y broses datblygu AI, tynnwch yr holl wybodaeth sy'n amherthnasol i swydd o'r cais. 
  • Gwella tryloywder ac atebolrwydd trwy wella dogfennaeth datblygu a gwerthuso modelau. 
  • Cyflwyno rheoliadau i adeiladu amrywiaeth a cynwysoldeb mewn AI systemau o lawr gwlad. Mae llywodraethau amrywiol wedi datblygu canllawiau i sicrhau amrywiaeth a lliniaru rhagfarn AI a all sicrhau canlyniadau annheg. 

[ Darllenwch hefyd: Dysgu Mwy Am Broses Casglu Data Hyfforddiant AI ]

Casgliad

Ar hyn o bryd, dim ond ychydig o gwmnïau technoleg mawr a chanolfannau dysgu sy'n ymwneud yn gyfan gwbl â datblygu datrysiadau AI. Mae'r mannau elitaidd hyn wedi'u trwytho mewn allgáu, gwahaniaethu a thuedd. Fodd bynnag, dyma'r mannau lle mae deallusrwydd artiffisial yn cael ei ddatblygu, ac mae'r rhesymeg y tu ôl i'r systemau AI datblygedig hyn yn gyforiog o'r un rhagfarn, gwahaniaethu ac allgáu gan y grwpiau a dangynrychiolir. 

Wrth drafod amrywiaeth a pheidio â gwahaniaethu, mae'n bwysig cwestiynu'r bobl y mae'n elwa arnynt a'r rhai y mae'n eu niweidio. Dylem hefyd edrych ar bwy y mae'n ei roi dan anfantais - trwy orfodi'r syniad o berson 'normal', gallai AI o bosibl roi 'eraill' mewn perygl. 

Ni fydd trafod amrywiaeth mewn data AI heb gydnabod cysylltiadau pŵer, tegwch a chyfiawnder yn dangos y darlun mwy. Er mwyn deall yn llawn gwmpas amrywiaeth mewn data hyfforddi AI a sut y gall bodau dynol ac AI gyda'i gilydd liniaru'r argyfwng hwn, estyn allan at y peirianwyr yn Shaip. Mae gennym ni beirianwyr AI amrywiol a all ddarparu data deinamig ac amrywiol ar gyfer eich datrysiadau AI. 

Cyfran Gymdeithasol