Yr Allwedd i Oresgyn Rhwystrau Datblygu AI
Data Mwy Dibynadwy
Cyflwyniad
Dechreuodd deallusrwydd artiffisial ddal dychymyg pan darodd y Dyn Tin o “The Wizard of Oz” y sgrin arian ym 1939, a dim ond ers hynny y mae wedi ennill troedle cadarnach yn y zeitgeist. Wrth gymhwyso, fodd bynnag, mae cynhyrchion AI wedi mynd trwy gylchoedd ffyniant a phenddelw rheolaidd sydd hyd yma wedi stymio'r mabwysiadau mwyaf dylanwadol.
Yn ystod y ffyniant, mae peirianwyr ac ymchwilwyr wedi cymryd camau breision, ond pan mae'n anochel bod eu dyheadau'n fwy na'r galluoedd cyfrifiadurol a oedd ar gael ar y pryd, mae cyfnod o gysgadrwydd wedi dilyn. Yn ffodus, mae'r cynnydd esbonyddol mewn pŵer cyfrifiadurol a broffwydwyd gan Gyfraith Moore ym 1965 wedi profi'n gywir ar y cyfan, ac mae'n anodd gorbwysleisio arwyddocâd y cynnydd hwn.

Darllenwch yr eLyfr: Yr Allwedd i Oresgyn Rhwystrau Datblygu AI, neu dadlwythwch fersiwn PDF o'r eLyfr.
Yr Allwedd i Oresgyn Rhwystrau Datblygu AI: Data Mwy Dibynadwy
Heddiw, mae gan y person cyffredin filiynau o weithiau yn fwy o bŵer cyfrifiadurol yn ei boced nag y bu’n rhaid i NASA dynnu oddi ar y lleuad yn glanio ym 1969. Mae’r un ddyfais hollbresennol honno sy’n gyfleus yn dangos digonedd o bŵer cyfrifiadurol hefyd yn cyflawni rhagofyniad arall ar gyfer oes aur AI: digonedd o ddata. Yn ôl mewnwelediadau gan y Grŵp Ymchwil Gorlwytho Gwybodaeth, crëwyd 90% o ddata'r byd yn ystod y ddwy flynedd ddiwethaf. Nawr bod y twf esbonyddol mewn pŵer cyfrifiadurol wedi cydgyfeirio o'r diwedd â thwf yr un mor feteorig wrth gynhyrchu data, mae arloesiadau data AI yn ffrwydro cymaint y mae rhai arbenigwyr yn credu a fydd yn cychwyn y Pedwerydd Chwyldro Diwydiannol.
Mae data gan y Gymdeithas Cyfalaf Menter Genedlaethol yn dangos bod y sector AI wedi gweld buddsoddiad o $ 6.9 biliwn yn ystod chwarter cyntaf 2020. Nid yw'n anodd gweld potensial offer AI oherwydd ei fod eisoes yn cael ei tapio o'n cwmpas. Rhai o'r achosion defnydd mwy gweladwy ar gyfer cynhyrchion AI yw'r peiriannau argymell y tu ôl i'n hoff gymwysiadau fel Spotify a Netflix. Er ei bod yn hwyl darganfod artist newydd i wrando arno neu sioe deledu newydd i oryfed mewn pyliau, mae'r gweithrediadau hyn braidd yn isel. Mae algorithmau eraill yn graddio sgoriau profion - yn rhannol yn penderfynu lle mae myfyrwyr yn cael eu derbyn i'r coleg - ac eraill yn didoli trwy résumés ymgeisydd, gan benderfynu pa ymgeiswyr sy'n cael swydd benodol. Gall rhai offer AI hyd yn oed fod â goblygiadau bywyd neu farwolaeth, fel y model AI sy'n sgrinio am ganser y fron (sy'n perfformio'n well na meddygon).
Er gwaethaf twf cyson yn enghreifftiau'r byd go iawn o ddatblygiad AI a nifer y cychwyniadau sy'n cystadlu i greu'r genhedlaeth nesaf o offer trawsnewidiol, erys heriau i ddatblygu a gweithredu effeithiol. Yn benodol, nid yw allbwn AI ond mor gywir ag y mae mewnbwn yn caniatáu, sy'n golygu bod ansawdd o'r pwys mwyaf.
Yr Her o Ansawdd Data Anghyson yn AI Solutions
Yn wir mae yna swm anhygoel o ddata yn cael ei gynhyrchu bob dydd: 2.5 quintillion beit, yn ôl Social Media Today. Ond nid yw hynny'n golygu ei fod i gyd yn deilwng o hyfforddi'ch algorithm. Mae rhywfaint o ddata yn anghyflawn, mae rhywfaint o ansawdd isel, ac mae peth yn syml yn anghywir, felly bydd defnyddio unrhyw ran o'r wybodaeth ddiffygiol hon yn arwain at yr un nodweddion allan o'ch arloesedd data AI (drud). Yn ôl ymchwil gan Gartner, bydd tua 85% o brosiectau AI a grëwyd erbyn 2022 yn cynhyrchu canlyniadau anghywir oherwydd data rhagfarnllyd neu wallus. Er y gallwch chi hepgor argymhelliad cân nad yw'n gweddu i'ch chwaeth yn hawdd, mae cost ariannol ac enw da sylweddol i algorithmau anghywir eraill.
Yn 2018, dechreuodd Amazon ddefnyddio teclyn llogi wedi'i bweru gan AI, wrth gynhyrchu ers 2014, a oedd â thuedd gref a digamsyniol yn erbyn menywod. Mae'n ymddangos bod y modelau cyfrifiadurol sy'n sail i'r offeryn wedi'u hyfforddi gan ddefnyddio résumés a gyflwynwyd i'r cwmni dros ddegawd. Oherwydd bod y mwyafrif o ymgeiswyr technoleg yn ddynion (ac yn dal i fod, efallai oherwydd y dechnoleg hon), penderfynodd yr algorithm gosbi résumés gyda “menywod” wedi'u cynnwys yn unrhyw le - capten pêl-droed menywod neu grŵp busnes menywod, er enghraifft. Penderfynodd hyd yn oed gosbi ymgeiswyr dau goleg menywod. Mae Amazon yn honni na ddefnyddiwyd yr offeryn erioed fel yr unig faen prawf ar gyfer gwerthuso darpar ymgeiswyr, ond eto edrychodd recriwtwyr ar yr injan argymell wrth chwilio am logi newydd.
Cafodd offeryn llogi Amazon ei ddileu yn y pen draw ar ôl blynyddoedd o waith, ond mae'r wers yn aros, gan dynnu sylw at bwysigrwydd ansawdd data wrth hyfforddi algorithmau ac offer AI. Sut olwg sydd ar ddata “o ansawdd uchel”? Yn fyr, mae'n gwirio'r pum blwch hyn:
1. Perthnasol
Er mwyn cael ei ystyried o ansawdd uchel, rhaid i ddata ddod â rhywbeth gwerthfawr i'r broses benderfynu. A oes cydberthynas rhwng statws ymgeisydd am swydd fel gladdgell polyn pencampwr y wladwriaeth a'i berfformiad yn y gwaith? Mae'n bosibl, ond mae'n ymddangos yn annhebygol iawn. Trwy chwynnu data nad yw'n berthnasol, gall algorithm ganolbwyntio ar ddidoli'r wybodaeth sydd mewn gwirionedd yn effeithio ar ganlyniadau.
2. Cywir
Rhaid i'r data rydych chi'n ei ddefnyddio gynrychioli'r syniadau rydych chi'n eu profi yn gywir. Os na, nid yw'n werth chweil. Er enghraifft, hyfforddodd Amazon ei algorithm llogi gan ddefnyddio 10 mlynedd o résumés ymgeiswyr, ond nid yw'n eglur a gadarnhaodd y cwmni'r wybodaeth a ddarparwyd ar y résumés hynny yn gyntaf. Mae ymchwil gan y cwmni gwirio cyfeiriadau Checkster yn dangos bod 78% o ymgeiswyr yn gorwedd neu y byddent yn ystyried gorwedd ar gais am swydd. Os yw algorithm yn gwneud penderfyniadau argymell gan ddefnyddio GPA ymgeisydd, er enghraifft, mae'n syniad da cadarnhau dilysrwydd y rhifau hynny yn gyntaf. Byddai'r broses hon yn cymryd amser ac arian, ond byddai hefyd yn ddiamau yn gwella cywirdeb eich canlyniadau.
3. Wedi'i drefnu'n gywir a'i anodi
Yn achos model llogi yn seiliedig ar résumés, mae anodi yn gymharol hawdd. Ar un ystyr, daw résumé ymlaen llaw, er y byddai eithriadau yn ddiau. Mae'r rhan fwyaf o ymgeiswyr yn rhestru eu profiad gwaith o dan bennawd “Profiad” a sgiliau perthnasol o dan “Sgiliau.” Fodd bynnag, mewn sefyllfaoedd eraill, fel sgrinio canser, bydd data yn llawer mwy amrywiol. Gallai gwybodaeth ddod ar ffurf delweddu meddygol, canlyniadau sgrinio corfforol, neu hyd yn oed sgwrs rhwng y meddyg a'r claf am hanes iechyd teulu ac achosion o ganser, ymhlith mathau eraill o ddata. Er mwyn i'r wybodaeth hon gyfrannu at algorithm canfod cywir, rhaid ei threfnu a'i hanodi'n ofalus i sicrhau bod y model AI yn dysgu gwneud rhagfynegiadau cywir yn seiliedig ar y casgliadau cywir.
4. Diweddar
Roedd Amazon yn ceisio creu teclyn a fyddai’n arbed amser ac arian trwy atgynhyrchu’r un penderfyniadau llogi y mae bodau dynol yn eu gwneud mewn llawer llai o amser. Er mwyn gwneud yr argymhellion mor gywir â phosibl, byddai angen cadw'r data'n gyfredol. Pe bai cwmni ar un adeg yn dangos ffafriaeth ar gyfer ymgeiswyr sydd â'r gallu i atgyweirio teipiaduron, er enghraifft, mae'n debyg na fyddai'r llogi hanesyddol hyn yn cael llawer o effaith ar ffitrwydd ymgeiswyr am swyddi heddiw ar gyfer unrhyw fath o rôl. O ganlyniad, byddai'n ddoeth eu tynnu.
5. Yn briodol amrywiol
Dewisodd peirianwyr Amazon hyfforddi algorithm gyda chronfa o ymgeiswyr a oedd yn wrywaidd dros ben. Roedd y penderfyniad hwn yn wall critigol, ac nid yw'n cael ei wneud yn llai egnïol gan mai'r rheini oedd y résumés a oedd gan y cwmni ar gael ar y pryd. Gallai peirianwyr Amazon fod wedi partneru â sefydliadau uchel eu parch â thebyg swyddi sydd ar gael a oedd wedi derbyn mwy o ymgeiswyr am swyddi benywaidd i wneud iawn am y diffyg, neu y gallai fod torri i lawr yn artiffisial nifer y résumés o ddynion i gyd-fynd â nifer y menywod a'r rhai hyfforddedig a tywysodd yr algorithm gyda chynrychiolaeth gywirach o'r boblogaeth. Y pwynt yw'r data hwnnw mae amrywiaeth yn allweddol, ac oni wneir ymdrech ar y cyd i ddileu rhagfarn mewn mewnbynnau, bydd allbynnau rhagfarnllyd drechaf.
Yn amlwg, nid yw data o ansawdd uchel yn ymddangos y tu allan i unman yn unig. Yn lle, rhaid ei guradu'n ofalus gan ystyried y canlyniadau a fwriadwyd. Yn y maes AI, dywedir yn aml fod “garbage in means garbage out.” Mae'r datganiad hwn yn wir, ond mae rhywfaint yn tanddatgan pwysigrwydd ansawdd. Gall AI brosesu llawer iawn o wybodaeth a'i throi'n unrhyw beth, o godi stoc i logi argymhellion i ddiagnosis meddygol. Mae'r gallu hwn yn llawer mwy na gallu bodau dynol, sydd hefyd yn golygu ei fod yn chwyddo'r canlyniadau. Dim ond cymaint o fenywod y gallai un recriwtiwr dynol rhagfarnllyd anwybyddu, ond gallai recriwtiwr AI rhagfarnllyd anwybyddu pob un ohonynt. Yn yr ystyr hwnnw, nid yw garbage i mewn yn golygu sothach allan yn unig - mae'n golygu y gall ychydig bach o ddata “sothach” droi yn safle tirlenwi cyfan.
Llywio Gofynion Cydymffurfiad Cymhleth
Fel pe na bai dod o hyd i ddata o ansawdd yn ddigon anodd, mae rhai o'r diwydiannau sy'n ennill y budd mwyaf o arloesiadau data AI hefyd yn cael eu rheoleiddio fwyaf. Efallai mai gofal iechyd yw'r enghraifft orau, ac er bod arolwg gan HIT Infrastructure wedi canfod bod 91% o fewnfudwyr y diwydiant o'r farn y gallai'r dechnoleg wella mynediad at ofal, mae'r optimistiaeth honno'n cael ei dymheru gan y ffaith bod 75% yn ei ystyried yn fygythiad i ddiogelwch a phreifatrwydd cleifion. - ac nid cleifion yw'r unig rai sydd mewn perygl.
Mae'r rheoliadau ysgubol a ddeddfwyd trwy'r Ddeddf Cludadwyedd ac Atebolrwydd Yswiriant Iechyd bellach yn croestorri â gwahanol rwystrau cydymffurfio â data lleol megis Rheoliad Diogelu Data Cyffredinol Ewrop, Deddf Preifatrwydd Defnyddwyr California yn yr Unol Daleithiau, a'r Ddeddf Diogelu Data Personol yn Singapore. Bydd llawer mwy yn ymuno â'r rheoliadau lleol hyn, ac wrth i deleiechyd ddod i'r amlwg fel ffynhonnell fwy arwyddocaol o ddata gofal iechyd, mae'n debygol y bydd rheoliadau'n cael gafael tynnach fyth ar ddata cleifion wrth eu cludo. O ganlyniad, bydd platfform cwmwl diogel a chydymffurfiol Shaip yn fodd hyd yn oed yn fwy gwerthfawr i gasglu a chael gafael ar ddata gofal iechyd i hyfforddi cynhyrchion AI.
Gall gwybodaeth bersonol adnabyddadwy fod yn fygythiad sylweddol i'ch datblygiad AI, ond mae hyd yn oed gweithrediad sy'n cydymffurfio'n llwyr mewn perygl os na all gyflawni'r math o ganlyniadau cywir sy'n dod gyda data hyfforddi amrywiol yn unig. Dangosodd astudiaeth yn 2020 yn y Journal of the American Medical Association fod algorithmau dysgu peiriannau yn y maes meddygol yn cael eu hyfforddi amlaf gyda data gan gleifion yng Nghaliffornia, Efrog Newydd, a Massachusetts. O ystyried bod y cleifion hyn yn cynrychioli llai nag un rhan o bump o boblogaeth yr UD, i ddweud dim byd o weddill y byd, mae'n anodd dychmygu sut y gallai'r modelau hyn gynhyrchu unrhyw beth ond canlyniadau rhagfarnllyd.
Goresgyn Rhwystrau Datblygu AI
Mae ymdrechion datblygu AI yn cynnwys rhwystrau sylweddol ni waeth ym mha ddiwydiant y maent yn digwydd, ac mae'r broses o fynd o syniad dichonadwy i gynnyrch llwyddiannus yn llawn anhawster. Rhwng yr heriau o gaffael y data cywir a'r angen i'w anhysbysu i gydymffurfio â'r holl reoliadau perthnasol, gall deimlo mai llunio a hyfforddi algorithm yw'r rhan hawdd.
Er mwyn rhoi pob mantais i'ch sefydliad sy'n angenrheidiol yn yr ymdrech i ddylunio datblygiad AI newydd arloesol, byddwch chi am ystyried partneru gyda chwmni fel Shaip. Sefydlodd Chetan Parikh a Vatsal Ghiya Shaip i helpu cwmnïau i beiriannu'r mathau o atebion a allai drawsnewid gofal iechyd yn yr UD Ar ôl mwy nag 16 mlynedd mewn busnes, mae ein cwmni wedi tyfu i gynnwys mwy na 600 o aelodau'r tîm, ac rydym wedi gweithio gyda channoedd o cwsmeriaid i droi syniadau cymhellol yn atebion AI.
Gyda'n pobl, ein prosesau a'n platfform yn gweithio i'ch sefydliad, gallwch ddatgloi'r pedwar budd canlynol ar unwaith a catapwltio'ch prosiect tuag at orffeniad llwyddiannus:
1. Y gallu i ryddhau eich gwyddonwyr data
Nid oes unrhyw beth o gwmpas bod y broses ddatblygu AI yn cymryd buddsoddiad sylweddol o amser, ond gallwch chi bob amser wneud y gorau o'r swyddogaethau y mae eich tîm yn treulio'r amser mwyaf yn eu cyflawni. Fe wnaethoch chi gyflogi'ch gwyddonwyr data oherwydd eu bod yn arbenigwyr ar ddatblygu algorithmau datblygedig a modelau dysgu peiriannau, ond mae'r ymchwil yn dangos yn gyson bod y gweithwyr hyn mewn gwirionedd yn treulio 80% o'u hamser yn cyrchu, glanhau a threfnu'r data a fydd yn pweru'r prosiect. Mae mwy na thri chwarter (76%) y gwyddonwyr data yn nodi bod y prosesau casglu data cyffredin hyn hefyd yn digwydd bod eu hoff rannau lleiaf o'r swydd, ond mae'r angen am ddata o ansawdd yn gadael dim ond 20% o'u hamser ar gyfer datblygiad gwirioneddol, sef y gwaith mwyaf diddorol ac ysgogol yn ddeallusol i lawer o wyddonwyr data. Trwy ddod o hyd i ddata trwy werthwr trydydd parti fel Shaip, gall cwmni adael i'w beirianwyr data drud a thalentog allanoli eu gwaith fel porthorion data ac yn lle hynny treulio'u hamser ar y rhannau o ddatrysiadau AI lle gallant gynhyrchu'r gwerth mwyaf.
2. Y gallu i sicrhau gwell canlyniadau
Mae dibynnu ar ddata ffynhonnell agored yn llwybr byr cyffredin arall sy'n dod gyda'i set ei hun o beryglon. Diffyg gwahaniaethu yw un o'r materion mwyaf, oherwydd mae'n haws ailadrodd algorithm sydd wedi'i hyfforddi gan ddefnyddio data ffynhonnell agored nag un wedi'i adeiladu ar setiau data trwyddedig. Trwy fynd ar hyd y llwybr hwn, rydych chi'n gwahodd cystadleuaeth gan newydd-ddyfodiaid eraill yn y gofod a allai danseilio'ch prisiau a chymryd cyfran o'r farchnad ar unrhyw adeg. Pan fyddwch chi'n dibynnu ar Shaip, rydych chi'n cyrchu'r data o'r ansawdd uchaf sydd wedi'i ymgynnull gan weithlu medrus a reolir, a gallwn roi trwydded unigryw i chi ar gyfer set ddata arfer sy'n atal cystadleuwyr rhag ail-greu'ch eiddo deallusol caled yn hawdd.
3. Mynediad at weithwyr proffesiynol profiadol
Gydag arbenigwyr parth yn nodi, trefnu, categoreiddio a labelu data i chi, rydych chi'n gwybod y gall y wybodaeth a ddefnyddir i hyfforddi'ch algorithm gynhyrchu'r canlyniadau gorau posibl. Rydym hefyd yn cynnal sicrwydd ansawdd rheolaidd i sicrhau bod data'n cwrdd â'r safonau uchaf ac y byddwn yn perfformio yn ôl y bwriad nid yn unig mewn labordy, ond hefyd mewn sefyllfa yn y byd go iawn.
4. Llinell amser datblygu carlam
Nid yw datblygiad AI yn digwydd dros nos, ond gall ddigwydd yn gyflymach pan fyddwch chi'n partneru â Shaip. Mae casglu ac anodi data mewnol yn creu tagfa weithredol sylweddol sy'n dal gweddill y broses ddatblygu. Mae gweithio gyda Shaip yn rhoi mynediad i chi ar unwaith i'n llyfrgell helaeth o ddata parod i'w defnyddio, a bydd ein harbenigwyr yn gallu dod o hyd i unrhyw fath o fewnbynnau ychwanegol sydd eu hangen arnoch gyda'n gwybodaeth ddofn am y diwydiant a'n rhwydwaith fyd-eang. Heb faich cyrchu ac anodi, gall eich tîm gyrraedd gwaith ar ddatblygiad gwirioneddol ar unwaith, a gall ein model hyfforddi helpu i nodi gwallau cynnar i leihau'r iteriadau sy'n angenrheidiol i gyflawni nodau cywirdeb.
Os nad ydych chi'n barod i allanoli pob agwedd ar eich rheolaeth data, mae Shaip hefyd yn cynnig platfform wedi'i seilio ar gymylau sy'n helpu timau i gynhyrchu, newid ac anodi gwahanol fathau o ddata yn fwy effeithlon, gan gynnwys cefnogaeth ar gyfer delweddau, fideo, testun a sain. . Mae ShaipCloud yn cynnwys amrywiaeth o offer dilysu a llif gwaith greddfol, megis datrysiad patent i olrhain a monitro llwythi gwaith, offeryn trawsgrifio i drawsgrifio recordiadau sain cymhleth ac anodd, ac elfen rheoli ansawdd i sicrhau ansawdd digyfaddawd. Gorau oll, mae'n raddadwy, felly gall dyfu wrth i ofynion amrywiol eich prosiect gynyddu.
Megis dechrau y mae oedran arloesi AI, a byddwn yn gweld datblygiadau ac arloesiadau anhygoel yn y blynyddoedd i ddod sydd â'r potensial i ail-lunio diwydiannau cyfan neu hyd yn oed newid y gymdeithas gyfan. Yn Shaip, rydym am ddefnyddio ein harbenigedd i wasanaethu fel grym trawsnewidiol, gan helpu'r cwmnïau mwyaf chwyldroadol yn y byd i harneisio pŵer atebion AI i gyflawni nodau uchelgeisiol.
Mae gennym brofiad dwfn mewn cymwysiadau gofal iechyd ac AI sgyrsiol, ond mae gennym hefyd y sgiliau angenrheidiol i hyfforddi modelau ar gyfer bron unrhyw fath o gais. I gael mwy o wybodaeth am sut y gall Shaip helpu i fynd â'ch prosiect o'r syniad i'w weithredu, edrychwch ar y nifer fawr o adnoddau sydd ar gael ar ein gwefan neu estyn allan atom heddiw.