Yr Allwedd i Oresgyn Rhwystrau Datblygu AI

Data Mwy Dibynadwy

Cyflwyniad

Dechreuodd deallusrwydd artiffisial ddal dychymyg pan darodd y Dyn Tin o “The Wizard of Oz” y sgrin arian ym 1939, a dim ond ers hynny y mae wedi ennill troedle cadarnach yn y zeitgeist. Wrth gymhwyso, fodd bynnag, mae cynhyrchion AI wedi mynd trwy gylchoedd ffyniant a phenddelw rheolaidd sydd hyd yma wedi stymio'r mabwysiadau mwyaf dylanwadol.

Yn ystod y ffyniant, mae peirianwyr ac ymchwilwyr wedi cymryd camau breision, ond pan mae'n anochel bod eu dyheadau'n fwy na'r galluoedd cyfrifiadurol a oedd ar gael ar y pryd, mae cyfnod o gysgadrwydd wedi dilyn. Yn ffodus, mae'r cynnydd esbonyddol mewn pŵer cyfrifiadurol a broffwydwyd gan Gyfraith Moore ym 1965 wedi profi'n gywir ar y cyfan, ac mae'n anodd gorbwysleisio arwyddocâd y cynnydd hwn.

Ai rhwystrau datblygiad
Darllenwch yr eLyfr: Yr Allwedd i Oresgyn Rhwystrau Datblygu AI, neu dadlwythwch fersiwn PDF o'r eLyfr.

Yr Allwedd i Oresgyn Rhwystrau Datblygu AI: Data Mwy Dibynadwy

Heddiw, mae gan y person cyffredin filiynau o weithiau yn fwy o bŵer cyfrifiadurol yn ei boced nag y bu’n rhaid i NASA dynnu oddi ar y lleuad yn glanio ym 1969. Mae’r un ddyfais hollbresennol honno sy’n gyfleus yn dangos digonedd o bŵer cyfrifiadurol hefyd yn cyflawni rhagofyniad arall ar gyfer oes aur AI: digonedd o ddata. Yn ôl mewnwelediadau gan y Grŵp Ymchwil Gorlwytho Gwybodaeth, crëwyd 90% o ddata'r byd yn ystod y ddwy flynedd ddiwethaf. Nawr bod y twf esbonyddol mewn pŵer cyfrifiadurol wedi cydgyfeirio o'r diwedd â thwf yr un mor feteorig wrth gynhyrchu data, mae arloesiadau data AI yn ffrwydro cymaint y mae rhai arbenigwyr yn credu a fydd yn cychwyn y Pedwerydd Chwyldro Diwydiannol.

Mae data gan y Gymdeithas Cyfalaf Menter Genedlaethol yn dangos bod y sector AI wedi gweld buddsoddiad o $ 6.9 biliwn yn ystod chwarter cyntaf 2020. Nid yw'n anodd gweld potensial offer AI oherwydd ei fod eisoes yn cael ei tapio o'n cwmpas. Rhai o'r achosion defnydd mwy gweladwy ar gyfer cynhyrchion AI yw'r peiriannau argymell y tu ôl i'n hoff gymwysiadau fel Spotify a Netflix. Er ei bod yn hwyl darganfod artist newydd i wrando arno neu sioe deledu newydd i oryfed mewn pyliau, mae'r gweithrediadau hyn braidd yn isel. Mae algorithmau eraill yn graddio sgoriau profion - yn rhannol yn penderfynu lle mae myfyrwyr yn cael eu derbyn i'r coleg - ac eraill yn didoli trwy résumés ymgeisydd, gan benderfynu pa ymgeiswyr sy'n cael swydd benodol. Gall rhai offer AI hyd yn oed fod â goblygiadau bywyd neu farwolaeth, fel y model AI sy'n sgrinio am ganser y fron (sy'n perfformio'n well na meddygon).

Er gwaethaf twf cyson yn enghreifftiau'r byd go iawn o ddatblygiad AI a nifer y cychwyniadau sy'n cystadlu i greu'r genhedlaeth nesaf o offer trawsnewidiol, erys heriau i ddatblygu a gweithredu effeithiol. Yn benodol, nid yw allbwn AI ond mor gywir ag y mae mewnbwn yn caniatáu, sy'n golygu bod ansawdd o'r pwys mwyaf.

Ai rhwystrau datblygiad

Yr Her o Ansawdd Data Anghyson yn AI Solutions

Yn wir mae yna swm anhygoel o ddata yn cael ei gynhyrchu bob dydd: 2.5 quintillion beit, yn ôl Social Media Today. Ond nid yw hynny'n golygu ei fod i gyd yn deilwng o hyfforddi'ch algorithm. Mae rhywfaint o ddata yn anghyflawn, mae rhywfaint o ansawdd isel, ac mae peth yn syml yn anghywir, felly bydd defnyddio unrhyw ran o'r wybodaeth ddiffygiol hon yn arwain at yr un nodweddion allan o'ch arloesedd data AI (drud). Yn ôl ymchwil gan Gartner, bydd tua 85% o brosiectau AI a grëwyd erbyn 2022 yn cynhyrchu canlyniadau anghywir oherwydd data rhagfarnllyd neu wallus. Er y gallwch chi hepgor argymhelliad cân nad yw'n gweddu i'ch chwaeth yn hawdd, mae cost ariannol ac enw da sylweddol i algorithmau anghywir eraill.

Yn 2018, dechreuodd Amazon ddefnyddio teclyn llogi wedi'i bweru gan AI, wrth gynhyrchu ers 2014, a oedd â thuedd gref a digamsyniol yn erbyn menywod. Mae'n ymddangos bod y modelau cyfrifiadurol sy'n sail i'r offeryn wedi'u hyfforddi gan ddefnyddio résumés a gyflwynwyd i'r cwmni dros ddegawd. Oherwydd bod y mwyafrif o ymgeiswyr technoleg yn ddynion (ac yn dal i fod, efallai oherwydd y dechnoleg hon), penderfynodd yr algorithm gosbi résumés gyda “menywod” wedi'u cynnwys yn unrhyw le - capten pêl-droed menywod neu grŵp busnes menywod, er enghraifft. Penderfynodd hyd yn oed gosbi ymgeiswyr dau goleg menywod. Mae Amazon yn honni na ddefnyddiwyd yr offeryn erioed fel yr unig faen prawf ar gyfer gwerthuso darpar ymgeiswyr, ond eto edrychodd recriwtwyr ar yr injan argymell wrth chwilio am logi newydd.

Cafodd offeryn llogi Amazon ei ddileu yn y pen draw ar ôl blynyddoedd o waith, ond mae'r wers yn aros, gan dynnu sylw at bwysigrwydd ansawdd data wrth hyfforddi algorithmau ac offer AI. Sut olwg sydd ar ddata “o ansawdd uchel”? Yn fyr, mae'n gwirio'r pum blwch hyn:

1. Perthnasol

Er mwyn cael ei ystyried o ansawdd uchel, rhaid i ddata ddod â rhywbeth gwerthfawr i'r broses benderfynu. A oes cydberthynas rhwng statws ymgeisydd am swydd fel gladdgell polyn pencampwr y wladwriaeth a'i berfformiad yn y gwaith? Mae'n bosibl, ond mae'n ymddangos yn annhebygol iawn. Trwy chwynnu data nad yw'n berthnasol, gall algorithm ganolbwyntio ar ddidoli'r wybodaeth sydd mewn gwirionedd yn effeithio ar ganlyniadau.

2. Cywir

Rhaid i'r data rydych chi'n ei ddefnyddio gynrychioli'r syniadau rydych chi'n eu profi yn gywir. Os na, nid yw'n werth chweil. Er enghraifft, hyfforddodd Amazon ei algorithm llogi gan ddefnyddio 10 mlynedd o résumés ymgeiswyr, ond nid yw'n eglur a gadarnhaodd y cwmni'r wybodaeth a ddarparwyd ar y résumés hynny yn gyntaf. Mae ymchwil gan y cwmni gwirio cyfeiriadau Checkster yn dangos bod 78% o ymgeiswyr yn gorwedd neu y byddent yn ystyried gorwedd ar gais am swydd. Os yw algorithm yn gwneud penderfyniadau argymell gan ddefnyddio GPA ymgeisydd, er enghraifft, mae'n syniad da cadarnhau dilysrwydd y rhifau hynny yn gyntaf. Byddai'r broses hon yn cymryd amser ac arian, ond byddai hefyd yn ddiamau yn gwella cywirdeb eich canlyniadau.

3. Wedi'i drefnu'n gywir a'i anodi

Yn achos model llogi yn seiliedig ar résumés, mae anodi yn gymharol hawdd. Ar un ystyr, daw résumé ymlaen llaw, er y byddai eithriadau yn ddiau. Mae'r rhan fwyaf o ymgeiswyr yn rhestru eu profiad gwaith o dan bennawd “Profiad” a sgiliau perthnasol o dan “Sgiliau.” Fodd bynnag, mewn sefyllfaoedd eraill, fel sgrinio canser, bydd data yn llawer mwy amrywiol. Gallai gwybodaeth ddod ar ffurf delweddu meddygol, canlyniadau sgrinio corfforol, neu hyd yn oed sgwrs rhwng y meddyg a'r claf am hanes iechyd teulu ac achosion o ganser, ymhlith mathau eraill o ddata. Er mwyn i'r wybodaeth hon gyfrannu at algorithm canfod cywir, rhaid ei threfnu a'i hanodi'n ofalus i sicrhau bod y model AI yn dysgu gwneud rhagfynegiadau cywir yn seiliedig ar y casgliadau cywir.

4. Diweddar

Roedd Amazon yn ceisio creu teclyn a fyddai’n arbed amser ac arian trwy atgynhyrchu’r un penderfyniadau llogi y mae bodau dynol yn eu gwneud mewn llawer llai o amser. Er mwyn gwneud yr argymhellion mor gywir â phosibl, byddai angen cadw'r data'n gyfredol. Pe bai cwmni ar un adeg yn dangos ffafriaeth ar gyfer ymgeiswyr sydd â'r gallu i atgyweirio teipiaduron, er enghraifft, mae'n debyg na fyddai'r llogi hanesyddol hyn yn cael llawer o effaith ar ffitrwydd ymgeiswyr am swyddi heddiw ar gyfer unrhyw fath o rôl. O ganlyniad, byddai'n ddoeth eu tynnu.

5. Yn briodol amrywiol

Dewisodd peirianwyr Amazon hyfforddi algorithm gyda chronfa o ymgeiswyr a oedd yn wrywaidd dros ben. Roedd y penderfyniad hwn yn wall critigol, ac nid yw'n cael ei wneud yn llai egnïol gan mai'r rheini oedd y résumés a oedd gan y cwmni ar gael ar y pryd. Gallai peirianwyr Amazon fod wedi partneru â sefydliadau uchel eu parch â thebyg swyddi sydd ar gael a oedd wedi derbyn mwy o ymgeiswyr am swyddi benywaidd i wneud iawn am y diffyg, neu y gallai fod torri i lawr yn artiffisial nifer y résumés o ddynion i gyd-fynd â nifer y menywod a'r rhai hyfforddedig a tywysodd yr algorithm gyda chynrychiolaeth gywirach o'r boblogaeth. Y pwynt yw'r data hwnnw mae amrywiaeth yn allweddol, ac oni wneir ymdrech ar y cyd i ddileu rhagfarn mewn mewnbynnau, bydd allbynnau rhagfarnllyd drechaf.

Yn amlwg, nid yw data o ansawdd uchel yn ymddangos y tu allan i unman yn unig. Yn lle, rhaid ei guradu'n ofalus gan ystyried y canlyniadau a fwriadwyd. Yn y maes AI, dywedir yn aml fod “garbage in means garbage out.” Mae'r datganiad hwn yn wir, ond mae rhywfaint yn tanddatgan pwysigrwydd ansawdd. Gall AI brosesu llawer iawn o wybodaeth a'i throi'n unrhyw beth, o godi stoc i logi argymhellion i ddiagnosis meddygol. Mae'r gallu hwn yn llawer mwy na gallu bodau dynol, sydd hefyd yn golygu ei fod yn chwyddo'r canlyniadau. Dim ond cymaint o fenywod y gallai un recriwtiwr dynol rhagfarnllyd anwybyddu, ond gallai recriwtiwr AI rhagfarnllyd anwybyddu pob un ohonynt. Yn yr ystyr hwnnw, nid yw garbage i mewn yn golygu sothach allan yn unig - mae'n golygu y gall ychydig bach o ddata “sothach” droi yn safle tirlenwi cyfan.

Goresgyn Rhwystrau Datblygu AI

Mae ymdrechion datblygu AI yn cynnwys rhwystrau sylweddol ni waeth ym mha ddiwydiant y maent yn digwydd, ac mae'r broses o fynd o syniad dichonadwy i gynnyrch llwyddiannus yn llawn anhawster. Rhwng yr heriau o gaffael y data cywir a'r angen i'w anhysbysu i gydymffurfio â'r holl reoliadau perthnasol, gall deimlo mai llunio a hyfforddi algorithm yw'r rhan hawdd.

Er mwyn rhoi pob mantais i'ch sefydliad sy'n angenrheidiol yn yr ymdrech i ddylunio datblygiad AI newydd arloesol, byddwch chi am ystyried partneru gyda chwmni fel Shaip. Sefydlodd Chetan Parikh a Vatsal Ghiya Shaip i helpu cwmnïau i beiriannu'r mathau o atebion a allai drawsnewid gofal iechyd yn yr UD Ar ôl mwy nag 16 mlynedd mewn busnes, mae ein cwmni wedi tyfu i gynnwys mwy na 600 o aelodau'r tîm, ac rydym wedi gweithio gyda channoedd o cwsmeriaid i droi syniadau cymhellol yn atebion AI.

Gyda'n pobl, ein prosesau a'n platfform yn gweithio i'ch sefydliad, gallwch ddatgloi'r pedwar budd canlynol ar unwaith a catapwltio'ch prosiect tuag at orffeniad llwyddiannus:

1. Y gallu i ryddhau eich gwyddonwyr data

Y gallu i ryddhau eich gwyddonwyr data
Nid oes unrhyw beth o gwmpas bod y broses ddatblygu AI yn cymryd buddsoddiad sylweddol o amser, ond gallwch chi bob amser wneud y gorau o'r swyddogaethau y mae eich tîm yn treulio'r amser mwyaf yn eu cyflawni. Fe wnaethoch chi gyflogi'ch gwyddonwyr data oherwydd eu bod yn arbenigwyr ar ddatblygu algorithmau datblygedig a modelau dysgu peiriannau, ond mae'r ymchwil yn dangos yn gyson bod y gweithwyr hyn mewn gwirionedd yn treulio 80% o'u hamser yn cyrchu, glanhau a threfnu'r data a fydd yn pweru'r prosiect. Mae mwy na thri chwarter (76%) y gwyddonwyr data yn nodi bod y prosesau casglu data cyffredin hyn hefyd yn digwydd bod eu hoff rannau lleiaf o'r swydd, ond mae'r angen am ddata o ansawdd yn gadael dim ond 20% o'u hamser ar gyfer datblygiad gwirioneddol, sef y gwaith mwyaf diddorol ac ysgogol yn ddeallusol i lawer o wyddonwyr data. Trwy ddod o hyd i ddata trwy werthwr trydydd parti fel Shaip, gall cwmni adael i'w beirianwyr data drud a thalentog allanoli eu gwaith fel porthorion data ac yn lle hynny treulio'u hamser ar y rhannau o ddatrysiadau AI lle gallant gynhyrchu'r gwerth mwyaf.

2. Y gallu i sicrhau gwell canlyniadau

Y gallu i gyflawni canlyniadau gwell Mae llawer o arweinwyr datblygu AI yn penderfynu defnyddio data ffynhonnell agored neu ffynonellau torfol i leihau treuliau, ond mae'r penderfyniad hwn bron bob amser yn y pen draw yn costio mwy yn y tymor hir. Mae'r mathau hyn o ddata ar gael yn rhwydd, ond ni allant gyd-fynd ag ansawdd setiau data sydd wedi'u curadu'n ofalus. Mae data torfol yn benodol yn rhemp gyda gwallau, hepgoriadau ac anghywirdebau, ac er y gellir datrys y materion hyn weithiau yn ystod y broses ddatblygu o dan lygaid craff eich peirianwyr, mae'n cymryd iteriadau ychwanegol na fyddai eu hangen pe byddech chi'n dechrau gydag uwch -data cydraddoldeb o'r dechrau.

Mae dibynnu ar ddata ffynhonnell agored yn llwybr byr cyffredin arall sy'n dod gyda'i set ei hun o beryglon. Diffyg gwahaniaethu yw un o'r materion mwyaf, oherwydd mae'n haws ailadrodd algorithm sydd wedi'i hyfforddi gan ddefnyddio data ffynhonnell agored nag un wedi'i adeiladu ar setiau data trwyddedig. Trwy fynd ar hyd y llwybr hwn, rydych chi'n gwahodd cystadleuaeth gan newydd-ddyfodiaid eraill yn y gofod a allai danseilio'ch prisiau a chymryd cyfran o'r farchnad ar unrhyw adeg. Pan fyddwch chi'n dibynnu ar Shaip, rydych chi'n cyrchu'r data o'r ansawdd uchaf sydd wedi'i ymgynnull gan weithlu medrus a reolir, a gallwn roi trwydded unigryw i chi ar gyfer set ddata arfer sy'n atal cystadleuwyr rhag ail-greu'ch eiddo deallusol caled yn hawdd.

3. Mynediad at weithwyr proffesiynol profiadol

Mynediad at weithwyr proffesiynol profiadol Hyd yn oed os yw'ch rhestr ddyletswyddau mewnol yn cynnwys peirianwyr medrus a gwyddonwyr data talentog, gall eich offer AI elwa o'r doethineb a ddaw trwy brofiad yn unig. Mae ein harbenigwyr pwnc wedi arwain nifer o weithrediadau AI yn eu meysydd ac wedi dysgu gwersi gwerthfawr ar hyd y ffordd, a'u hunig nod yw eich helpu i gyflawni'ch un chi.

Gydag arbenigwyr parth yn nodi, trefnu, categoreiddio a labelu data i chi, rydych chi'n gwybod y gall y wybodaeth a ddefnyddir i hyfforddi'ch algorithm gynhyrchu'r canlyniadau gorau posibl. Rydym hefyd yn cynnal sicrwydd ansawdd rheolaidd i sicrhau bod data'n cwrdd â'r safonau uchaf ac y byddwn yn perfformio yn ôl y bwriad nid yn unig mewn labordy, ond hefyd mewn sefyllfa yn y byd go iawn.

4. Llinell amser datblygu carlam

Nid yw datblygiad AI yn digwydd dros nos, ond gall ddigwydd yn gyflymach pan fyddwch chi'n partneru â Shaip. Mae casglu ac anodi data mewnol yn creu tagfa weithredol sylweddol sy'n dal gweddill y broses ddatblygu. Mae gweithio gyda Shaip yn rhoi mynediad i chi ar unwaith i'n llyfrgell helaeth o ddata parod i'w defnyddio, a bydd ein harbenigwyr yn gallu dod o hyd i unrhyw fath o fewnbynnau ychwanegol sydd eu hangen arnoch gyda'n gwybodaeth ddofn am y diwydiant a'n rhwydwaith fyd-eang. Heb faich cyrchu ac anodi, gall eich tîm gyrraedd gwaith ar ddatblygiad gwirioneddol ar unwaith, a gall ein model hyfforddi helpu i nodi gwallau cynnar i leihau'r iteriadau sy'n angenrheidiol i gyflawni nodau cywirdeb.

Os nad ydych chi'n barod i allanoli pob agwedd ar eich rheolaeth data, mae Shaip hefyd yn cynnig platfform wedi'i seilio ar gymylau sy'n helpu timau i gynhyrchu, newid ac anodi gwahanol fathau o ddata yn fwy effeithlon, gan gynnwys cefnogaeth ar gyfer delweddau, fideo, testun a sain. . Mae ShaipCloud yn cynnwys amrywiaeth o offer dilysu a llif gwaith greddfol, megis datrysiad patent i olrhain a monitro llwythi gwaith, offeryn trawsgrifio i drawsgrifio recordiadau sain cymhleth ac anodd, ac elfen rheoli ansawdd i sicrhau ansawdd digyfaddawd. Gorau oll, mae'n raddadwy, felly gall dyfu wrth i ofynion amrywiol eich prosiect gynyddu.

Megis dechrau y mae oedran arloesi AI, a byddwn yn gweld datblygiadau ac arloesiadau anhygoel yn y blynyddoedd i ddod sydd â'r potensial i ail-lunio diwydiannau cyfan neu hyd yn oed newid y gymdeithas gyfan. Yn Shaip, rydym am ddefnyddio ein harbenigedd i wasanaethu fel grym trawsnewidiol, gan helpu'r cwmnïau mwyaf chwyldroadol yn y byd i harneisio pŵer atebion AI i gyflawni nodau uchelgeisiol.

Mae gennym brofiad dwfn mewn cymwysiadau gofal iechyd ac AI sgyrsiol, ond mae gennym hefyd y sgiliau angenrheidiol i hyfforddi modelau ar gyfer bron unrhyw fath o gais. I gael mwy o wybodaeth am sut y gall Shaip helpu i fynd â'ch prosiect o'r syniad i'w weithredu, edrychwch ar y nifer fawr o adnoddau sydd ar gael ar ein gwefan neu estyn allan atom heddiw.

Llinell amser datblygu carlam

Gadewch i ni siarad

  • Trwy gofrestru, rwy'n cytuno â Shaip Polisi preifatrwydd ac Telerau Gwasanaeth a rhoi fy nghaniatâd i dderbyn cyfathrebiad marchnata B2B gan Shaip.