Mae adroddiadau diweddar bod Meta wedi oedi gwaith gyda Mercor ar ôl i Mercor ddatgelu digwyddiad diogelwch sy'n gysylltiedig â'r prosiect ffynhonnell agored LiteLLM wedi tynnu sylw at ran o'r pentwr AI y mae llawer o fentrau'n dal i danamcangyfrif: yr haen data a llif gwaith y tu ôl i hyfforddi a gwerthuso modelau.
I timau AI menter, mae'r wers wirioneddol yn fwy nag un cwmni newydd neu un toriad diogelwch. Mae'n atgoffa mai dim ond mor wydn â'r gwerthwyr, yr offer, y piblinellau data, a'r rheolaethau llywodraethu sy'n eistedd y tu ôl iddynt y mae rhaglenni AI. Pan fydd sefydliadau'n dibynnu ar bartneriaid allanol ar gyfer casglu data, anodi, gwerthuso, neu lifau gwaith arbenigol, mae risg gwerthwyr yn dod yn risg model yn gyflym. Mae'r fframwaith ehangach hwnnw'n arbennig o berthnasol nawr oherwydd dywedodd Mercor ei fod yn un o filoedd o gwmnïau yr effeithiwyd arnynt gan ymosodiad cadwyn gyflenwi sy'n gysylltiedig â LiteLLM a'i fod wedi lansio ymchwiliad wedi'i gefnogi gan fforensig.
Pam mae risg gwerthwyr AI bellach yn agosach at risg model
Anaml y bydd y gadwyn gyflenwi AI fodern yn syml. Gall un llif gwaith gynnwys darparwyr data allanol, timau anodi, rhwydweithiau contractwyr, APIs, meddalwedd canol ffynhonnell agored, piblinellau meincnod, ac amgylcheddau mireinio neu werthuso mewnol. Os bydd un haen yn methu, nid yw'r effaith yn gyfyngedig i amser gweithredu. Gall effeithio ar awgrymiadau perchnogol, metadata llif gwaith, rhesymeg meincnod, gwybodaeth cwsmeriaid, neu brosesau gwerthuso mewnol. Mae stori Mercor yn atgoffa defnyddiol y gall cyflymder heb lywodraethu greu breuder cudd.
Mae angen model diwydrwydd dyladwy gwerthwr AI cryfach ar fentrau

Mae'r safon ar gyfer gwerthwyr data AI yn codi. Nid yw mentrau bellach yn gwerthuso partneriaid ar gyflymder neu raddfa yn unig, ond ar ba mor dda y gallant gefnogi piblinellau data dibynadwy, ansawdd mesuradwy, a gweithrediadau diogel a chydymffurfiol.
Dylai adolygiad gwerthwr gwmpasu mwy na'r haen uchaf
Un o'r gwersi pwysicaf o ddigwyddiad Mercor yw bod y risg yn gysylltiedig â chyfaddawd cadwyn gyflenwi yn ymwneud â LiteLLM, nid dim ond stori syml am "werthwr wedi cael ei hacio". Mewn AI, mae eich wyneb risg yn cynnwys haenau cerddorfaol, cysylltwyr, offer gwerthuso, a meddalwedd canolradd yn gynyddol. Gall gwerthwr sy'n edrych yn ddiogel barhau i gyflwyno amlygiad i lawr yr afon os nad yw'r dibyniaethau hynny'n cael eu llywodraethu'n dda.
Mae ansawdd data a llywodraethu yn anwahanadwy
Mae methiannau diogelwch yn dominyddu penawdau, ond gall llywodraethu gwan fod yr un mor gostus hyd yn oed heb doriad diogelwch. Mae cyfarwyddiadau gwael, labeli anghyson, trin achosion ymylol amwys, a llinach set ddata heb ei dogfennu i gyd yn diraddio perfformiad model dros amser.
Dyna pam mae timau AI aeddfed yn rhoi mwy a mwy o bwyslais ar sut mae adolygiad dynol wedi'i strwythuro, sut mae ansawdd yn cael ei fesur, a sut mae penderfyniadau setiau data yn cael eu dogfennu. Mae cynnwys cyhoeddus Shaip yn pwysleisio'r un cyfeiriad hwn drwy llifau gwaith o ansawdd dynol-yn-y-ddolen, Canllawiau casglu data AI, ac yn benodol i'r parth Gwasanaethau data hyfforddi LLM.
Adeiladu AI ar Ddata y gallwch ymddiried ynddo
Beth ddylai mentrau ei ofyn i unrhyw werthwr data AI nawr

Sut mae data yn cael ei gaffael, ei drwyddedu, ei ddilysu a'i lywodraethu?
Dylai gwerthwr credadwy allu esbonio tarddiad, arferion casglu, safonau dogfennu, prosesau caniatâd, a rheolau cadw. Mae canllawiau prynwyr cyhoeddus Shaip yn rhoi pwyslais cryf ar darddiad, sicrhau ansawdd, ac arferion casglu cydymffurfiol.
Pa reolaethau ansawdd dynol sydd ar waith?
Mae angen mwy na “mae gennym ni SA” ar fentrau. Mae angen adolygiad aml-haen, dyfarnu clir, cywirdeb mesuradwy, a dolenni adborth arnynt. Mae deunyddiau cyhoeddus Shaip yn pwysleisio adolygiad arbenigol a gwerthusiad dan arweiniad dynol ar gyfer llifau gwaith LLM.
Pa offer ffynhonnell agored a thrydydd parti sydd o fewn y llif gwaith?
Os na all gwerthwr esbonio ei bentwr dibyniaethau, mae hynny'n broblem llywodraethu. Mae stori Mercor yn dangos pam.
Pa dystiolaeth sy'n cefnogi cydymffurfiaeth a pharodrwydd archwilio?
Mae angen prawf ar ystum diogelwch, nid iaith y brand. Mae Shaip yn tynnu sylw'n gyhoeddus at ISO 27001:2022, HIPAA, a SOC 2 ar ei dudalen cydymffurfio.
Siop Cludfwyd Terfynol
Nid pennawd newyddion yn unig yw'r saib rhwng Meta a Mercor. Mae'n arwydd bod caffael AI yn aeddfedu. Nid dim ond a all gwerthwr eich helpu i symud yn gyflymach yw'r cwestiwn craidd mwyach. Y cwestiwn yw a all y gwerthwr hwnnw eich helpu i symud yn gyflymach heb beryglu llywodraethu, ansawdd data, neu ymddiriedaeth menter.
Mae Shaip yn helpu mentrau i adeiladu piblinellau AI cryfach drwy Data hyfforddi AI, Gwasanaethau sy'n canolbwyntio ar LLM, ac yn barod ar gyfer mentrau Diogelwch a Chydymffurfiaeth.
Beth yw risg gwerthwr data AI?
Risg gwerthwr data AI yw'r risg weithredol, diogelwch, cydymffurfiaeth ac ansawdd a gyflwynir gan ddarparwyr trydydd parti sy'n ymwneud â chasglu, anodi, gwerthuso neu offer llif gwaith data AI.
Pam mae diogelwch y gadwyn gyflenwi yn bwysig mewn deallusrwydd artiffisial?
Gan fod llifau gwaith AI yn aml yn dibynnu ar lyfrgelloedd ffynhonnell agored, haenau cerddorfaol, a chysylltwyr sy'n symud data sensitif rhwng systemau, gall gwendid mewn un ddibyniaeth effeithio ar y biblinell ehangach.
Beth ddylai mentrau chwilio amdano mewn gwerthwr data AI?
Dylai mentrau werthuso tarddiad, sicrhau ansawdd dynol, rheolaethau mynediad, archwiliadwyedd, tystiolaeth cydymffurfio, tryloywder dibyniaeth, a pharodrwydd ymateb i ddigwyddiadau. Mae canllawiau prynwyr cyhoeddus a thudalennau cydymffurfio Shaip yn adlewyrchu'r blaenoriaethau hyn.
Pam mae adolygiad dynol yn dal yn bwysig ar gyfer deallusrwydd artiffisial mewn mentrau?
Gan fod tasgau amwys neu sensitif i'r maes yn dal i fod angen barn, cyd-destun ac atebolrwydd. Mae canllawiau HITL cyhoeddus Shaip yn fframio adolygiad dynol fel pwynt rheoli craidd mewn ansawdd data.