Gorffennaf 18, 2023

Tu ôl i'r Llenni: Archwilio Gwaith Mewnol ChatGPT - Rhan 2

Croeso yn ôl i ail ran ein trafodaeth hynod ddiddorol gyda ChatGPT. Yn y rhan gychwynnol o'n sgwrs, buom yn trafod rôl casglu data, anodi a phwysigrwydd Dyn-yn-y-ddolen wrth hyfforddi Modelau Mawr Ieithyddol. Byddwn nawr yn siarad am yr heriau, y rhagfarn a wynebir wrth hyfforddi modelau AI, eu cymhwysiad a sut mae modelau AI uwch yn effeithio ar fodau dynol yn gyffredinol.

Gall, gall awtomeiddio'r broses o anodi data yn wir leihau'r amser, y gost, a'r gwall dynol posibl sy'n gysylltiedig ag anodi â llaw. Gwneir hyn yn aml trwy dechnegau a elwir yn "labelu awtomatig" neu "ddysgu lled-oruchwyliaeth." Dyma ychydig o strategaethau ar gyfer anodi awtomataidd:

Systemau Seiliedig ar Reolau: Mae'r rhain yn cynnwys creu rheolau penodol y mae'r peiriant yn eu dilyn i anodi data. Er enghraifft, gallai fod yn rheol labelu unrhyw destun sy'n edrych fel cyfeiriad e-bost (ee, yn cynnwys symbol '@') fel 'E-bost'.
Modelau Dysgu Peiriannau: Gellir defnyddio modelau dysgu peirianyddol sydd wedi'u hyfforddi ymlaen llaw i anodi data newydd. Er enghraifft, gellid defnyddio model adnabod endid a enwir sydd wedi’i hyfforddi ymlaen llaw i nodi a labelu endidau mewn testun.
Dysgu Gweithredol: Yn y dull hwn, mae model dysgu peiriant yn cael ei hyfforddi i ddechrau gyda swp bach o ddata wedi'i anodi â llaw. Yna, mae'r model yn anodi'r data y mae'n fwyaf hyderus yn ei gylch, a chaiff yr anodiadau hyn eu gwirio a'u cywiro gan anodyddion dynol. Mae'r model yn cael ei ailhyfforddi gyda'r set ddata fwy hwn ac mae'r broses yn cael ei hailadrodd.
Goruchwyliaeth Wan: Yma, defnyddir anodyddion gwan lluosog (a allai fod yn systemau seiliedig ar reolau, torfoli, heuristics, ac ati) i labelu data. Er bod pob anodydd gwan yn amherffaith, gall eu labeli cyfun ddarparu brasamcan da ar gyfer hyfforddi model cychwynnol.
Trosglwyddo Dysgu: Mae'r dull hwn yn trosoledd model sydd wedi'i hyfforddi ar un dasg ac yn ei gymhwyso i dasg gysylltiedig arall. Er enghraifft, gellid defnyddio model sydd wedi’i hyfforddi i adnabod gwrthrychau mewn delweddau fel man cychwyn ar gyfer model sydd wedi’i ddylunio i adnabod mathau penodol o wrthrychau.

Er y gall anodi awtomataidd fod yn arf pwerus, mae'n bwysig cofio nad yw bob amser yn berffaith, a gall yr ansawdd amrywio yn seiliedig ar y dull a ddefnyddir a chymhlethdod y dasg. Gall fod gwallau oherwydd tuedd yn y rheolau cychwynnol neu'r set hyfforddi, ac mae tasgau cymhleth yn aml yn gofyn am oruchwyliaeth ddynol. Felly, cyfuniad o anodi awtomataidd ac â llaw (dysgu lled-oruchwyliaeth) yn aml yw'r dull gorau ar gyfer setiau data mawr, cymhleth.

Gall casglu ac anodi data ar gyfer prosiectau AI a dysgu peirianyddol gyflwyno sawl her, gan gynnwys:

Amrywiaeth a Chynrychioldeb Data: Mae sicrhau bod data a gesglir yn cwmpasu senarios amrywiol ac yn cynrychioli amodau'r byd go iawn yn gywir yn heriol. Er enghraifft, mae model adnabod delweddau yn gofyn am ddelweddau gyda goleuadau, cyfeiriadedd a chefndiroedd amrywiol.
Preifatrwydd a Moeseg Data: Mae parchu hawliau preifatrwydd a chadw at ganllawiau moesegol wrth gasglu data yn hollbwysig. Mae dienwi data cleifion mewn gofal iechyd AI yn sicrhau preifatrwydd heb gyfaddawdu ar ei ddefnyddioldeb ar gyfer hyfforddiant model.
Ansawdd Data: Mae data o ansawdd uchel yn hanfodol; gall data swnllyd, amherthnasol neu anghywir gael effaith negyddol ar berfformiad model. Mae data cyfryngau cymdeithasol, gyda slang, teipio, a defnydd iaith anghyson, yn gosod heriau ar gyfer hyfforddiant dadansoddi teimladau.
Ansawdd a Chysondeb Anodi: Mae sicrhau anodiadau cywir a chyson yn gymhleth. Wrth ddosbarthu delweddau, gall gwahanol anodyddion sy'n labelu'r un gwrthrych yn wahanol ddrysu'r model yn ystod yr hyfforddiant.
Amser a chost: Mae anodi â llaw yn cymryd llawer o amser ac yn ddrud, yn enwedig ar gyfer setiau data mawr. Ar gyfer prosesu iaith naturiol, mae angen amser sylweddol ac arbenigedd ieithyddol ar anodyddion i ddeall cyd-destun y testun.
Hyfywedd: Mae graddio'r broses anodi tra'n cynnal ansawdd yn heriol. Mae modelau iaith yn aml yn gofyn am biliynau o enghreifftiau, sy'n golygu bod angen cydlynu rhwng tîm mawr o anodyddion a sicrhau cysondeb ar draws anodiadau.
Amwysedd Labelu: Gall labeli cywir fod yn oddrychol ac yn agored i'w dehongli. Efallai y bydd gan anodwyr farn wahanol ar dasgau dadansoddi teimladau, gan arwain at aseiniadau label gwahanol ar gyfer yr un testun.
Data Sensitif: Mae angen rhagofalon ychwanegol wrth drin data sensitif, megis cofnodion meddygol neu ariannol. Efallai y bydd angen hyfforddiant neu ardystiad arbenigol ar anodwyr i drin y data hwn yn briodol a sicrhau ei fod yn cael ei ddiogelu.

Mae mynd i'r afael â'r heriau hyn yn aml yn gofyn am gyfuniad o gynllunio prosiect da, canllawiau clir ar gyfer casglwyr data ac anodyddion, defnyddio offer awtomataidd lle bo modd, a system gadarn ar gyfer rheoli ansawdd.

Mae rhagfarn mewn data hyfforddi yn broblem sylweddol mewn dysgu peirianyddol oherwydd bod modelau’n dysgu o’r data y maent wedi’u hyfforddi arno. Os yw'r data hyfforddi yn rhagfarnllyd, gall rhagfynegiadau'r model fod yn unochrog hefyd. Dyma rai ffyrdd o fynd i'r afael â thueddiadau yn ystod y broses fireinio:

Cydbwyso'r Set Ddata: Addaswch y set ddata i gael cynrychiolaeth gyfartal o wahanol ddosbarthiadau.
Defnyddiwch Algorithmau Lliniaru Bias: Defnyddio technegau a gynlluniwyd i leihau tuedd yn rhagfynegiadau'r model.
Cymhwyso Preifatrwydd Gwahaniaethol: Ychwanegu sŵn at ddata i ddiogelu priodoleddau sensitif.
Perfformio Tiwnio Model Ymwybodol o Ragfarn: Addaswch y model gan ystyried lliniaru rhagfarn.
Cyflogi Adolygiad Dynol a Chanllawiau: Mae adolygwyr yn dilyn canllawiau sy'n cyfarwyddo i beidio â ffafrio unrhyw grŵp yn ystod y mireinio.
Sefydlu Dolen Adborth Barhaus: Mae rhyngweithio rheolaidd ag adolygwyr yn caniatáu dysgu parhaus a chywiro tuedd.

Cofiwch, mae dileu rhagfarn yn gyfan gwbl yn heriol, ond gall y camau hyn helpu i'w leihau.

Mae gan fodelau iaith mawr ystod eang o gymwysiadau ymarferol mewn diwydiannau amrywiol:

Cynhyrchu Cynnwys: Gallant helpu i gynhyrchu cynnwys fel erthyglau, adroddiadau a negeseuon e-bost.
Gwasanaeth Cwsmeriaid: Gellir eu defnyddio mewn chatbots a chynorthwywyr rhithwir i awtomeiddio cymorth i gwsmeriaid.
Cyfieithu Iaith: Gallant helpu i gyfieithu testun rhwng gwahanol ieithoedd.
Tiwtora: Gallant roi esboniadau ar bynciau amrywiol, gan helpu mewn addysg.
Ysgrifennu Cod: Gallant gynorthwyo i ysgrifennu cod, gan gynorthwyo datblygiad meddalwedd.
Marchnata a Hysbysebu: Gallant gynhyrchu cynnwys creadigol ar gyfer ymgyrchoedd marchnata.
Hygyrchedd: Gallant helpu i gynhyrchu lleferydd ar gyfer cymwysiadau testun-i-leferydd.

Gallai modelau AI uwch ail-lunio marchnadoedd swyddi mewn sawl ffordd:

Awtomeiddio Swyddi: Gallai tasgau arferol a chyffredin, yn enwedig mewn sectorau fel gweithgynhyrchu, logisteg, a gwaith clerigol, gael eu hawtomeiddio, gan arwain at ddadleoli swyddi.
Creu Swyddi Newydd: Ar yr ochr gadarnhaol, byddai cynnydd AI yn creu rolau newydd nad oeddent yn bodoli o'r blaen, megis arbenigwyr AI, dadansoddwyr data, peirianwyr dysgu peiriannau, a rolau mewn moeseg a pholisi AI.
Trawsnewid Swyddi: Bydd llawer o swyddi'n cael eu trawsnewid yn hytrach na'u dileu, gydag AI yn cymryd drosodd agweddau arferol o'r gwaith, gan ryddhau gweithwyr i ganolbwyntio ar dasgau mwy cymhleth a chreadigol.
Newid Galw Sgiliau: Bydd galw cynyddol am sgiliau digidol a dealltwriaeth o ddeallusrwydd artiffisial, a allai arwain at fwlch sgiliau yn y tymor byr.

Felly, er y bydd AI yn sicr yn amharu ar farchnadoedd swyddi, mae hefyd yn cyflwyno cyfleoedd ar gyfer swyddi newydd a chynhyrchiant cynyddol.

Mae gan fodelau AI a dysgu peiriannau cyfredol, er gwaethaf eu galluoedd rhyfeddol, nifer o gyfyngiadau o hyd:

Diffyg Dealltwriaeth: Nid yw modelau AI yn deall cyd-destun na chysyniadau yn yr un ffordd ag y mae bodau dynol. Maent yn nodi patrymau mewn data ond nid ydynt yn deall yr ystyr sylfaenol.
Dibyniaeth Data: Mae angen llawer iawn o ddata arnynt ar gyfer hyfforddiant. Os yw'r data'n rhagfarnllyd, yn anghyflawn, neu o ansawdd gwael, gellir effeithio'n sylweddol ar berfformiad y model.
Cyffredinoli: Mae modelau sydd wedi’u hyfforddi ar dasgau neu setiau data penodol yn aml yn ei chael hi’n anodd cyffredinoli eu dysgu i senarios newydd, nas gwelwyd.
Eglurhad: Yn aml mae'n anodd deall pam mae rhai modelau (yn enwedig modelau dysgu dwfn) wedi gwneud penderfyniadau penodol, gan arwain at ddiffyg tryloywder neu ddehongliad.
Cadernid: Gall modelau AI fod yn sensitif i fân newidiadau mewn data mewnbwn (sŵn, afluniad) ac efallai na fyddant yn perfformio'n ddibynadwy ym mhob cyflwr.
Pryderon Moesegol: Gall cymwysiadau AI arwain at faterion preifatrwydd, camddefnydd posibl, neu ragfarn anfwriadol, gan godi pryderon moesegol a chyfreithiol.

Mae’r cwestiwn a all AI byth ddeall y cyd-destun yn yr un ffordd ag y mae dyn yn un cymhleth ac mae’n cynnwys y ddadl barhaus am natur AI ac ymwybyddiaeth.

O’m gwybodaeth i’w diwedd ym mis Medi 2021, mae AI wedi cymryd camau breision o ran dealltwriaeth gyd-destunol, yn enwedig gyda datblygiad modelau iaith soffistigedig fel GPT-3 a GPT-4. Gall y modelau hyn gynhyrchu testun tebyg i ddyn yn seiliedig ar y mewnbwn a gânt a'u dealltwriaeth fewnol o'r berthynas rhwng geiriau a chysyniadau.

Fodd bynnag, mae'n bwysig nodi bod y “ddealltwriaeth” hon yn wahanol i ddealltwriaeth ddynol. Nid yw systemau AI, fel y maent yn bodoli ar hyn o bryd, yn meddu ar ymwybyddiaeth, hunanymwybyddiaeth, na'r un dyfnder o wybodaeth trwy brofiad ag sydd gan fodau dynol. Maent yn dehongli cyd-destun yn seiliedig ar batrymau mewn data, nid ar brofiad byw neu afael greddfol ar naws. Felly, mae eu dealltwriaeth o'r cyd-destun yn sylfaenol wahanol i'n dealltwriaeth ni.

Er enghraifft, er y gall Deallusrwydd Artiffisial gynhyrchu ymateb i gwestiwn am brofiad personol, megis “sut oeddech chi'n teimlo ar eich diwrnod cyntaf yn yr ysgol?”, mae'n gwneud hynny ar sail patrymau yn y data y cafodd ei hyfforddi arno, nid ar unrhyw ddata. profiad personol neu emosiynau sydd ganddo. Nid oes gan AI deimladau na phrofiadau personol.

O ran y dyfodol, mae’n anodd dweud. Mae cynnydd mewn ymchwil a datblygu AI yn parhau ar gyflymder cyflym, ond mae'r naid o gydnabod patrwm i ddealltwriaeth ac ymwybyddiaeth wirioneddol debyg i ddynol yn un enfawr, ac nid ydym yn gwybod eto a yw'n bosibl na sut y byddai'n cael ei gyflawni. Hyd yn oed os daw systemau deallusrwydd artiffisial yn fwy soffistigedig wrth ddehongli cyd-destun, ni fydd hyn o reidrwydd yn golygu bod ganddynt ddealltwriaeth ddynol ohono.

Er ei bod yn amhosibl rhagweld yn bendant, mae arbenigwyr ym maes deallusrwydd artiffisial wedi nodi sawl maes lle disgwylir datblygiadau sylweddol yn y dyfodol agos, o’m gwybodaeth i ym mis Medi 2021:

Gwell dealltwriaeth a chynhyrchiad iaith naturiol: Mwy o AI sgyrsiol tebyg i ddynol a chyfieithiadau awtomataidd gwell.
Tegwch AI, eglurdeb, a thryloywder: Technegau ar gyfer deall gwneud penderfyniadau AI, sicrhau tegwch, a hyrwyddo tryloywder.
AI mewn gofal iechyd: Gwell diagnosis o glefydau, rhagfynegi canlyniadau cleifion, a thriniaeth bersonol trwy AI.
Dysgu atgyfnerthu a deallusrwydd artiffisial cyffredinol: Systemau AI mwy addasadwy a all ddysgu amrywiaeth o dasgau ac addasu i sefyllfaoedd newydd.
AI a chyfrifiadura cwantwm: Cryfhau pŵer cyfrifiannol gan alluogi modelau mwy cymhleth ac amseroedd hyfforddi cyflymach.
Dysgu Ffederal: Dysgu peirianyddol sy'n cadw preifatrwydd sy'n hyfforddi modelau ar draws dyfeisiau lluosog heb rannu data.

Croeso! Rwy'n falch y gallwn eich cynorthwyo. Peidiwch ag oedi cyn estyn allan os oes gennych fwy o gwestiynau yn y dyfodol. Cael diwrnod gwych!

Cyfran Gymdeithasol

Siaradwch ag Arbenigwr

Enw cyntaf*
Cyfenw*
E-bost*
Rhif Ffôn*
Cwmni *
Gwlad*
Gwlad
sylwadau*
Trwy gofrestru, rwy'n cytuno â Shaip Polisi preifatrwydd ac Telerau Gwasanaeth a rhoi fy nghaniatâd i dderbyn cyfathrebiad marchnata B2B gan Shaip.
CAPTCHA

Dadlwythwch y Llyfr Am Ddim

Efallai yr hoffech

Tu ôl i'r Llenni: Archwilio Gwaith Mewnol ChatGPT - Rhan 2

Cyfran Gymdeithasol

Siaradwch ag Arbenigwr

Cynnydd Cynorthwywyr Llais Seiliedig ar AI i Wella Ansawdd Gofal Iechyd

Cipolwg ar Ddyfodol Automobiles wrth Ôl-edrych i AI Sgyrsiol

Tu ôl i'r Llenni: Archwilio Gwaith Mewnol ChatGPT - Rhan 1

Gwasanaethau Data AI

Cwrw Arbenigol

Diwydiant

cynhyrchion

Cwmni

Adnoddau

Cysylltu â ni