Croeso yn ôl i ail ran ein trafodaeth hynod ddiddorol gyda ChatGPT. Yn y rhan gychwynnol o'n sgwrs, buom yn trafod rôl casglu data, anodi a phwysigrwydd Dyn-yn-y-ddolen wrth hyfforddi Modelau Mawr Ieithyddol. Byddwn nawr yn siarad am yr heriau, y rhagfarn a wynebir wrth hyfforddi modelau AI, eu cymhwysiad a sut mae modelau AI uwch yn effeithio ar fodau dynol yn gyffredinol.
- Systemau Seiliedig ar Reolau: Mae'r rhain yn cynnwys creu rheolau penodol y mae'r peiriant yn eu dilyn i anodi data. Er enghraifft, gallai fod yn rheol labelu unrhyw destun sy'n edrych fel cyfeiriad e-bost (ee, yn cynnwys symbol '@') fel 'E-bost'.
- Modelau Dysgu Peiriannau: Gellir defnyddio modelau dysgu peirianyddol sydd wedi'u hyfforddi ymlaen llaw i anodi data newydd. Er enghraifft, gellid defnyddio model adnabod endid a enwir sydd wedi’i hyfforddi ymlaen llaw i nodi a labelu endidau mewn testun.
- Dysgu Gweithredol: Yn y dull hwn, mae model dysgu peiriant yn cael ei hyfforddi i ddechrau gyda swp bach o ddata wedi'i anodi â llaw. Yna, mae'r model yn anodi'r data y mae'n fwyaf hyderus yn ei gylch, a chaiff yr anodiadau hyn eu gwirio a'u cywiro gan anodyddion dynol. Mae'r model yn cael ei ailhyfforddi gyda'r set ddata fwy hwn ac mae'r broses yn cael ei hailadrodd.
- Goruchwyliaeth Wan: Yma, defnyddir anodyddion gwan lluosog (a allai fod yn systemau seiliedig ar reolau, torfoli, heuristics, ac ati) i labelu data. Er bod pob anodydd gwan yn amherffaith, gall eu labeli cyfun ddarparu brasamcan da ar gyfer hyfforddi model cychwynnol.
- Trosglwyddo Dysgu: Mae'r dull hwn yn trosoledd model sydd wedi'i hyfforddi ar un dasg ac yn ei gymhwyso i dasg gysylltiedig arall. Er enghraifft, gellid defnyddio model sydd wedi’i hyfforddi i adnabod gwrthrychau mewn delweddau fel man cychwyn ar gyfer model sydd wedi’i ddylunio i adnabod mathau penodol o wrthrychau.
Er y gall anodi awtomataidd fod yn arf pwerus, mae'n bwysig cofio nad yw bob amser yn berffaith, a gall yr ansawdd amrywio yn seiliedig ar y dull a ddefnyddir a chymhlethdod y dasg. Gall fod gwallau oherwydd tuedd yn y rheolau cychwynnol neu'r set hyfforddi, ac mae tasgau cymhleth yn aml yn gofyn am oruchwyliaeth ddynol. Felly, cyfuniad o anodi awtomataidd ac â llaw (dysgu lled-oruchwyliaeth) yn aml yw'r dull gorau ar gyfer setiau data mawr, cymhleth.
- Amrywiaeth a Chynrychioldeb Data: Mae sicrhau bod data a gesglir yn cwmpasu senarios amrywiol ac yn cynrychioli amodau'r byd go iawn yn gywir yn heriol. Er enghraifft, mae model adnabod delweddau yn gofyn am ddelweddau gyda goleuadau, cyfeiriadedd a chefndiroedd amrywiol.
- Preifatrwydd a Moeseg Data: Mae parchu hawliau preifatrwydd a chadw at ganllawiau moesegol wrth gasglu data yn hollbwysig. Mae dienwi data cleifion mewn gofal iechyd AI yn sicrhau preifatrwydd heb gyfaddawdu ar ei ddefnyddioldeb ar gyfer hyfforddiant model.
- Ansawdd Data: Mae data o ansawdd uchel yn hanfodol; gall data swnllyd, amherthnasol neu anghywir gael effaith negyddol ar berfformiad model. Mae data cyfryngau cymdeithasol, gyda slang, teipio, a defnydd iaith anghyson, yn gosod heriau ar gyfer hyfforddiant dadansoddi teimladau.
- Ansawdd a Chysondeb Anodi: Mae sicrhau anodiadau cywir a chyson yn gymhleth. Wrth ddosbarthu delweddau, gall gwahanol anodyddion sy'n labelu'r un gwrthrych yn wahanol ddrysu'r model yn ystod yr hyfforddiant.
- Amser a chost: Mae anodi â llaw yn cymryd llawer o amser ac yn ddrud, yn enwedig ar gyfer setiau data mawr. Ar gyfer prosesu iaith naturiol, mae angen amser sylweddol ac arbenigedd ieithyddol ar anodyddion i ddeall cyd-destun y testun.
- Hyfywedd: Mae graddio'r broses anodi tra'n cynnal ansawdd yn heriol. Mae modelau iaith yn aml yn gofyn am biliynau o enghreifftiau, sy'n golygu bod angen cydlynu rhwng tîm mawr o anodyddion a sicrhau cysondeb ar draws anodiadau.
- Amwysedd Labelu: Gall labeli cywir fod yn oddrychol ac yn agored i'w dehongli. Efallai y bydd gan anodwyr farn wahanol ar dasgau dadansoddi teimladau, gan arwain at aseiniadau label gwahanol ar gyfer yr un testun.
- Data Sensitif: Mae angen rhagofalon ychwanegol wrth drin data sensitif, megis cofnodion meddygol neu ariannol. Efallai y bydd angen hyfforddiant neu ardystiad arbenigol ar anodwyr i drin y data hwn yn briodol a sicrhau ei fod yn cael ei ddiogelu.
Mae mynd i'r afael â'r heriau hyn yn aml yn gofyn am gyfuniad o gynllunio prosiect da, canllawiau clir ar gyfer casglwyr data ac anodyddion, defnyddio offer awtomataidd lle bo modd, a system gadarn ar gyfer rheoli ansawdd.
- Cydbwyso'r Set Ddata: Addaswch y set ddata i gael cynrychiolaeth gyfartal o wahanol ddosbarthiadau.
- Defnyddiwch Algorithmau Lliniaru Bias: Defnyddio technegau a gynlluniwyd i leihau tuedd yn rhagfynegiadau'r model.
- Cymhwyso Preifatrwydd Gwahaniaethol: Ychwanegu sŵn at ddata i ddiogelu priodoleddau sensitif.
- Perfformio Tiwnio Model Ymwybodol o Ragfarn: Addaswch y model gan ystyried lliniaru rhagfarn.
- Cyflogi Adolygiad Dynol a Chanllawiau: Mae adolygwyr yn dilyn canllawiau sy'n cyfarwyddo i beidio â ffafrio unrhyw grŵp yn ystod y mireinio.
- Sefydlu Dolen Adborth Barhaus: Mae rhyngweithio rheolaidd ag adolygwyr yn caniatáu dysgu parhaus a chywiro tuedd.
Cofiwch, mae dileu rhagfarn yn gyfan gwbl yn heriol, ond gall y camau hyn helpu i'w leihau.
- Cynhyrchu Cynnwys: Gallant helpu i gynhyrchu cynnwys fel erthyglau, adroddiadau a negeseuon e-bost.
- Gwasanaeth Cwsmeriaid: Gellir eu defnyddio mewn chatbots a chynorthwywyr rhithwir i awtomeiddio cymorth i gwsmeriaid.
- Cyfieithu Iaith: Gallant helpu i gyfieithu testun rhwng gwahanol ieithoedd.
- Tiwtora: Gallant roi esboniadau ar bynciau amrywiol, gan helpu mewn addysg.
- Ysgrifennu Cod: Gallant gynorthwyo i ysgrifennu cod, gan gynorthwyo datblygiad meddalwedd.
- Marchnata a Hysbysebu: Gallant gynhyrchu cynnwys creadigol ar gyfer ymgyrchoedd marchnata.
- Hygyrchedd: Gallant helpu i gynhyrchu lleferydd ar gyfer cymwysiadau testun-i-leferydd.
- Awtomeiddio Swyddi: Gallai tasgau arferol a chyffredin, yn enwedig mewn sectorau fel gweithgynhyrchu, logisteg, a gwaith clerigol, gael eu hawtomeiddio, gan arwain at ddadleoli swyddi.
- Creu Swyddi Newydd: Ar yr ochr gadarnhaol, byddai cynnydd AI yn creu rolau newydd nad oeddent yn bodoli o'r blaen, megis arbenigwyr AI, dadansoddwyr data, peirianwyr dysgu peiriannau, a rolau mewn moeseg a pholisi AI.
- Trawsnewid Swyddi: Bydd llawer o swyddi'n cael eu trawsnewid yn hytrach na'u dileu, gydag AI yn cymryd drosodd agweddau arferol o'r gwaith, gan ryddhau gweithwyr i ganolbwyntio ar dasgau mwy cymhleth a chreadigol.
- Newid Galw Sgiliau: Bydd galw cynyddol am sgiliau digidol a dealltwriaeth o ddeallusrwydd artiffisial, a allai arwain at fwlch sgiliau yn y tymor byr.
Felly, er y bydd AI yn sicr yn amharu ar farchnadoedd swyddi, mae hefyd yn cyflwyno cyfleoedd ar gyfer swyddi newydd a chynhyrchiant cynyddol.
- Diffyg Dealltwriaeth: Nid yw modelau AI yn deall cyd-destun na chysyniadau yn yr un ffordd ag y mae bodau dynol. Maent yn nodi patrymau mewn data ond nid ydynt yn deall yr ystyr sylfaenol.
- Dibyniaeth Data: Mae angen llawer iawn o ddata arnynt ar gyfer hyfforddiant. Os yw'r data'n rhagfarnllyd, yn anghyflawn, neu o ansawdd gwael, gellir effeithio'n sylweddol ar berfformiad y model.
- Cyffredinoli: Mae modelau sydd wedi’u hyfforddi ar dasgau neu setiau data penodol yn aml yn ei chael hi’n anodd cyffredinoli eu dysgu i senarios newydd, nas gwelwyd.
- Eglurhad: Yn aml mae'n anodd deall pam mae rhai modelau (yn enwedig modelau dysgu dwfn) wedi gwneud penderfyniadau penodol, gan arwain at ddiffyg tryloywder neu ddehongliad.
- Cadernid: Gall modelau AI fod yn sensitif i fân newidiadau mewn data mewnbwn (sŵn, afluniad) ac efallai na fyddant yn perfformio'n ddibynadwy ym mhob cyflwr.
- Pryderon Moesegol: Gall cymwysiadau AI arwain at faterion preifatrwydd, camddefnydd posibl, neu ragfarn anfwriadol, gan godi pryderon moesegol a chyfreithiol.
O’m gwybodaeth i’w diwedd ym mis Medi 2021, mae AI wedi cymryd camau breision o ran dealltwriaeth gyd-destunol, yn enwedig gyda datblygiad modelau iaith soffistigedig fel GPT-3 a GPT-4. Gall y modelau hyn gynhyrchu testun tebyg i ddyn yn seiliedig ar y mewnbwn a gânt a'u dealltwriaeth fewnol o'r berthynas rhwng geiriau a chysyniadau.
Fodd bynnag, mae'n bwysig nodi bod y “ddealltwriaeth” hon yn wahanol i ddealltwriaeth ddynol. Nid yw systemau AI, fel y maent yn bodoli ar hyn o bryd, yn meddu ar ymwybyddiaeth, hunanymwybyddiaeth, na'r un dyfnder o wybodaeth trwy brofiad ag sydd gan fodau dynol. Maent yn dehongli cyd-destun yn seiliedig ar batrymau mewn data, nid ar brofiad byw neu afael greddfol ar naws. Felly, mae eu dealltwriaeth o'r cyd-destun yn sylfaenol wahanol i'n dealltwriaeth ni.
Er enghraifft, er y gall Deallusrwydd Artiffisial gynhyrchu ymateb i gwestiwn am brofiad personol, megis “sut oeddech chi'n teimlo ar eich diwrnod cyntaf yn yr ysgol?”, mae'n gwneud hynny ar sail patrymau yn y data y cafodd ei hyfforddi arno, nid ar unrhyw ddata. profiad personol neu emosiynau sydd ganddo. Nid oes gan AI deimladau na phrofiadau personol.
O ran y dyfodol, mae’n anodd dweud. Mae cynnydd mewn ymchwil a datblygu AI yn parhau ar gyflymder cyflym, ond mae'r naid o gydnabod patrwm i ddealltwriaeth ac ymwybyddiaeth wirioneddol debyg i ddynol yn un enfawr, ac nid ydym yn gwybod eto a yw'n bosibl na sut y byddai'n cael ei gyflawni. Hyd yn oed os daw systemau deallusrwydd artiffisial yn fwy soffistigedig wrth ddehongli cyd-destun, ni fydd hyn o reidrwydd yn golygu bod ganddynt ddealltwriaeth ddynol ohono.
- Gwell dealltwriaeth a chynhyrchiad iaith naturiol: Mwy o AI sgyrsiol tebyg i ddynol a chyfieithiadau awtomataidd gwell.
- Tegwch AI, eglurdeb, a thryloywder: Technegau ar gyfer deall gwneud penderfyniadau AI, sicrhau tegwch, a hyrwyddo tryloywder.
- AI mewn gofal iechyd: Gwell diagnosis o glefydau, rhagfynegi canlyniadau cleifion, a thriniaeth bersonol trwy AI.
- Dysgu atgyfnerthu a deallusrwydd artiffisial cyffredinol: Systemau AI mwy addasadwy a all ddysgu amrywiaeth o dasgau ac addasu i sefyllfaoedd newydd.
- AI a chyfrifiadura cwantwm: Cryfhau pŵer cyfrifiannol gan alluogi modelau mwy cymhleth ac amseroedd hyfforddi cyflymach.
- Dysgu Ffederal: Dysgu peirianyddol sy'n cadw preifatrwydd sy'n hyfforddi modelau ar draws dyfeisiau lluosog heb rannu data.