Astudiaeth Achos: Cymedroli Cynnwys
Gwefan 30K+ wedi'i sgrapio a'i hanodi ar gyfer Cymedroli Cynnwys
sy'n ymdrechu i sicrhau'r gofod ar-lein lle rydym yn cysylltu a chyfathrebu.
Wrth i ddefnydd cyfryngau cymdeithasol barhau i dyfu, mae'r
problem seiberfwlio wedi dod i'r amlwg fel a
rhwystr sylweddol i lwyfannau ymdrechu i'w cyflawni
sicrhau lle diogel ar-lein. A syfrdanol
Mae 38% o unigolion yn dod ar draws hyn
ymddygiad niweidiol yn ddyddiol,
gan bwysleisio'r galw brys am ddyfeisgar
dulliau safoni cynnwys.
Mae sefydliadau heddiw yn dibynnu ar y defnydd o
deallusrwydd artiffisial i fynd i'r afael â'r parhaus
problem seiberfwlio yn rhagweithiol.
Seiberddiogelwch:
Datgelodd Adroddiad Gorfodi Safonau Cymunedol Ch4 Facebook – gweithredu ar 6.3 miliwn o ddarnau o gynnwys bwlio ac aflonyddu, gyda chyfradd ddatrys ragweithiol o 49.9%
Addysg:
A 2021 canfu astudiaeth fod 36.5%% y myfyrwyr yn y taleithiau unedig rhwng yr oedrannau 12 & 17 blynyddoedd wedi profi seiberfwlio ar ryw adeg neu'i gilydd yn ystod eu haddysg.
Yn ôl adroddiad yn 2020, prisiwyd y farchnad datrysiadau safoni cynnwys byd-eang ar USD 4.07 biliwn yn 2019 a disgwylir iddi gyrraedd USD 11.94 biliwn erbyn 2027, gyda CAGR o 14.7%.
Datrysiad y Byd Go Iawn
Data sy'n cymedroli sgyrsiau byd-eang
Roedd y cleient yn datblygu system awtomataidd gadarn
safoni cynnwys Machine Learning
model ar gyfer ei offrwm Cloud, ar gyfer y maent
yn chwilio am werthwr parth-benodol sydd
allai eu cynorthwyo gyda data hyfforddi cywir.
Gan ddefnyddio ein gwybodaeth helaeth mewn prosesu iaith naturiol (NLP), buom yn cynorthwyo'r cleient i gasglu, categoreiddio, ac anodi mwy na 30,000 o ddogfennau yn Saesneg a Sbaeneg i adeiladu Model Dysgu Peiriant Cymedroli cynnwys awtomataidd wedi'i rannu'n gynnwys Gwenwynig, Aeddfed neu Rhywiol. categorïau.
Problem
- Crafu gwe 30,000 o ddogfennau yn Sbaeneg a Saesneg o barthau blaenoriaeth
- Categoreiddio'r cynnwys a gasglwyd yn segmentau byr, canolig a hir
- Labelu'r data a gasglwyd fel cynnwys gwenwynig, aeddfed neu rywiol eglur
- Sicrhau anodiadau o ansawdd uchel gyda chywirdeb o leiaf 90%.
Ateb
- Web Wedi dileu 30,000 o ddogfennau yr un ar gyfer Sbaeneg a Saesneg o BFSI, Gofal Iechyd, Gweithgynhyrchu, Manwerthu. Rhannwyd y cynnwys ymhellach yn ddogfennau byr, canolig a hir
- Roedd labelu'r cynnwys yn llwyddiannus wedi'i ddosbarthu fel cynnwys gwenwynig, aeddfed, neu gynnwys rhywiol amlwg
- Er mwyn cyflawni ansawdd 90%, gweithredodd Shaip broses rheoli ansawdd dwy haen:
» Lefel 1: Gwiriad Sicrwydd Ansawdd: 100% o'r ffeiliau i'w dilysu.
» Lefel 2: Gwiriad Dadansoddi Ansawdd Critigol: Tîm CQA Shaips i asesu 15%-20% o'r samplau ôl-weithredol.
Canlyniad
Helpodd y data hyfforddi i adeiladu model ML safoni cynnwys awtomataidd a all esgor ar nifer o ganlyniadau buddiol ar gyfer cynnal amgylchedd ar-lein mwy diogel. Mae rhai o’r canlyniadau allweddol yn cynnwys:
- Effeithlonrwydd i brosesu swm helaeth o ddata
- Cysondeb wrth sicrhau gorfodi unffurf o bolisïau safoni
- Scalability i addasu i sylfaen gynyddol o ddefnyddwyr a maint y cynnwys
- Gall Cymedroli amser real nodi a
cael gwared ar gynnwys a allai fod yn niweidiol wrth iddo gael ei gynhyrchu - Cost-effeithiolrwydd trwy leihau'r ddibyniaeth ar gymedrolwyr dynol
Enghreifftiau o Gymedroli Cynnwys
Dywedwch wrthym sut y gallwn helpu gyda'ch menter AI nesaf.