最近,人社部公布了一批新職業(yè),其中有個(gè)新職業(yè)叫作“人工智能訓(xùn)練師”?!叭斯ぶ悄苡?xùn)練師”究竟做些啥?我們來看看。
算法、算力與數(shù)據(jù)是人工智能發(fā)展的三大要素,其中數(shù)據(jù)是人工智能發(fā)展的燃料。每天,人類社會(huì)產(chǎn)生的海量數(shù)據(jù)必須經(jīng)過清洗與標(biāo)注,換成人工智能熟悉的語言才有價(jià)值。因此,人工智能訓(xùn)練師主要任務(wù)就是數(shù)據(jù)采集和標(biāo)注,特別是數(shù)據(jù)標(biāo)注。如果說人工智能是個(gè)孩子,數(shù)據(jù)標(biāo)注師就是帶領(lǐng)這個(gè)孩子認(rèn)識(shí)世界的啟蒙老師。有了足夠多、足夠好的數(shù)據(jù),AI才能學(xué)會(huì)像人一樣去感知、思考和決策,更好地為人類服務(wù)。
人工智能產(chǎn)業(yè)發(fā)展之初,數(shù)據(jù)采集與標(biāo)注需要人力完成的部分比較多,現(xiàn)在數(shù)據(jù)平臺(tái)已有了持續(xù)學(xué)習(xí)能力,大部分采集與標(biāo)注工作人工智能自己就可完成,實(shí)現(xiàn)預(yù)標(biāo)注與自動(dòng)標(biāo)注。因此,目前數(shù)據(jù)標(biāo)注工作以機(jī)器輔助與人工標(biāo)注結(jié)合為主。除了眼底檢查片、肺部X光片等技術(shù)含量較高有專業(yè)要求,大多數(shù)人均能按照規(guī)則,在平臺(tái)上完成語音、人臉、道路的標(biāo)注操作,只要能熟練操作電腦即可。
數(shù)據(jù)標(biāo)注技術(shù)門檻低,招工人群范圍廣泛,對(duì)于促進(jìn)就業(yè)作用顯著。業(yè)內(nèi)人士介紹,目前公司招聘的員工以大專生為主;標(biāo)注規(guī)則由百度與相關(guān)領(lǐng)域?qū)<夜餐贫?,并形成可操作軟件平臺(tái)提供給企業(yè),對(duì)員工簡單培訓(xùn)就能上手。以人臉識(shí)別為例,目前他們能實(shí)現(xiàn)對(duì)約150個(gè)特征點(diǎn)的標(biāo)注。大致標(biāo)注規(guī)則是數(shù)據(jù)標(biāo)注師看到雙眼皮就標(biāo)記雙眼皮,看到獅子鼻就標(biāo)記獅子鼻,讓機(jī)器自己理解與學(xué)習(xí)。標(biāo)注特征點(diǎn)越多,AI就越能精確識(shí)別人臉。
數(shù)據(jù)標(biāo)注員的工作隨著人工智能發(fā)展需求不斷調(diào)整。前幾年人工智能發(fā)展伊始,語音識(shí)別、人臉、圖像等識(shí)別需求大;近幾年無人駕駛進(jìn)入發(fā)展快車道,人工智能訓(xùn)練師就改成標(biāo)注無人車、地圖、3D點(diǎn)云等數(shù)據(jù),天天看的是車道線、行人、障礙物。
有了足夠技術(shù)基礎(chǔ),數(shù)據(jù)標(biāo)注員還能教會(huì)人工智能新任務(wù)。疫情期間,戴口罩的人臉識(shí)別需求激增。“根據(jù)客戶需求,山西數(shù)據(jù)標(biāo)注基地采集了大量戴口罩人臉照片,由數(shù)據(jù)標(biāo)注師對(duì)眉毛、眼鏡、顴骨等人臉關(guān)鍵點(diǎn)精準(zhǔn)標(biāo)注,訓(xùn)練人工智能完成了戴口罩人臉圖像識(shí)別?!卑俣龋ㄉ轿鳎┤斯ぶ悄芑A(chǔ)數(shù)據(jù)產(chǎn)業(yè)基地負(fù)責(zé)人尉赤說,“人們能在不摘口罩情況下實(shí)現(xiàn)精確體溫測量,或是通過人臉識(shí)別通道閘機(jī),背后就是這些數(shù)據(jù)標(biāo)注員在訓(xùn)練人工智能。”
未來,數(shù)據(jù)標(biāo)注人工智能訓(xùn)練師,將成為創(chuàng)造大量就業(yè)需求的新興職業(yè)領(lǐng)域。