最近,人社部公布了一批新職業(yè),其中有個新職業(yè)叫作“人工智能訓練師”?!叭斯ぶ悄苡柧殠煛本烤棺鲂┥??我們來看看。
算法、算力與數(shù)據(jù)是人工智能發(fā)展的三大要素,其中數(shù)據(jù)是人工智能發(fā)展的燃料。每天,人類社會產(chǎn)生的海量數(shù)據(jù)必須經(jīng)過清洗與標注,換成人工智能熟悉的語言才有價值。因此,人工智能訓練師主要任務就是數(shù)據(jù)采集和標注,特別是數(shù)據(jù)標注。如果說人工智能是個孩子,數(shù)據(jù)標注師就是帶領這個孩子認識世界的啟蒙老師。有了足夠多、足夠好的數(shù)據(jù),AI才能學會像人一樣去感知、思考和決策,更好地為人類服務。
人工智能產(chǎn)業(yè)發(fā)展之初,數(shù)據(jù)采集與標注需要人力完成的部分比較多,現(xiàn)在數(shù)據(jù)平臺已有了持續(xù)學習能力,大部分采集與標注工作人工智能自己就可完成,實現(xiàn)預標注與自動標注。因此,目前數(shù)據(jù)標注工作以機器輔助與人工標注結(jié)合為主。除了眼底檢查片、肺部X光片等技術(shù)含量較高有專業(yè)要求,大多數(shù)人均能按照規(guī)則,在平臺上完成語音、人臉、道路的標注操作,只要能熟練操作電腦即可。
數(shù)據(jù)標注技術(shù)門檻低,招工人群范圍廣泛,對于促進就業(yè)作用顯著。業(yè)內(nèi)人士介紹,目前公司招聘的員工以大專生為主;標注規(guī)則由百度與相關領域?qū)<夜餐贫?,并形成可操作軟件平臺提供給企業(yè),對員工簡單培訓就能上手。以人臉識別為例,目前他們能實現(xiàn)對約150個特征點的標注。大致標注規(guī)則是數(shù)據(jù)標注師看到雙眼皮就標記雙眼皮,看到獅子鼻就標記獅子鼻,讓機器自己理解與學習。標注特征點越多,AI就越能精確識別人臉。
數(shù)據(jù)標注員的工作隨著人工智能發(fā)展需求不斷調(diào)整。前幾年人工智能發(fā)展伊始,語音識別、人臉、圖像等識別需求大;近幾年無人駕駛進入發(fā)展快車道,人工智能訓練師就改成標注無人車、地圖、3D點云等數(shù)據(jù),天天看的是車道線、行人、障礙物。
有了足夠技術(shù)基礎,數(shù)據(jù)標注員還能教會人工智能新任務。疫情期間,戴口罩的人臉識別需求激增?!案鶕?jù)客戶需求,山西數(shù)據(jù)標注基地采集了大量戴口罩人臉照片,由數(shù)據(jù)標注師對眉毛、眼鏡、顴骨等人臉關鍵點精準標注,訓練人工智能完成了戴口罩人臉圖像識別。”百度(山西)人工智能基礎數(shù)據(jù)產(chǎn)業(yè)基地負責人尉赤說,“人們能在不摘口罩情況下實現(xiàn)精確體溫測量,或是通過人臉識別通道閘機,背后就是這些數(shù)據(jù)標注員在訓練人工智能?!?
未來,數(shù)據(jù)標注人工智能訓練師,將成為創(chuàng)造大量就業(yè)需求的新興職業(yè)領域。