近日,在ICVS中國自動駕駛年會—火山引擎 X NVIDIA云上創(chuàng)新專場上,火山引擎首次面向智駕行業(yè)集中展示了AI數(shù)據(jù)服務(wù)的能力。據(jù)了解,火山引擎AI數(shù)據(jù)服務(wù)提供高質(zhì)量的數(shù)據(jù)采集、標注服務(wù),平均交付準確率已經(jīng)可以實現(xiàn)99%以上。
對于自動駕駛領(lǐng)域的研發(fā)來說,將大量標注過的數(shù)據(jù)“投喂”給算法,通過訓練讓模型具備感知能力并達到一定識別準確率的一過程,早已成為“行業(yè)標配”。
所謂“數(shù)據(jù)標注”,是指對未經(jīng)處理的語音、圖片、文本、視頻等原始數(shù)據(jù)進行加工處理, 并轉(zhuǎn)換為機器可識別的信息的過程。不過,隨著應(yīng)用場景的不斷豐富,自動駕駛所需標注的數(shù)據(jù)類型越來越呈現(xiàn)天量、多樣化,數(shù)據(jù)標注的準確性難以保證,且綜合成本較高。造成這一結(jié)果的原因,除了需求的不確定性、標注標準較為單一化等之外,人力成本和返工成本較高也是很重要的原因。
當前,許多數(shù)據(jù)標注企業(yè)仍停留在勞動密集型產(chǎn)業(yè)的定位中,在面對現(xiàn)階段自動駕駛所需要處理的巨量數(shù)據(jù)時,就顯得捉襟見肘。
從趨勢上來看,行業(yè)正在向AI輔助+精細化管理的方向轉(zhuǎn)變。通過AI輔助標注算法的升級,減少人力、提升標注效率,是未來數(shù)據(jù)標注創(chuàng)新的路徑之一。需要大規(guī)模堆人力的魔咒,正在不斷被技術(shù)所打破。
據(jù)介紹,火山引擎數(shù)據(jù)標注平臺中集成了多種標注模板、預標注與邊標邊訓算法,同時具有保障數(shù)據(jù)安全、平臺操作便捷、可定制化、可與火山引擎云產(chǎn)品打通的特性。通過模版工具豐富多樣、人工與算法靈活配合、數(shù)據(jù)服務(wù)專業(yè)高效靈活將持續(xù)為客戶的數(shù)據(jù)處理工作保駕護航。
圖:火山引擎數(shù)據(jù)標注平臺的優(yōu)勢
另外,平臺支持系統(tǒng)部署到企業(yè)自有服務(wù)器上,企業(yè)的所有系統(tǒng)數(shù)據(jù)均在自主管理下,私密數(shù)據(jù)的安全性有保障。同時還可根據(jù)企業(yè)自身需求與業(yè)務(wù)場景,定制個性化產(chǎn)品方案,讓產(chǎn)品更好地被企業(yè)使用,實現(xiàn)業(yè)務(wù)發(fā)展與標注需求的一比一完美適配。
在標注工具方面,則實現(xiàn)了對各類常見的文本、圖像、視頻、語音、3D點云數(shù)據(jù)的自定義處理需求,降低了模板冗余,幫助客戶快速獲取低成本、高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù)。
在算法賦能方面,火山引擎的數(shù)據(jù)標注平臺的AI預標注與邊標邊訓的算法能力,大幅提高了標注效率與準確率,可輔助和代替部分人工操作,并根據(jù)項目類型,選擇適合的模型能力在相應(yīng)項目階段接入。
圖:標注平臺的模型能力
模型過濾階段:由模型進行原始數(shù)據(jù)的分析,過濾掉不需要人工標注的數(shù)據(jù),只留下需要人工標注的數(shù)據(jù)。
模型預標階段:用模型進行數(shù)據(jù)的預先標注,標注員只需進行確認或修改。
模型糾錯階段:在標注作業(yè)時,模型可以實時進行智能糾錯,避免標注員提交低質(zhì)量任務(wù)。
模型質(zhì)檢環(huán)節(jié):在質(zhì)檢作業(yè)時,模型可以輔助篩選需重點質(zhì)檢任務(wù)或直接完成數(shù)據(jù)的驗收。
火山引擎利用邊標邊訓的數(shù)據(jù)標注模型,智能化地學習作業(yè)內(nèi)容與標注尺度,通過“自學習”方式驅(qū)動完成算法迭代,“智能+無感知”地學習人工標注習慣,帶來更高的準確率和更好的數(shù)據(jù)標注體驗。
在接到長周期、大批量類型項目時,模型偏向于“特定業(yè)務(wù)類型”,高準確率帶來更高的人效收益;在處理短周期、小批量類型項目時,系統(tǒng)可快速切入并賦能業(yè)務(wù),節(jié)省前期人工準備的時間。最終可實現(xiàn)30%-100%的效率提升和10%-30%的質(zhì)量提升。
在業(yè)務(wù)快速發(fā)展的當下,AI數(shù)據(jù)服務(wù)業(yè)務(wù)對工時精細化管理的需求愈發(fā)迫切。
圖:工時管理平臺
為了更好的服務(wù)業(yè)務(wù),火山引擎還推出工時管理系平臺。該管理平臺將實現(xiàn)工時精細化管理,推進工時管理系統(tǒng)化進程,提高工時數(shù)據(jù)的準確性,為高效實現(xiàn)項目工時管理和人效管理提供有力支持。
AI數(shù)據(jù)服務(wù)負責人金亮表示,“當前,AI算法對訓練數(shù)據(jù)維度和樣本復雜性的要求變得越來越高,這對數(shù)據(jù)標注技術(shù)、標注平臺能力、數(shù)據(jù)安全、不同維度數(shù)據(jù)協(xié)同標注等都提出了挑戰(zhàn)?;鹕揭鍭I數(shù)據(jù)服務(wù)通過打造智能化數(shù)據(jù)平臺,輔以交互式人工標注和質(zhì)量控制措施,將有效降低數(shù)據(jù)標注復雜度,提升整體數(shù)據(jù)質(zhì)量,最終解決自動駕駛模型訓練的痛點,快速地部署AI。”(作者:董凌)
關(guān)鍵詞: