今年4月,國家發(fā)改委首次發(fā)函確定了“新基建”。與前幾輪基建關(guān)注橋梁道路、建筑工程不同,新基建以數(shù)字化、智能化為主基調(diào),圍繞著5G、云計算、AI展開,全力構(gòu)建信息數(shù)字化基礎(chǔ)設(shè)施,助推我國經(jīng)濟持續(xù)飛躍增長。
作為新基建最核心版塊之一的人工智能,是許多領(lǐng)域數(shù)字化與智能化轉(zhuǎn)型的基礎(chǔ)與關(guān)鍵。在新基建政策推動下,人工智能版塊迎來了新騰飛,大批資金、人才流入,一場科技競賽即將打響。
據(jù)天眼查數(shù)據(jù)顯示,以工商登記為準,僅5月,我國新增人工智能相關(guān)企業(yè)就有近11萬家,在傳統(tǒng)企業(yè)受疫情影響業(yè)務收縮時,人工智能產(chǎn)業(yè)逆勢增長,較去年同比增長28.54%。新增的企業(yè)分布在AI產(chǎn)業(yè)鏈的各個層級,而入局門檻相對較低AI基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)受到青睞。
AI離不開數(shù)據(jù),新基建撬動行業(yè)變革
作為驅(qū)動AI的三駕馬車之一,數(shù)據(jù)相對算法、算力,受關(guān)注程度不高,但數(shù)據(jù)的重要性卻是不容忽視的。
在目前主流的深度學習框架之下,算法模型十分依賴人工標注的數(shù)據(jù),并且短時間內(nèi),這種依賴還很難改變。
Google AI部門負責人Jeff Dean曾在公開課上演示過傳統(tǒng)訓練方法與深度神經(jīng)網(wǎng)絡算法在不同數(shù)據(jù)規(guī)模之下的表現(xiàn),結(jié)果證明深度神經(jīng)網(wǎng)絡模型的準確率與數(shù)據(jù)量呈正相關(guān),也就是說,數(shù)據(jù)量越大,算法模型最后的效果就越好。
通常情況下,訓練一個最簡單的圖像物品識別算法,需要至少數(shù)萬張圖片標注數(shù)據(jù);一個文本審核程序,需要數(shù)十萬甚至上百萬條NLP數(shù)據(jù)訓練;一個語音交互應用,需要數(shù)千小時的語音訓練,并且還得針對不同口音、不同話題持續(xù)優(yōu)化;而布局一個智慧城市應用,所需的數(shù)據(jù)量更是驚人。
在新基建浪潮下,AI科技企業(yè)為了搶占市場,不斷提高算法精確度,并且與許多傳統(tǒng)產(chǎn)業(yè)相結(jié)合,創(chuàng)造新的應用場景,因此將釋放出大量的數(shù)據(jù)采集與標注需求,涌向市場。
根據(jù)某咨詢發(fā)布的《2020年中國AI基礎(chǔ)數(shù)據(jù)服務行業(yè)發(fā)展報告》預測,中國人工智能基礎(chǔ)數(shù)據(jù)服務市場規(guī)模,到2025年將突破100億元,發(fā)展前景巨大。
AI基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)引來洗牌期,突圍者會是誰
在新基建的政策推動下,國內(nèi)AI數(shù)據(jù)市場規(guī)模將迎來猛增,玩家逐漸入局分食蛋糕,AI數(shù)據(jù)服務商之間的競爭開始日益加劇,一場突圍賽迫在眉睫。
從市場整體來看,目前我國AI基礎(chǔ)數(shù)據(jù)市場的競爭者主要有兩類。一是中小數(shù)據(jù)供應商、眾包團隊,這類供應方通常盤踞在國內(nèi)三、四線城市小鎮(zhèn),依靠大量廉價的勞動力,迅速占領(lǐng)市場,成為了AI數(shù)據(jù)產(chǎn)業(yè)的中堅力量。
但總體而言,這類供應模式還屬于勞動密集型產(chǎn)業(yè),在市場擴張早期,能享受到部分紅利,隨著大批競爭者的涌入,最終會因缺乏商業(yè)壁壘,而生存困難。
考慮到長遠發(fā)展,許多供應商轉(zhuǎn)型,從而誕生了品牌數(shù)據(jù)服務商這一新模式。
品牌數(shù)據(jù)服務商從技術(shù)和服務流程兩方面深化,角色從數(shù)據(jù)提供者,轉(zhuǎn)變?yōu)閿?shù)據(jù)處理專家,通過為客戶提供一站式的數(shù)據(jù)解決方案,來建立自己的競爭壁壘。
從市場反饋來看,越來越多科技公司傾向選擇品牌數(shù)據(jù)服務商。主要原因是品牌數(shù)據(jù)服務商技術(shù)相對更成熟,擁有自有標注平臺,在規(guī)范性、安全性都更有保障,并且對于小語種標注、NLP、語音合成等難度較高項目,品牌數(shù)據(jù)服務商也更具優(yōu)勢。
目前,市場上已經(jīng)涌現(xiàn)了一批品牌數(shù)據(jù)服務商,但囿于技術(shù)、資金等因素,總體數(shù)量還相對較少。
景聯(lián)文:專業(yè)數(shù)據(jù)服務為AI商業(yè)賦能
2012年組建的景聯(lián)文團隊是市場上最別樹一幟的AI品牌數(shù)據(jù)服務商。景聯(lián)文早期專注于指紋防偽技術(shù),靠算法發(fā)家,2017、2019年連續(xù)兩屆拿下LivDet:Fingerprint Liveness Detection Competition(國際活體指紋檢測大賽)全場冠軍。
因為指紋算法業(yè)務的采集需求,景聯(lián)文在原有基礎(chǔ)上逐漸衍生出了數(shù)據(jù)采集與標注業(yè)務,并于2016年正式面向市場開放。
得益于多年指紋采集業(yè)務的流程經(jīng)驗,在數(shù)據(jù)來源合規(guī)以及交付保密性方面,景聯(lián)文一直走在行業(yè)前列。
隨著人工智能產(chǎn)業(yè)的發(fā)展,景聯(lián)文乘著這股浪潮,在行業(yè)中迅速崛起。目前景聯(lián)文在全國范圍內(nèi)擁有5個標注基地,220名全職人工智能訓練師;上線了自有標注平臺,涵蓋了絕大多數(shù)主流標注工具,支持語義分割、拉框標注、多邊形標注、關(guān)鍵點標注、3D點云、2D3D融合標注、圖片分類、聲紋識別、ASR轉(zhuǎn)寫、韻律標注、NLP、文本分類、OCR轉(zhuǎn)寫、情緒判斷等多種標注業(yè)務;提供企業(yè)私有化部署、跨地區(qū)作業(yè)等定制服務。
無論是前兩年的行業(yè)降溫,還是疫情期間的斷檔,景聯(lián)文的業(yè)務都非常穩(wěn)定。
景聯(lián)文CEO鄭曉薇說“景聯(lián)文的發(fā)展方向從來都是能夠為客戶提供合理、安全、可靠的AI數(shù)據(jù)解決方案,這是目前市場上非常稀缺的一種競爭力。”
而對于新基建帶來的機遇與競爭,鄭曉薇則表示:“我們有信心接住這股浪潮!”
伴隨著一系列的政策紅利扶持,AI技術(shù)將以最快的速度更新迭代,最終將在教育、安防、家居、生產(chǎn)等多個領(lǐng)域?qū)崿F(xiàn)商業(yè)落地。而為客戶提供一站式數(shù)據(jù)服務的景聯(lián)文,在這輪新基建中,將作為基建力量,默默支撐著人工智能產(chǎn)業(yè)邁向新的高地。
來 源: 經(jīng)理人
編 輯:liuy