百度為何開源(Yuan)深度機器學習(Xi)平台?-公司新聞-惠州合力电子有[You]限公司(Si)
新聞[Wen]資訊
公司新聞

網站首(Shou)頁 > 公司新聞

百度為[Wei]何開源深度(Du)機器學[Xue]習平台?

5月20日,百度(Du)在github上開源了其深度機器學習平台。此番發布的深度機器(Qi)學習(Xi)開源[Yuan]平台屬(Shu)于“深盟”的開源組織,其核(He)心開發者來自百(Bai)度深度學習研究院(IDL),微軟亞洲研究院、華盛頓(Dun)大學、紐約大學、香港科技大(Da)學,卡耐基·梅隴大[Da]學等知名公司(Si)和(He)高校。

通過這(Zhe)一開(Kai)源平台[Tai],世界各地的(De)開發(Fa)者們可以[Yi]免費獲得更優質(Zhi)和更容[Rong]易使用的(De)分布式機器學習算法源碼,從而大幅[Fu]降低開[Kai]發和部署分布式機器學[Xue]習系(Xi)統及相關應[Ying]用的門檻。包(Bao)括今[Jin]日頭條、汽車之家[Jia]等在内的多家公司已經通[Tong]過該開放平台受益。

作為[Wei]在人[Ren]工智能布局較早的玩家,百度(Du)擁有領先業界(Jie)的實力。從2013年百度深度學習研究院(IDL)的[De]創建及2014年Andrew Ng的加盟至今,百度DMLC分布式深[Shen]度機器學[Xue]習開源項目(簡(Jian)稱“深盟”)已在深度學習的(De)多個應用領(Ling)域做過探索[Suo],上線了如xgboost(速度[Du]快效果好的Boosting模型)、CXXNET(極[Ji]緻[Zhi]的C++深度[Du]學習庫)、Minerva(高(Gao)效靈活的并行深度(Du)學習引擎)以及(Ji)Parameter Server(一小時訓練600T數據)等産品,在語音識别、OCR識别、人臉識别以及計[Ji]算效率提升上[Shang]發[Fa]布了多(Duo)個成(Cheng)熟産品[Pin]。

而具有一系列領先優勢的百度[Du]卻選(Xuan)擇開源其深度機器學習平台[Tai],為何交底自己的(De)核[He]心技術?

深(Shen)思之下,卻(Que)是在面對業界無(Wu)奈[Nai]時的遠見之舉(Ju)。

擁抱[Bao]世界:開源的魅(Mei)力

開[Kai]源,顧名思義,就是開(Kai)放[Fang]自己的源代(Dai)碼給[Gei]别人查閱和使用[Yong],盡[Jin]管看起來(Lai)很傻,然而(Er)諸多曆史事實卻告訴我們擁抱世界也能讓(Rang)世界擁抱你。

Android的[De]逆襲[Xi]就是明證,在iOS侵占絕大多[Duo]數智能手機操[Cao]作系統的時[Shi]代(Dai)誕生,Google選擇開源[Yuan],讓早[Zao]已在蘋果面[Mian]前沒有機會[Hui]的業界見到(Dao)了(Le)希望,至[Zhi]今Android已擁有過半(Ban)的市場份額(E),以至于在[Zai]移動互聯網大[Da]行其道的今(Jin)天,Google可以(Yi)憑借[Jie]它與旗下産品的整合打造屬于自己[Ji]的強大生态(Tai)系統。相比之下,生而嬌貴的Windows mobile的故事夠[Gou]令人發醒的,終于微軟也不[Bu]得不寄人籬下地(Di)去兼容Android和iOS平台應用。此(Ci)外,作為微軟[Ruan]最主要的應用程序框架,微軟對(Dui).net寄予厚望,希望它的開源可以來到所(Suo)有平台,進而重現JAVA的光輝曆史。這也[Ye]證[Zheng]明了即使強大如微軟也無法憑[Ping]借一(Yi)己[Ji]之力讓其(Qi)産品得到世(Shi)界的擁抱。

衆人拾材火焰(Yan)高(Gao):用平台籠絡世界的力量

要實[Shi]現人工智能,機器[Qi]必須具備自主學習能(Neng)力,深[Shen]度學習作[Zuo]為機器學習領域的重大(Da)突破,可以完(Wan)成具有高度抽象特征的(De)人[Ren]工(Gong)智能任務,如自然語(Yu)言理解[Jie]等複雜場景,因而備受業界追[Zhui]捧。當然,機器[Qi]學習領域并不隻是有深度學習這[Zhe]一種算法的存在,然而深度學習(Xi)卻有着[Zhe]顯著的優勢[Shi]:在數[Shu]據集足夠大(Da)的[De]情況[Kuang]下,深度學習擁有最好的預(Yu)測能力。盡管在算法的(De)選擇上仍然存在“殺雞焉[Yan]用宰牛刀”的争論,但深度學習算法為人(Ren)工智能領域注入的強大能力卻是其他算法無[Wu]以比拟的;同時,随着深(Shen)度學習技術的[De]成熟,諸多傳[Chuan]統(Tong)機器(Qi)學習算法的淘汰幾乎是必然[Ran]的。然[Ran]而正如前述,深度[Du]學習對大量數據的需求及其本身的(De)複雜性仍然是(Shi)其發展壯[Zhuang]大(Da)路(Lu)上(Shang)的最大阻礙,也是業界的無奈所在。

百度在此領域發[Fa]力較早,且在諸多(Duo)方[Fang]向上進行(Hang)了深入的研究,利用深入學習(Xi)結合自(Zi)身(Shen)搜索引擎[Qing]的大數據讓(Rang)機器翻譯及[Ji]自然語言等技術實現了新的飛躍(Yue)。然而在面向更[Geng]廣大更具體的應用場景時,任[Ren]何一個公司都難以(Yi)滿足所有[You]需求。借鑒曆史(Shi),開放共赢(Ying)不僅可以把事情做的[De],也讓[Rang]業界和生态[Tai]系統得到健康發展(Zhan)。

百度此次開源也是[Shi]完全奔着建(Jian)平台去的。完全采用C++語言搭建核心[Xin],為平台的穩定高效運行(Hang)奠定了基礎;覆蓋[Gai]了三類(Lei)最(Zui)常用的機器學習[Xi]算法,包括用于點(Dian)擊預測的稀疏[Shu]線性模型[Xing]、用于排序的[De]決策樹模型以及深入學習,滿足了最廣大的需求[Qiu];重[Zhong]點開發的“蟲洞[Dong]”項目将自動構[Gou]建(Jian)深(Shen)盟所有項(Xiang)目,為所有組件提供一[Yi]緻的數據流支持且提[Ti]供包[Bao]括Amazon EC2,Microsoft Azure, Google Compute Engine在内的雲計算平台兼(Jian)容支持,降低平(Ping)台[Tai]的準入門檻(Kan)。

開源[Yuan]并入駐Github也進一步強調了其開[Kai]放的[De]心态和對平台的信心。一系列的[De]動[Dong]作都是希(Xi)望讓開發者可以獲得更優質更容易使用的深入[Ru]學習算法源碼(Ma),降低開發和部[Bu]署深入[Ru]學習系統及[Ji]相關應用的門檻,進而利用世界的力量壯大自身。

面對可預料(Liao)的(De)爆發,技術一定程度上漸發成熟,但[Dan]也因為各自[Zi]的[De]技術(Shu)基因和路線差異,面臨着極大[Da]的分裂傾(Qing)向。開放的心态(Tai)擁抱[Bao]世界,打(Da)造機器學習領域的國際标準,百度的此舉既是對(Dui)前期研究投(Tou)入的回收保(Bao)障,更是攜手籠絡友商,确[Que]保自身的話語權所在[Zai]。