百度為何開源深度機(jī)器學習平台?-公司(sī)新聞(wén)-惠州中復協佳技術有限公司 - cyberhost.cc
新聞資訊
公司新聞

網站首(shǒu)頁 > 公司新聞

百度為何開源深(shēn)度機器學(xué)習平台?

5月20日,百度在github上開源了(le)其深度機器學習平台。此番發(fā)布的深度機器學習開源平台(tái)屬于“深盟(méng)”的開(kāi)源組織,其核心(xīn)開發者(zhě)來自百度深(shēn)度學習研(yán)究院(IDL),微軟亞洲研究院、華盛頓(dùn)大學、紐約大學、香港(gǎng)科技大學(xué),卡耐基·梅隴大(dà)學等知名公司(sī)和高校

通過這一開源平台,世(shì)界各地的開發(fā)者們可以免費(fèi)獲(huò)得更優(yōu)質和更容易使用的分布式機器學習算(suàn)法源碼,從而大(dà)幅降低開(kāi)發(fā)和部署分布(bù)式機器學習系統(tǒng)及相關應用(yòng)的門檻。包括今日頭條(tiáo)、汽車之(zhī)家等在内的多(duō)家公司已經(jīng)通過該開放平台受益。

作為在人(rén)工(gōng)智能布局較(jiào)早的玩家,百度擁有領先業界的實力。從2013年百度深度學習研(yán)究院(yuàn)(IDL)的創建及(jí)2014年(nián)Andrew Ng的加盟至今,百度(dù)DMLC分布式深(shēn)度機(jī)器學(xué)習開源項目(簡稱“深(shēn)盟”)已在深(shēn)度學(xué)習的多個應用(yòng)領域做過探索,上線了如xgboost(速度快效果(guǒ)好的Boosting模型)、CXXNET(極(jí)緻的C++深度(dù)學習庫)、Minerva(高(gāo)效靈活的并行深(shēn)度(dù)學習引擎)以及Parameter Server(一小(xiǎo)時(shí)訓練600T數據等産品,在語(yǔ)音識别、OCR識别、人(rén)臉識(shí)别以及計算效率提升上(shàng)發布了多個成熟産品(pǐn)。

而具有(yǒu)一系列領先優勢的百度卻選擇開源其深度(dù)機器學習平台(tái),為何交(jiāo)底自己的核心技術

深(shēn)思之下,卻是在面對業界無奈(nài)時的遠(yuǎn)見(jiàn)之舉。

擁抱世界開源(yuán)的魅

開(kāi)源,顧(gù)名思義(yì),就是開(kāi)放自己的(de)源代碼給别人查(chá)閱(yuè)和使用,盡(jìn)管看起來很傻然而(ér)諸多曆史事(shì)實(shí)卻告(gào)訴(sù)我們擁抱世界也能讓(ràng)世界擁抱你。

Android的逆襲就是明證,在iOS侵占絕大多(duō)數智能手機操(cāo)作系統(tǒng)的時代(dài)誕生,Google選擇開源(yuán),讓早已在蘋果面前沒有(yǒu)機會的業(yè)界見到(dào)了希望,至(zhì)今(jīn)Android已擁有過半的市場份額,以至于在(zài)移動互聯網大(dà)行其道的今天,Google可以憑借它與(yǔ)旗下産品的(de)整合打造屬于自(zì)己的強大生态(tài)系(xì)統。相比(bǐ)之下(xià),生而嬌貴(guì)的Windows mobile的故事夠(gòu)令人發醒的,終于微軟也不得不寄人籬下地去兼容(róng)Android和iOS平台應用。此外(wài),作(zuò)為微軟最(zuì)主要(yào)的應用程(chéng)序框架,微軟對(duì).net寄予(yǔ)厚望(wàng),希望它的開源(yuán)可以來到(dào)所有平台(tái),進而重(zhòng)現JAVA的光(guāng)輝曆史。這也證(zhèng)明了即使強大如微(wēi)軟(ruǎn)也無法憑借(jiè)一己之力讓(ràng)其(qí)産品得到(dào)世界的(de)擁(yōng)抱。

衆人拾材火焰高:用(yòng)平台籠絡世界的力量

要實現人工智能,機(jī)器必(bì)須具(jù)備(bèi)自主學習(xí)能(néng)力,深(shēn)度學(xué)習(xí)作為機器學習領域的重大突破,可以完成具有高度抽象特征(zhēng)的人(rén)工智能任務,如自然語言理解(jiě)等複雜場(chǎng)景,因(yīn)而備受(shòu)業界(jiè)追捧。當然,機器學習領域并不隻是有深度學習這(zhè)一(yī)種算法的(de)存在,然而(ér)深(shēn)度學習卻有着顯(xiǎn)著的優勢:在數據集足夠大的(de)情況下,深度學(xué)習擁(yōng)有最好的預測能力。盡管在算法(fǎ)的選擇上仍然存(cún)在“殺(shā)雞焉用宰牛刀”的争論(lùn),但深度學習(xí)算法為人工智能領域注入的強大能力卻是其他算法(fǎ)無以比拟的;同時,随着深(shēn)度學(xué)習(xí)技(jì)術的成熟諸多傳統(tǒng)機器學習(xí)算(suàn)法的淘汰幾乎是(shì)必然的。然(rán)而正(zhèng)如前(qián)述,深度(dù)學習對大量數據的需(xū)求及其本身的複雜(zá)性仍然是其發展壯大路上的最大阻礙(ài),也是業界的無(wú)奈所(suǒ)在。

百度在(zài)此領域發力較早(zǎo),且(qiě)在諸(zhū)多方(fāng)向上(shàng)進(jìn)行了深入的研究,利用深入學習結合自身搜索引(yǐn)擎(qíng)的大數據讓機器翻(fān)譯及自然語言等技(jì)術實(shí)現了新的飛躍(yuè)。然而在面(miàn)向更廣大更具(jù)體的應用場景時,任(rèn)何一個公司都難以滿足所有(yǒu)需求。借鑒曆(lì)史,開放共(gòng)赢不僅可以把(bǎ)事情做(zuò)的,也(yě)讓業界和生态(tài)系統得到健康發展

百度此次(cì)開源也是(shì)完全奔着(zhe)建平(píng)台去的。完全采用C++語言搭建核(hé)心,為平台的(de)穩(wěn)定高效運行奠定了(le)基礎;覆蓋了三(sān)類最(zuì)常用的機器學習算法,包括用于點擊預測的稀疏線性模(mó)型(xíng)、用于排序(xù)的決策樹(shù)模型以及深入(rù)學習,滿足了最廣大的需求;重點開(kāi)發的“蟲洞”項目将自動構建深(shēn)盟所有項(xiàng)目,為所有(yǒu)組件提供一緻(zhì)的數(shù)據流支持且提供包括Amazon EC2,Microsoft Azure, Google Compute Engine在内的(de)雲計算平台兼容支(zhī)持降低(dī)平台的準入門檻。

開源(yuán)并入駐Github也進一步強(qiáng)調了其開放(fàng)的心态(tài)和對平台的(de)信心。一系列的動作都是希望讓(ràng)開發者可以獲(huò)得更優質更容(róng)易使(shǐ)用的深(shēn)入(rù)學習算法(fǎ)源碼,降(jiàng)低開發和部(bù)署深入學(xué)習系(xì)統及相關應用的門檻,進(jìn)而利用世(shì)界的力量(liàng)壯大自身。

面對(duì)可預(yù)料的爆發,技術一定程度(dù)上漸(jiàn)發成熟(shú),但(dàn)也因為各(gè)自的技術基因和路線差(chà)異,面臨着極大的分裂傾(qīng)向。開放的心态擁(yōng)抱世界,打造(zào)機器(qì)學習領域的國(guó)際标準,百(bǎi)度的此舉既是(shì)對前(qián)期研究(jiū)投入的回收(shōu)保障,更是攜手籠絡(luò)友商确保自身(shēn)的話語(yǔ)權所在。