5月20日,百(bǎi)度在github上開源了(le)其深度機器學(xué)習平台(tái)。此番發(fā)布的深度機器(qì)學習開源平台(tái)屬于“深盟(méng)”的開(kāi)源組(zǔ)織,其核心開發者來自百(bǎi)度深(shēn)度學習研(yán)究院(idl),微(wēi)軟亞洲(zhōu)研究(jiū)院、華盛頓(dùn)大學、紐(niǔ)約大學、香港科(kē)技大學(xué),卡耐(nài)基·梅隴大(dà)學(xué)等(děng)知(zhī)名公司(sī)和高(gāo)校。
通過這(zhè)一開源平(píng)台,世(shì)界各地的(de)開發(fā)者們(men)可以免費(fèi)獲得更優質和更容易使用的(de)分布式機(jī)器學(xué)習算法(fǎ)源(yuán)碼,從(cóng)而大幅降(jiàng)低開(kāi)發和部署分布(bù)式機器(qì)學習系(xì)統及相關應用(yòng)的門檻(kǎn)。包括今日頭(tóu)條、汽車之(zhī)家等在(zài)内的多家公司(sī)已(yǐ)經通(tōng)過該開放(fàng)平台(tái)受益。
作為在人(rén)工智能布(bù)局較早的玩(wán)家,百度(dù)擁有(yǒu)領先(xiān)業界(jiè)的實力(lì)。從2013年百(bǎi)度深度學(xué)習研究院(idl)的(de)創建及(jí)2014年andrew ng的加盟至今(jīn),百度dmlc分布式深(shēn)度機器學習開源項目(mù)(簡稱“深盟”)已(yǐ)在深度學習(xí)的(de)多個應用(yòng)領域(yù)做(zuò)過(guò)探索,上線(xiàn)了如(rú)xgboost(速度(dù)快效果好的boosting模(mó)型)、cxxnet(極(jí)緻的c++深度(dù)學習庫)、minerva(高效靈(líng)活的并行深度(dù)學習引擎(qíng))以及(jí)parameter server(一小(xiǎo)時(shí)訓練600t數(shù)據)等(děng)産(chǎn)品,在語音識别、ocr識别、人(rén)臉識别以及計算效(xiào)率提升上(shàng)發布了多個成(chéng)熟産品。
而(ér)具有(yǒu)一(yī)系(xì)列(liè)領先優(yōu)勢的百(bǎi)度卻選(xuǎn)擇開(kāi)源(yuán)其(qí)深度機器(qì)學習平台(tái),為何(hé)交底(dǐ)自己(jǐ)的核(hé)心技術?
深(shēn)思之下,卻是在面對(duì)業界(jiè)無奈時的遠見之舉。
擁抱世界:開源(yuán)的(de)魅力
開源,顧名思義,就是開(kāi)放自己的(de)源代碼給别人查閱(yuè)和使(shǐ)用,盡管看起(qǐ)來很(hěn)傻,然而(ér)諸多曆(lì)史(shǐ)事實卻告訴我(wǒ)們擁(yōng)抱世(shì)界(jiè)也能讓(ràng)世界(jiè)擁抱你。
android的(de)逆襲就是(shì)明證(zhèng),在ios侵(qīn)占絕大多(duō)數智能手(shǒu)機操(cāo)作系(xì)統的時代(dài)誕生,google選擇(zé)開源,讓早已在蘋果(guǒ)面前沒(méi)有(yǒu)機會(huì)的業界見(jiàn)到了(le)希望,至今android已擁有過半的市場(chǎng)份額,以至于在(zài)移動(dòng)互聯網(wǎng)大(dà)行其道的(de)今天,google可以憑(píng)借(jiè)它與旗下(xià)産品(pǐn)的整(zhěng)合打(dǎ)造(zào)屬于自(zì)己的強大生(shēng)态系統。相比(bǐ)之下(xià),生而嬌貴的windows mobile的故事夠令人發(fā)醒的,終于微軟(ruǎn)也不得不(bú)寄(jì)人(rén)籬下地去兼容(róng)android和ios平(píng)台應用。此(cǐ)外,作為微(wēi)軟最主要的應(yīng)用程(chéng)序框架(jià),微(wēi)軟對(duì).net寄予厚望,希望(wàng)它的開源可以來到(dào)所(suǒ)有平台,進而重現java的光(guāng)輝曆史。這也證(zhèng)明了即使(shǐ)強大如微(wēi)軟也無法(fǎ)憑借一己之力(lì)讓其(qí)産品得到(dào)世界的擁抱。
衆人拾材火(huǒ)焰高:用平(píng)台(tái)籠絡世(shì)界的(de)力量(liàng)
要實(shí)現人(rén)工(gōng)智(zhì)能,機(jī)器必須具備(bèi)自(zì)主學習能(néng)力,深度學(xué)習作為機(jī)器學習領域的(de)重(zhòng)大突破,可以(yǐ)完成(chéng)具(jù)有(yǒu)高度(dù)抽象(xiàng)特征的人(rén)工智(zhì)能任(rèn)務,如(rú)自然語言(yán)理解(jiě)等複雜(zá)場景,因(yīn)而備受業界追捧。當(dāng)然,機(jī)器學(xué)習領(lǐng)域并不隻(zhī)是有深(shēn)度(dù)學習這一種算法的(de)存在,然而深度學習卻有着顯著的優勢:在數據集足(zú)夠大的(de)情(qíng)況下,深度學(xué)習擁有最好(hǎo)的預測能力。盡管(guǎn)在算法(fǎ)的選擇(zé)上仍然(rán)存在“殺(shā)雞焉用宰牛刀(dāo)”的争論,但深度(dù)學習(xí)算法(fǎ)為人(rén)工智能(néng)領域注入的強大能力(lì)卻(què)是其(qí)他(tā)算法(fǎ)無以(yǐ)比拟的(de);同(tóng)時,随着深(shēn)度學(xué)習技(jì)術(shù)的成熟(shú),諸多(duō)傳統機器(qì)學習(xí)算法的淘(táo)汰幾乎(hū)是(shì)必(bì)然(rán)的。然而正如前(qián)述,深度學習對大量數據(jù)的需(xū)求及其本身的(de)複雜性仍然是其發展(zhǎn)壯(zhuàng)大路上的(de)最大阻礙,也是業界(jiè)的無(wú)奈所(suǒ)在。
百(bǎi)度在(zài)此領域發力(lì)較(jiào)早,且(qiě)在諸多方(fāng)向上(shàng)進(jìn)行(háng)了深(shēn)入的(de)研究,利用(yòng)深入學習結合(hé)自身搜索引擎的大數據讓機(jī)器翻譯及自然(rán)語言(yán)等(děng)技(jì)術實現了新的飛躍(yuè)。然而在面向(xiàng)更(gèng)廣大(dà)更具(jù)體的應用場景(jǐng)時,任(rèn)何一個公司都(dōu)難(nán)以滿足(zú)所有(yǒu)需求(qiú)。借鑒曆史(shǐ),開放共赢(yíng)不僅(jǐn)可以把事情做的,也(yě)讓業(yè)界和生态系統得到(dào)健康(kāng)發展(zhǎn)。
百度(dù)此次開源也是(shì)完全奔(bēn)着(zhe)建平(píng)台去(qù)的。完全采用c++語言搭(dā)建核(hé)心,為平台的穩(wěn)定高效運(yùn)行奠(diàn)定了基礎(chǔ);覆蓋了三類最常用的機器(qì)學習算(suàn)法,包括用于點(diǎn)擊預(yù)測(cè)的稀疏(shū)線性(xìng)模(mó)型、用于(yú)排序(xù)的決策樹(shù)模型以及深入(rù)學習,滿(mǎn)足了最(zuì)廣大的需(xū)求;重點開發(fā)的“蟲洞(dòng)”項目(mù)将自(zì)動構建深(shēn)盟所有項(xiàng)目,為所有組件提供一(yī)緻(zhì)的數(shù)據流支(zhī)持且提(tí)供包(bāo)括amazon ec2,microsoft azure, google compute engine在内的(de)雲計(jì)算(suàn)平(píng)台兼(jiān)容支持,降低平(píng)台的準入(rù)門檻。
開源并入駐github也進一步強調了其開放的心态(tài)和對平台的信(xìn)心。一(yī)系列的動(dòng)作都是希望讓開發者可(kě)以獲得更優質更容易使用的深入(rù)學習算法源碼(mǎ),降低(dī)開(kāi)發和部(bù)署深入學習系(xì)統及相關(guān)應用(yòng)的門檻,進(jìn)而利用世界的(de)力量(liàng)壯大自身。
面對(duì)可預(yù)料(liào)的爆發,技(jì)術一定(dìng)程度(dù)上漸發成熟,但(dàn)也因為各自的(de)技術(shù)基(jī)因和路(lù)線差異,面(miàn)臨着(zhe)極大的分裂傾(qīng)向。開放的心态(tài)擁抱(bào)世界(jiè),打造機器學習(xí)領域(yù)的國際标準,百度的此舉既是(shì)對前(qián)期(qī)研究投(tóu)入的回(huí)收(shōu)保障,更是(shì)攜(xié)手籠絡(luò)友商(shāng),确保自身的話(huà)語權所在(zài)。
公司新(xīn)聞(wén)
網站首頁 > 公司新(xīn)聞
百度(dù)為(wéi)何開(kāi)源深(shēn)度機器學(xué)習平台?