天元 曠視宣布開源自研深度學(xué)習(xí)框架 MegEngine,天元開源有何目標(biāo)?
wujiai
量子比特報道 | 官方賬號
經(jīng)過6年的潛心打造和優(yōu)化,如今已到了8.0版本,曠視技術(shù)體系的這一關(guān)鍵支柱正式開源。
剛剛,中國最早以深度學(xué)**為驅(qū)動的AI獨角獸曠視科技宣布開源自研的深度學(xué)**框架(Brain++的核心組件之一),中文名天元,取自圍棋棋盤的中心點。
發(fā)布會上,曠視聯(lián)合創(chuàng)始人、CTO唐文斌透露,這也是一種對“人工智能”的致敬。
與以往開源的“前輩”框架不同,曠視科技開源AI框架,是其創(chuàng)業(yè)、成長,以及屢創(chuàng)行業(yè)紀(jì)錄的核心驅(qū)動引擎。
那么曠視天元為什么要開源?目的是什么?又將給行業(yè)帶來哪些改變?
在介紹天元開源時,唐文斌介紹了“天元”的另一層含義:萬事萬物的根本。
他說:“我們希望通過天元這樣的深度學(xué)**框架,能夠作為中國人工智能的基石,幫助中國的人工智能做得更好。”
聚焦曠視自身,開源也是其“以算法為核心向產(chǎn)業(yè)升級,打造AI基礎(chǔ)設(shè)施”戰(zhàn)略的延伸,近幾年的一系列動作都是朝著這個方向的持續(xù)推進。
智能時代的生產(chǎn)力工具
2019年初,曠視科技發(fā)布AIoT操作系統(tǒng)“河圖”,應(yīng)用于物流場景,讓更多硬件能夠連接,實現(xiàn)平臺的統(tǒng)一管控和調(diào)度。
同時,這個體系也能讓更多的生態(tài)伙伴參與其中,發(fā)展自己的智能物流解決方案,創(chuàng)造場景價值。
“河圖”發(fā)布后,雖然平臺軟件讓更多硬件能夠連接、AI+場景更加豐富,但曠視發(fā)現(xiàn),一個更大的需求出現(xiàn)了——場景是無限的。
他們認(rèn)為,這導(dǎo)致各種場景對算法的需求是無限的,但沒有哪家公司能夠創(chuàng)造所有的算法。要解決這個矛盾,激發(fā)整個行業(yè)的算法創(chuàng)新,需要一套對所有人開放的人工智能基礎(chǔ)設(shè)施。
那么什么是AI基礎(chǔ)設(shè)施?
唐文斌在發(fā)布會上表示,只有AI芯片平臺、AI生產(chǎn)力平臺才能稱為AI基礎(chǔ)設(shè)施。
其中,毫無疑問的是,AI計算需要有AI芯片平臺支撐,而AI生產(chǎn)力則需要來自“框架”。
此前,我們在觀察和評估AI框架的時候,也有更宏觀的視角:
縱觀人類社會三次生產(chǎn)力大爆發(fā)的時代,生產(chǎn)力的焦點都是規(guī)模工具的重要性,農(nóng)耕文明時代的核心是犁的使用,使農(nóng)業(yè)得以規(guī);l(fā)展。
工業(yè)革命的關(guān)鍵是蒸汽機的引入和推廣,讓機器得以大規(guī)模部署和應(yīng)用,取代了手工作坊。而在智能時代,如何實現(xiàn)數(shù)據(jù)的大規(guī)模應(yīng)用和處理,成為競爭力的關(guān)鍵。
通常,我們把技術(shù)視為第一生產(chǎn)力,但過于關(guān)注技術(shù),往往會忽視“技術(shù)”大規(guī)模應(yīng)用的工具。
如果我們回過頭來看,就會發(fā)現(xiàn)這樣的一個規(guī)律:誰掌握了時代的生產(chǎn)工具,誰就掌握了生產(chǎn)力,誰就有可能成為時代紅利的最大受益者,在競爭中占據(jù)上風(fēng)。
按照產(chǎn)業(yè)經(jīng)濟學(xué)理論,生產(chǎn)效率的本質(zhì)在于減少消耗、增加產(chǎn)出,從而利用剩余推動進一步發(fā)展,并在每次增長瓶頸時抓住產(chǎn)業(yè)變革的奇點,實現(xiàn)范式轉(zhuǎn)移和產(chǎn)能跨越,從而真正跨越周期。
具體到當(dāng)前AI驅(qū)動的智能時代,打造人工智能算法框架無疑是降低消耗的利器:AI算法的大規(guī)模推行將促進產(chǎn)出,各行各業(yè)將進入新一輪能效轉(zhuǎn)型戰(zhàn)。
因此在產(chǎn)業(yè)智能化的大趨勢下,算法開發(fā)框架的意義進一步凸顯,成為構(gòu)建數(shù)字基礎(chǔ)設(shè)施、產(chǎn)生AI生產(chǎn)力的核心工具之一。
從這個角度來看天元,曠視科技開源天元,不僅是對技術(shù)社區(qū)的貢獻,更是曠視科技引入開放創(chuàng)新、打造Brain++生產(chǎn)力平臺、競逐產(chǎn)業(yè)智能時代的戰(zhàn)略舉措。
唐文斌認(rèn)為,任何一個行業(yè),只有引發(fā)標(biāo)準(zhǔn)化、規(guī);倪B鎖反應(yīng),才能迎來真正的繁榮。
這是天元的設(shè)計哲學(xué),直接體現(xiàn)在框架設(shè)計的功能和能力上。
天元框架四大特點
天元是曠視Brain++的核心組件之一,主要功能是借助友好的編程接口幫助開發(fā)者進行大規(guī)模深度學(xué)**模型的訓(xùn)練和部署。
按照曠視官方給出的總結(jié),天元具備訓(xùn)練推理一體化、動靜結(jié)合、包容性強、靈活高效等四大特點,可以媲美其他主流深度學(xué)**框架。
所謂訓(xùn)練推理一體化,是指通過天元訓(xùn)練得到的模型和產(chǎn)品,可以直接用于產(chǎn)品推理和封裝,在部署時,還能幫助開發(fā)人員自動刪除冗余代碼,實現(xiàn)模型自動優(yōu)化。
動靜合一,意味著天元融合了“靜態(tài)圖形性能高、占用資源少、易部署”與“動態(tài)圖形簡潔靈活、易調(diào)試、易使用”的優(yōu)勢。
在充分發(fā)揮動態(tài)圖模型訓(xùn)練優(yōu)勢的同時,開發(fā)者可以利用天元一鍵動靜轉(zhuǎn)換功能,以靜態(tài)圖的形式完成生產(chǎn)部署。此外,天元還支持動靜混合編程,靈活性更高。
發(fā)布會上,曠視研究院高級技術(shù)總監(jiān)田中博舉了一個例子。
他說:“利用天元的動態(tài)圖形功能的時候,大概一秒鐘就能計算出來,如果轉(zhuǎn)換成靜態(tài)圖像的話,可以支持到這個水平!
但這還不是全部。
他還介紹說:“這種情況下如果要訓(xùn)練更大batch、更大的模型,可以使用亞線性自動內(nèi)存優(yōu)化技術(shù),天元可以在不降低計算速度的情況下,實現(xiàn)訓(xùn)練能力!
隨著模型變得越來越大、越來越深,它會發(fā)揮更好的作用。
田中博透露,根據(jù)曠視內(nèi)部的一些評估,對于一些大型模型,可以實現(xiàn)20倍以上的內(nèi)存節(jié)省,而速度幾乎沒有變化。
兼容性體現(xiàn)在天元的易用性上,其API學(xué)**成本較低,對于**慣了傳統(tǒng)機器學(xué)**的開發(fā)者來說,也很容易上手。此外,天元還支持直接導(dǎo)入模型的功能,遷移成本低,大大方便了模型復(fù)現(xiàn)。
靈活高效具體指天元對多平臺、多設(shè)備的適應(yīng)能力強,通過匯編、指令重排序等技術(shù),天元內(nèi)置的算子無論在推理還是生產(chǎn)環(huán)境中都能充分發(fā)揮多核的優(yōu)勢,靈活調(diào)用設(shè)備的算力,尤其適合大模型算法的訓(xùn)練。
那么問題來了,天元的能力和特性,其關(guān)鍵的秘密到底是什么呢?
建筑設(shè)計。
天元框架整體架構(gòu)
從架構(gòu)上看,天元分為計算接口、圖形表示、優(yōu)化編譯、運行管理、計算內(nèi)核五層。
在頂層計算接口上,天元配置C++及接口,解決框架學(xué)**接口不同,模型難以復(fù)現(xiàn)的問題;
在圖表示層,天元內(nèi)置動靜轉(zhuǎn)換功能,支持開發(fā)人員混合使用動態(tài)圖和靜態(tài)圖模式進行編程;
在優(yōu)化編譯層,天元構(gòu)建核心計算圖以支撐高效的用戶交互,并進一步優(yōu)化和編譯API中表達的計算,包括自動導(dǎo)數(shù)、圖優(yōu)化、圖編譯功能。
在運行時設(shè)備管理方面,天元配置了計算調(diào)度和內(nèi)存管理兩大模塊,通過計算調(diào)度模塊將設(shè)備抽象成執(zhí)行流,通過調(diào)度器實現(xiàn)智能調(diào)度。
在內(nèi)存優(yōu)化方面,天元同時采用動態(tài)和靜態(tài)內(nèi)存分配方式,支持自動子線性內(nèi)存優(yōu)化,同時曠視自主研發(fā)了自動子線性內(nèi)存管理優(yōu)化器,讓天元能夠達到更優(yōu)的內(nèi)存優(yōu)化效果。
天元底層(計算內(nèi)核)擁有基于異構(gòu)架構(gòu)的計算內(nèi)核,內(nèi)置高效的計算機視覺算子,并具備對X86、CUDA等主流硬件設(shè)備的智能適配能力。
它可以利用內(nèi)置算法根據(jù)設(shè)備本身啟發(fā)式地選擇最優(yōu)內(nèi)核,也可以讓用戶選擇最適合計算的內(nèi)核。
此外,天元配備高性能異構(gòu)通信庫,支持用戶在不同的機器、計算卡之間進行高性能通信,實現(xiàn)多機多卡、大規(guī)模、分布式算法訓(xùn)練。
在實踐中使用這樣的框架會產(chǎn)生什么效果?
正如開篇所言,曠視科技能夠成長為全球估值最高的AI獨角獸之一,離不開這個框架的強大驅(qū)動。
核心中的核心
六年來,天元框架作為曠視“真核”Brain++的一部分,與深度學(xué)**云計算平臺()、數(shù)據(jù)管理平臺()一起支撐了曠視全部業(yè)務(wù)。
曠視科技首席科學(xué)家、研究院院長孫劍表示:“曠視科技1400名研發(fā)人員全部采用天元框架,并應(yīng)用到數(shù)百款產(chǎn)品、數(shù)十個計算平臺上!
在孫劍看來,天元和谷歌推出的天元有很大不同。
“AI公司和平臺公司的深度學(xué)**框架考慮的點、位置、方向都不一樣,”他說,“我們的深度學(xué)**框架(天元)??是基于曠視核心業(yè)務(wù)的,我們希望讓特定領(lǐng)域的AI開發(fā)者受益,希望他們可以同時使用不同的框架,或者用不同的框架來解決不同的問題。”
例如在主流的計算機視覺模型(18、、v2和V2)上,天元的訓(xùn)練速度與其他主流框架存在差異。
此次開源,曠視科技還發(fā)布了一系列圍繞天元框架的開發(fā)工具。
例如,開箱即用的在線深度學(xué)**工具,讓開發(fā)者可以快速體驗天元的框架,進行模型訓(xùn)練;天元還推出了包含頂尖算法的模型中心,包括曠視研究院的最新技術(shù)和研究成果。
同時,曠視還將分布式計算中的數(shù)據(jù)并行、模型并行應(yīng)用于天元,進一步提高大規(guī)模圖像數(shù)據(jù)處理和模型訓(xùn)練的效率。
為了在更大范圍、更多類型的設(shè)備上部署,天元提供了神經(jīng)架構(gòu)搜索、網(wǎng)絡(luò)剪枝、構(gòu)建低比特小型神經(jīng)網(wǎng)絡(luò)等功能。
而且天元還融入曠視科技的最新技術(shù),自動設(shè)計深度學(xué)**算法的各個關(guān)鍵環(huán)節(jié),讓算法訓(xùn)練算法、讓AI創(chuàng)造AI,從而降低進入門檻。
以上這些能力都證明了天元是曠視最核心、最強大的能力。
最直接的例子是曠視連續(xù)三年斬獲COCO“物體檢測”冠軍,統(tǒng)治力堪比“中國乒乓球隊”。 2019年奪得ICCV冠軍后,孫劍再次感謝Brain++,稱一系列成績的取得都離不開背后強大的Brain++。
而負(fù)責(zé)Brain++平臺算法制作/研發(fā)的天元則扮演著更為重要的角色。
但即便是如此強大的武器,核心中的核心,如今也被曠視科技開源了。
為什么?
耗時6年打造優(yōu)化,開源是一場“無限游戲”
對于曠視科技來說,推動開源的直接因素有兩個:一是技術(shù)是否成熟,二是時機是否合適。
曠視聯(lián)合創(chuàng)始人兼CEO印奇表示,這與AI產(chǎn)業(yè)的發(fā)展有直接關(guān)系。
他說,當(dāng)算法成為改變甚至顛覆軟件行業(yè)的力量時,最后的關(guān)鍵就是這些AI公司是否具備平臺能力,即“能否批量、高效、比競爭對手更迅速地供給優(yōu)質(zhì)算法”。
這場競爭的決定性因素就是是否掌握了核心引擎的框架。
因此曠視科技在2014年就自主研發(fā)了“天元”框架,開發(fā)時間較早。
2015年中,天元框架在曠視科技內(nèi)部全面推廣,業(yè)務(wù)線內(nèi)的模型全部更換為使用自研框架訓(xùn)練的版本。
同年11月,谷歌開源該框架后,曠視一度猶豫是否繼續(xù)開發(fā)深度學(xué)**框架,但經(jīng)過大規(guī)模評估后,曠視還是決定自己開發(fā)框架,畢竟新框架的效果并不理想。
如今,天元在不斷完善,Brain++逐漸成型,曠視科技在不斷壯大,所競爭的市場也在不斷擴大,開源已經(jīng)成為一家行業(yè)領(lǐng)先公司的責(zé)任。
“我們認(rèn)為我們應(yīng)該為中國整個人工智能生態(tài)系統(tǒng)做出一些貢獻。我不知道這個貢獻會有多大,但我認(rèn)為這是我們應(yīng)該做的!币嬲f。
在天元開源發(fā)布會上,唐文斌還進一步透露了曠視對天元的期待,希望通過開源,能夠與更多人一起,利用AI的力量創(chuàng)造更多價值。
當(dāng)然,曠視作為一家AI創(chuàng)業(yè)公司,如何在最大程度發(fā)揮開源能力的同時,保證核心業(yè)務(wù)不受損害?天元是否開源、如何開源,這也是外界關(guān)注的核心問題。
從天元的發(fā)展路線圖中,我們可以看出曠視科技對于這些問題的態(tài)度,不僅沒有回避,而且相當(dāng)坦誠。
唐文斌坦言,此次開源的天元是Alpha版本,基于.0,約有35萬行代碼,覆蓋了絕大多數(shù)應(yīng)用場景。
6月份,曠視將發(fā)布天元Beta版本,增加對ARM系列CPU的支持、更多加速設(shè)備支持、量化與低位計算支持等功能。
9月,曠視將發(fā)布1.0正式版本,全面支持主流計算設(shè)備,升級動態(tài)計算能力,優(yōu)化整個訓(xùn)練和推理流程的用戶體驗。
唐文斌表示,也希望更多人能夠?qū)ξ覀兊漠a(chǎn)品提出批評、建議、貢獻代碼,共同建設(shè)更好的天元。
但不管怎樣,從現(xiàn)在開始,開發(fā)人員在選擇構(gòu)建模型算法的框架時,多了一個不可忽視的可靠選擇。
此外,對于整個AI行業(yè)來說,競爭維度也進一步增強,開源競爭不再是某個算法或模型單點的開源,而是變成了框架、平臺、生態(tài)群體之間的爭奪。
正如唐文斌所言:“AI可以賦能很多行業(yè)、很多場景,這是一場無限的游戲!
在這場博弈中,曠視因 Brain++ 而強大,Brain++ 因天元而無處不在。AI 復(fù)興讓曠視成為第一家上市的 AI 創(chuàng)業(yè)公司。如今,曠視正通過天元,將自己的 AI 影響力和能力傳播到更廣闊的智能時代。
量子位還問CEO印奇,天元開源內(nèi)部的小目標(biāo)是什么?
尹奇回答:中國開發(fā)者中口碑最好的框架。
如今,天元已正式開放,接受大家的考察和評鑒。
門戶網(wǎng)站:
天元深度學(xué)**框架官網(wǎng):
開源地址:
- 超過-
·今日頭條簽約
關(guān)注我們,第一時間獲取最新前沿科技資訊








