久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

博客專欄

EEPW首頁 > 博客 > 開源之道,和而不同 | CCF-GAIR AI 源創專場

開源之道,和而不同 | CCF-GAIR AI 源創專場

發布人:AI源創評論 時間:2020-10-11 來源:工程師 發布文章

AI研習社按:2020 年 8 月 7 日 - 9 日,全球人工智能與機器人峰會(CCF-GAIR 2020)正式開幕。峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)聯合承辦,鵬城實驗室、深圳市人工智能與機器人研究院協辦。從 2016 年的學產結合,2017 年的產業落地,2018 年的垂直細分,2019 年的人工智能 40 周年,峰會一直致力于打造國內人工智能和機器人領域規模最大、規格最高、跨界最廣的學術、工業和投資平臺。

CCF-GAIR 2020 第二天,峰會與 AI 研習社、OpenI 啟智社區聯合舉辦“AI 源創專場”,重點討論了新基建背景下,國內開源創新建設將催生的新勢能,以及將引發和促進的新產業機會。

AI 源創專場的策劃,醞釀一年之久,形成半年之前。2020 年 1 月 8 日,采訪洪強寧的那個下午,洪強寧說了一句讓人印象深刻的話,“全世界的程序員是一個共同體”。使這個共同體成為可能的,就是開源。具體報道可參見《“教授”洪強寧和他穿越的技術江湖》。

在此之前,崔寶秋也兩次談及多年追隨開源的心路歷程,作為雷軍同寢室的同學,崔寶秋畢業之后先去了中科院計算所讀博士,1995 年去紐約州立大學石溪分校繼續深造。他開始接觸自由軟件和開源軟件,博士論文涉及的代碼也全部開源。無論后來在 IBM、雅虎、 Linkedin,直到在小米,崔寶秋都是堅定的開源信徒,從未有過動搖。開源也是崔寶秋和 Daniel Povey 惺惺相惜的重要原因。具體報道可參見《小米崔寶秋:開源是軟件的未來》。

現任 OpenI 啟智平臺秘書長和鵬城實驗室 AI 開源平臺辦公室主任的劉明,20 年前就和開源結下了不解之緣。作為一個開源老兵,他曾任全球首個中文 Linux 版本、香港上市企業沖浪 Linux 總經理,還曾擔任過永中 Office 總經理,在基礎軟件領域聲名顯赫。從民間到廟堂,從西方到東方,劉明的故事正是 20 年中國開源故事的縮影。喜歡八卦的同學,可以閱讀左林右貍的知識星球《開源老兵的中國往事》。閱讀訪問:https://t.zsxq.com/vz3zJeM。

而AI 源創專場的聯合主辦方,都和開源有著極深的淵源。AI 研習社發軔于早期的雷鋒字幕組,那是一群熱愛分享的,由985、211高校為主體的AI 愛好者組成的字幕翻譯Team,專注于AI領域的海外內容翻譯。大家發揚著雷鋒精神,通過開源方式組織在一起,高效率的完成翻譯任務,再開源分享到社區。如今,它已發展成為擁有20萬用戶的985、211學生為主體的AI學術青年和開發者的社區。始于開源,成于AI。

OpenI 啟智平臺更是肩負“新一代人工智能開源開放平臺”的使命與夢想,英文名稱Open Intelligence,簡稱OpenI。本次圓桌論壇嘉賓,邀請了陳天健,OpenI理事會理事,微眾****AI Group副總經理、專家工程師,聯邦學習技術總負責人;邀請了黃之鵬,OpenI技術委員會委員,華為計算開源生態部副總監;邀請了田忠博,OpenI新晉核心成員曠視科技的最新AI開源框架天元的技術負責人。圓桌論壇主持人,正是劉明,OpenI秘書處秘書長。

技術英雄、龍頭企業、官方機構,角色不同,濟濟一堂。本次AI源創圓桌論壇有崔寶秋這樣的開源信徒,有曠視田忠博這樣的開源新銳,也有走到哪里都有一群程序員粉絲的開源網紅,濤思數據創始人陶建輝和一流科技創始人袁進輝。大家各抒己見,碰撞不斷,激發聽眾對開源的深度思考和“強化學習”,這或許就是開源本來的樣子,星光閃耀,和而不同。

AI 研習社將圓桌論壇進行了不改變原意的編輯,以下為全文:

一  新基建 7 個內容,哪個跟你最密切?

(主持人)劉明:

今天我們緊扣主題:一是新基建,二是 AI。

AI 發展太快了,去年年底我也是主持,當時在場的天健和寶秋都是老朋友,在啟智開發者大會討論了:第一是 AI 的邊界是什么、第二是開源的能量是什么。

現在 AI 的發展真的很快,2016 年討論的是深度學習技術,第二年討論數據,去年開始討論倫理,我們當時定的主題是邊界。

今天的主題是三個方面的討論:一是新基建;二是 AI,而且應該討論當前最熱話題“超級 AI ”;三是開源。

時間比較緊,大家自我介紹就免了,大家都認識了。

我們先討論新基建,新基建啥意思很多都已知道,我原來所在的單位工信部、還有發改委做了七大領域的規劃,什么是新基建?5G、特高壓和電力互聯網、高鐵和軌道交通、新能源汽車充電樁、數據中心和云計算、AI、工業互聯網。

我原來在產業界,最早做過中文 Linux 的版本,叫沖浪 Linux,后來在永中 Office,在基礎軟件領域做了很多事。后來在工信部搞產業研究和促進。

請嘉賓根據自己的理解說一下,七個新基建當中排排序,就講講一兩個,覺得和你所在的單位,哪個和你最密切?

陳天健:謝謝劉明老師,我是微眾****的陳天健。國家進行新一代網絡的建設,也會影響未來工業互聯網的面貌。新基建一方面是機會,一方面是挑戰。

如果基礎設施好了、數據多了、算力也強了,但是應用數據的能力,也就是 AI 這塊沒有很好跟上的話,也大不起來,對從業人員既是機遇也是挑戰。

崔寶秋:新基建跟開源都是相關的,像今天咱們的AI源創里面有AI,后面的大數據、5G、工業互聯網、新能源充電樁、特高壓,我認為都跟開源有關系,比較簡單的就是AI的開源、大數據的開源,6G其實跟開源也有關系,這些是今天可以看得到的。

就像今天我演講中講的,開源是個模式、開源是個平臺、開源是個方法,包括開源硬件,在新基建中都會扮演特別重要的角色。

田忠博:新基建是個整體,幾個技術都非常重要。如果讓我挑的話,我可能會挑工業互聯網,這是人工智能技術發揮非常很大作用的廣闊天地,跟中國現在的升級和轉型能夠非常好的結合在一起。

對于曠視來說,新基建是一個從一到萬的新的征程,我們要做好一,在傳統工業和新技術加持的工業互聯網上打造新的增長點,像我們在機器人和物流方面一直在深耕,希望可以在新的政策和機遇下,可以有新的發展。

陶建輝:我是濤思數據創始人陶建輝。新基建對我們公司來講,意義特別重大,七個方向,無論是高鐵、軌道交通、電力,還是新能源、工業互聯網、云計算、數據中心,都和我們公司做的東西密切相關。

因為我們是做數據采集的處理,我相信世界上經過 90% 的數據都是機器采集的數據,包括電網、包括工業互聯網、包括新能源汽車,而且我認為要通過開源的方式解決,因為沒有任何一家能夠獨占,讓所有人都受惠。

而且開源的方式有個好處,正好給中國一個機會,因為現在基礎軟件幾乎都是國外的,利用 5G 的機會,中國巨大的市場有可能誕生出新的,乃至于中國真正的基礎軟件。

袁進輝:大家好,我是一流科技袁進輝,我們是做深度學習框架,前幾天也正好開源了。

我想對新基建做一下歸類,世界上的存在形式有幾種:一種是物質、一種是能量、一種是信息,新基建覆蓋非常全,高鐵是運東西的,是物質的;能量的是高壓輸電和充電樁,還有一半幾乎都是和信息有關,信息涉及到世界的數字化,數據的采集,背后數據分析的大腦,以及現實世界的反饋,從這個角度來說把所有的方面都覆蓋了。

黃之鵬:謝謝,對于我們公司來說,啥都做,好像啥都相關。不過既然說到開源,新基建里面的基建,這個之前也和袁老師溝通中也說過,像編譯器這種,大家不是特別會接觸到,這種基礎設備也是非常重要的。

二 AI 里算法、算力、數據,哪個對你更重要?

(主持人)劉明:大家說得都非常好,前不久我參與發改委領導組織寫作的一本書,叫《新基建-數字時代的新結構性力量》,關于新基建,你怎么樣想象都不過分。因為它是一個中國引領的,全新的社會經濟產業生態建設,不光是基礎設施,是這樣一個大的生態工程。

舉個例子,中美現在最熱的爭端,以前是華為,今天是頭條,為什么是這兩個?

1G~5G是數字新基建底座,不同時代的基礎設施催生不同的新業態。2G應用框架是****,只能支撐文字字符;3G開始支撐移動互聯網應用app、集大成者是微信,微信的技術應用框架就是語音+圖片,4G曾想沖刺視頻、網速及能效都不夠用。終于等到支撐視頻甚至VR的5G時代來了,但底座是華為的,視頻新的應用場景新業態是字節跳動在創新、而且還引領著美國人在效仿,你說人家能不急嗎?!所以華為成為眼中釘,字節跳動成為肉中刺。    

所以我覺得新基建從各個領域,不光是帶來基礎設施、而是帶來了新生態的引領,這么一個宏大的工程,怎么形容它都不過分。

我是資深的開源老兵,開源界的很多人都認識我,開源已經從最早的個人英雄、技術驅動,到企業和商業的驅動,開始進入生態驅動。三個維度都具備了,既有技術、又有商業價值、又有生態價值。除了企業,生態在中國更多是政府的主導、以及第三方組織的加入。新基建就是最大的一個生態驅動。

這事太大,但是跟開源有關,跟 AI 有關。那么下面我們就談談 AI。

昨天全體大會很多大咖都分享了AI最新最熱話題,開場報告高文老師介紹了“鵬城云腦“和“數字視網膜“,印象深刻的是周志華老師針對當前火爆的“暴力美學”成功模型GTP-3、數據驅動的大數據+超級算法+超級算力的當前AI主流,提出另一條數據驅動+知識驅動的“反譯學習”思路。而我們鵬城實驗室的“云腦",真的是在打造一臺“暴力機器”。AI 在今年突然到了兩個分叉點,原來覺得已經差不多到天花板了,現在到了是走暴力規模化,還是反輔以人類知識智慧另辟蹊徑,這是兩個方向。

不管怎樣,還是分三個方面,就是人工智能三要素來談,一個是算力,一個是算法,一個是數據。

今天國內做算法或者說框架的,大都在這里。剛才演講的 Zilliz 的顧鈞,和臺上濤思數據的陶建輝,都是做數據的。天健也是我們OpenI啟智的理事,他在楊強老師團隊里在引領聯邦學習的熱潮,而且貢獻我們社區關鍵的數據環境項目“OpenI縱橫”,大家都知道的GitHub是代碼環境,AI開源社區建設還需要數據環境,我們非常看好聯邦學習、希望打造成為AI開源社區安全可靠的數據環境。

所以我想從自己的角度,每個人講講,AI 里算法、算力、數據哪個重要,你在這個領域是在世界級的領頭,還是在國內領頭,還是什么樣的想法?

這三天基本人人都在談 GPT-3 。你怎么看在這個轉折點上,算力、算法、數據,我們有什么機會?

陳天健:我們既做 AI 方面的研究,我們也做 AI 產業化的應用,在互聯網金融這個行業。

我們觀察來看,國內包括國外 AI 的研究界和產業界的分裂或是自相矛盾越來越嚴重,而不是越來越輕,產業界研究的問題學術界看不上,覺得你們這個是屬于臟活、累活,沒什么用。

工業界也看不上學術界搞的東西,覺得你們說的這些東西都是三十年以后才能用得上,今天有一個問題需要解決,但是解決不了,你有沒有辦法?仔細研究一下也沒辦法解決。

所以這個分裂的問題,我相信不會因為外部的變化,比如說國家對于新基建的投入,內部的變化,包括企業對商業模式的探索,而發生本質上的改變。

但是也是有機會去彌合當中的分歧,我相信就是開源。因為不管你的理論研究做成什么樣、是什么樣的方向,最后總得有一個交付,開源是一個比較好的交付的界面。

企業也可以通過與高校進行開源上的合作,去彌合產業界需要的 AI 技術,和學術界開發的高大上的新的 AI 技術之間的斷層或是分裂,在我們看來,算力、算法都不重要,重要的是產業界和學術界要盡量減少分歧,通過一種合作平臺的方式,進一步減少、逐步的減少這種分歧。

崔寶秋:劉明老師講的兩點非常對,就是算力和算法。

很有感觸,最近大家都在談 GPT-3,讓人驚艷,我們稱之為“暴力美學”,也代表了廣義的開源,也代表了我之前講的,大家不要過早的唱衰 AI、唱衰大數據、唱衰深度學習,以大數據和深度學習為代表的 AI 技術,或稱之為 BigData 的大數據 AI,才剛開始。

去年就有人在說,深度學習遇到極限,大數據不行了。當然我們渴求新一代、下一代的 AI 技術,但是現實點講,今天的大數據紅利,深度學習和 AI 帶來的技術紅利才剛剛開始。

今天的GPT-3,它的驚艷,它的“暴力美學”,讓世人吃驚,我們用強大的算力、強大的算法和后面的廣義的開源帶來的東西,我們有很多紅利都沒吃呢,這里面跟學術界、企業界已經慢慢區分不開了。

剛才 Daniel 接受采訪被記者問,他做的 K2 這個子項目,是學術相關還是偏向產業相關?他說兩者都有。

我還是借此機會講一下,今天的 AI ,春天才剛剛開始,我覺得我們從產業上,從新基建帶來的機會上,從人類科技的進步上,我覺得都是個機會。

紅利還有很多,不要過早的標新立異,搞些讓人吃驚的標題唱衰 AI,AI 需要大家呵護,過去的 AI 寒冬都是因為大家對 AI 有過高的預期、過熱的爆炒、過度的冷落才造成了 AI 的冬天,今天我們需要呵護大數據和深度學習帶來的 AI 技術,能幫我們做什么要有清醒的認識,我們可以做很多東西的,以此謀求下一代的 AI 技術,需要呵護今天的 AI 技術,開源會扮演很重要的角色。

田忠博:在我看來,人工智能三個因素實際上都非常重要,都需要在整體上有新的方法和新的突破,我對這個事情從來不悲觀。

曠視建立研究院之初對深度學習充滿的信任,剛才寶秋老師也說了基于 GPT-3 的模型很驚艷,我覺得并不意外,我們看到 AlphaGo 大家也是同樣的震驚,研究界并不應該驚奇,我們自己就會發現,16 倍的數據集會使物體檢測顯著的性能提升,說明我們的算法的邊界遠未達到。

我們增大數據、增大算力,會發現能力進一步提升,我們現在沒有看到邊界或是能限制我們想象力的東西,現在我們真正面臨的問題,還是在于我們是否能在基礎上更進一步,把人工智能帶向下一代的能力,讓它更加指數型的發展,我覺得這是我們的挑戰。我從來不相信深度學習或人工智能的瓶頸論。

陶建輝:(陶建輝,濤思數據創始人兼 CEO )剛才劉明講的算法、算力和數據,我們公司濤思數據主要注重在數據上,尤其是物聯網大數據。

新基建是要孵化 IT 的新基建,任何一道新的場景出來,數據存儲包括操作性,都要做相應的改進,我們公司針對物聯網、車聯網和工業互聯網的場景,做了更好的存儲方法,國家新基建對我們來講,正好是最好的春天的到來。像我們自己開源之后,獲得的反響也很大,這是另外一個紅利。

新基建給我們帶來巨大的紅利。中國還有一個巨大的紅利,以前是農民工的紅利,現在的紅利是工程師的紅利。中國的研發人員的數量已經相當龐大,二十年前我從美國第一次回國的時候,中國研發人員的素質和美國相差非常巨大,數量也是相差非常巨大。現在都是一兩千萬軟件研發人員,軟件研發人員在呼喚新的工具,這個新的工具實際上是新的基礎設施,包括人工智能、機器學習新的框架,包括像我們這種新的數據存儲的軟件,這些都是新的機會,這是前所未有。

而且通過開源的方式還有一個好處,不僅是在中國,而且可以走向國際市場,尤其是今天中美貿易戰、意識形態紛爭的今天,如果你不開源,美國人更不相信你。門都沒有,通過開源,我認為有可能走進歐美的市場。

袁進輝:(袁進輝,一流科技創始人)我非常同意寶秋和田忠博的說法,最近一年對 AI 特別是深度學習為代表方法的批評的聲音變多了,這個從學術界大家往前看是正常的。

但是在工業界,至少是在可 Work 的方法里,深度學習代表了數據驅動的潮流,現在應該說是頂峰,還沒有看到超越的方法。以前是基于規則,人需要把知識嵌入進去;后來基于統計學習的方法,深度學習出來之后,大部分場景都可以端到端了,意思就是說很多地方都是讓數據教程序,就不需要人去編程序,從數據里面推導出來程序,程序再去做一些推理和應用。

深度學習本身的貢獻是解決了建模的問題,我們如果做過編程工作的話會有體會,在編程的過程中,把一個現實的東西建模出來是最有挑戰的,所以架構師的身價很貴,建模搞定再寫程序就是工作量的問題了, 深度學習把建模的過程自動化了,這是它偉大之處。但是它也有一些局限性,學術界再往前看,是知識驅動,得到一些新的方法。這是我第一觀點。

第二個觀點就是,深度學習的特色是需要非常多的數據,非常大量的計算,參數量從以前的幾千萬到幾億、十億,到現在 GPT-3 有 1700 億,現在已經到了非常高的程度,高到什么程度?

我們知道人腦里神經元的連接是百萬億級,就是說 1000 億大概還離人腦連接,還隔了三個數量級。這就會引起一個想象:假如這個數據再大,計算力再大,比如我們感到人的智能神秘的那一部分,現在覺得人工智能搞不定的這部分,是不是通過規模到達一定程度之后,就出現了涌現,就是靠規模搞定了,原來 GPT-3 沒人想到,AlphaGo 的能力也想不到,規模到一定的程度就出現了。可能不是這么簡單,但是留給人很多的想象力。所以我覺得在數據和計算力的緯度上,還有非常多的事情需要挖掘。

以 GPT-3 為代表的話,這里面跟開源也有關系,GPT-3 模型背后,解決大規模訓練的技術,其實還沒開源的。即使有些公司有 1 萬的GPU,有些很多數據是訓練過的,框架層次做了非常深度的優化,千億級參數的優化,需要用到模型運行、流水并行的技術,現在開源框架還做不了,這是一個問題。

我要廣告一下,OneFlow 就是為這種目的而生的,OneFlow 開源出來之后,對這種非常大規模的模型,不需要用戶去定制開發,比如說安防領域,有千萬級的人臉識別問題就可以做了,廣告推薦系統是百億、千億級特征的,也不需要定制就可以做了,大家有這種需求可以嘗試一下。

黃之鵬:(黃之鵬,華為計算開源生態部副總監)我說點悲觀的,我從另外一個角度來說,因為我主要是偏開源運營的,我覺得是現在有一個巨大的海嘯在朝我們涌來,但是我們可能還不太感覺,華為像是在遠洋的巨輪,已經先感覺到了。

我們正在逐步邁向物理上隔離,虛擬意義上互聯的狀態,這種情況下對于開源的挑戰是什么,對 AI 的挑戰是什么?

回到劉明老師說的三個方面,這個物理不光是機器包括信息,包括物理上的隔離,后面更加強調各個區域自主本地化的世界,那么開源怎么做?我們之前理解的開源是世界是平的,包括修正案的保護、許可證,我們所熟知的一切東西,可能都是要改變的。

再往前推,我個人認為,做框架的話,如果你不能掌握像編譯器這類的基礎設施的能力,不會跟硬件做系統級優化的能力,不掌握硬件的話,以后真的什么都做不了。

現在還沒有廣泛到大家感覺到,陽光、空氣、水會不會斷掉?我們已經感覺到了。其實對于做開源,我們所遇到的困難,可能是其他公司做開源的同仁感覺不那么明顯,我是站在相對比較悲觀的角度。

三  在開源里你是什么狀態,遇到什么問題?

(主持人)劉明:確實,現在是最好的時代,也是最壞的時代,這一年什么都感受到了。

這讓我想起2011 年的時候,(工信)部里面說大數據爆了,全年的數據相當于之前一萬年。數據引爆的智能、還有云的算力,AI 就不再細談了,最后該討論開源。

每次寶秋總來,他就像站在巨人(開源)的身上,從自由軟件談到開源軟件。我也是各個時代都參與過,Linux時代當過全球第一個中文Linux版本沖浪Xteam Linux的老總,但因為沖浪當年過早在香港上市、不像現在商湯一樣被政府待見,后來巨頭發起的OpenStack企業級開源運動也全程參與并利用在工信部工作的資源力推過,包括Richard Stallman 最后一次到中國來,參與過接待。前段時間社區熱傳一張照片、文嵩和徐繼哲還有我在給Stallman演講前調試一臺筆記本,他自己不帶電腦,也恨蘋果電腦,在場開源大牛們一水標配蘋果本,我那時正好在推Ubuntu中國官方社區優麒麟,帶著優麒麟電腦,是為東北亞開源論壇出行日韓而特意買的一臺聯想超極本,他覺得這臺可以用,呵呵目前這臺電腦和Richard的PPT還一直跟隨我放在辦公室。

開源是貼近人類文明的開發方式,也是人類進步唯一的、最先進的一種方式。我們這種方式原來以為它很理想,現在發現開源也不理想,也有寶秋總前面演講中說的坑和這么大的挑戰。在座既有陶總這樣的開源網紅,也有開源最佳實踐的巨頭。本來我還通過Linux基金會想邀請Zilliz 創始老板星爵來一起聊、他有個觀點是國產開源需要更多利他主義,他剛當選當選 LF AI (Linux Foundation AI 基金會)新一屆董事會主席。我還邀請過清華伯克利的譚章熹教授、深圳首個諾獎/圖靈獎實驗室RISC-V國際開源實驗室負責人,去年在鵬城實驗室與章熹的導師David Patterson一起聊過開源硬件肯定有與軟件不同之處,后來RISC-V基金會CEO Calista Redmond來訪時我們又進一步探討過。圓桌就應該從每個人不同的角度,討論開源應該怎么做。

悲壯的之鵬讓我們加速進入了終極話題。大家都是開源的老兵,你對自己、對開源的認識,你現在在開源里是怎么狀態,遇到什么問題?

陳天健:(天健的開源加速主義哲學解釋很棒,說到點子上,理解很深)。

大家聊開源之前的話,其實可以想一個事,叫做“加速主義”。兩個人打架,一個強一個弱,強的人說,弱的人通常在成長,所以我得提早和你干一架,他愿意早打。弱的人因為信息不對稱,他腰里藏著 40 米長刀,就等著強的人早打。于是在市場上大家都達成一致,我們要早打。

怎么個打法?在軟件的整個供應鏈上就是開源,一開始在進入開源商業模式之前沒有想到這么“有毒”,開了以后發現越來越“有毒”,整個供應鏈完全開源了,一旦開源再也不能走閉源的回頭路了,用的每個部件,供應鏈上 99% 的部件都來自于開源社區,所以開源是非常“有毒”的一種商業模式,它加速了一切。

你原來要進入細分市場的話,可能要花三年的時間吹牛,三年的時間做現場測試,再花三年的時間看市場的反映,來來回回十年就過去了。

一旦進入開源的軟件供應鏈或是生態的玩法,軟件行不行,第一天就有人拿出來評測,一兩年你的社區、生態還沒發展起來,這個項目基本上就要涼了,所以開源從哲學角度來說,是加速主義的產物。

既然加速的話,我們匯報一下我們加速的成果。2019 年初的時候,我們開源了聯邦學習的框架Fate;2019 年年中的時候,加入了 Linux 基金會;現在經過一年多時間的發展,使用 Fate 的廠商已經擴展到十幾家,這是我們知道的,未知的還不算。

它創造了一個新的細分市場,就是基于聯邦學習的大數據價值交易的市場,基本上復興了大數據。你在互聯網上找的任意一個關于隱私計算的帖子,當中一半以上的廠商,它的內核都是基于 Fate 或者是 Fate 的一種變體。

你會發現,開源的模式對于加速生態的構建、加速試錯、加速商業生態的形成、加速軟件供應鏈的重構,是有非常大的幫助的,它加速了一切。

反過來,對于所有的開源從業者提出了挑戰,這個坑是你挖的,加速也是你推動的,反過來,你在這個加速的過程中,是不是能跟上節奏,不斷的調整商業模式的設計,構建更大的基于開源軟件的生態聯盟,這是給每一個開源的商業化從業者的挑戰。

崔寶秋:今天我講到“開源新時代”,確實我們面臨一些挑戰。我可能比較樂觀,最終會過去的,過去一兩年我關注的是巨頭后面的寡頭壟斷,開源界的寡頭壟斷。就是控制權,不夠那么開放、不夠那么中立、不夠那么平等,不夠那么全球化。今天的形勢把這個給擴大化了,給加劇了,但是我覺得長遠來看是會過去。

我可能是一個樂天派、樂觀主義者,我相信開源是人類科技進步的最佳模式和平臺,包括數據、人類的知識是屬于全人類的,用某種形式傳承下去,把這個全人類的巨人一直呵護下去,這個我覺得是有可能的。

當然最近一些比較敏感的話題讓我們看到一些黑暗的一面,比如說華為同事看到的一些東西,我們也看到了,行業中可以看到一些不好的事情。原來說開源,應該是沒有國界的東西,現在慢慢有國界了。

因為開源許可,不管是 GPL,還是 Apache 也好,誰來解讀它?很多是來自于美國,誰來執行它?所有的法律法規,解釋權在哪里、執行機構在哪里?開源本來是全人類的事情,變得有國界了,挺讓人覺得這是可悲的地方。

所以我特別希望咱們中國要做一些自己的事情,開源的一些東西,我覺得應該推動一下,更加開放、更加中立、更加平等、更加全球化的一些許可和法規,真正讓開源變成全人類的事情,而不是一兩個國家的事情,或者不同意識形態的事情,就像食譜一樣,大家都可以做,有些算法大家都會知道,這是屬于全人類的。

我覺得一些黑暗的東西,今天看的一些倒行的事情,我認為是暫時的,慢慢會過去,希望中國在未來的世界格局中,會扮演越來越重要的角色,中國可以推動一個更加極致的開源,為下一代的文明,咱們可以推動一些事情,我是樂觀的。

田忠博:感覺這個話題比較復雜,對于開源來說大家理解不太一樣,有些人覺得是挑戰,有些人覺得是機遇,有些人覺得是責任,有些人認為可能是商業,包括曠視做開源,很多人有一些猜測和想法,我現在沒辦法代表公司發言,我只能代表我自己,我自己是怎么看這個事情,包括我的團隊。

其實開源是非常自然的事情,我經常和團隊說,代碼是工程師的自然語言,在最低的限制上,開源是工程師、研究員相互交流想法的一種方法;在最低的限度上,任何的一種代碼都應該被分享出來,希望用這種方式連接更多的智慧、更多的想法,我們可以看到深度學習、看到人腦,本質上是連接的智慧,希望通過這樣的方式能夠促進。

所以我會覺得對于開源,不希望它復雜,希望它能回到本質的屬性,是一種交流、一種拓展。大家可能認為曠視剛做開源,其實我們一直都是通過論文或者是其他方式,把我們最新的研究成果開源開放出來,確實天元是曠視第一個大型的開源項目,還有非常多的困難,非常多的問題需要克服,但我覺得終將走向一個讓大家變得更好的趨勢,這也是我們做這件事的本心和初心。

陶建輝:我分享兩個方面。一個方面是特別好的方面,我自己感覺開源對我公司帶來巨大的價值,市場、品牌一下子就起來了,我們本來前面做兩年也賣了將近十個客戶,也沒什么人知道我們,開源以后,中國的開發者真的是沒有不知道我們的,現在也有美國、德國、意大利、西班牙的用戶。

我們去年 7 月份宣布開源之后,我們有 5 天時間是在 GitHub 趨勢榜排名第一,我們就在這周一,8 月 3 日,我們把核心的集群功能開源,宣布之后,今天是第 4 天,已經連續 4 天排名第一,大家可以搜一下叫 TDengine,里面有我自己寫的 4 萬多行代碼。這是好的一面,很鼓舞人心,覺得自己寫的代碼有價值,我們畢竟是寫程序的,要有人看、有人喜歡這個程序才有價值。

另一方面,在中國做開源是個極其難的事情,為什么?軟件幾乎沒人買,軟件很難很難,Oracle 在中國的銷售額只占全球的 4% 不到,在中國做開源誰買單?任何一個好的軟件要生存下去,必須有商業和錢驅動,誰來掏這個錢?像Linux的個人英雄時代已經不在了,一定要背后有集團和商業利益在驅動。這個東西偏偏在中國不具備這樣的土壤,因為大家不愿意為服務、為軟件買單,開源在中國站起來還有很長的路。

我們公司選擇做開源真的是相當相當難,我自己和別人有點不一樣,我是海歸背景,我從成立的第一天起,就認準中國賺不到錢,開源,我是拼命想做歐美市場,偏偏現在又有意識形態之爭,讓我們的未來充滿著變數。

如果你們想用開源在中國做生意,是真賺不到,而歐美市場,像意識形態的原因,真的是充滿太多的變數。

袁進輝:我們也是做開源的,也是創業公司,陶總說完讓我心里拔涼拔涼的。

我們經常說開源的正面,我說一個是比較少想到的,開源有一個負面的作用,它可能是扼殺創新的。就是開源的東西出來之后形成一種生態,我們可以想象它像一個黑洞一樣,很多的應用、算法、開發者都是圍繞著它的,有什么新的東西出來,都被這個已經成為“標準”的東西吸進去了,如果有個團隊,有個新的想法的時侯,會被嚇倒,大部分人一看開源這個東西太龐大了,工程上也非常龐大,生態上也非常難以逆轉,有時新的想法不是那么容易嘗試。

比如我們做深度學習框架,三四年以來被頻繁的問這個問題。就是 Google 做了、Facebook 做了,微軟、亞馬遜,國內的華為、百度都做了,你一個小小的公司,你憑什么做這個事情,你怎么出來等等一系列的問題。

所以說這個開源的東西形成了一種生態之后,有一些主流的玩家以后,新的想法不太容易出來。而且很多算法我們可以調用,現在有一種叫調包俠,它(框架)做得已經非常容易了之后,形成一種懶惰,底層的東西我不去了解。

有的時候做復雜的創新,比如說早期的 AlphaGo,這個創新背后都是帶著復雜的系統工程,即使有的團隊想過這種想法,沒有系統工程的能力支持,也沒法做。有的時候造成一種懶惰之后,就會阻礙創新,特別是國內,我們不要滿足于成為調用別人 API 的人。

第二個我想說的,開源提供了非常大的機會。我做一個類比,以前一個演藝人員要成為明星,只有走中央電視臺、上電影;但現在像李佳琦、李子柒等,只要他有才華,他通過自媒體、社交網絡,是有非常快速出來的通道,開源就是這樣的市場。

我們知道很多知名的機器學習領域用得多的軟件,不是大的商業公司干的,是個人英雄主義干的,陳天奇、賈揚清早期的項目是個人做出來,大家覺得好用以后在社區里就像指數傳播、網絡效應,飛快就起來了,這是非常好的機會,英雄不問出身,不一定是大公司可以干的,能力很強的人、很強的團隊、創業公司,我認為也有機會。

第三個我想說一下,像寶秋說的一樣,我也是樂觀的,我也覺得國內的人現在面臨政治的沖突,但是不要因為這個因素變得封閉,而要更加開放,要有全球的視野、全球的胸懷。

非常好的開源軟件,像美好的文藝作品、電影一樣,就是人類優秀的文化、文明的成果,我們應該實事求是的承認,國內以前在這方面,是比較少有非常優秀的貢獻者。我認為這個時代到了,從應用的牽引,很多互聯網公司和 AI 公司應用層次完全不輸于國外,人才積累也到這個程度了,我們國內的開發者應該有這種志向,創造出非常優秀的開源項目和作品。

黃之鵬:感覺我是搶先打開了一個潘多拉盒子。我也說點樂觀的,剛才說了很多我覺得會產生的挑戰,背后意味著什么?其實對中國做開源的人是件好事,意味著無論是國家、企業還是社會,開源或是專業復合型的開源人才越來越重要,大家原來認為開源是文化上、精神上的,只有經過轉變,很多公司才會意識到開源是非常復雜、綜合性的事情。

我大概說一下我個人對后面發展的理解。

像剛才我演講中講的,MindSpore 整個社區的章程是我一手寫的,它的社區治理、開放性我敢說放在國內是非常領先的。我們讓渡了很多東西放在社區里面。其實我們可以完全像谷歌一樣,為啥我們華為出人出力,還搞一個技術委員會在上面管著我們?這是因為我非常堅信整個開源開放,包括治理這一套東西的有效性,不是什么東西能夠推翻的。

當時未來可能會改變的東西是什么?一個是我們未來會越來越面臨物理上隔離、虛擬上連接的一個社會,所以來說,未來我們經常會做的一個,就是大量的本地化的事情,現在大家覺得寫個英文文檔基本上已經打遍天下了,未來可能不夠用。而且大家想一下,因為疫情,我們有一個巨大的人才紅利,很多留學的人都回來了,中法、中德、中日、中韓很多的雙語人才之前在國外工作,這些人才只要我有預算,都希望用起來。其實在國內通過互聯網可以做很多這種國際化加本地化的拓展,這會有一個新的變化。

我覺得去年劉老師在力推OpenI啟智社區時做得特別好的一件事,也是挺大的一件事就是經常請北****學院張平老師等開源知識產權專家來做講座,讓大家明白開源首先是法律、知識產權、許可證、還要合規治理,這些跟GitHub等代碼托管平臺一樣都是開源社區重要的基礎設施,但往往大家普遍缺乏這方面的意識,只關注代碼和技術。所以以后開源的人才一定是綜合性的人才,他要懂開源社區的法律,專利,開源開發,開源治理,傳播這一系列的事情,以后才能把開源做起來。

今天論壇本身就是非常巨大的進步,放五年前,劉老師只能請一批西方面孔,我覺得今天這個圓桌環節本身已經是一個巨大的成功,像袁老師說的,其實在大的尺度上,我也是很樂觀的,我對開源從來沒有動搖過,我開發所有的知識,都是從開源來的,我覺得它一定會走下去的。

四  聽眾提問:開源怎么賺錢?

(主持人)劉明:感謝之鵬,危機更多的是”機”,物理世界隔離了,帶來虛擬世界的爆發。這是去年從貿易戰、科技戰到全球大戰疫帶來的一個趨勢,也是全人類的一個機會。

臺下聽眾們有沒有要提的問題。

提問(平安科技):我請教兩個問題,第一是我們現在開源的話,有沒有安全問題?第二是我們做開源產品、做社區,有沒有商業價值?在哪里?

陳天健:我們做的開源項目比較特殊,我們做的是和數據安全合作相關的項目,安全問題說到底,開源沒有與之比的商業模式,因為誰去認證黑盒?沒有后門這樣的東西,因此只有開源這樣的模式。所以我們對于開源的選擇可以說是一種必然的選擇。

我們的軟件建成了一種各方進行大數據合作建模的一個事實標準。類似于大數據的 HTTPS,這樣的話,我們在上面可以進行多方位的,比如說金融業務的變現,構建一個大數據的合作本身就是金融網絡的基礎,所以我們相對于出售 License 這種模式,我們相對來說還不太受到商業方面的困擾。所以我們才會去投入這種基礎設施,通過開源去推動各種標準的構建。

陶建輝:我可以分享一下開源怎么賺錢,我正在寫一篇博客,講我們的開源策略是什么。我是紅杉、GGV、明勢資本投的公司,我們已經拉了 2000 多萬美元,那是一定要賺錢的,我開源不是只為人民服務的,否則沒人敢投我。

那怎么賺錢呢?我們采取的模式在美國叫 Open Core 。就是核心代碼完全開源,那哪些不開源呢?我們公司的產品不是百分之百開源,大概還有百分之幾的代碼不開源,輔助性的功能不開源,剛性需求、必須用的全部開源。比如說,像類似于數據庫的插入、查詢、集群都開源,但是我的異地容災不開源,一鍵登錄不開源,數據加密不開源。

因為異地容災,我絕對不會開源,因為像中小企業異地容災無所謂、數據加密無所謂,沒有的話照樣跑,像 mongoDB、Spark、Kafka 都是這種做法,現在是美國相當成功的商業模式,叫 Open Core,就是輔助功能不開源。

我陶建輝為什么要做物聯網大數據平臺,做得挺好還要開源,為什么?我希望全世界邊緣計算、物聯網平臺,里面的數據處理幾乎都用陶建輝開發的,不說 70%、80% 的市場份額,超過 30%的市場份額被我占了就是壟斷了,一旦你壟斷的時候,你就跟微信一樣,插個扁擔都能開花。

那可以做很多事情,可以做云服務,包括我們選擇的 License 是 AGPL,它最大的限制是不希望云廠商用,我開源我可不希望阿里和亞馬遜拿來賺錢,正常的公司都可以用。這是我們的賺錢之道。如果我們開源不能賺錢,做不了偉大的作品,我更不可能花錢雇好的人才,微軟出來的都是200、300 萬,我怎么請得起?公司必須賺錢,才可能做出偉大的產品,才能持久的發展。

劉明:陶老師自己寫代碼、寫文檔、寫博客、寫微信,他一個人都能干還干得好,這就是為什么他能成功?

陶建輝:因為是創業公司,雇不起。(眾笑)

五  總結 AI 開源之道

(主持人)劉明:時間已經到了,大家每個人總結一下。

我先總結一下,我們今天有做創業的,像陶總、袁總,剛才一堆人都圍著,他們首先是技術明星,做得很Happy。而在座的大企業,越大的企業,挑戰就越多,擔的責任就越多,苦惱也就越多。但這里面最苦的其實是我,大家不知道,為了開源我進了“佛門”,我還是武當的正式弟子,我就是尋求道。記得之鵬有個同事,是鴻蒙的CORE,曾要我帶他去趟寺廟,說做開源太苦了。

最后請大家總結一下,AI、開源你們每個人怎么看,你希望中國在這方面提供什么樣的基礎設施?中國圍繞 AI 開源提供什么樣的環境?

這個問題也是我很感興趣,是我現在努力在做的事情。

陳天健:AI 作為軟件供應鏈當中的一環,現在比較火,但是開源仍然是它的最好商業模式,原因就是它可以有效的降低 AI 的構建成本。我們在整個 AI 的開源環境中,提供的主要就是怎么樣去聯合各方的數據,同時保護各方的數據上的利益,這一個對于權責利的調整,可能更有助于整個 AI 供應鏈在數據這一環節的形成。

崔寶秋:我特別想強調,我覺得 AI 開源,或者整體開源會激發創新,開放和開源遲早會激發創新。袁老師講的會打壓創新,就是我講的那種寡頭壟斷。

開源也是一個希望,希望咱們國家能保護這些自己開源、基于開源模式的公司,讓這些公司賺到錢,我相信是有各種模式的。中國和歐美國家是一樣的,中國可以賺到錢的,我堅信這一點。

我希望政府可以在開源上,立一個更加先進的,下一代的法規、許可證,能不能讓它更加極致、開放、透明、全球化,這是我特別希望的。我們在開源上需要綜合性人才、法律法規的制定,這些先進性是咱們中國必須要占據的。

田忠博:曠視其實是享受了在技術上開源、開放的整體紅利,所以我們也是在積極的參與開源浪潮,從我來想,我希望有朝一日通過我們自己的努力,能把大家認為中國人做不好開源軟件,我們能做到最好。

陶建輝:我覺得要把開源做好,最重要的是中國要把尊重知識產權真正做好。我就說一句話。

袁進輝:如果用一兩句話說的話,我們希望做出世界領先的、創新的技術,引領潮流的項目。

就像剛才寶秋總說的“不重復造輪子”如果別人做的很好了,那的確沒必要重新造一套,而且還不如人家,我們又必須說為了安全的因素,必須要用一樣,這個我是不太贊同的,我贊同的是造出來比別人好,不光是自己用而且全世界用,這是我追求的東西。

黃之鵬:AI 開源對于我來說,主要是希望國家能有更多的自研的硬件,自己的算力,開源開放的數據集,這個特別重要,而且重要性會越來越大。

然后作為對開源文化普及的一部分,就想說一下剛才陶總的那個,我是不太認可 Open Core 模式的,還有其他的賺錢的方式,大家可以自己去網上搜一下,這個是很好的一個,其實北美現在也有這種激烈的討論。

劉明:時間的原因意猶未盡,我們還有晚宴,私下再進行交流,圓桌討論就到此結束,我的感覺是非常大的機會、當然也是非常大的挑戰,尤其從事 AI、開源兩個領域,我們從文化上,我們不太善于協作,開源的核心就是大規模的協作,像 Linux 系統,幾百萬甚至更多的程序員一起寫一個項目,我們怎么避免單打獨斗,這是我們開源的一個核心,這是我為什么要去學佛學道,10多年堅持禪修和太極,佛為心道為骨,這個是文化,找到這個根上去。

現在 AI 不光是代碼開源,包括算力、數據,都需要逐步開源進化和優化。最近的 GPT-3 帶來很大的啟示,再次打破常識,甚至被認為是超越 AlphaGo 的技術突破,讓人類真切看到了通用語言智能的希望。年初賈楊清在一次報告中給出一個數據,現實的算力需求現在是每 3.5 個月增長一倍,所以算力時代真的來臨。除了算力,還有算法,我們通過優化算法、優化軟件框架也能進化。GPT-3發布前、OpenAI提出超摩爾定律,AI算法效率每16個月翻一番。微軟+英偉達的超級算力,OpenAI的超級模型和算法,這樣一個頂級科研與超強工程的大兵團通力協作,帶來了“暴力美學”,就這樣一個結果出來。所以看來 AI 并不是在衰落,而是非常大的一個機會。

開源通過我們的文化,這樣一個物理隔離、虛擬世界的建設,新基建的機會,可能產生一個新的,超越的可能性。我非常堅信,雖然很痛苦也很困難,AI和開源是我們最大的一個機會。

謝謝大家!

*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



關鍵詞:

相關推薦

技術專區

關閉