技術生態異軍突起,昇思MindSpore進入AI框架第一梯隊

2023-02-23 09:15:14

來源:Alter聊科技

ChatGPT掀起的新一輪人工智能狂歡下,隱藏在背后的“大模型”正進入越來越多開發者的視野。
誠如幾年前開始流行的一種說法:數據是燃料、模型是引擎、算力是加速器。ChatGPT的出現,恰如其分地詮釋了數據、模型和算力的“化學反應”。而在其中扮演“橋梁”角色的,恰恰是上承應用、下接硬件的AI框架。
正是在這樣的背景下,市場調研機構Omdia通過對AI開發者進行調研,在日前發布了《中國人工智能框架市場調研報告》,向外界揭示了國內開發者對于AI框架的認知,以及不斷變化的行業格局。
 
01開發者眼中的AI框架市場
隨著ChatGPT的熱度越來越高,不少人坦言:“人工智能領域正在引發新一輪科技競賽”,其實AI的學術競賽在2020年前后就已經開始。
 
OpenAI在這一年推出了著名的GPT-3,擁有1750億參數量;DeepMind的AlphaFold2在第14屆國際蛋白質結構預測競賽中奪冠;同時全球AI論文發表量逐年增長,來自中國的論文比例越來越高...... 頂會論文、大模型、科學智能代表的技術生態,達到了前所未有的熱度。
 
同樣是在2020年,以昇思MindSpore等為代表的中國AI框架紛紛開源,開始了追趕TensorFlow、PyTorch等前輩們的追逐賽,中國AI框架的崛起和技術生態的繁榮,不可避免地出現了交叉。
 
就像Omdia在《中國人工智能框架市場調研報告》中給出的觀點:在大模型應用的趨勢下,國內開發者對于AI框架的認知發生了一些微妙的變化。
 
比如“對于超大規模模型訓練能力,您覺得哪個人工智能框架最好?”的問題中,36%的開發者投票給了TensorFlow/JAX,15%的開發者選擇的是PyTorch,昇思MindSpore以10%的占比排名第三。
 
需要說明的是,開發者的答案在某種程度上受到了認知習慣的影響,自然而然地給“老牌框架”打了高分。譬如谷歌的TensorFlow并非原生支持大模型,通過新推出的另一個新生框架JAX作為TensorFlow的簡化庫融入;PyTorch則是靠第三方并行算法庫補充了大模型支持能力。昇思MindSpore正依托原生支持大模型的能力快速崛起。
 
再比如“您認為最適合做AI for Science項目的人工智能框架是?”的問答下,TensorFlow和新生框架JAX收到了45%的開發者支持,昇思MindSpore在這個問題下超過了PyTorch,以37%的支持率排名第二。
 
而在人工智能框架使用率的排名中,TensorFlow和PyTorch的先發優勢依然存在,但昇思MindSpore以11%的份額進入第一梯隊。TensorFlow早在2015年就已經開源,PyTorch的歷史也可以追溯到2017年,昇思MindSpore比“前輩”們晚了三到五年,但表現出了快速趕超老牌AI框架的態勢,扮演了“挑戰者”的角色。
 
如果說Omdia的報告主要是基于開發者的認知,可能與實際情況存在一定出入,那硬核的技術生態與行業生態的合作,則以板上釘釘的數字佐證著昇思MindSpore等中國AI框架崛起態勢:
 
在技術生態方面,昇思MindSpore已經與200多所高校、科研機構展開創新合作;在行業生態方面,僅在2022年獲得昇思技術認證的企業就超過800多家,涵蓋制造、金融、電信運營商等國計民生行業;在開源生態方面,昇思MindSpore在Gitee AI開源項目綜合排名TOP1,軟件下載增速第一,總量已超過370萬……
 
02昇思MindSpore越級的時與勢
一個殘酷但有現實意義的現象是,2020年AI框架市場還是一幅百家爭鳴的景象,目前卻出現了典型的虹吸效應。
 
按照Omdia的調研數據,在中國人工智能框架的使用率方面,TensorFlow、PyTorch、昇思MindSpore和飛槳合計占了86%的市場份額,大多數AI框架的使用率不足1%,曾經聲名鵲起的Caffe、CNTK等已逐漸掉出主流隊伍,只有昇思MindSpore一家逆勢進入了AI框架的第一梯隊。
 
想要弄清問題的答案,昇思MindSpore可以說是最好的研究對象。過去近三年時間里,昇思MindSpore到底做對了什么?
 
第一個參考答案是大模型的“時”。
 
2021年9月的華為全聯接大會上,昇思MindSpore迭代至1.5版本,最直接的變化就是原生支持AI大模型訓練,通過全自動并行、可視化智能調優等大幅提升了大模型的開發效率。
 
其中在大模型并行訓練上,昇思MindSpore支持數據并行、MoE并行、優化器并行、多副本并行等7大并行計算能力,將訓練千億模型的代碼量降低了80%、調優時間下降60%;和TensorFlow、PyTorch等框架相比,昇思MindSpore是支持模型結構最全的AI框架,包含稠密、稀疏MoE、卷積結構、高維稀疏等。

第二個參考答案是應用創新的“勢”。
 
2022年11月發布的2.0版本中完成了AI與HPC的融合,通過神經網絡模擬的非線性擬合,讓科學家無需再解高維方程,進一步提升了科技創新效率。特別是在產業應用創新方面,昇思MindSpore構建了流體仿真、電磁仿真、分子模擬在內的科學計算套件,持續使能應用創新。
 
和PyTorch的興起不謀而合,昇思MindSpore也將技術生態作為“先手棋”。印證昇思MindSpore “路線正確”的案例,絕不止Omdia的報告和開發者的認同,還有一份沉甸甸的成績單。
 
 
衡量創新能力的一個重要標準正是論文數量。按照Papers with Code網站的統計數據,2022年使用昇思MindSpore的頂級會議論文已經超過600篇,在國內AI框架中排名第一,在全球范圍內僅次于PyTorch。
 
而在大模型的創新中,目前國內科研院所和高校已經發布了10多個基于昇思MindSpore的大模型。其中紫東.太初是全球首個三模態大模型,能夠實現視覺、文本、語音三個模態間的高效協同,曾在2022世界人工智能大會上斬獲“卓越人工智能引領者”獎;東方.御風是業界首個工業級流體仿真大模型,在進行飛機流場模擬仿真時,對比傳統的科學計算,在精度一樣的情況下,東方.御風的仿真時間只需要原來的1/25。
 
如果把人工智能產業生態比喻成森林的話,人工智能框架就像是森林中的土壤,尋求創新的開發者自然會“擇水土而居”。
 
03不應被忽視的可信AI問題
 
在全民“調戲”ChatGPT的風潮中,ChatGPT有時會“一本正經地胡說八道”,這其實暴露了存在事實性錯誤、知識盲區和常識偏差等諸多問題。
 
Omdia在《中國人工智能框架市場調研報告》中向開發者詢問了類似的問題,最終的答案似乎超出了一些人的料想:在所有主流人工智能框架中,國內的開發者普遍認為TensorFlow 與 昇思MindSpore 對“負責任的人工智能”提供的支持最好。
 
 
個中原因其實不難解釋。為了打消開發者擔心的安全隱私等問題,谷歌通過Model Cards等工具讓框架更加透明、更具備可解釋性,同時TensorFlow也提供了一系列支持數據安全和隱私的功能、庫和培訓工具。
 
昇思MindSpore之所以能夠在可信方面超越PyTorch,離不開對AI安全技術體系的布局,提供了涵蓋AI訓練、AI測評、AI部署的一整套端到端的安全可信體系,包括聯邦學習、模型水印、模型加密等外界所熟知的可信機制。
 
比如聯邦學習是一種常見的隱私保護方式,可以在不收集數據的情況下協同進行模型的訓練,實現數據的“可用不可見”,繼而保護隱私信息。然而聯邦學習和大模型的結合也產生了諸多挑戰,涉及到計算代價、通信開銷、隱私泄露、模型安全等等,需要解決隱私保護與效率的兩難課題。
 
昇思MindSpore的回答是跨域可信訓練。
 
以鵬城.盤古大模型為例,昇思的聯邦學習能力助力盤古超大模型協同訓練,根據各地算力情況將大模型拆分,以AI計算中心超大算力實現盤古主干網絡的正反向訓練,同步在銀行等計算機房做數據處理,模型Embedding、TOP層算Loss正反向訓練,實現了敏感數據不出本地,并讓聯邦學習的訓練時延降低了30%、通信和計算開銷降低了40%。
 

就像Omdia在報告中的評論:“負責任的人工智能”既是一套道德準則,又是一套技術體系, 是以安全、可靠和合乎道德的方式開發、評估、部署和規?;斯ぶ悄芟到y的方法,對人工智能的可持續發展非常重要。
 
大模型、科學智能等技術生態在過去三年時間里深入影響了開發者對AI框架的選擇,把時間再拉長一些的話,能否在可信AI方面有所作為,能否打消開發者的疑慮,無疑將左右AI框架下一個三到五年的市場排位。
 
04寫在最后
 
人工智能的星星之火能否燎原,AI框架有著不可或缺的作用。
 
一座城市的繁榮,不在于有多高的摩天大樓,而是無處不在的建筑群。沿循這樣的邏輯,AI框架的價值在于賦予不同的開發者“建造高樓”的能力,讓人工智能的前沿能力進入每一個行業、每一家企業。
 
至少,以昇騰AI為首的中國人工智能產業建設者早已開始發力。
 
不只是昇思MindSpore在技術生態上的異軍突起,Atlas系列硬件、異構計算架構CANN、昇騰應用使能MindX等軟硬件也在持續創新,為開發者打造了“端、邊、云”的全場景AI基礎設施,讓人工智能在千行百業不斷擴散。

索取“此產品”的詳細資料,請留言
  • *姓名:
  • *手機:
  • *郵寄地址:
相關閱讀
<
色欲午夜无码久久久久久