《kimi人工智能月度報告丨ai人物觀點》


    關鍵詞:算力十問


    1.沈向洋:大模型將橫掃所有垂直行業


    “大模型大到一定地步以後就湧現出來。多大才湧現出來?沒人講得清楚。”3月23日,2024全球開發者先鋒大會在上海開幕,美國國家工程院外籍院士沈向洋在《大模型時代的機遇和挑戰》的演講中分享了關於大模型的五方麵思考。


    第一,大模型的到來,強迫人類重新思考人機關係。“我們受到的衝擊,到底有多少是機器智能的發展,有多少是人機交互的震撼。”他認為,不管是什麽技術,最終目的是幫助人更好運用機器,不忘初心。


    第二,大模型將橫掃所有垂直行業。大模型可分為通用大模型、行業大模型、企業大模型和個人大模型。“一個通用大模型如果沒有萬卡、不上1萬億參數,基本上以後就不太好意思說這是一個通用模型了。行業大模型大致上是千億參數、千億卡的訓練規模。企業大模型可能隻需要100張卡、百億參數。最有意思的是個人大模型,利用個性化參數,結合雲和端,這是非常有意義的。”


    第三,算力是門檻。影響算力的兩大因素是模型大小和數據規模,隨著參數增加,對算力的需求幾乎是幾何級的。“千卡萬卡是錢堆出來的。以前有一句話叫貧窮限製想象力,現在貧窮可能扭曲想象力,因為如果沒有卡,能想象要做的項目可能就不太一樣了。”


    第四,ai帶來社會衝擊。這些衝擊包括對民眾的衝擊、企業的衝擊、政府監管的衝擊、社會發展的衝擊,帶來一本正經胡說八道、深度偽造等倫理問題,很多國家開始立法,這需要共同推動治理、向前發展。


    第五,智能的本質。人工智能蓬勃發展,但人們對智能的本質並沒有清晰認知。“大模型大到一定地步以後就湧現出來。多大才湧現出來?沒人講得清楚。”沈向洋表示,“很多人相信scalingw(規模法則),但今天的深度學習,理論非常欠缺。從宇宙到量子,物理學有一套大一統的理論統一起來,叫作theory of everything。今天深度學習沒有這樣的理論,所以叫作theory of anything。”


    2.中國工程院鄔賀銓院士:《算力十問》


    在第二屆“華彩杯”算力創新應用大賽啟動會上,中國工程院鄔賀銓院士發表題為《算力十問》的主旨報告


    就超算、通算、智算三類算力是否存在合理比例的問題,鄔院士認為,不同地區需求不同,不可能有固定的比例。通常國家與區域創新中心城市對超算有較大需求;機 密性和時延敏感性決定了城市政務數據和重要企業關鍵數 據盡量在同城通算;東部地區的ai訓練任務重、智算比例高;西部算力樞紐也需要增加智算能力,但一般西部地區以配置通算為主。


    關於算存比,鄔院士強調,存力與算力需配合,避免因存力短缺造成算力等待而影響處理效率。而存力按位於服務器內外分為內存與外存,對於cpu密集型計算任務,影響算力效率與性能的主要是內存,據分析合理的算存比是gflops\/gb為 1;對 i\/o 密集計算任務,需頻繁訪問外存,如何考慮計入外存力的算存比合理取值,值得商榷。鄔賀銓同時指出,存力有hdd機械硬盤和sdd固態硬盤之分,後者可節能 70%,但我國sdd僅占24.7%,不及美國一半。


    就邊緣與終端算力運用的問題,鄔院士認為,當邊緣\/終端具有70億參數以上的推理能力時,邊緣\/終端可離線進行推理任務,目前手機可支持130億參數,2024 年還會出現支持千億參數的手機。當邊緣\/終端僅具有10億參數的推理能力時,需要與雲端協同提供智能能力。鄔院士提出,單終端算力小,數以億計的終端算力集合就非常可觀,但跨終端的協同計算是否可行值得商榷。


    關於異地算力節點的協同,鄔院士認為,將算力集群擴展到跨域,多個異地的算力節點共同承擔一個計算任務,實時性的交互要求光傳輸係統無損和確定性時延,任何丟 包和抖動都無法保證計算效率;在異屬異構的場景下異地 協同計算的實施可操作性更是挑戰。他強調,集約化建設大型算力節點比分布異地協同能夠顯著提升能效和算力效 率,東數西算和數據災備都需要在異地算力樞紐間建立廣 域連接,但這僅是算力任務的轉移而不是異地實時協同計算。


    關於算網協同,鄔院士認為,算力與網絡往往屬於不同的運營主體,跨運營商的協同調度也有管理難題。而且網絡通常並不感知所承載的數據屬性。當前,首先要厘清算網協同的標準與方法,發揮ipv6的分段選路、srv6作為算網協同統一承載協議的作用,通過編程空間實現雲網\/算網的融通。


    就如何解除中小企業使用算力的顧慮,鄔院士建議,政府站台主導建設麵向中小企業的雲智平台,降低企業利用算力的門檻和對安全的擔心。


    ——總結·點評——


    沈向洋博士和鄔賀銓院士的觀點分別從大模型的發展趨勢和算力的多維度問題出發,為理解ai技術演進和基礎設施建設的現狀與未來提供了深刻洞察。


    沈向洋觀點概覽:


    沈向洋認為,大模型rgenguage models)將在所有垂直行業中扮演顛覆性角色,強調了模型規模的重要性。他指出,未來的通用大模型將以萬億參數為常態,而針對特定行業的模型則可能達到千億參數級別,即便是企業內部使用的模型也將達到百億參數量級。沈向洋的觀點預示著大模型技術不僅將繼續推動自然語言處理等領域的進步,還將廣泛滲透至醫療、金融、教育等各行各業,成為推動數字化轉型的關鍵力量。


    鄔賀銓觀點概覽:


    鄔賀銓院士的《算力十問》報告則從算力的需求、分配、效率、協同等多個角度進行了深入探討。他指出,不同類型的算力(超算、通算、智算)需求因地區而異,強調了存算比優化的重要性,並區分了不同類型計算任務對內存與外存的不同依賴。鄔賀銓還討論了邊緣計算與終端算力的潛力,提出隨著終端設備推理能力的增強,邊緣計算與終端協同將成為趨勢,但也麵臨跨終端協同計算的挑戰。關於算力節點的異地協同,他認為雖然存在技術與管理上的挑戰,但算網協同和標準化工作對於提升整體效能至關重要。針對中小企業,鄔賀銓建議政府應發揮作用,通過構建雲智平台來降低算力使用門檻,增強安全性信心。


    兩位專家的觀點綜合展示了ai技術發展與算力基礎設施建設的廣闊前景及麵臨的實際挑戰,指明了技術創新與政策支持對於推動行業發展的關鍵作用。

章節目錄

閱讀記錄

靈魂交響曲:人工智能日記所有內容均來自互聯網,繁體小說網隻為原作者新質生產力的小說進行宣傳。歡迎各位書友支持新質生產力並收藏靈魂交響曲:人工智能日記最新章節