原文地址:http://news.sciencenet.cn/htmlnews/2022/9/485510.shtm
人工智能預訓練大模型的研發,面臨著數據規模大、數據質量參差不齊、模型體積大、訓練難度高、算力需求大等一系列挑戰。在這樣的背景下,如何加速大模型的產業落地,讓大模型發揮更大價值?
9月1日,2022世界人工智能大會(WAIC 2022)在上海開幕。在由深度學習技術及應用國家工程研究中心主辦的“AI開源開放與產業智能化高峰論壇”上,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰對上述問題作出了回應。在他看來,具有算法、算力和數據綜合優勢的企業可以將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業提供大模型服務。如此一來,大數據、大算力、大模型能力僅需少數企業操心,千行百業直接應用AI模型即可。
百度首席技術官王海峰提出的大模型“類芯片代工模式”。 百度供圖
王海峰以臺積電、三星等企業為例,進一步闡釋大模型的產業模式,認為可類比芯片行業的代工廠模式。他說:“芯片制造工藝有很高的技術壁壘、有價格高昂的產線,但仍能夠根據客戶需求,標準化、自動化地大批量生產芯片,形成規模經濟。同理,大模型生產企業在大模型能力、海量數據、大規模算力等方面具有優勢,能夠根據AI應用方的需求,自動化、標準化地進行多場景多領域的模型生產,當達到一定規模時,即可形成健康、可持續發展的大模型產業模式。”
大模型的開發、訓練、推理部署以及產業落地,離不開深度學習平臺的支撐。深度學習平臺下接芯片,上承應用,相當于智能時代的“操作系統”。大模型加上深度學習平臺,可以貫通從硬件適配、模型訓練、推理部署,到場景應用的AI全產業鏈。
大模型的“類臺積電”產業模式,已經在百度的大模型實踐中得到驗證。
目前,百度已研制了文心產業級知識增強大模型系列,包括以鵬城-百度·文心為代表的基礎通用大模型、生物計算領域大模型,以及能源、金融和航天行業大模型等,還包括輔助大模型適配場景應用的工具和平臺,探索生態共建的創意社區“旸谷”等。百度文心大模型也作為今年WAIC “八大鎮館之寶”之一,在展區亮相。
文心系列大模型的成功研制和應用,背后是基于飛槳的有力支撐。飛槳是我國首個自主研發、開源開放的產業級深度學習平臺,集核心框架、產業級模型庫、開發套件和工具組件及學習和實訓社區于一體,正標準化、自動化地支撐大模型生產和應用。
在大模型訓練方面,飛槳研發了端到端自適應分布式訓練技術,根據模型特性和算力平臺特性,自動選擇并行策略,實現端到端極致的性能優化。在大模型推理方面,飛槳打造了針對大模型的壓縮、推理、服務化全流程部署方案,能廣泛支持不同種類的模型結構,實現高速推理。同時,飛槳還提供自動模型壓縮工具,幫助節約算力資源。
據介紹,文心大模型基于飛槳平臺開源開放,共建生態,累計已有超過1萬開發者,基于文心大模型,創建了3萬多個任務。目前,文心大模型已廣泛應用于百度產品,顯著提升產品效果和研發效率,并應用于金融、能源、醫療、制造、企業服務等領域,大模型的生態初現崢嶸。
“大模型的產業模式將是‘類臺積電’模式。大模型加上深度學習平臺,貫通AI全產業鏈,是產業智能化的基座。”王海峰最后總結。
10月14日,2024國際光化學技術與產業大會在武漢開幕。參加會議的2021年諾貝爾化學獎獲得者、德國馬克斯·普朗克煤炭研究所教授本杰明·李斯特(BenjaminList),在會議期間接受了《中國科學......
Meta首席人工智能科學家、有“AI教父”之稱的楊立昆(YannLeCun)似乎并不不擔心人工智能會對人類構成威脅。他在接受最新采訪時詳細闡述了自己的觀點,并在回答有關AI是否聰明到足以對人類構成威脅......
2024年10月10日,深化部市合作推動人工智能賦能新型工業化座談會在京召開,北京市委書記尹力,工業和信息化部黨組書記、部長金壯龍,北京市委副書記、市長殷勇講話。工業和信息化部黨組成員、副部長單忠德,......
“我整個職業生涯一直在做這個東西,但心里很清楚,同行也這么認為——在我們有生之年,‘蛋白質的折疊’問題是不可能解決的,尤其是蛋白質結構預測問題。結果AlphaFold出來了!”10月9日,博士生導師、......
記者10日從中山大學獲悉,該校醫學院施莽教授團隊與阿里云李兆融團隊將人工智能技術應用于病毒鑒定,發現了傳統研究方法未能發現的病毒“暗物質”,探索了病毒學研究的新路徑。相關成果近日發表在國際期刊《細胞》......
2024年諾貝爾獎的三大科學獎項已經依次揭曉。人工智能(AI)成為今年開獎期間最熱門的詞匯。其中,美國物理學家約翰·霍普菲爾德和英裔加拿大計算機科學家杰弗里·辛頓出人意料地獲得了諾貝爾物理學獎,而辛頓......
在當前由大模型和AIGC(人工智能生成內容)驅動的AI時代,算力需求暴增,同時還面臨供給不足、供需匹配難、能耗激增等挑戰,算力產業亟須由“量”向“質”加速高質量發展。近日,《人工智能算力高質量發展評估......
在當前由大模型和AIGC(人工智能生成內容)驅動的AI時代,算力需求暴增,同時還面臨供給不足、供需匹配難、能耗激增等挑戰,算力產業亟須由“量”向“質”加速高質量發展。近日,《人工智能算力高質量發展評估......
2024年諾貝爾三大科學獎項中,兩大獎項與人工智能研究相關,先是物理學獎頒給了曾獲圖靈獎的機器學習先驅,緊接著化學獎也將一半頒給了“程序員”。不僅諾獎得主在接到獲獎電話時表示大感意外,就連諾貝爾獎官方......
工業和信息化部辦公廳、國家藥監局綜合司關于印發人工智能醫療器械創新任務揭榜優勝單位名單的通知。原文如下:工信廳聯科函〔2024〕355號各省、自治區、直轄市及計劃單列市、新疆生產建設兵團工業和信息化主......