隨著人工智能大模型的不斷發展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學院自動化研究所獲悉,該所聯合鵬城實驗室提出了一種高效推理策略AutoThink,可讓大模型實現自主切換思考模式,避免“過度思考”。
“當前,越來越多的大模型開始具備‘深度思考能力’。”中國科學院自動化研究所研究員張啟超說,模型在回答問題之前要先生成一整段包含反復自我反思、自我驗證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復雜問題的能力,但同時也帶來了“過度思考”的問題,即在處理簡單任務時也會生成冗余的思考過程。
“比如使用者對大模型提問‘2+3等于幾’,大模型可能會從自然數定義講起,列出加法交換律,甚至反復確認,最后才輸出答案是5。”張啟超說,這種不必要的“過度思考”現象在推理模型中廣泛存在。
針對這一問題,AutoThink可賦予推理模型根據題目難度自主切換思考模式的能力,即通過所設計的提示詞和多階段強化學習,引導其自主決定是否進行深度思考。
張啟超介紹,AutoThink提供了一種簡單而有效的推理新范式——通過省略號提示配合三階段強化學習,引導大模型不再“逢題必深思熟慮”,而是根據問題難度自主決定“是否思考”“思考多少”。在多個數學數據集上,AutoThink實現了準確率與效率平衡,既提升性能又節省算力,展示出較強的適應性和實用性。
據悉,AutoThink已集成于一站式智能科研平臺ScienceOne,并將用于訓練ScienceOne的基座大模型S1-Base。研發團隊表示,讓大模型“更聰明地思考、更簡潔地表達”,是未來科學基礎大模型演進的重要方向。
隨著人工智能大模型的不斷發展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學院自動化研究所獲悉,該所聯合鵬城實驗室提出了一種高效推理策略AutoThink,可......
隨著人工智能大模型的不斷發展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學院自動化研究所獲悉,該所聯合鵬城實驗室提出了一種高效推理策略AutoThink,可......
5月27日,南開大學數學科學學院與多點數智有限公司、智現未來科技有限公司、淡水泉投資管理有限公司正式簽署合作共建備忘錄,聯合啟動數學與人工智能實驗班項目。根據共建備忘錄,數學與人工智能實驗班將于202......
近日,我所能源與環境小分子催化研究中心(509組群)鄧德會研究員團隊與新加坡南洋理工大學李昊博博士團隊合作,受邀撰寫了人工智能在催化劑設計與合成領域的Perspective評述文章,系統梳理了人工智能......
5月20日,同濟大學舉行人工智能賦能學科創新行動發展大會,并宣布學校圍繞“工程智能”系統布局的首批五大研究院——工程智能研究院、醫學人工智能研究院、極端環境建造研究院、自主智能機器人研究院、航空運輸與......
在今天(22日)下午召開的商務部例行新聞發布會上,新聞發言人就美國對人工智能芯片出口管制問題進行回應。商務部新聞發言人何詠前:中方已多次闡明立場,美方濫用出口管制,對中國進行遏制打壓,違反國際法和國際......
盡管人工智能生成內容已非常流暢,但提供的信息很多時候還是不準確。日本研究人員近日在德國《先進科學》雜志發表的一項研究成果顯示,這一問題與人類的語言障礙——失語癥類似。新研究成果可以為研究人員改進人工智......
當前,我國生成式人工智能產業發展迅速,相關企業數量已經超過4500家。然而,生成式人工智能與實體經濟融合的深度和廣度仍有待提升,其巨大潛力尚未充分釋放。究其原因,一方面在于生成式人工智能技術本身仍處于......
為深入貫徹落實《國務院辦公廳關于全面深化藥品醫療器械監管改革促進醫藥產業高質量發展的意見》以及省委、省政府“數字遼寧,智造強省”的工作部署,推動新一代信息技術與醫藥產業鏈深度融合,提高全省醫藥領域信息......
近日,工業和信息化部與國家標準委聯合印發《國家智能制造標準體系建設指南(2024版)》。該指南在2021版的基礎上,優化了標準體系框架和標準布局,進一步聚焦人工智能等新技術與制造業的融合應用,在智能裝......