用AI生成數據訓練AI或導致模型崩潰
科技日報北京7月25日電 (記者張夢然)《自然》24日正式發表的一篇研究論文指出了一個人工智能(AI)嚴重問題:用AI生成的數據集訓練未來幾代機器學習模型,可能會嚴重“污染”它們的輸出,這被稱為“模型崩潰”。研究顯示,原始內容會在9次迭代以后,變成不相關的“胡言亂語”(演示中一個建筑文本最終變成了野兔的名字),這凸顯出使用可靠數據訓練AI模型的重要性。生成式AI工具越來越受歡迎,如大語言模型等,這類工具主要用人類生成的輸入進行訓練。不過,隨著這些AI模型在互聯網不斷壯大,計算機生成內容可能會以遞歸循環的形式被用于訓練其他AI模型或其自身。包括英國牛津大學在內的聯合團隊一直在進行相關研究,并在去年論文預印本中提出這一概念。在正式發表的論文中,他們用數學模型演示了AI可能會出現的“模型崩潰”。他們證明了一個AI會忽略訓練數據中的某些輸出(如不太常見的文本),導致其只用一部分數據集來自我訓練。團隊分析了AI模型會如何處理主要......閱讀全文
用AI生成數據訓練AI或導致模型崩潰
科技日報北京7月25日電?(記者張夢然)《自然》24日正式發表的一篇研究論文指出了一個人工智能(AI)嚴重問題:用AI生成的數據集訓練未來幾代機器學習模型,可能會嚴重“污染”它們的輸出,這被稱為“模型崩潰”。研究顯示,原始內容會在9次迭代以后,變成不相關的“胡言亂語”(演示中一個建筑文本最終變成了野
用AI生成數據訓練AI或導致模型崩潰
《自然》24日正式發表的一篇研究論文指出了一個人工智能(AI)嚴重問題:用AI生成的數據集訓練未來幾代機器學習模型,可能會嚴重“污染”它們的輸出,這被稱為“模型崩潰”。研究顯示,原始內容會在9次迭代以后,變成不相關的“胡言亂語”(演示中一個建筑文本最終變成了野兔的名字),這凸顯出使用可靠數據訓練
《自然》封面:以AI生成數據訓練AI,模型變傻?
大模型有許多“崩”的時候,但有一種崩潰叫做“自毀前程”——近日,《自然》發表在封面的一篇論文指出,用AI生成的數據集訓練未來幾代機器學習模型,可能會“污染”它們的輸出。這項由英國牛津大學、劍橋大學、帝國理工學院、加拿大多倫多大學等多所高校聯合開展的研究顯示,原始內容會在數代內變成不相關的“胡言亂語”
《自然》封面:以AI生成數據訓練AI,模型變傻?
大模型有許多“崩”的時候,但有一種崩潰叫做“自毀前程”—— 近日,《自然》發表在封面的一篇論文指出,用AI生成的數據集訓練未來幾代機器學習模型,可能會“污染”它們的輸出。這項由英國牛津大學、劍橋大學、帝國理工學院、加拿大多倫多大學等多所高校聯合開展的研究顯示,原始內容會在數代內變成不相關的“胡
用AI數據訓練AI可能最終導致崩潰
《自然》7月24日發表的一篇論文指出,用人工智能(AI)生成的數據集訓練未來幾代機器學習模型可能會污染它們的輸出,這個概念稱為“模型崩潰”(model collapse)。該研究顯示,原始內容會在數代內變成不相關的胡言亂語,顯示出使用可靠數據訓練AI模型的重要性。 生成式AI工具越來越受歡迎,
用AI數據訓練AI可能最終導致崩潰
《自然》7月24日發表的一篇論文指出,用人工智能(AI)生成的數據集訓練未來幾代機器學習模型可能會污染它們的輸出,這個概念稱為“模型崩潰”(model collapse)。該研究顯示,原始內容會在數代內變成不相關的胡言亂語,顯示出使用可靠數據訓練AI模型的重要性。生成式AI工具越來越受歡迎,如大語言
合成數據能否讓AI模型精確可靠?
人工智能(AI)初創公司xAI創始人埃隆·馬斯克近日表示:“在AI訓練中,我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺,為滿足AI的“胃口”,科技行業正轉向使用合成數據。澳大利亞“對話”網站在本月稍早時間報道中指出,合成數據
合成數據能否讓AI模型精確可靠?
人工智能(AI)初創公司xAI創始人埃隆·馬斯克近日表示:“在AI訓練中,我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺,為滿足AI的“胃口”,科技行業正轉向使用合成數據。 澳大利亞“對話”網站在本月稍早時間報道中指出,
合成數據能否讓AI模型精確可靠?
人工智能(AI)初創公司xAI創始人埃隆·馬斯克近日表示:“在AI訓練中,我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺,為滿足AI的“胃口”,科技行業正轉向使用合成數據。澳大利亞“對話”網站在本月稍早時間報道中指出,合成數據
生成式AI時代,大模型數據安全如何保障?
在生成式AI(人工智能)時代,數據安全的出路可能會是“用魔法打敗魔法”,知識產權保護也可能要提前到token(字符串)層面。4月26日,在2024中關村論壇上,人工智能企業與學者就AI大模型的數據安全問題進行了討論。中關村論壇數據安全治理與發展論壇現場? 澎湃新聞記者 秦盛 攝“在生成式人工智能時代
新訓練可減少AI系統社會偏見
來自美國俄勒岡州立大學工程學院和Adobe公司的科學家攜手,開發出一種用于訓練人工智能(AI)的新技術FairDeDup。該技術不僅能降低訓練成本,而且有望減少AI系統的社會偏見。研究團隊已經在近期于美國西雅圖舉行的IEEE/CVF計算機視覺和模式識別會議大會上介紹了FairDeDup算法。該會議是
新訓練可減少AI系統社會偏見
來自美國俄勒岡州立大學工程學院和Adobe公司的科學家攜手,開發出一種用于訓練人工智能(AI)的新技術FairDeDup。該技術不僅能降低訓練成本,而且有望減少AI系統的社會偏見。研究團隊已經在近期于美國西雅圖舉行的IEEE/CVF計算機視覺和模式識別會議大會上介紹了FairDeDup算法。該會議是
人工智能框架生態峰會掀開AI大模型新篇章
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502804.shtm
AI語言模型“提速”藥物發現
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/502762.shtm美國麻省理工學院和塔夫茨大學研究人員設計出一種基于大型語言模型(如ChatGPT)的人工智能算法,這種稱為ConPLex的新模型可將目標蛋白與潛在的藥物分子相匹配,而無需執行計算分子結
DeepMind-AI模型預測天氣又快又好
近日一項發表于《自然》的研究報道了谷歌DeepMind開發的首個天氣預測人工智能(AI)模型——GenCast。該模型比目前運行中的最佳中期預報系統——歐洲中期天氣預報中心的集合預報(ENS)更精準。GenCast在8分鐘內就能完成15天的預測,而目前的預測程序需要幾個小時。據介紹,包括ENS在內的
AI“模型崩潰”風險需警惕
從客戶服務到內容創作,人工智能(AI)影響了眾多領域的進展。但是,一個日益嚴重的被稱為“模型崩潰”的問題,可能會使AI的所有成就功虧一簣。“模型崩潰”是今年7月發表在英國《自然》雜志上的一篇研究論文指出的問題。它是指用AI生成的數據集訓練未來幾代機器學習模型,可能會嚴重“污染”它們的輸出。多家外媒報
AI大模型“拿捏”電池壽命
作為現代生活中不可或缺的能源載體,電池的重要性不言而喻。從清晨喚醒我們的鬧鐘,到隨身攜帶的手機、平板電腦等智能設備,無一不依賴于電池提供的穩定電力。此外,隨著科技的發展,電動汽車、無人機等新興領域也廣泛應用了各類高性能電池,推動了綠色出行和智能科技的進步。因此,電池不僅極大地便利了我們的日常生活,還
學術論文正被高價出售給大模型訓練,作者卻零收入
·越來越多的學術出版商正將研究論文賣給科技公司用以訓練人工智能(AI)模型,而作者收入為零。大語言模型(LLM)因訓練數據問題再次引發爭議。日前,國際著名期刊《自然》(《Nature》)雜志編輯伊麗莎白·吉普尼(Elizabeth Gibney)發布一篇題為《你的論文被用來訓練人工智能模型了嗎?幾乎
推動人工智能產業快速發展要把保障數據安全放在突出位置
美國人工智能公司OpenAI推出GPT Store,掀起AI應用新潮流;谷歌遭遇裁員風波,聚焦AI戰略調整;特斯拉創始人埃隆·馬斯克起訴OpenAI,指控其背離了初衷,將人工智能用于盈利而非為人類福祉服務……近期,人工智能領域大模型聲勢高漲,產品與服務推陳出新,但同時也伴隨著諸多爭議,尤其是在數
基于昇騰AI的紫東.太初憑何脫穎而出?
9月1日,2022世界人工智能大會最高大獎SAIL(Super AI Leader,卓越人工智能引領者)塵埃落定。 三模態人工智能大模型“紫東.太初”在800多個角逐者中脫穎而出一舉奪魁。此前數周,在濟南舉行的首屆中國算力大會上,“紫東.太初”同樣表現穩健,抱回“DC Tech創新先鋒”獎杯。
告別傳統課堂,《人工智能通識》如何用AI學AI
8月30日,記者從西南交通大學獲悉,為積極貫徹落實國家教育數字化戰略行動,以數字化開辟教育發展新賽道、塑造發展新動能,進一步推動人工智能賦能教育教學轉型,學校將打造面向全校師生的人工智能通識課程《人工智能通識》,該課程是學校的首門AI課程。《人工智能通識》課程將于2024年秋季學期在線上線下同步上線
馬斯克出手,打造“地表最強AI訓練集群”
以10萬塊英偉達“H100”液冷GPU構建的算力集群,將會產生怎樣的洪荒之力?近日,SpaceX和特斯拉的創始人埃隆·馬斯克在社交平臺發文稱,如此規模的超級算力集群正部署在美國田納西州孟菲斯市的“xAI孟菲斯超算中心”。要指出的是,“H100”是英偉達專為處理大型語言模型數據而開發的芯片,每塊芯片價
馬斯克計劃年底訓練出“世界最強AI”
馬斯克稱將在今年年底訓練出全球最強AI。當地時間7月22日,特斯拉CEO埃隆·馬斯克在旗下社交平臺X上表示,xAI團隊、X團隊、英偉達及其他支持公司已經于當地時間凌晨4時20分開始在“孟菲斯超級集群(Memphis Supercluster)”上進行訓練。他介紹,“孟菲斯超級集群”由10萬個液冷H1
馬斯克宣稱的“最強AI訓練系統”上線
科技日報訊?(記者劉霞)人工智能(AI)爭霸賽硝煙再起。據美國“數碼趨勢”網站近日報道,xAI公司首席執行官埃隆·馬斯克在X平臺上宣布,該公司打造的超級AI訓練集群Colossus已正式上線。馬斯克稱該集群為世界上“最強大的AI訓練系統”。所謂“最強大”的說法基于該系統所用圖形處理器(GPU)的數量
Meta開始測試首款自研AI訓練芯片
據路透社當地時間11日報道,消息人士稱,Meta公司正在測試其首款用于訓練人工智能(AI)系統的芯片。路透社認為,這是Meta朝著設計更多自己的定制芯片、減少對外部供應商(如英偉達)依賴的關鍵一步。報道稱,Meta已開始進行小規模的芯片部署,并計劃在測試順利后大規模生產。據路透社介紹,Meta擁有F
“弱智吧”帖子訓練AI效果最好?作者回應
白岳霖和他的小伙伴們實在想不到,他們最近做的中文指令微調數據集,會因為使用了百度貼吧“弱智吧”的帖子相關數據而火爆“出圈”。白岳霖是中國科學院深圳先進技術研究院三年級碩士生。他的團隊在題為“COIG-CQIA: Quality is All You Need for Chinese Instruct
AI視頻生成模型Sora來了
原文地址:http://news.sciencenet.cn/htmlnews/2024/2/517625.shtm
釋放AI大模型促消費潛力
??今年的《政府工作報告》提出持續推進“人工智能+”行動,旨在抓住人工智能技術突破機遇,使我國數字技術與制造優勢、市場規模優勢充分結合,推動人工智能大模型廣泛應用,真正賦能千行百業、走進千家萬戶。在構建新發展格局戰略背景下,AI大模型在激活內需市場、促進消費升級等方面充滿“模”力。??隨著人工智能技
AI模型助力精準診斷冠心病
近日,由上海市第一人民醫院與聯影智能的一項研究開發并驗證一款可自動量化心肌血流狀況的CT心肌灌注成像深度學習模型,輔助醫生準確診斷患者心肌缺血程度,其衍生的缺血心肌體積百分比指數可作為預測不良心血管事件(以下簡稱MACE)發生概率的重要參考,能幫助醫生預判患者發病幾率,進而制定個性化治療方案。相關論
3大遙感數據源接入“商湯地界”AI遙感大模型
原文地址:http://news.sciencenet.cn/htmlnews/2024/3/519533.shtm近日,商湯科技宣布攜手國內頭部遙感數據平臺“吉林一號網”、“四維地球”、“星圖地球”,升級了其“SenseEarth智能遙感云”平臺的數據源。用戶無需準備數據,即可通過“商湯地界”平臺