隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問(wèn)題上深入思考,而不是對(duì)所有問(wèn)題“想個(gè)不停”?記者5月29日從中國(guó)科學(xué)院自動(dòng)化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過(guò)度思考”。
“當(dāng)前,越來(lái)越多的大模型開始具備‘深度思考能力’。”中國(guó)科學(xué)院自動(dòng)化研究所研究員張啟超說(shuō),模型在回答問(wèn)題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過(guò)程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問(wèn)題的能力,但同時(shí)也帶來(lái)了“過(guò)度思考”的問(wèn)題,即在處理簡(jiǎn)單任務(wù)時(shí)也會(huì)生成冗余的思考過(guò)程。
“比如使用者對(duì)大模型提問(wèn)‘2+3等于幾’,大模型可能會(huì)從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說(shuō),這種不必要的“過(guò)度思考”現(xiàn)象在推理模型中廣泛存在。
針對(duì)這一問(wèn)題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過(guò)所設(shè)計(jì)的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡(jiǎn)單而有效的推理新范式——通過(guò)省略號(hào)提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問(wèn)題難度自主決定“是否思考”“思考多少”。在多個(gè)數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺(tái)ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊(duì)表示,讓大模型“更聰明地思考、更簡(jiǎn)潔地表達(dá)”,是未來(lái)科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問(wèn)題上深入思考,而不是對(duì)所有問(wèn)題“想個(gè)不停”?記者5月29日從中國(guó)科學(xué)院自動(dòng)化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過(guò)度思考”。
“當(dāng)前,越來(lái)越多的大模型開始具備‘深度思考能力’。”中國(guó)科學(xué)院自動(dòng)化研究所研究員張啟超說(shuō),模型在回答問(wèn)題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過(guò)程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問(wèn)題的能力,但同時(shí)也帶來(lái)了“過(guò)度思考”的問(wèn)題,即在處理簡(jiǎn)單任務(wù)時(shí)也會(huì)生成冗余的思考過(guò)程。
“比如使用者對(duì)大模型提問(wèn)‘2+3等于幾’,大模型可能會(huì)從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說(shuō),這種不必要的“過(guò)度思考”現(xiàn)象在推理模型中廣泛存在。
針對(duì)這一問(wèn)題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過(guò)所設(shè)計(jì)的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡(jiǎn)單而有效的推理新范式——通過(guò)省略號(hào)提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問(wèn)題難度自主決定“是否思考”“思考多少”。在多個(gè)數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺(tái)ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊(duì)表示,讓大模型“更聰明地思考、更簡(jiǎn)潔地表達(dá)”,是未來(lái)科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
本文鏈接:http://www.jsaykz.com/v-146-957.html我國(guó)科學(xué)家提出高效推理策略 可避免大模型“過(guò)度思考”
相關(guān)文章:
折疊iPhone已進(jìn)入P1原型開發(fā)階段:2026年見07-05
理想感言句子11-09
建材營(yíng)銷個(gè)人年終總結(jié)報(bào)告10-11
大學(xué)秋季運(yùn)動(dòng)會(huì)加油稿11-22
小學(xué)生作文300字04-21
趕集作文600字11-19
河北民族師范學(xué)院屬于什么等級(jí)的高校12-10
西安理工大學(xué)高科學(xué)院學(xué)費(fèi)貴嗎 大概招生多少人07-29
幼兒園中班數(shù)學(xué)教案:動(dòng)物瓶12-03
世界水日宣傳口號(hào)03-26