首頁 熱點 業界 科技快訊 數碼 電子消費 通信 前沿動態 電商

丁寧:大模型的關鍵突破是“預訓練”,效果超出想象

2023-08-27 01:52:47 來源 : 新浪財經


【資料圖】

來源:睿見Economy

2023年亞布力論壇夏季高峰會于8月24日-27日在深圳召開。深圳市人工智能與機器人研究院常務副院長丁寧出席并演講。

丁寧坦言,“大模型讓人印象非常深刻”。在其看來,大模型的關鍵突破是“預訓練的步驟”。

他解釋說,以前機器學習是就問題本身學習相關數據,而“預訓練”是先不學某個具體的問題,而是所有知識都要了解——構建一種世界的常識體系,把人的認知體系,包括物理和邏輯關系都搞清楚了,再來說解決具體問題,“它的效果一下子超出人的想象”。

“這是大模型里面的一個比較關鍵的問題,通過預訓練方法把常識體系構建起來”,他說。

標簽:

相關文章

最近更新
萋萋(關于萋萋簡述) 2023-08-27 01:09:46