(資料圖)
來源:睿見Economy
2023年亞布力論壇夏季高峰會于8月24日-27日在深圳召開。地平線創始人、CEO余凱表示,對我國企業在大模型方面的創新是比較悲觀的,不僅僅是芯片的差距,而是“整體綜合實力、生態包括創新的差距都比較大”。
深圳市人工智能與機器人研究院常務副院長丁寧則表示,“我們好像被帶到一條沒辦法翻盤的路上,因為他們的技術路線相當于把我們綁在這個地方,根源還是大模型本身的基礎理論跟硬件、芯片結合起來,我們好像就跟不上了”。
丁寧認為,我國企業應該從底層、最基礎的研究層面,探索新機會和新路徑,“不至于這么被動”。
“如果說要讓機器具備人類的知識體系,人類認識世界的方法,我相信這個方法是比較多的,不見得現在從語言切入入口,還有沒有這種可能性?有些基礎研究我認為是比較重要的”,他強調。
對于ChatGPT,丁寧認為,語言模型是基于人類認知已經產生的數據和文本來學習,“相當于是隔了一道”,而認知世界的方法是有很多的,比如可以讓智能通過某種載體去自己探索物理世界。
“小孩在學習語言之前是跟世界互動的,到處爬來爬去,拿個杯子、蘋果到處玩,甚至還要咬上一口,舔一舔,綜合的對物理世界的感知,然后自己體會,總結出一些概念之后,跟一些知識就對應上了,這個過程需要載體”,丁寧解釋說,現在的大模型是基于語言、圖像信息類的模態進行學習,把物理世界剝離掉了。
“比如照片是很難描述重力系統跟物體之間的關系”,他說。
在丁寧看來,語言模型朝著多模態模型發展,再往后就要把物理量整合起來,更全面的對世界進行感知,再利用大模型的技術路線、超大規模的計算,建立常識體系。
“這是不是我們現在可以發力的機會?難度很大,我們在嘗試。可以從根本上的技術路線做調整,解決我們現在尷尬、被動的狀態”,他建議。