#### 簡要說明* DeepMind資深員工David Silver為他的新創公司Ineffable Intelligence籌集了11億美元,估值達51億美元。* Silver表示,強化學習,而非大型語言模型,是通往超智能的最佳途徑。* 該公司旨在打造通過模擬和自我對弈學習的“超級學習者”AI。DeepMind的科學家David Silver,曾在2016年AlphaGo戰勝世界圍棋冠軍李世乭的歷史性勝利中扮演關鍵角色,已籌集11億美元,準備推出一家押注下一個AI時代不會來自當前主導技術的初創公司。Silver的公司Ineffable Intelligence於一月成立,估值達51億美元,並押注於強化學習,這是一種通過試錯來改進的AI方法。Silver認為,這種方法比目前主導領域的大型語言模型更具可信度,能更有效地通往超智能。“我認為我們的使命是與超智能進行首次接觸,” Silver在接受_Wired_採訪時表示。“所謂的超智能,我真正指的是一些令人難以置信的東西。它應該能自行發現新的科學、技術、政府或經濟形式。”由哲學家Nick Bostrom在其2014年著作《超智能》中普及,該術語指超越人類智慧、在幾乎所有領域都超越人類的AI,而人工通用智能(AGI)則描述能在廣泛任務中匹配人類推理能力的系統。<span data-mce-type="bookmark" style="display:inline-block;width:0px;overflow:hidden;line-height:0" class="mce_SELRES_start"></span>Silver認為,大型語言模型的根本限制在於它們從人類生成的數據中學習,而非通過經驗建立自己的理解。“人類數據就像一種化石燃料,提供了一個驚人的捷徑,”他說。“你可以把自己學習的系統想像成一種可再生燃料——它可以不斷學習、永不停歇,沒有限制。”Silver在其職業生涯中一直在推動這一觀點。AlphaGo結合了人類訓練數據、強化學習和自我對弈,開發出令頂尖人類玩家都感到驚訝的策略,展示了AI在狹窄領域超越人類先例的能力。“我覺得非常重要的是,有一個專注於這種方法的精英AI實驗室,”他對_Wired_說。“而不是另一個地方只專注於LLMs的角落。”Ineffable Intelligence計劃打造Silver所稱的“超級學習者”——置於模擬環境中的AI代理,能追求目標、失敗、適應並自主提升,而不受靜態人類數據集的限制。Silver拒絕描述這些模擬的具體樣貌,但表示這種方法將使代理能夠合作並自主開發能力。Silver認為,大型語言模型受到訓練數據的限制,他補充說,在一個所有人都相信地球是平的的世界中訓練的模型,除非能自己測試現實,否則可能會一直持有這一信念。他指出,通過經驗學習的系統能夠發現不同的真相。Ineffable Intelligence未立即回應_Decrypt_的置評請求。
Google DeepMind 資深人士籌集 11 億美元打造不以人類數據訓練的人工智慧
簡要說明
DeepMind的科學家David Silver,曾在2016年AlphaGo戰勝世界圍棋冠軍李世乭的歷史性勝利中扮演關鍵角色,已籌集11億美元,準備推出一家押注下一個AI時代不會來自當前主導技術的初創公司。 Silver的公司Ineffable Intelligence於一月成立,估值達51億美元,並押注於強化學習,這是一種通過試錯來改進的AI方法。Silver認為,這種方法比目前主導領域的大型語言模型更具可信度,能更有效地通往超智能。 “我認為我們的使命是與超智能進行首次接觸,” Silver在接受_Wired_採訪時表示。“所謂的超智能,我真正指的是一些令人難以置信的東西。它應該能自行發現新的科學、技術、政府或經濟形式。”
由哲學家Nick Bostrom在其2014年著作《超智能》中普及,該術語指超越人類智慧、在幾乎所有領域都超越人類的AI,而人工通用智能(AGI)則描述能在廣泛任務中匹配人類推理能力的系統。 Silver認為,大型語言模型的根本限制在於它們從人類生成的數據中學習,而非通過經驗建立自己的理解。 “人類數據就像一種化石燃料,提供了一個驚人的捷徑,”他說。“你可以把自己學習的系統想像成一種可再生燃料——它可以不斷學習、永不停歇,沒有限制。”
Silver在其職業生涯中一直在推動這一觀點。AlphaGo結合了人類訓練數據、強化學習和自我對弈,開發出令頂尖人類玩家都感到驚訝的策略,展示了AI在狹窄領域超越人類先例的能力。 “我覺得非常重要的是,有一個專注於這種方法的精英AI實驗室,”他對_Wired_說。“而不是另一個地方只專注於LLMs的角落。” Ineffable Intelligence計劃打造Silver所稱的“超級學習者”——置於模擬環境中的AI代理,能追求目標、失敗、適應並自主提升,而不受靜態人類數據集的限制。Silver拒絕描述這些模擬的具體樣貌,但表示這種方法將使代理能夠合作並自主開發能力。 Silver認為,大型語言模型受到訓練數據的限制,他補充說,在一個所有人都相信地球是平的的世界中訓練的模型,除非能自己測試現實,否則可能會一直持有這一信念。他指出,通過經驗學習的系統能夠發現不同的真相。 Ineffable Intelligence未立即回應_Decrypt_的置評請求。