Claude Code的出現則突破了另一個維度——本地化部署。相比OpenAI將智能體放在雲端容器中,Claude Code選擇"居住"在用戶的本地電腦上,與開發者的工作環境緊密融合。這個選擇反映了一個現實:在能力不均衡的過渡階段,本地協作比雲端編排更實用。它重新定義了AI與人的交互方式——不再是訪問一個網站,而是成為工作環境的一部分。
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Глобальний зсув у парадигмі розробки ШІ: погляд на 6 основних еволюцій LLM-технологій у 2025 році з Programming Suixiang
站在2025年的尾聲,回顧這一年的AI發展,最令人矚目的不是某個單一模型的性能突破,而是整個技術棧、甚至開發思維方式的系統性轉變。這些編程隨想的觀察者會發現,2025年的AI不僅在能力上迭代,更在範式上革新。從強化學習的新方向到圖形界面的探索,每一個變化都在重新定義我們與智能系統的互動方式。
可驗證獎勵強化學習成為主流:從被動反饋到主動探索
過去幾年,大語言模型的訓練堆棧相對穩定:預訓練→監督微調→基於人類反饋的強化學習(RLHF)。這套組合拳在2022年確立後就鮮少變動。但到了2025年,一個新的技術成為所有AI實驗室的標配——基於可驗證獎勵的強化學習(RLVR)。
這個轉變的意義遠比聽起來要深刻。以往的RLHF依賴人類判斷,而RLVR則讓模型在數學題、編程問題等"客觀可驗證"的環境中自我訓練。模型開始學會拆解問題、遞進推理、嘗試多條求解路徑——這看起來像是某種"思維"的湧現。DeepSeek-R1的論文詳細展示了這個現象,OpenAI的o1(2024年底)和o3(2025年初)則讓整個行業意識到,這不僅僅是論文上的進展,而是生產力的跨越式提升。
從編程隨想的角度看,這意味著AI不再是單純的"條件反射機制",而是獲得了某種系統化的問題求解能力。計算從模型大小轉向"思考時間"——更多的推理軌跡成為新的擴展維度,這給了模型一個全新的發展空間。
智能的新形態:幽靈而非動物
2025年讓整個行業開始用全新的視角審視AI。我們並不是在培育某種"數字動物",而是在召喚某種"幽靈"——一種完全不同於生物智能的存在形態。
人類大腦在叢林環境中進化,優化的是部落生存;而大語言模型在互聯網文本、數學獎勵、人類點贊中優化。兩者的目標函數截然不同,導致智能形態也截然不同。這個新認知釋放了一個有趣的預測:AI的性能不會均勻發展,而是呈現出"鋸齒狀"特徵——在可驗證領域(數學、編程)表現超群,在需要真實世界常識的地方卻顯得困頓。
這也解釋了為什麼基準測試在2025年變得不那麼可信。当所有測試都是"可驗證環境"時,RLVR的特性就會導致模型在測試集附近"過度優化",製造虛假的性能幻覺。"在測試集上訓練"已經成為新的現實。
LLM應用層的新生代:Cursor和Claude Code
如果說基礎模型代表"通才",那麼新興的應用層則代表"專才"。Cursor作為代碼編輯的AI助手,做的正是這件事——它不是讓用戶直接調用OpenAI或Claude的API,而是整合、編排、優化這些LLM調用,加上上下文工程、成本控制、用戶界面。這套組合讓Cursor成為了LLM時代應用層的新標杆,也啟發了行業思考"XX領域的Cursor"會是什麼樣子。
編程隨想在此也能看到端倪:基礎模型與應用的分工正在重塑。基礎模型會越來越像"通才大學畢業生"——知識廣但不夠專深;而應用則負責將這些"畢業生"整合成"專業團隊",配備私有數據、專業工具鏈、用戶反饋回路。
Claude Code的出現則突破了另一個維度——本地化部署。相比OpenAI將智能體放在雲端容器中,Claude Code選擇"居住"在用戶的本地電腦上,與開發者的工作環境緊密融合。這個選擇反映了一個現實:在能力不均衡的過渡階段,本地協作比雲端編排更實用。它重新定義了AI與人的交互方式——不再是訪問一個網站,而是成為工作環境的一部分。
編程民主化的實現:從Vibe Coding看發展方向
“Vibe Coding”(氛圍編程)可能是2025年最具顛覆性的概念。它描述的是這樣一個現象:用戶可以用自然語言描述需求,AI完成代碼實現,過程中不需要深入理解底層技術細節。
從編程隨想的實踐來看,這個範式的價值已被驗證。開發者可以用Rust寫BPE分詞器而無需掌握Rust的深度細節,可以快速編寫一次性工具去debug某個問題,因為代碼已經變得"免費、短暫、可塑"。這不僅賦能了普通人,也讓專業開發者的生產效率倍增——許多"本不會被實現"的軟件原型如今可以快速驗證。
這個轉變的深層意義在於,編程的成本函數改變了。從前需要投入數天甚至數周的小工具,現在可能只需數小時。這會重塑整個軟件生態的經濟學。
多模態的下一步:Nano banana與圖形界面的回歸
谷歌的Gemini Nano banana代表的是一個更深層的範式轉換。如果說大語言模型是繼上世紀70、80年代個人計算後的下一代計算範式,那麼人機交互方式的演進也應該遵循類似的歷史路徑。
當年從命令行到圖形界面的轉變,本質上是"適配人類感知偏好"——人類天生厭惡文本閱讀,更偏好視覺化、空間化的信息傳遞。同樣的邏輯適用於AI時代。純文本對話雖然有效,但並非人類的首選方式。Nano banana的突破不僅在於圖像生成能力本身,更在於文本、圖像與世界知識的一體化模型權重——這是多模態的下一步,也是圖形界面時代的開端信號。
從編程隨想的角度,這意味著我們可能正在見證UI/UX的第二次大革命。第一次是從CLI到GUI,第二次可能就是從文本對話到多模態交互。
總結:編程範式的連鎖反應
2025年的這些轉變並非孤立發生。RLVR帶來了新的能力維度,促使應用層尋求專業化,這反過來推動了Vibe Coding的可行性。而多模態的成熟則為更自然的人機交互打開了大門。
從編程隨想者的視角看,我們正在經歷一個難得的範式轉折點——不僅是AI能做什麼的轉變,更是人與AI如何協作、協作的成本結構如何改變的轉折點。下一步會如何演進,取決於這些新範式能否真正融合成一個更深層的生產力突破。