Jika model dasar mewakili “generalist”, maka lapisan aplikasi yang baru muncul mewakili “spesialis”. Cursor sebagai asisten AI untuk pengeditan kode, melakukan hal ini—bukan hanya memanggil API OpenAI atau Claude secara langsung, tetapi mengintegrasikan, mengatur, dan mengoptimalkan panggilan LLM tersebut, ditambah engineering konteks, pengendalian biaya, antarmuka pengguna. Kombinasi ini menjadikan Cursor sebagai tolok ukur baru di lapisan aplikasi era LLM, sekaligus menginspirasi industri untuk memikirkan “Cursor bidang XX” seperti apa bentuknya.
Claude Code的出现则突破了另一个维度——本地化部署。相比OpenAI将智能体放在云端容器中,Claude Code选择"居住"在用户的本地电脑上,与开发者的工作环境紧密融合。这个选择反映了一个现实:在能力不均衡的过渡阶段,本地协作比云端编排更实用。它重新定义了AI与人的交互方式——不再是访问一个网站,而是成为工作环境的一部分。
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Paradigma Pengembangan AI Berubah Secara Signifikan: Melihat 6 Perkembangan Teknologi LLM Tahun 2025 dari Programming Sui Xiang
站在2025年的尾声,回顾这一年的AI发展,最令人瞩目的不是某个单一模型的性能突破,而是整个技术栈、甚至开发思维方式的系统性转变。这些编程随想的观察者会发现,2025年的AI不仅在能力上迭代,更在范式上革新。从强化学习的新方向到图形界面的探索,每一个变化都在重新定义我们与智能系统的互动方式。
可验证奖励强化学习成为主流:从被动反馈到主动探索
过去几年,大语言模型的训练堆栈相对稳定:预训练→监督微调→基于人类反馈的强化学习(RLHF)。这套组合拳在2022年确立后就鲜少变动。但到了2025年,一个新的技术成为所有AI实验室的标配——基于可验证奖励的强化学习(RLVR)。
这个转变的意义远比听起来要深刻。以往的RLHF依赖人类判断,而RLVR则让模型在数学题、编程问题等"客观可验证"的环境中自我训练。模型开始学会拆解问题、递进推理、尝试多条求解路径——这看起来像是某种"思维"的涌现。DeepSeek-R1的论文详细展示了这个现象,OpenAI的o1(2024年底)和o3(2025年初)则让整个行业意识到,这不仅仅是论文上的进展,而是生产力的跨越式提升。
从编程随想的角度看,这意味着AI不再是单纯的"条件反射机制",而是获得了某种系统化的问题求解能力。计算从模型大小转向"思考时间"——更多的推理轨迹成为新的扩展维度,这给了模型一个全新的发展空间。
智能的新形态:幽灵而非动物
2025年让整个行业开始用全新的视角审视AI。我们并不是在培育某种"数字动物",而是在召唤某种"幽灵"——一种完全不同于生物智能的存在形态。
人类大脑在丛林环境中进化,优化的是部落生存;而大语言模型在互联网文本、数学奖励、人类点赞中优化。两者的目标函数截然不同,导致智能形态也截然不同。这个新认知释放了一个有趣的预测:AI的性能不会均匀发展,而是呈现出"锯齿状"特征——在可验证领域(数学、编程)表现超群,在需要真实世界常识的地方却显得困顿。
这也解释了为什么基准测试在2025年变得不那么可信。当所有测试都是"可验证环境"时,RLVR的特性就会导致模型在测试集附近"过度优化",制造虚假的性能幻觉。"在测试集上训练"已经成为新的现实。
LLM应用层的新生代:Cursor和Claude Code
Jika model dasar mewakili “generalist”, maka lapisan aplikasi yang baru muncul mewakili “spesialis”. Cursor sebagai asisten AI untuk pengeditan kode, melakukan hal ini—bukan hanya memanggil API OpenAI atau Claude secara langsung, tetapi mengintegrasikan, mengatur, dan mengoptimalkan panggilan LLM tersebut, ditambah engineering konteks, pengendalian biaya, antarmuka pengguna. Kombinasi ini menjadikan Cursor sebagai tolok ukur baru di lapisan aplikasi era LLM, sekaligus menginspirasi industri untuk memikirkan “Cursor bidang XX” seperti apa bentuknya.
编程随想在此也能看到端倪:基础模型与应用的分工正在重塑。基础模型会越来越像"通才大学毕业生"——知识广但不够专深;而应用则负责将这些"毕业生"整合成"专业团队",配备私有数据、专业工具链、用户反馈回路。
Claude Code的出现则突破了另一个维度——本地化部署。相比OpenAI将智能体放在云端容器中,Claude Code选择"居住"在用户的本地电脑上,与开发者的工作环境紧密融合。这个选择反映了一个现实:在能力不均衡的过渡阶段,本地协作比云端编排更实用。它重新定义了AI与人的交互方式——不再是访问一个网站,而是成为工作环境的一部分。
编程民主化的实现:从Vibe Coding看发展方向
“Vibe Coding”(氛围编程)可能是2025年最具颠覆性的概念。它描述的是这样一个现象:用户可以用自然语言描述需求,AI完成代码实现,过程中不需要深入理解底层技术细节。
从编程随想的实践来看,这个范式的价值已被验证。开发者可以用Rust写BPE分词器而无需掌握Rust的深度细节,可以快速编写一次性工具去debug某个问题,因为代码已经变得"免费、短暂、可塑"。这不仅赋能了普通人,也让专业开发者的生产效率倍增——许多"本不会被实现"的软件原型如今可以快速验证。
这个转变的深层意义在于,编程的成本函数改变了。从前需要投入数天甚至数周的小工具,现在可能只需数小时。这会重塑整个软件生态的经济学。
多模态的下一步:Nano banana与图形界面的回归
谷歌的Gemini Nano banana代表的是一个更深层的范式转换。如果说大语言模型是继上世纪70、80年代个人计算后的下一代计算范式,那么人机交互方式的演进也应该遵循类似的历史路径。
当年从命令行到图形界面的转变,本质上是"适配人类感知偏好"——人类天生厌恶文本阅读,更偏好视觉化、空间化的信息传递。同样的逻辑适用于AI时代。纯文本对话虽然有效,但并非人类的首选方式。Nano banana的突破不仅在于图像生成能力本身,更在于文本、图像与世界知识的一体化模型权重——这是多模态的下一步,也是图形界面时代的开端信号。
从编程随想的角度,这意味着我们可能正在见证UI/UX的第二次大革命。第一次是从CLI到GUI,第二次可能就是从文本对话到多模态交互。
总结:编程范式的连锁反应
2025年的这些转变并非孤立发生。RLVR带来了新的能力维度,促使应用层寻求专业化,这反过来推动了Vibe Coding的可行性。而多模态的成熟则为更自然的人机交互打开了大门。
从编程随想者的视角看,我们正在经历一个难得的范式转折点——不仅是AI能做什么的转变,更是人与AI如何协作、协作的成本结构如何改变的转折点。下一步会如何演进,取决于这些新范式能否真正融合成一个更深层的生产力突破。