Vol.75 2025年AI领域十大核心趋势：从AGI使命到Agent工程实践深度解析

第一时间捕获有价值的信号

⼤家好，Weekly Gradient第 75 期已送达，本期内容深度解析2025年AI领域十大核心发展趋势，涵盖OpenAI的AGI使命与万亿级基础设施规划、Agent工程平台的技术突破、多模态AI的应用实践、AI泡沫风险分析、创业公司增长策略、AI编码效率优化、投资机构科技哲学以及Transformer架构的未来演进方向。

AI 商业化

聚焦AI行业的商业化路径、市场竞争格局和商业模式创新，包含投资趋势、GTM策略、SaaS转型等商业分析

1.2025 AI 现场：我们这一年的目击与狂想（十字路口Crossing）

2025年真是AI的拐点之年啊！中美在大模型战场上各显神通，中国用开源策略对抗美国的氪金堆叠，模型能力快速追赶。Agent终于进入元年阶段，Manus把AI从语言带到了行为层面，虽然生态还很混乱，但垂直领域的Agent已经开始落地了。最让人震撼的是资本市场的狂热，AI本身都变成了市场，OpenAI这些巨头万亿估值驱动着整个行业，但巨额投入和硬件折旧压力也让人担心是不是走到了产业极限。多模态技术像Sora 2、Veo 3持续突破，中国在硬件算力和机器人领域也有亮眼表现，整个行业既充满机遇又暗藏风险。

2.【对谈】筷子科技陈万锋：AI 视频的「网感」不是玄学，是工程（AI炼金术）

筷子科技陈万锋的分享太实在了！他直接点破商家要的根本不是高大上的艺术品，而是能批量生产、高效获客的‘视频传单’。AI在这里扮演的角色就是把海量素材变成成千上万条商业视频，打造稳定输出的内容供应链。最颠覆认知的是他把‘网感’从玄学拉回现实——这玩意儿居然能工程化拆解成理解自身、竞品和热点，AI负责发散创意，人来做筛选把关。他还提出‘反智能’的产品哲学，强调知道什么时候该让人介入才是真本事，全自动反而容易让用户失去掌控感。面对大模型冲击，他坚信深度理解行业商业逻辑和客户场景才是护城河。给AI创业者的建议也特别接地气：别老盯着大客户，下沉市场的小微企业反而能给你最真实残酷的反馈，帮你把产品打磨得更扎实。

3.李想长谈AI：从生产工具到AGI终端，VLA与企业战略深度解析（宝玉(@dotey)）

理想汽车CEO李想在长达三小时的访谈中，把AI的未来讲得明明白白。他直言现在的AI大多只是制造混乱的‘信息工具’，必须进化成能真正干活的‘生产工具’才有价值，Agents存在的全部意义就在于此。特别让人惊讶的是，他高度评价DeepSeek遵循‘反人性’的最佳实践，直接加速了理想VLA的研发进程。访谈里还详细拆解了理想的下一代VLA架构，从‘昆虫智能’到‘人类智能’的三步训练法，预训练、后训练、强化训练环环相扣，最终要打造出真正的‘VLA司机大模型’。更震撼的是，李想直接公布了理想汽车到2030年要成为全球领先人工智能终端企业的终极目标，把汽车定位为首个AGI终端，未来还要拓展到家庭、穿戴设备。最后他还分享了管理智慧，区分AI的‘智能’和人类的‘智慧’，认为AI的价值就是把我们从低价值劳动中解放出来，去追求更高层次的东西。

4.OpenAI 2025年直播活动总结：AGI使命、研究路线与万亿级基础设施规划（宝玉(@dotey)）

OpenAI刚刚在10月28日的直播中公布了震撼行业的宏大蓝图！他们不仅重申了让AGI造福全人类的使命，更宣布将投入1.4万亿美元建设超过30吉瓦的计算能力，启动‘星门’数据中心项目。最让人兴奋的是，他们计划把ChatGPT打造成AI云平台，鼓励开发者创造价值，同时预测超级智能十年内到来，设定了2026年实现实习生水平AI研究助手、2028年实现全自动化AI研究员的具体目标。安全方面也毫不含糊，提出了五大安全保障层次，确保技术发展可控可靠。这不仅是技术宣言，更是商业战略的全面展示，从基础设施布局到年收入数千亿美元的目标，OpenAI正在重新定义AI行业的竞争格局。

5.企业 IT 部门是 AI 转型的最大阻力？| 任鑫 x 徐文浩（AI炼金术）

这期播客聊得真有意思！任鑫和徐文浩两位大佬把企业AI转型的痛点都说透了。现在AI To B根本不是卖软件那么简单，更像是给企业做咨询加培训，帮他们真正把RAG、Agent这些技术用起来。有意思的是，B端和C端对AI的需求完全不同——B端要的是准确可靠的工作流，C端反而喜欢Agent那种能带来惊喜的不确定性。最扎心的是，很多企业IT部门反而成了AI落地的最大障碍，因为他们既不懂外面的新技术，又不够了解自家业务。商业化方面也很有启发，现在流行’被动投喂’的信息流模式，用户接受度更高，还有AIO这种通过优化内容来抢占AI搜索流量的新玩法。听完感觉对AI怎么在企业里真正落地清晰多了！

6.MiniMax M2 & Agent，大巧若拙（MiniMax 稀宇科技）

MiniMax 这次推出的 M2 模型真的挺让人惊喜的！它专门针对 Agent 和代码开发做了优化，居然能同时搞定效果、价格和速度这三个传统上难以兼顾的问题。M2 在编程和工具调用上表现特别出色，能稳定执行复杂的长链条任务，而且在 Artificial Analysis 榜单上冲进了全球前五。最吸引人的是它的价格优势，API 价格只有 Claude Sonnet 的 8%，推理速度还快了一倍，现在通过 MiniMax Agent、开放平台 API 和 HuggingFace 上的模型权重全面开放，还提供限时免费，这波操作确实让更多开发者和企业能用上高性价比的 AI 能力，感觉对推动 AI Native 组织的建设帮助很大。

7.LangChainAI to Host Launch Events for New Agent Engineering Platform（Harrison Chase(@hwchase17)）

LangChainAI创始人Harrison Chase刚刚在推特上发出邀请，他们要在旧金山、波士顿和纽约办一系列线下发布活动！这可不是普通聚会，而是展示他们拿到1.25亿美元融资后，在智能体工程平台上的最新成果。感觉LangChain这次是要大干一场，把AI智能体的开发能力再往上推一个台阶，挺让人期待的。

8.Agentic Commerce Protocol and building the Economic Infrastructure for AI — with Emily Glassberg Sands， Head of Data & AI at Stripe（Latent Space）

Open 8.Agentic Commerce Protocol and building the Economic Infrastructure for AI — with Emily Glassberg Sands， Head of Data & AI at Stripe（Latent Space）

Stripe正在为AI经济搭建基础设施，这事儿挺酷的！他们和OpenAI联手搞了个智能体商务协议，让AI助手能直接用共享支付Token买东西，就像给AI装上了信用卡。更厉害的是他们的支付基础模型，把银行卡欺诈检测准确率从59%飙到97%，处理着数百亿笔交易。还有个聪明的Token计费功能，AI公司可以根据大模型推理成本实时调整定价，再也不怕成本波动了。数据显示，用Stripe的AI公司增长特别猛，达到千万级收入的速度比普通SaaS快两三倍，而且一开始就能覆盖全球市场，人均收入也更高。看来AI不只是技术革命，更是一场商业模式的彻底重塑。

9.8 个月做到 1 亿美元 ARR，Lovable 增长负责人：免费用户不是成本，是营销渠道（Founder Park）

最近读到一篇关于AI时代增长策略的深度分析，真是让人眼前一亮！传统SEO和社交媒体这些老路子现在越来越不管用了，因为用户都跑去跟AI聊天了。Lovable的增长负责人Elena Verna提出了个颠覆性的观点：免费用户根本不是成本，而是活生生的营销渠道。想想看，与其把钱砸给广告平台，不如让用户免费体验高级功能，这本身就是最好的获客方式。更让人警醒的是，AI正在让很多简单功能变得一文不值，电子签名、表单生成这些过去还能赚钱的功能，现在用户自己用AI工具就能搞定。所以企业必须专注于开发那些复杂、高频使用的核心功能，否则随时可能被用户自建的工具颠覆。文章还分享了八大增长策略，核心就是要把产品本身打造成营销引擎，通过产品设计让用户自发传播，利用AI加速迭代，把用户数据变成竞争优势，让产品体验直接塑造品牌形象。这些思路对做B2B SaaS的朋友们特别有启发，值得好好琢磨。

10.Coatue 最新报告：复盘 400 年、 30+ 次泡沫，我们离 AI 泡沫还很远（海外独角兽）

Coatue 这份报告真的挺有意思，他们翻遍了400年历史数据，对比了30多次市场泡沫，结论很明确：AI根本不是泡沫，而是一场实实在在的生产力革命！报告详细分析了当前AI市场的估值、资本开支和IPO活跃度，发现和互联网泡沫时期完全不同，AI的增长已经扩散到能源、半导体、软件等多个领域，不再依赖少数科技巨头。他们还系统性地反驳了市场对AI的八大质疑，包括通胀压力、高估值、集中度过高这些常见担忧，用数据和历史经验证明AI投资的财务可控性和巨大增长空间。最让人兴奋的是，Coatue预测AI利润在未来5-10年将达到万亿美元规模，他们甚至开发了专门的AI盈利追踪框架来量化AI带来的经济价值。通过Google和Oracle的案例，报告指出市场严重低估了AI对企业业绩的实际影响，建议大家别被短期波动吓跑，要关注基本面，遵循特定的投资原则和跟踪指标来把握这个长期机遇。

11.From Idea to $650M Exit: Lessons in Building AI Startups（Y Combinator）

哇，这真是AI创业的实战宝典！Casetext创始人Jake Heller分享了从零到6.5亿美元收购的完整心法。核心是三步走：先看用户愿意为什么付费——辅助、替代还是颠覆现有工作；然后深入专业领域，把复杂流程拆解成具体步骤，通过严格测试确保AI产品真正可靠；最后让产品质量自己说话，把销售变成被动接单。特别打动我的是他对定价的思考——要敢于根据创造的价值定价，而不是成本，同时认真倾听客户愿意怎么付钱。建立信任也很关键，通过正面比较和专门的部署工程师让客户放心。说到底，AI创业不是技术炫技，而是踏踏实实解决真实问题，当产品足够强大时，市场自然会找上门来。

12.对话真人级 AI Agent 客服 Jekka 创始人：AI 的边界、大规模实践与终点（此话当真）

最近和 Jekka AI 创始人艾伦聊了聊，发现 AI Agent 在企业服务领域已经玩得这么溜了！他们特别强调一个观点：AI 的可靠性比智力上限重要得多——想想也是，企业可受不了那种时灵时不灵的 AI。Jekka 通过让 AI 严格遵循 SOP、具备通识能力，把稳定性做到了真人级别，在客服场景里能独立解决问题，转化率蹭蹭往上涨。还有个挺有意思的视角，他们把 AI 定义为“跨实体语言”，感觉一下子打开了新思路，原来 AI 不只是工具，还能表达情感、连接不同实体。听完觉得，AI 真不是遥不可及的黑科技，而是实实在在能提升效率、降低成本的好帮手。

AI 产品设计

探索AI原生产品的设计范式与用户体验革新，强调产品哲学、交互模式、Agent设计等

1.LangSmith Agent Builder: No-Code AI Agent Creation in Private Preview（LangChain(@LangChainAI)）

LangChain刚刚推出了一个超酷的新产品！LangSmith Agent Builder现在开放私人预览，这可是个真正的无代码神器，能让商业用户和普通人都能轻松创建复杂的AI Agent。最厉害的是它基于LangChain Deep Agents架构，能自动搞定规划、记忆管理和子Agent编排这些复杂任务，再也不用为每个细节绞尽脑汁了。这意味着部署AI应用的速度会大大加快，绝对是让非技术背景的人也能玩转高级AI应用的重要一步！

2.Introducing LangSmith’s No Code Agent Builder（LangChain Blog）

LangSmith 这次推出的无代码 Agent Builder 真的很贴心，直接把 AI 代理的创建门槛降到了地板级别！以前总觉得构建智能代理是技术人员的专利，现在业务人员也能轻松上手了。最吸引人的是它不走传统可视化工作流程的老路，而是让 LLM 来做动态决策，这样代理就能处理那些事先没法完全规划好的复杂任务。开发过程也特别人性化，通过对话式引导帮你生成 Prompt，完全不用懂什么提示词工程。而且代理还有持久记忆功能，能从你的纠正中学习，越用越聪明。感觉这种设计思路特别适合企业内部的生产力场景，比如邮件助手、聊天助手什么的，让 AI 真正成为日常工作的好帮手。

3.当阿里入局全球 AI Coding，战场里的 60 天 | 对话叔同：Qoder 创始人（十字路口Crossing）

阿里Qoder上线60天就吸引了50万开发者，这成绩太惊人了！创始人叔同分享的秘诀是：他们没去卷新项目生成的红海，而是专注解决开发者95%时间都在面对的真实软件维护难题。Qoder把自己定位成智能体编程平台，核心思路是‘我不干，智能体干’——通过需求文档驱动的方式，让AI能长时间独立完成复杂任务。产品设计上特别注重给开发者掌控感，不是盲目追求不打断心流，而是让你成为AI的管理者。最亮眼的是Repo Wiki功能，AI能自动生成并实时更新代码库文档，彻底解决了祖传代码的维护痛点。叔同还坚信AI不会取代程序员，而是会放大生产力，未来工程师需要更多复合能力，这观点让人对AI时代充满期待！

4.“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS（十字路口Crossing）

Flowith OS这次真的玩大了，直接给AI Agent造了个操作系统！它解决了传统Agent最头疼的环境限制、记忆缺失和权限顾虑，让AI能在浏览器里自由思考和行动。实测中这家伙表现惊人，淘宝自动购物、微博内容发布都流畅得不像话，遇到障碍时还会主动寻找替代方案——比如抓取数据失败后，它居然自己去找隐藏的数据库和GitHub项目，这种自主解决问题的能力太让人惊喜了。感觉AI正在从听话的工具变成能独立思考的伙伴，这波操作确实称得上是AI世界的“Day 1”时刻。

5.【案例】ChatGPT Pulse：撬动使用频次、商业变现和数据飞轮（AI炼金术）

ChatGPT Pulse 这次玩得真聪明！它不再傻傻等着用户提问，而是每天早上主动给你推送信息，就像有个贴心助理把重要内容整理好送到你面前。这下用户再也不用费脑子想该问什么了，从‘提问者’变成‘批奏折的皇帝’，使用门槛直接降到最低。更妙的是，AI 会主动展示自己的能力，让你慢慢信任它，愿意给它更多权限，最后升级成你的专属行动代理人。技术上也很有巧思，把计算任务都安排在夜间处理，白天直接推送结果，既省了算力成本又让体验更流畅。商业变现也找到了新路子，从私密聊天转向信息流场景，广告和推荐服务都变得自然多了。用户每次点赞、点击都在帮模型变得更好，这种数据飞轮效应让产品越用越聪明。感觉这波操作真的把 AI 产品带到了新高度！

6.Vercel’s CEO Shares 5 $1M+ AI Startup Ideas & The v0 Playbook（Greg Isenberg）

Vercel CEO Guillermo Rauch 亲自示范了如何用一个下午就打造出功能完整的AI应用，这效率简直惊人！他分享的五个百万美元级AI创业点子特别实用，从AI相机到对话式表单，每个都直击市场需求痛点。最打动我的是他强调的’品味’和精简UI理念，现代产品开发真的需要不断观察用户行为，简化交互体验。利用V0和AI SDK这些工具，创意落地变得如此高效，看完让人跃跃欲试想动手实践。

7.对话 a16z 被投 Phota Labs 联创张璇儿：在 Photoshop 与美图之间，如何杀出一条新路？（白鲸出海）

Phota Labs正在用生成式AI重新定义我们与照片的关系，他们不只是修图或生成新图，而是带你回到拍照那一刻，重新决定光线、构图和故事。创始人张璇儿分享的核心在于AI要理解你的身份和拍摄场景，确保生成的照片既美又真实，不会过度失真。产品设计很巧妙，让你通过选择摄影师风格来表达审美，而不是面对复杂的参数设置，这种情感连接让照片真正成为美好记忆的载体。选择纯软件路径也很明智，利用现有硬件就能实现功能，更贴近大家的日常使用习惯。这确实是在Photoshop和美图之间走出了一条新路，让AI不只是工具，而是帮你重构记忆的伙伴。

8.Google DeepMind Developers: How Nano Banana Was Made（a16z）

谷歌DeepMind团队打造的Nano Banana真是让人眼前一亮！这个模型巧妙融合了Gemini的智能和Imagen的视觉质量，实现了无需大量训练的个性化图像生成。最打动我的是它如何真正解放创作者——专业艺术家可以把90%的精力投入到创意构思上，而普通用户也能轻松制作个性化内容。不过团队也坦诚分享了面临的挑战：既要满足艺术家对角色一致性和精确控制的需求，又要为普通用户提供简单直观的对话式界面。看着AI从工具逐渐演变为创意伙伴，未来还能在视频生成和教育领域大展身手，这种技术与人性的融合确实令人期待。

9.117. 开源一段论文探索之旅：模型范式、Infra 和数据、语言、多模态的完整变迁史（张小珺Jùn｜商业访谈录）

一位非技术背景的产品经理用一年多时间啃下了数百篇AI论文，把整个AI发展史梳理得明明白白！从1999年GPU诞生到2024年最新进展，他把AI技术演进划分为模型范式、基础设施、语言模型和多模态四大板块，详细解读了36篇关键论文。深度学习的AlexNet、革命性的Transformer、AlphaGo Zero的强化学习突破、LoRA高效微调技术，还有Scaling Law和LAION-5B这些数据算力里程碑，都在他的研究范围内。更棒的是，他分享了如何用AI工具辅助论文阅读，推荐了体系化学习资源，强调在AI早期阶段，产品经理深入理解技术原理对产品创新至关重要。这简直就是给所有想深入AI领域的人一份超实用的成长指南！

10.在 Sora 诞生之前，胡修涵做了两年多的「二次元版 Sora」（Founder Park）

胡修涵的创业项目‘捏 Ta’在 Sora 出现前就做了两年多的‘二次元版 Sora’，他分享的经验太有启发了！现在 AI 用户最核心的需求其实是创造‘意义感’，大家不再只想被动看内容，而是渴望主动参与、混剪和创作，从中获得满足感。Remix 玩法和 Agentic Workflow 是关键，把看似不相关的元素连起来产生新意，再用 AI Agent 简化复杂流程，创作门槛一下子就降低了。社区运营也很有讲究，不能老想着用钱激励或者过度指导，得用‘辅助’心态，提供好工具和平台，让创意自己冒出来，这样创作者才有内生动力。‘捏 Ta’已经有百万用户、十万核心创作者，每月60万原生投稿，这成绩背后正是对技术和用户需求的巧妙平衡。

AI 工程实践

涵盖AI系统技术实现与场景化开发的全流程，包含工程架构、工具链实践、提示工程等核心技术环节

1.如何让 Agent 更符合预期？基于上下文工程和多智能体构建云小二 Aivis 的十大实战经验（阿里云开发者）

构建稳定可靠的Agent确实是个技术活，云小二Aivis项目踩过的坑给我们提供了很多实用经验。最核心的就是要把模糊需求变得具体可衡量，让模型真正明白我们想要什么。上下文管理特别关键，既要精准投喂相关信息，又要保持简洁，避免信息过载导致模型跑偏。身份和历史执行必须清晰记录，不然模型很容易角色混乱或者产生幻觉。用JSON、YAML这些结构化语言表达复杂逻辑效果出奇地好，比纯文字指令准确多了。自定义工具协议在特定场景下比通用协议更靠谱，记忆管理让Agent在多轮对话中保持连贯性。多智能体架构既能保证可控性又能灵活处理复杂任务，而人在回路则是持续优化的根本保障，毕竟AI最终还是要服务好人类需求。

2.如何构建企业级数据智能体：Data Agent 开发实践（阿里技术）

阿里DMS团队这次分享的企业级数据智能体实践真的很硬核！他们不是在做简单的ChatBI，而是打造了一个能同时搞定描述性、诊断性、预测性和规范性分析的智能助手。最让人兴奋的是，他们用Code-based Reasoning把LLM的幻觉风险转移到了可执行的代码层面，再通过云原生沙箱环境来验证，这样分析结果既可靠又能复现。构建过程中，深度语义理解、上下文管理和安全工具调用这三个技术内核缺一不可，特别是多Agent协作优化上下文管理的设计，让不同层级的用户都能获得更深层次的数据洞察。这种把高级分析门槛降下来的思路，对企业来说简直是福音！

3.让 Agent 系统更聪明之前，先让它能被信任（阿里云开发者）

最近读到一篇关于AI Agent开发的深度分析，感觉特别戳中痛点！很多人以为Agent开发很简单，其实那都是假象——框架封装、平台托管把复杂问题推迟了，但调试、状态管理这些工程难题根本没解决。Agent系统要面对可运行、可复现、可进化三层复杂度挑战，LLM的不确定性在内存、编排和测试环节会被放大，导致系统难以稳定运行。从‘能跑’到‘能用’需要系统化设计，不能只靠Prompt Hack，生产环境要求高可靠性，必须用结构化内存、编排和测试手段。文章强调‘先稳定后聪明，先可观测后优化’的原则，把Agent当成系统组件来管理，建立可回放机制、版本追踪和监控指标，这样才能确保生产环境的可靠性。ReAct、CodeAct这些设计模式也提供了很好的实践参考。

4.以 Dify 架构设计为例，一篇文看懂 AI 原生应用开发平台（腾讯云开发者）

最近深入研究了AI原生应用开发平台，发现Dify和TaskingAI这两个平台真的把AI应用开发的门槛降到了新低！它们不像传统框架那样需要各种复杂集成，而是直接提供了一站式解决方案，特别是有状态会话管理和向量存储这些核心功能都内置好了。TaskingAI采用了微服务架构和领域驱动设计，代码结构特别清晰，很适合快速搭建轻量级AI应用。而Dify的GraphEngine更是厉害，基于事件驱动和DAG的工作流引擎能可视化编排各种AI任务节点，处理复杂场景游刃有余。这些平台都强调模块化管理和多租户隔离，确保开发既灵活又安全。更让人兴奋的是，未来的AI应用开发可能会走向意图驱动，系统还能自动检测故障并持续优化，想想就觉得前景无限！

5.从 0 到 1：天猫 AI 测试用例生成的实践与突破（阿里技术）

天猫团队这次真的把AI用活了！他们面对电商业务快速迭代的测试压力，打造了一套智能测试用例生成系统。核心思路很清晰：先用规范化模板提升需求文档质量，再通过精心设计的Prompt引导大模型生成用例，同时构建包含业务场景、资损案例的结构化知识库，结合RAG技术精准召回相关信息。最厉害的是他们还开发了AI Agent来辅助知识库建设和需求补全。这套方案在导购、详情页等C端业务中表现惊艳，85%的用例直接被采纳，中小需求的用例编写时间缩短了四分之三。虽然现在对视觉稿支持和复杂需求处理还有提升空间，但这已经让我们看到了AI在测试全流程自动化的巨大潜力。

6.在性能优化时，如何避免盲人摸象（阿里云开发者）

性能优化这事儿最怕的就是盲人摸象，光盯着局部问题修修补补，结果反而搞出更多麻烦。有个堆外内存OOM的案例特别典型，传统监控根本发现不了，得靠GC日志、pmap这些工具深挖才能找到根因。现在很多团队还在看平均响应时间，其实P95/P99这些尾部指标才能真正反映用户体验，那些短时毛刺才是用户最不爽的地方。要是对HTTP协议、线程池连接池这些底层原理理解不够，遇到复杂问题简直无从下手。好在文章给了一套很实用的排查框架，从终端到服务端层层分解，帮我们系统性地定位瓶颈，避免东一榔头西一棒槌的无效优化。

7.基于 Spring AI Alibaba 的 DeepResearch 架构与实践（阿里云开发者）

哇，这个基于Spring AI Alibaba的DeepResearch系统真是把自动化研究做到了极致！它用11个智能节点组成完整的工作流，从规划、研究到编码、报告一气呵成，完全不需要人工干预。最厉害的是它的混合检索能力，能同时从API、数据库和用户文件里找资料，再用RRF算法智能融合结果，确保给大模型的信息又全又准。生成报告时还能选Markdown、PDF或HTML格式，而且支持连续对话，让整个研究过程像跟专家聊天一样自然。部署也很友好，提供了详细的Docker和本地启动指南，企业想用的话直接就能上手，这绝对是构建智能研究助手的最佳实践！

8.AIO Sandbox：为 AI Agent 打造的一体化、可定制的沙箱环境（字节跳动技术团队）

字节跳动推出的AIO Sandbox真是解决了AI Agent开发的大难题！以前Agent要在不同沙箱间来回折腾，数据传得头大，现在一个Docker镜像就把浏览器、代码执行、终端、文件操作全整合了，文件系统和鉴权都统一管理，效率直接起飞。最棒的是它还能高度定制，开发者可以根据不同Agent的需求打造专属环境，想装什么依赖就装什么。安全方面也考虑得很周到，JWT鉴权加上容器隔离，还能人工介入调试，既保证了Agent的强大操作能力，又确保了系统安全可靠。这绝对是AI工程实践领域的一大进步！

9.AI 编程上瘾指南，一天不用浑身难受（腾讯技术工程）

最近读到一篇关于AI编程的深度指南，真是让人大开眼界！原来AI已经不只是简单的代码补全工具，而是能真正理解业务需求、设计方案、生成完整模块的编程伙伴了。文章详细介绍了以CodeBuddy为核心的AI编程生态，通过信息层、工具层、能力层和质量层的分层思维，把AI编程变得系统化。最吸引人的是AI与软件开发生命周期的结合，通过结构化任务分解、智能上下文工程这些方法，反馈周期从周缩短到天，开发者真的能演变为全栈工程师。不过文章也很实在，提醒我们AI编程不是万能的，在标准化业务逻辑和测试用例生成上表现很棒，但在复杂算法创新和业务规则上还是需要人类专家主导。看完之后感觉既兴奋又清醒，AI编程确实能大幅提升效率，但也得学会合理使用，避免过度依赖带来的架构失控和版本管理问题。

10.AI 出码率 70%+的背后：高德团队如何实现 AI 研发效率的量化与优化（阿里云开发者）

高德团队这次真的把 AI 编程这件事玩明白了！他们发现大家都在用 AI 写代码，但到底效率提升了多少却没人说得清，于是从零搭建了一套科学的效率评估体系。最核心的是‘AI 出码率’这个指标，就是看 AI 生成的代码在最终提交代码中占多大比例，再配合会话次数、使用时长等辅助指标，终于能准确衡量 AI 工具的实际效果了。数据采集方案也很有意思，从最初只能逆向读取本地数据库，进化到基于 MCP 协议的标准化采集，现在能兼容多种开发环境，工程效率大幅提升。最厉害的是他们形成了数据驱动的闭环优化：通过分析指标数据，不断优化提示词设计，明确哪些场景不适合用 AI，沉淀最佳实践。结果三个月内就把 AI 出码率从 30% 拉到了 70% 以上，团队从被动尝试变成了主动探索，真正养成了和 AI 协作编程的习惯。这种把量化管理和工程实践结合的做法，确实为其他团队提供了可复用的经验。

11.OpenAgent Framework for Verifiable AI Agents on Open Network（LangChain(@LangChainAI)）

LangChain社区又放大招了！这次推出的OpenAgent Framework专门解决AI代理在开放网络上的可信度问题，特别适合DeFAI和DeSci这些需要高度透明性的场景。最让人兴奋的是它内置了计算验证机制，能对关键操作进行验证，相当于给AI代理装了个‘黑匣子’。在去中心化环境里快速部署安全可靠的AI解决方案一直是个头疼的问题，这个框架看来是找准了痛点，期待看到它在实际应用中的表现！

12.Introducing Deep Agents CLI: A Coding Application with Memory（Harrison Chase(@hwchase17)）

Harrison Chase刚刚发布了Deep Agents CLI这个超实用的工具！它基于deepagents包构建，最厉害的地方是内置了记忆功能，能让CLI长期记住指令和上下文。这对于处理复杂的多步骤编码任务简直是神器，再也不用反复交代背景信息了。作为LangChain创始人，Harrison还贴心地提供了详细的博客和视频教程，想构建高级AI代理和编码工具的朋友们绝对不要错过这个宝藏资源。

13.Introducing DeepAgents CLI（LangChain Blog）

最近发现一个挺有意思的工具——DeepAgents CLI，它让开发者直接在终端里就能创建和管理AI代理。这些代理可不是一次性的，它们有持久化记忆系统，能记住之前学的东西，下次会话还能接着用，感觉就像有个越来越聪明的编程助手。最实用的是它能帮你做各种事：读写文件、执行需要你确认的Shell命令、上网搜索、调用API，还能用可视化待办列表规划任务。你可以为不同项目创建专门的代理，比如一个负责代码重构，一个专攻API开发。安装也很简单，pip或uv都能装，设置好API密钥就能用了。对于那些需要反复调试和长期跟进的项目来说，这种能记住上下文的AI助手确实能省不少事。

14.OpenAI Unveils Aardvark: A GPT-5 Powered AI Agent for Security Bug Fixing（OpenAI(@OpenAI)）

OpenAI 这次又放了个大招！他们悄悄推出了 Aardvark，一个基于 GPT-5 的 AI 代理，专门用来抓安全漏洞和自动修复。虽然还在内测阶段，但这家伙能自主检测并解决安全问题，简直像给软件开发配了个全天候的安全专家。想想看，以后开发团队不用再为各种漏洞头疼，AI 直接帮你搞定，不仅安全级别能大幅提升，连开发流程都会顺畅很多。这波操作确实让人眼前一亮，AI 在软件安全领域的潜力看来比我们想象的还要大。

15.Thinking Machines Lab 最新研究结果如何复现？On-Policy Distillation 让训练成本直降 10 倍（魔搭ModelScope社区）

有个超棒的消息要分享！Thinking Machines Lab推出的On-Policy Distillation技术真的把大模型训练的门槛降下来了。它让小模型也能学会大模型的真本事，而且训练成本直接降了10倍！关键是这个技术特别聪明，让学生模型自己生成数据，同时让教师模型给每一步动作打分，既解决了传统强化学习太烧钱的问题，又避免了监督微调不会处理错误的缺陷。更让人惊喜的是，在个性化助手训练中，它居然能完美避免灾难性遗忘，让小模型学会新知识的同时不忘掉原来的对话能力。如果你担心实践起来有性能瓶颈，别怕，他们推荐的MS-SWIFT框架已经集成了vLLM加速和独立的DeepSpeed配置，把资源不对称的问题都解决了。这简直就是为想用大模型能力但又预算有限的小伙伴们量身定做的解决方案！

16.Introducing SWE-1.5: Our Fast Agent Model（Simon Willison’s Weblog）

Cognition AI刚刚发布了SWE-1.5，这个拥有数千亿参数的编码代理模型真的让人眼前一亮！它不仅实现了接近顶尖水平的编码性能，更厉害的是速度达到了惊人的950 tokens/秒，直接把Haiku 4.5和Sonnet 4.5这些竞争对手甩在了身后。这背后是Cerebras的推理优化技术在做支撑，让模型运行效率大幅提升。训练过程也相当硬核，他们动用了数千个GB200 NVL72芯片集群，还开发了专门的otterlink虚拟机管理程序，在数万个并发沙箱环境中进行强化学习训练。有意思的是，这种在高保真模拟环境中进行大规模强化学习微调的做法，在Cursor的Composer-1模型上也能看到，看来这确实是开发先进编码代理工具的新趋势了。虽然目前只能通过他们的Windsurf编辑器使用，基础模型细节也还没公开，但这种工程实践上的突破确实为软件工程AI的发展指明了方向。

17.Harrison Chase Endorses LangChain Middleware for Effective Agents（Harrison Chase(@hwchase17)）

LangChain创始人Harrison Chase最近在推特上公开点赞了中间件技术对AI代理的重要性！他特别提到V1.0版本中create_agent结合中间件的功能，这真是个聪明的设计——它能自动控制上下文长度，精准路由工具调用，还能清理掉旧的结果。这样一来，AI代理不仅变得更简单易用，可靠性也大大提升。Chase的认可让我们看到，中间件在管理复杂AI操作时扮演着关键角色，对正在构建高级AI应用的开发者来说，这绝对是值得关注的技术突破。

18.MiniMax M2 & Agent: Ingenious in Simplicity（Simon Willison’s Weblog）

MiniMax M2这款开源模型真的让人眼前一亮！它在智能体应用场景中表现特别出色，人工分析给出的智能分数直接冲到了开源模型榜首，尤其是在工具使用和指令遵循方面能力超强。更棒的是它的架构设计很巧妙，只有10B活跃参数和230GB权重，这意味着我们可以在Mac Studio这样的消费级硬件上本地运行，大大降低了使用门槛。MiniMax还贴心地提供了与Anthropic兼容的API，开发者可以直接用现有的工具链来接入，11月7日前免费试用，之后定价也很有竞争力。Simon Willison甚至为他的LLM工具开发了专用插件，通过SVG生成示例展示了实际集成效果，看得出来这确实是个实用又强大的工具。

19.Build Hour: AgentKit（OpenAI）

OpenAI 这次推出的 AgentKit 真是让人眼前一亮！它把复杂的智能体开发变得像搭积木一样简单，通过可视化界面就能设计工作流，还能管理版本和连接各种工具。最棒的是 ChatKit 让部署的智能体界面可以完全按品牌风格定制，用户体验直接拉满。更让人安心的是 Evals 功能，能测试每个环节、优化提示词，确保智能体在实际使用中稳定可靠。现在开发团队都在转向评估驱动开发，从一开始就用真实数据测试，这样出来的智能体性能强多了。无论是客户支持还是内部工具，AgentKit 都能大幅缩短开发周期，让复杂的多智能体系统变得触手可及。

20.Composer: Building a fast frontier model with RL（Simon Willison’s Weblog）

Cursor刚刚发布了Composer-1这个号称速度提升4倍的智能编码模型，确实让人眼前一亮！它采用混合专家架构，专门针对软件工程场景通过强化学习进行训练，能够处理长上下文代码生成。更厉害的是他们自研的训练基础设施，结合PyTorch和Ray在数千个GPU上实现高效训练。不过有个小遗憾，模型的基础来源一直是个谜，团队对是否基于开源模型微调始终避而不谈，这种透明度问题确实让人对模型的实际能力有些疑虑。

21.DeepAgents 0.2 Released with Backend Abstraction for Flexible Filesystem Swapping（LangChain(@LangChainAI)）

LangChain刚刚发布了DeepAgents 0.2版本，这个开源的多模型代理框架带来了一个很实用的新功能——后端抽象。现在开发者可以轻松切换代理使用的文件系统了，无论是本地系统、远程虚拟机还是数据库存储，都能灵活适配。这意味着构建AI代理时不再受限于单一存储方案，可以根据实际需求选择最适合的后端，让整个系统更具适应性和扩展性。对于正在开发复杂AI应用的朋友来说，这个功能应该能大大简化系统架构设计的工作量。

22.Deep Agents 0.2 Released with Flexible Backend Abstraction（Harrison Chase(@hwchase17)）

太棒了！LangChain创始人Harrison Chase刚刚宣布Deep Agents 0.2版本正式发布，这次带来了一个超实用的新功能——后端抽象。这意味着你现在可以自由切换底层文件系统了，无论是本地存储、数据库还是远程虚拟机都能轻松支持。随着AI模型越来越强大，能够构建更复杂自主的代理，像Deep Agents这样的工具正变得不可或缺。如果你想知道LangChain为什么如此重视这个领域，不妨去看看他们博客里的详细解读。

23.New DeepLearning.AI Course: Fine-tuning and RL for LLMs Post-training（DeepLearning.AI(@DeepLearningAI)）

DeepLearning.AI和AMD联手推出的这门新课程太及时了！专门教大家如何把预训练好的大语言模型变成真正实用的开发者助手和AI应用。课程内容特别扎实，从LLM生命周期开始，一步步带你掌握微调技术、基于人类反馈的强化学习，还有奖励建模、近端策略优化这些硬核方法。更棒的是，课程不仅讲理论，还覆盖了评估设计、奖励入侵检测、红队测试这些实战环节，连合成数据准备和生产部署管线都考虑到了。如果你正在为如何让LLM更好地落地发愁，这门课绝对值得关注！

24.New LangChain Academy Courses on Building Agents with LangChain 1.0（Harrison Chase(@hwchase17)）

好消息！LangChain 学院刚刚推出了全新的免费课程，专门教大家如何用最新发布的 LangChain 1.0 框架构建 AI 代理。创始人 Harrison Chase 亲自推荐，课程提供 Python 和 TypeScript 两个版本，真是太贴心了。课程内容非常实用，涵盖了新的 create_agent 抽象、模型、消息、记忆和工具这些核心组件，还有定制化中间件和使用 LangSmith 进行调试的技巧。这标志着 LangChain 正在向更专注、更强大的代理开发平台演进，对于想要掌握最新技术的开发者来说，这绝对是及时雨般的学习资源。

25.LangChain Launches Free LangGraph Essentials Course for AI Agents（LangChain(@LangChainAI)）

LangChain 这次真的给开发者送福利了！他们刚刚在 LangChain Academy 上线了免费的 LangGraph Essentials 课程，而且同时支持 Python 和 TypeScript 两种语言。这个课程专门教你如何使用 LangGraph 这个底层编排框架来构建健壮的 AI 代理，正好赶上 LangGraph 发布 1.0 稳定版本。课程内容很实用，从创建代理工作流程开始，到掌握状态、节点和边这些核心组件，再到实现内存和集成人在环交互，基本上把构建复杂 AI 任务需要的技能都覆盖了。对于想要深入 AI 代理开发的朋友来说，这绝对是个不容错过的学习机会！

26.Build beautiful frontends with OpenAI Codex（OpenAI）

哇，这演示简直像变魔术一样！OpenAI Codex现在能直接从白板草图和屏幕截图生成前端代码了，拍张手绘设计图，它就能给你做出带3D地球仪的旅行应用界面，还能自动添加旅行日志仪表板。最厉害的是这AI居然会自己检查代码质量，确保在不同屏幕尺寸和深色模式下都能正常显示，就像有个懂设计的开发者在帮你把关。你可以通过云端服务或本地命令行工具来使用它，特别适合快速制作数据可视化页面或一次性Web应用，感觉前端开发的迭代速度要被彻底改变了！

27.MiniMax-M2 发布！10B 激活，专为高效编码与 Agent 工作流而生（魔搭ModelScope社区）

MiniMax刚刚发布了M2模型，这个基于MoE架构的大模型真的很巧妙——总参数230B但只激活10B，既保证了旗舰级的性能表现，又大幅降低了部署成本。它在编码和智能体任务上特别出色，能处理多个代码文件，还能自动完成编码-运行-调试的完整循环，甚至能调用Shell、浏览器这些复杂工具链协同工作。10B激活参数的设计让反馈循环更快、成本效益更高，特别适合未来那些需要多个智能体协同工作的场景。如果你正在寻找一个既强大又经济实惠的AI助手来提升开发效率，这个模型值得关注。

28.LangChain v1 Introduces Revolutionary Standard Content Blocks for Model Interoperability（Harrison Chase(@hwchase17)）

LangChain v1 这次推出的标准内容块功能确实挺有意思的！创始人 Harrison Chase 在推特上特别强调了这项更新，认为它是个“悄然颠覆性”的互操作层。简单来说，这个功能让开发者能更轻松地在不同 AI 模型提供商之间切换，不用再为适配各种接口头疼了。对于经常需要调整模型配置的 AI 应用来说，这简直是福音啊，不仅提升了开发效率，也让整个应用架构更灵活了。看来 LangChain 在简化 AI 开发流程上又迈进了一大步！

29.LangChain and LangGraph 1.0 Released with New Documentation Site（Harrison Chase(@hwchase17)）

好消息！LangChain和LangGraph终于发布了1.0稳定版本，这对AI开发者来说绝对是个重要里程碑。这两个框架可是构建AI智能体的核心工具，现在达到1.0版本意味着它们更加成熟可靠了。更让人兴奋的是，全新的文档网站也同步上线，学习资源变得更加完善。而且这次发布背后还有更大的故事——LangChain刚刚完成了12.5亿美元估值的新一轮融资，正在打造一个全面的智能体工程平台。看得出来，LangChain在AI开发生态中的地位越来越稳固了，这对整个行业来说都是个积极的信号。

30.MiniMax 和 Kimi 为了“注意力”，隔空交手（硅星人Pro）

最近MiniMax和月之暗面Kimi在AI大模型技术上展开了一场精彩的隔空对话！MiniMax M2选择回归传统的Full Attention机制，他们坦诚地解释了放弃高效注意力方案的原因——工程链路太复杂，评测体系跟不上，基础设施也不够成熟。有意思的是，他们认为随着GPU性能的快速提升，Full Attention的成本问题自然会解决。而另一边，Kimi则带来了全新的Kimi Linear，采用创新的Kimi Delta Attention和Multi-head Latent Attention混合架构，不仅大幅减少了KV Cache，还显著提升了解码吞吐量，甚至声称首次在公平对比下全面超越了Full Attention。这两种技术路线真的很有意思，一个选择等待硬件进步，一个主动寻求架构突破，完美展现了大模型行业在效率与性能之间如何权衡取舍的思考。

31.#288.深入 AI 应用开发：Chip Huyen 揭示成功 AI 产品的秘密与未来趋势（跨国串门儿计划）

这期播客真是干货满满！Chip Huyen 直接点破了AI开发中的常见误区——别光顾着追新模型，真正重要的是和用户好好沟通、把数据质量提上去、优化工作流程。她特别强调后训练才是现在让AI模型脱颖而出的关键，预训练数据都快饱和了，微调和RLHF才是拉开差距的地方。说到RAG，选什么向量数据库其实没那么重要，真正决定效果的是你怎么准备数据——分块、加上下文、重构问答格式，这些细节处理好了，检索效果立马提升。企业内部推广AI工具也挺头疼的，怎么衡量生产力提升是个大难题，而且AI自动化会让部门界限越来越模糊，以后得靠更紧密的跨团队合作才行。听完感觉对AI开发的理解又深了一层，这些实操建议太实用了！

32.#284.Claude Code：Anthropic 工程师如何打造 AI 编程新范式（跨国串门儿计划）

哇，这期播客真的让人大开眼界！Anthropic 的工程师们打造的 Claude Code 完全颠覆了传统编程方式，直接在终端里和 AI 对话就能写代码，效率提升得不是一点半点。最酷的是他们那种内部测试文化，70-80% 的工程师都在日常使用，产品迭代完全是自下而上的，难怪能这么贴合开发者需求。他们把开发经验固化成提示词和子智能体的做法太聪明了，就像滚雪球一样，越用越顺手，代码审查、大规模迁移这些复杂任务都能自动化处理。听着他们描述未来命令行界面会成为 AI 编程的主流形态，甚至展望自主智能体的愿景，感觉编程这件事正在经历一场真正的革命。

33.对李想的第二次 3 小时访谈：智慧是我们和万物的关系（语言即世界language is world）

理想汽车创始人李想在这次深度访谈中分享了太多硬核观点！他把AI工具分成信息、辅助和生产三级，特别强调真正的Agent必须做到知行合一，光说不练可不行。最让人兴奋的是他详细拆解了VLA司机大模型的训练过程——从预训练学世界知识，到后训练模仿驾驶，再到强化训练实现超人驾驶，交通领域将成为VLA最早落地的确定性场景。他还提出了Agent OS的概念，认为这将成为各专业Agent开发的共享平台。理想汽车正在向人工智能终端企业转型，要在软件、硬件和服务三个层面全面创新，应对AGI时代的挑战。整个访谈充满了对技术落地的务实思考，既有战略高度又有实操细节，值得反复品味。

34.118. 对李想的第二次 3 小时访谈：CEO 大模型、MoE、梁文锋、VLA、能量、记忆、对抗人性、亲密关系、人类的智慧（张小珺Jùn｜商业访谈录）

理想汽车CEO李想这次访谈真是干货满满！他直接把AI工具分成了信息、辅助和生产三大类，强调真正的AI生产工具必须能实际行动，像自动驾驶那样实实在在地解决问题。理想汽车正在打造的VLA模型太有意思了，从预训练到后训练再到强化学习，完全模仿人类学习驾驶的过程，目标就是培养出比人类司机更靠谱的‘司机大模型’。李想还预测未来五年会出现Agent OS平台，各行各业都能在上面开发自己的专业Agent，而不是等什么通用AI。最让人印象深刻的是他对组织管理的思考，说要‘对抗人性’坚持最佳实践，用3-7人的小团队保持高效能量。最后他提醒我们，AI终究是工具，人类要发展的是处理万物关系的智慧，让AI帮我们腾出时间去做更有价值的事情。

35.Building the Real-World Infrastructure for AI， with Google， Cisco & a16z（a16z）

哇，这场关于AI基础设施的讨论真的让人大开眼界！原来AI建设的规模比90年代互联网浪潮还要大100倍，需要数万亿美元的投资，这简直是在重塑整个技术世界。现在电力、计算和网络都成了稀缺资源，数据中心都往电力充足的地方跑，不再挤在大城市了，这推动着分布式架构的兴起。专家们强调，要从芯片到应用全面协同设计硬件、软件和网络，才能实现极致效率，这让我觉得未来的计算技术栈会彻底改变。还有，AI工作负载正催生专用芯片的黄金时代，比如TPUs，既要追求每瓦性能，还得考虑地缘政治的影响。网络也面临带宽和突发流量的挑战，需要根本转型来提高能源效率。在企业应用方面，AI在代码迁移、调试这些领域潜力巨大，但关键是公司文化得跟上，不能因为短期局限就放弃，要适应快速迭代的节奏。听说未来12个月内智能代理和多模态模型会有超乎想象的进展，真是让人期待又有点紧张啊！

36.AI 编码效率 x10，Bug 风险也 x10（宝玉的分享）

听说AI能让编程效率飙升10倍，是不是很心动？但亚马逊工程师的实战经验告诉我们，速度翻倍的同时，Bug和系统崩溃的风险也跟着翻了10倍！这可不是危言耸听，编码速度上去了，如果工程实践跟不上，Bug数量就会爆炸式增长。他们提出了一个超实用的‘Agentic Coding’工作流——把AI当成能力超强但没责任感的初级程序员，而我们工程师则要转型做技术主管，专注任务拆解、指令下达和代码审查。更棒的是，AI让过去昂贵的最佳实践变得触手可及：搭建高仿真‘风洞测试’环境从几个月缩短到几天，CI/CD流程升级到分钟级反馈来匹配AI的编码速度，决策沟通系统也要提速10倍以上，减少不必要的会议，鼓励快速试错。说到底，想享受AI的高速红利，就得同步升级我们的工程‘下压力’！

37.AI 编程带来的新变革（宝玉的分享）

哇，这波AI编程带来的效率提升太惊人了！团队通过和AI智能体紧密配合，竟然能实现10倍的代码产出，这简直是开发效率的飞跃。不过别以为这是让AI随便写代码，工程师们还得严格审查每一行代码，确保质量。高速开发也带来了新烦恼，Bug率上升了，传统的测试流程和部署管线都跟不上节奏，团队沟通也变得更复杂。好在文章给出了解决方案，用AI来降低全系统本地测试的成本，大幅加速CICD管线，优化团队实时沟通。最让人兴奋的是，AI让那些过去因为太贵而无法实施的先进工程实践变得可行，整个软件开发流程都在协同进化，这才是真正的机会所在！

38.他用豆包和文心一言们做出的这款游戏，被万人追捧｜对话游戏创作者银河电灯（硅星人Pro）

太有意思了！一个完全没有编程和美术背景的创作者，竟然靠着豆包、文心一言这些AI工具，独立做出了被万人追捧的网页解谜游戏《大学生登山失踪事件》。银河电灯把整个创作过程都拆解出来了——从日本ARG游戏里找灵感，用AI检查剧本逻辑，让Gemini和GitHub Copilot写代码，再让文心一言生成那些特别有中国味的场景图片。他说AI就像个听话的‘制作人’，但真正决定创意上限的永远是人自己。不过AI也不是万能的，它会突然‘忘记’之前写好的代码，或者瞎改一通，生成图片时也搞不清空间关系。他还分享了‘倒推提示词’这种调试技巧，特别实用。最让人期待的是，他说未来AI说不定能直接‘嵌’进游戏里，和玩家实时互动，那可就太酷了！

39.揭秘 Every 六位工程师的 AI“武功秘籍”（宝玉的分享）

Every公司的六位工程师真是把AI用出了新高度！他们运营着四款AI产品和一份日更电子报，全靠深度整合Claude Code、Codex这些AI工具。每个人都有自己独特的工具组合，从需求规划到代码生成、审查再到项目管理，整个开发流程都被AI武装起来了。最厉害的是他们不是盲目依赖AI，而是设置了护栏、分阶段工作，还密切监控AI产出。像Figma MCP这样的多模态工具让AI能直接理解设计文件，配合工程师记录的“学习文档”，确保AI输出的代码既准确又贴合需求。这种策略性的AI使用方式，让这个小团队在复杂项目中游刃有余，效率和质量都得到极大提升，绝对是技术团队在AI时代的优秀范本。

40.Claude Skills Just 10x’d My AI Agents (I’m Shocked)（Greg Isenberg）

哇，Claude Skills 真的让 AI 代理能力飙升了！它通过按需加载相关上下文和执行自定义脚本，创建出确定性的任务工作流程，彻底告别了那些飘忽不定的 AI 输出。最棒的是它解决了‘上下文腐烂’这个老大难问题，只给 AI 喂它真正需要的信息，性能一下子就上去了。看到演示里那些构件构建器、A/B 测试生成器，还有实时把推文转成电子报的转换器，感觉就像给 AI 装上了专业工具箱。这种结构化方法让 AI 变得可靠多了，正好能解决现在很多人因为提示工程不好用而对 AI 失去信心的问题。

41.#277. Block 的 AI 原生基因：揭秘 AI 如何重塑工作与创新（跨国串门儿计划）

Block 这家公司可真是把 AI 玩明白了！他们自己开发的开源 AI 代理 Goose 简直是个神器，工程师们每周能省下 8-10 小时，连非技术同事都能用它来搭建软件，全公司预计能节省 20-25% 的人工时间。更厉害的是，他们发现光有 AI 工具还不够，必须调整组织架构——从 GM 负责制转向职能型结构，让技术团队统一协作，这才是真正实现 AI 原生的关键。未来工程师的工作方式可能会彻底改变，AI 代理 24 小时不停工，主动预判需求甚至推翻重写代码，不过人类的品味和判断依然要牢牢把握方向。还有个挺颠覆的观点：代码质量其实不是产品成功的决定性因素，看看 YouTube 和 Cash App 就知道，真正重要的是解决了用户什么问题。Block 坚持开源，希望这些技术能惠及更多人，这种格局值得点赞。

42.基于大语言模型的 Vibe Coding 综述（宝玉的分享）

最近读到一篇关于Vibe Coding的深度分析，感觉特别有共鸣。这种新兴编程模式把人类开发者、软件项目和AI智能体放在一个三方协作框架里，完全颠覆了传统的编程方式。有意思的是，经验丰富的开发者用这种模式反而可能效率降低，问题不在于AI不够聪明，而是我们缺乏系统性的上下文管理、有效的反馈机制和必要的基础设施支持。文章详细介绍了五种开发模式，从无约束自动化到测试驱动，核心观点是把AI当作真正的‘智能体’来管理，而不是简单的工具。开发者需要学会在关键节点设置检查站，自动化验证流程，但在过程中要给AI足够的自主权。最触动我的是开发者角色的根本转变——从代码生产者变成AI协调者和架构监督者，这意味着我们的核心价值不再是写代码，而是意图表达、上下文管理、系统级调试和质量验证。当然这种转变也带来了不少挑战，比如代码可靠性问题、大规模监管需求，还有我们自身思维模式的调整，现有的教育体系也明显跟不上了。

其他

行业前沿与开源生态，整合行业深度洞察与开源技术动态的复合型主题，技术哲学、AGI讨论、领袖观点

1.万字长文：重构软件工程迷思，搞懂需求与产品思维（腾讯云开发者）

这篇深度文章真的戳中了软件开发的痛点！大家经常在需求讨论中各说各话，就是因为缺乏标准化的表达方式。文章把需求定义为’人+场景’的认知组合，而产品才是真正的解决方案，这个区分太重要了。用户价值原来不只是理性的便宜方便，还有酷爽美这些感性体验，而且总是通过对比产生的。最让人印象深刻的是ToC和ToB产品的根本差异：一个重用户体验和人性洞察，一个强调商业价值和行业知识。技术人员在需求阶段可不能只当执行者，要积极参与讨论、挑战方案合理性，甚至在技术型产品中扮演产品经理角色，这样才能确保项目真正成功落地。

2.Sam， Jakub， and Wojciech on the future of OpenAI with audience Q&A（OpenAI）

OpenAI这次公开讨论真是信息量爆炸！三位核心领导直接摊牌了未来十年的路线图：十年内要实现超人工智能，而且具体到2025年9月就要推出AI研究助理，2028年3月实现全自动AI研究员。最震撼的是那个1.4万亿美元的基础设施投入，要建超过30吉瓦的计算能力，还计划每周生产1吉瓦的“基础设施工厂”，星际之门项目听起来就像科幻成真。他们正在把自己打造成一个AI云平台，强调用户自由和隐私保护，甚至提出“AI特权”这种新概念。组织架构也大调整，非营利基金会监督公共利益公司，重点投入250亿美元用AI来治愈疾病，还要建立AI韧性层来应对生物安全和工作流失风险。问答环节他们直面了模型成瘾、用户控制这些棘手问题，承诺给成年用户更多自由。这波操作看得出来OpenAI是铁了心要推动AI发展，同时也在认真考虑怎么让技术真正造福人类。

3.Y Combinator Shares Path to Great Work（Y Combinator(@ycombinator)）

Y Combinator 这条推文真是戳中了创新的核心！它告诉我们，想要做出真正有影响力的工作，得先在自己选择的领域里深耕，把基础打扎实。然后关键来了——要敏锐地发现那些还没被解决的知识空白和机会点，也就是所谓的‘差距’和‘前沿’。最后就是勇敢地去探索这些充满潜力的方向。这和 YC 帮助创始人打造用户真正需要产品的理念完全契合，不管你是创业者、研究者，还是任何想要创造价值的人，这套方法论都特别实用。

4.Marc Andreessen and Ben Horowitz on the State of AI（a16z）

Marc Andreessen和Ben Horowitz这对投资界大佬在a16z大会上聊AI，观点相当犀利。他们觉得现在纠结AI有没有’真正创造力’其实意义不大，因为AI混合信息的能力已经碾压了99.99%的人类，这种实用价值就足够震撼了。不过他们也清醒地指出，领导力和现实成功需要的是情商、勇气这些人类特质，AI现在还差得远。关于AI泡沫的担忧，他们直接泼了冷水——需求这么旺盛，哪来的泡沫？倒是预测未来会出现人才和芯片的供应过剩，经济规律总会起作用。最让人警醒的是中美AI竞赛的部分，他们说西方虽然在软件创新上领先，但中国在制造和实施上的优势太明显了，特别是到了机器人时代，如果西方继续去工业化，可能会被中国在具身智能领域彻底超越。这场对话既有对AI能力的乐观，也有对竞争格局的深刻忧虑。

5.领投 Ilya 新公司，13 年净 IRR 33%，Greenoaks 的科技投资哲学（海外独角兽）

Greenoaks这家投资机构真的很有意思，他们不是那种广撒网的投资方式，而是专注于寻找未来能进入标普500指数的顶尖企业。创始人Neil Mehta分享的投资哲学很实在——企业必须创造出令人惊叹的客户体验，这才能建立真正的竞争壁垒。他们特别看重创始人的专注度、雄心和执行力，而且愿意在企业低谷期坚定支持优秀创始人。想想Coupang和Carvana的例子，在市场普遍质疑的时候，Greenoaks反而通过深度研究识别出真正的潜力股。他们的团队结构也很特别，拒绝矩阵式管理，保持精简却能实现快速决策。最打动人的是，他们认为今天的投资竞争反而更少，因为真正愿意深度思考、减少噪音的投资者确实稀缺。这种长期主义的投资视角，在当下浮躁的市场环境中显得格外珍贵。

6.#276. Łukasz Kaiser: Transformer 的诞生、推理模型与 AI 的未来（跨国串门儿计划）

这期播客真的让人大开眼界！Transformer模型的共同作者Łukasz Kaiser亲自分享了AI领域最前沿的思考。他详细解释了推理模型这个革命性的新范式——AI不再只是预测下一个词，而是能够进行内部思考、调用外部工具，这样数据需求更少、幻觉更少，还能加速科学发现。最震撼的是他预测未来一两年AI会有’令人害怕’的迅猛进步，但同时也点出了GPU和能源短缺这个现实瓶颈。关于AI对工作的影响，他提出了很务实的观点：不是简单取代工作，而是人机协作的新模式。OpenAI构建有益AGI的愿景听起来很振奋，但我们也确实需要认真思考AI带来的伦理挑战和社会影响。听完这些，你会对AI如何重塑世界有更深刻的理解。