Vol.81 2026年AI行业趋势预测：垂直领域、世界模型与智能体工程深度解析

第一时间捕获有价值的信号

⼤家好，Weekly Gradient第 81 期已送达，本期内容深入探讨2026年AI行业核心趋势，涵盖垂直行业应用爆发、世界模型技术突破、AI智能体工程化落地、开源生态竞争以及投资策略转向。分析包括GPT-5.2、GLM系列等模型进展，AgentScope、AutoGLM等工具演进，以及a16z、朱啸虎等行业领袖对AI创业、市场回调与效率提升的深度洞察。

AI 商业化

聚焦AI行业的商业化路径、市场竞争格局和商业模式创新，包含投资趋势、GTM策略、SaaS转型等商业分析

1.GPT-5.2（Simon Willison’s Weblog）

嘿，OpenAI这次真的放大招了！面对谷歌Gemini 3的步步紧逼，他们直接亮出了GPT-5.2和Pro版本，号称是专门为专业知识工作打造的最强系列。最让人惊讶的是，这些模型的知识库竟然更新到了2025年8月，这更新速度简直像坐火箭。虽然价格涨了不少，特别是Pro版，但性能提升确实惊人——GDPval测试达到了70.9%，ARC-AGI-2也有52.9%。更夸张的是，Pro版在ARC-AGI-1任务上的效率比一年前提升了390倍，这背后的技术优化肯定不简单。还有个亮点是视觉能力的大幅增强，OCR识别和图像生成都变得更准更细，以后处理图表和界面应该会顺手很多。现在可以通过OpenAI的界面、Codex工具和新API来用这些模型了，感觉专业领域的AI应用又要迎来一波升级潮。

2.124. 年终回顾【站在 2025 年之外】和戴雨森聊 2026 年预期、The Year of R、回调、我们如何下注（张小珺Jùn｜商业访谈录）

真格基金戴雨森在播客里聊得挺实在的，他复盘了2025年AI行业的发展，说模型能力确实进步很大，特别是中国公司在开源生态里追得很快。但更值得关注的是他对2026年的判断——他称之为“回报与研究之年”，意思是大家不能再光砸钱搞模型了，得开始看实际回报，同时研究上也得有新突破才行。他还提到AI Agent已经开始落地，但离完全自主还远着呢，现在真正跑出来的反而是那些帮你提升效率的C端工具。戴雨森特别提醒，模型公司光靠API服务可能不够，得自己下场做应用或者在垂直领域建护城河。最后他泼了盆冷水，说行业可能有泡沫，2026年市场说不定会回调，创业者得准备好应对高质量增长的压力。整体听下来，既有对技术进展的肯定，也有对商业现实的冷静提醒，挺有启发的。

3.喝点 VC｜a16z 专访百亿美金 AI 语音独角兽 11Labs CEO ：首要之务是深入行业内部，花时间理解他们的核心诉求与激励机制（Z Potentials）

a16z 这次专访了 AI 语音独角兽 ElevenLabs 的 CEO Mati Stanizewski，聊得特别实在。这家公司最让人佩服的是，他们能让 5-10 人的小团队完全自主决策，产品迭代快得惊人，这在 AI 领域简直是超能力。他们还在全球招顶尖人才，搞扁平化、没头衔的管理，员工可以身兼多职，这种模式真的挺酷的。更关键的是，Mati 分享了他们怎么从服务个人创作者成功转向企业级市场，秘诀就是深入行业内部，真正理解客户的痛点和激励机制。他们通过声音市场、授权合作这些方式，让 AI 语音技术在配音、音乐这些创意产业里落地，同时保护各方权益。最后他还提醒，公司大了以后，激励机制设计特别重要，得小心别让团队行为跑偏。整篇专访干货满满，既有实战经验，又有深度思考，值得细读。

4.123. 对 ONE2X 创始人王冠 3 小时访谈：生成系统、没有中间商赚差价、平台的权力分配（张小珺Jùn｜商业访谈录）

ONE2X创始人王冠在访谈中分享了他对AI浪潮的深刻洞察，核心观点直击要害：数据才是AI智能的根基，决定了模型能力的上限。他把AI发展分为三个阶段，特别强调产品内生数据是应用层创业成功的关键——通过设计新的语言体系和环境，产生独有的高质量数据，这才是真正的产品壁垒。他选择AI视频生成作为创业方向，不仅因为视频的商业价值高、技术可控，更预见到AI将让视频创作像发朋友圈一样简单，彻底改变内容生态。最颠覆的是，他认为未来的AI公司将是生成系统公司，直接连接生产与消费，消除中间商赚差价，让消费者获得个性化内容，创作者则从“生产者”变成“表达者”，平台权力向用户端倾斜。这背后，产品经理的角色也被放大，既要定义模型能力，又要优化工作流释放价值。听着就让人兴奋，这不仅是技术演进，更是一场商业和权力结构的重塑！

5.a16z 年度预测：2026 年，AI 创业的新机会都在垂直行业，AI 产品会走向定制化（Founder Park）

a16z对2026年AI行业的预测挺有意思的，他们觉得AI要彻底变天了。不再是简单的效率工具，而是会像空气一样渗透到各行各业，从工厂生产线到个人生活，整个思考模式都会被重塑。最值得关注的是，真正的创业机会不在硅谷那些科技公司扎堆的地方，反而藏在物流、医疗、金融这些传统行业里，那里有大量杂乱的非结构化数据等着AI去处理。消费级产品也在悄悄转型，以前是帮你完成任务，现在要变成懂你心思的伙伴，这样才能留住用户。企业软件更是要大变样，传统的数据库系统地位会下降，取而代之的是能自主执行工作流的智能体，交互界面变得动态又主动。感觉未来几年，谁能把AI和具体行业场景结合得深，谁就能抓住最大的市场蛋糕。

6.He Built a $3B+ Company. This is his next BIG IDEA.（a16z）

嘿，读到一篇超有启发的访谈！Thumbtack和Athena创始人Jonathan Swanson聊了他如何把授权玩成生产力核武器。很多人总觉得“自己做更快”，结果把自己困在琐事里，他却从白宫实习时就学会了靠行政助理解放时间——现在更猛，直接搞AI助理来民主化这套玩法。从每月20块的ChatGPT到专业服务，不同预算都能开始把任务丢出去，专注真正重要的事。他还分享了怎么从“按任务授权”进化到“按算法授权”：把偏好和流程写成清晰SOP，让助理像执行代码一样自主工作，效率直接拉满。当然，光靠工具不够，Swanson特别强调创始人的心理韧性——公司出问题、招聘翻车时，你得学会对杂事说“不”，甚至搞个“人生董事会”来管理关键关系，才能一直“留在牌桌上”。最后，他的野心是打造一个融合人类同理心和AI效率的助理系统，帮所有创始人打破时间枷锁，把野心撑到更大。如果你也老觉得时间不够用，或者好奇AI怎么真正改变工作方式，这篇绝对值得细读。

7.快手正悄悄地把可灵做成一个世界模型（硅星人Pro）

快手的可灵视频生成工具，野心可不止是做做特效那么简单。他们正悄悄布局一个更宏大的目标——打造能理解物理世界的“世界模型”。虽然现在产品看起来像个AI影视创作助手，但背后那堆密集的科研论文，比如研究导航模式、提升空间动态感知，都在指向一个方向：让模型真正学会推演世界变化，而不只是画像素。这背后藏着快手真正的商业算盘。影视工具的市场天花板有限，但要是模型能实时理解物理规律、与人或环境交互，那价值就大了去了——具身智能、自动驾驶、游戏引擎，这些才是未来可能爆发的蓝海。当然，路还长着呢，最大的坎儿就是实时性。现在生成一段5秒视频还得等两分钟，这哪够“交互”啊？不过，快手已经在琢磨怎么压缩上下文、优化架构，试图让模型从“离线渲染器”变成能即时反应的智能体。看来，这场从视频生成迈向世界模型的竞赛，快手是铁了心要押注到底了。

8.122. 朱啸虎现实主义故事的第三次连载：人工智能的盛筵与泡泡（张小珺Jùn｜商业访谈录）

朱啸虎这期播客聊得挺实在，直接给当前火热的 AI 领域泼了盆冷水，但又不是那种纯粹的悲观。他判断至少未来三年内，AI 产业还不会形成泡沫，那些唱衰的声音更像是为未来的爆发做准备。有意思的是，他发现 OpenAI 已经悄悄变了，不再只盯着遥不可及的通用人工智能，而是开始拼命做应用，搞群聊、做 POS 系统，目标很明确——抢用户、抢时间，想成为下一个超级入口。他还特别看好咱们中国，觉得在数据中心和开源生态上有独特优势，甚至大胆预测未来 5 到 10 年，中国 AI 产业有可能超越美国。对于想投钱或者创业的朋友，他的建议很直接：别去挤那些巨头扎堆的热门赛道了，机会藏在那些又苦又累的垂直领域里，比如 AI 玩具、洗船机器人这些，大厂看不上，但做好了就是一片蓝海。这背后其实是个残酷的现实：AI 时代，创业公司的生存空间被挤压得更厉害了，必须得更聪明、更聚焦，才能找到自己的活路。

9.Khosla 继 OpenAI 后的最大赌注，General Intuition 凭 38 亿个游戏高光片段做世界模型（海外独角兽）

最近看到一家叫 General Intuition 的初创公司，他们做的事情挺有意思的。简单来说，他们从游戏高光剪辑平台 Medal 那儿拿到了 38 亿个游戏短视频片段，这些可不是随便录的，都是玩家们打出来的精彩瞬间，还同步记录了当时的操作数据。他们就用这些数据来训练一个能理解物理世界“直觉”的 AI 模型。这个模型和咱们熟悉的 ChatGPT 那种处理文字和逻辑的大语言模型不一样，它专门负责理解物理世界的连续变化和因果关系，比如一个球扔出去会怎么飞，门怎么开。他们发现，用消费级的显卡就能跑这种复杂的模型，成本一下子降下来了，而且还能直接在玩家的电脑上运行，不用老往云端传数据，延迟低，反应快。更厉害的是，这个 AI 学人类玩家学得特别像，操作很细腻，甚至能在视野被挡住的时候，还能准确判断目标在哪，说明它真的理解了物体不会凭空消失这个物理概念。他们的商业计划也很清晰，先从游戏行业入手，比如做个 AI 替补玩家或者智能游戏控制器；然后扩展到自动驾驶的模拟训练，用游戏数据来预训练模型，能省下大量真实路测的成本和风险；最终目标是让 AI 能驱动现实世界里 80% 的基础物理交互，成为未来机器人时代的智能标准。感觉他们是在下一盘大棋，想把 AI 从屏幕后面带到咱们身边的物理世界里来。

10.YC F25 Demo Day：83 个 AI 项目完整盘点（硅星人Pro）

最近YC的F25批次Demo Day简直太震撼了，156家公司里竟然有83家都是AI驱动的，占比超过一半！这可不是简单的AI热潮，而是标志着AI已经彻底从单一赛道变成了各行各业的底层能力，成了创业项目的默认前提。你看，AI Agent的基础设施正在快速成熟，从记忆层到安全认证再到可观测性，整个技术栈都完善起来了，为下一代智能系统打下了坚实基础。更让人兴奋的是，AI不再只是聊天助手，而是变成了能自主完成任务的“数字员工”，在IT支持、法律合规、医疗账单这些垂直领域大显身手，24小时在线提升效率。开发者工具依然是最大热点，AI编码助手和无代码平台持续火爆，而且超过80%的AI公司都采用了PLG策略，通过免费试用和快速部署来加速市场拓展。不过竞争也越来越激烈，同质化产品不少，未来的创新点得转向行业深度、价值链位置和自动化程度，创业者得有深厚的产业经验才能脱颖而出。

11.#352.AI 时代的财富密码：四年十亿营收，不玩硅谷规则，Surge AI 创始人揭示 AI 发展的真相与未来（跨国串门儿计划）

这期播客聊得太有料了！Surge AI 的创始人 Edwin Chen 直接开炮，把硅谷那套烧钱扩张、追逐估值的玩法批了个遍。人家公司四年做到十亿营收，团队不到百人，全靠自有资金，这效率简直颠覆认知。他反复强调，AI 模型想真正厉害，光堆数据没用，关键得靠高质量数据和人类专家的“品味”来定义好坏。现在很多 AI 公司为了刷排行榜或者互动率，把模型优化成了“垃圾内容生成器”，完全跑偏了。Edwin 还提到强化学习环境这个新思路，让 AI 在模拟场景里学习完整过程，而不是只看结果，这更接近人类的学习方式。他认为 AGI 还得等上几十年，创业者别老想着短期套现，应该沉下心做点真正解决大问题的产品。听完感觉，AI 行业确实需要更多这种清醒的声音，别光顾着热闹，忘了初心。

AI 产品设计

探索AI原生产品的设计范式与用户体验革新，强调产品哲学、交互模式、Agent设计等

1.PayPal 黑帮成员下场重新创业：融资 2000 万美元，要用 AI Agent 干掉 Slack（深思圈）

PayPal黑帮成员David Sacks带着他的新项目Glue杀回来了，直接瞄准了Slack和Teams这些老牌协作工具。Glue最酷的地方在于，它把传统的频道模式彻底颠覆了，改用“线程”作为协作的基本单位，每个线程都是独立的对话，可以精准发送给需要的人，再也不用在几十个频道里大海捞针了。更厉害的是，Glue把AI Agent深度集成进来，让它像一个真正的团队成员一样，能理解上下文、跨应用访问数据，主动帮你总结信息、回答问题，甚至推荐专家。背后支撑这一切的是Model Context Protocol（MCP），这个协议让AI能安全地连接35+个应用，实现工作流自动化。Glue还特别强调数据隐私，承诺不用客户数据训练模型，这和Slack之前的争议形成了鲜明对比。他们的终极目标是让AI从“需要提问”走向“主动参与”，让协作变得更智能、更自然。这波操作，看起来是要重新定义企业协作的未来啊。

2.OpenAI Begins Public Rollout of GPT-5.2（OpenAI(@OpenAI)）

嘿，OpenAI这次真的放大招了！GPT-5.2正式全面推出，这可是他们旗舰AI模型的新一代版本。虽然推文里只给了个官网链接让大家自己去挖细节，但明摆着这是一次重量级更新。据说这次会带来不少增强功能，肯定比之前的版本更聪明、更好用。作为AI圈的重磅消息，这波更新值得咱们好好关注一下，看看OpenAI又给AI产品设定了什么新标杆。

3.GLM-ASR 开源，智谱 AI 输入法发布（智谱）

智谱AI这次动作不小，直接把语音识别和大模型能力打包进了一个桌面输入法里。他们不仅开源了GLM-ASR系列模型，包括云端和端侧两个版本，还推出了基于这些模型的智谱AI输入法。最吸引人的是，这个输入法不只是把语音转成文字那么简单，它能让用户直接用语音指令完成翻译、改写、情绪转化甚至写代码这些复杂任务。想象一下，在电脑前说句话就能搞定一堆工作，这交互方式确实挺酷的。而且他们还考虑得很周到，支持耳语识别和个性化词汇导入，连开发者和设计师的需求都照顾到了。感觉这产品是想彻底改变我们在PC上的工作方式，让语音成为真正的生产力工具。

4.下一代 AI 交互，会长成什么样子？| 42 章经 AI Newsletter（42章经）

嘿，最近读到一篇挺有意思的讨论，讲的是下一代 AI 交互会变成什么样。文章从创业公司的角度切入，认为个性化软件是 AI 时代最大的机会，但光靠独立开发还不够，平台化才是关键——它能解决信任、集成和分发这些头疼的问题。深度个性化被看作 AI 最厉害的超能力，甚至催生了“软件即内容”这种新玩法。另一个亮点是 AI 语音输入法，它正在从简单的工具进化成潜在的语音操作系统，通过减负、提供上下文、代用户表达，成为用户和 AI 之间最高频的接口，当然也绕不开隐私和权限的挑战。文章还列举了五种优秀的 AI 交互设计，比如参数滑块让控制更量化，反向 Onboarding 减少用户初始投入，善用等待时间优化体验，通过“命名”管理预期，还有视角滤镜提供可复用的思维工具。最后，作者把产品设计比作建筑设计，强调未来的核心是系统思维——产品得像建筑一样，构建能包容矛盾、适应多重时间尺度的结构，用“节奏分层”来平衡快慢层级，保持系统的韧性。整体来看，这不仅是技术层面的探讨，更是在思考如何让 AI 产品更人性化、更可持续。

5.Z Potentials｜26 岁连续创业者陈锴杰：Scale Agentic RL 开启模型下半场，但决胜点在于产品 Taste（Z Potentials）

26岁的连续创业者陈锴杰分享了他的AI创业故事，从自动驾驶到智能家居，再到现在的Macaron AI。他坚信AI的下半场在于Scale Agentic RL，但真正决定胜负的是产品的“Taste”。Macaron AI不再只是帮你写邮件，而是让你创建小应用来解决生活中的实际问题，比如管理日程或提醒喝水。它更像一个朋友，主动、有活力，而不是冷冰冰的助理。初期他们关注用户创建了多少应用，未来会更看重这些应用是否真的被用起来、是否值得分享。在巨头环伺的AI市场，陈锴杰认为技术和产品必须紧密协同，才能打造出既有深度又有温度的产品。

6.朱啸虎投资，Refly.AI 黄巍：n8n、扣子太难用，Vibe Workflow 才是更大众的解决方案（Founder Park）

Refly.AI 创始人黄巍聊得挺实在，直接点出 n8n、扣子这些 AI 工作流工具对普通人来说太难上手了。他们做的 Vibe Workflow 想解决的就是这个痛点——把每个节点都设计成智能体，用户用自然语言就能搭出复杂流程，既保留工作流的可控性，又降低使用门槛。有意思的是，他们不光在做工具，还在悄悄收集用户的“思维链行为数据”，说是能推动产品自我进化，甚至未来让 AI 直接帮我们完成物理世界的任务。黄巍还分享了团队怎么招人、产品怎么跟着模型升级迭代，听起来野心不小，但思路挺清晰：AI 越复杂，用户体验越得简单。

7.本科生造火箭，博士做饭搭子：这届奇绩创坛的这 10 个项目，不太讲道理（硅星人Pro）

奇绩创坛这届项目太有意思了，完全不是我们印象中那种追求规模和效率的传统创业。一群顶尖高校的年轻人，有的辍学造火箭，有的用AI做情绪饭搭子，还有的把AI宠物扛在肩上。他们创业的出发点特别个人化，要么是解决自己真实遇到的痛点，要么是把热爱的事情做到极致，甚至就是想突破某个领域的边界。你看那个FoodPal，用AI当你的饭搭子，不只是推荐餐厅，还能陪你聊天解闷；Blinkko做个肩上AI宠物，主打的就是陪伴感。还有两款AI游戏，一个让你改写三国历史，一个模拟人类文明发展，玩的就是深度个性化。这些项目把AI技术用出了人情味，不再是冷冰冰的工具，而是能提供情绪价值、创造沉浸式体验的伙伴。同时，硬科技也没落下，低成本可回收火箭、仿生扑翼机器人这些项目，展示了顶尖的科研实力和前沿技术应用。他们都在非常垂直的细分市场里挖掘机会，比如水下机器人、二次元AI社区，虽然领域小众，但潜力巨大。这波创业者，用技术实现个人热爱，正在悄悄重塑很多行业的玩法。

AI 工程实践

涵盖AI系统技术实现与场景化开发的全流程，包含工程架构、工具链实践、提示工程等核心技术环节

1.AI 研发新范式：基于技术方案全链路生成代码（腾讯技术工程）

腾讯广告审核团队最近分享了一个特别有意思的实践：他们搞出了一套让AI真正能在企业里写代码的方法。现在很多AI编程工具在简单场景还行，但一到复杂的业务系统就掉链子，生成的代码根本没法用。他们的秘诀是把技术方案彻底标准化——不是给人看的文档，而是专门给AI设计的执行模板。比如把代码分成控制器、业务逻辑、持久层这些模块，每个模块都做成清晰的Prompt模板，AI一看就知道该怎么写。更聪明的是，他们还让AI写完代码后自己总结归档，配合内部的CodeBuddy工具链，整个流程变得可控多了。结果挺惊人的：在审核中心这个复杂业务里，AI生成的代码有超过50%能被直接采用，需求覆盖率达到70%以上，所有研发人员都用上了这套系统。这让我觉得，AI编程要真正落地，光有模型能力不够，关键得把人的工程经验和AI的执行方式打通。他们现在正朝着全链路协同的方向探索，虽然还有挑战，但这条路子确实让人看到了AI赋能研发的实在可能性。

2.产品研发 AI 提效实践：PRD 智能体在需求领域的提效探索（阿里云开发者）

阿里云团队最近搞了个挺有意思的探索，他们用 AI 智能体来优化产品研发流程，特别是那个最让人头疼的需求文档环节。传统写 PRD 和做系统分析，经常要反复沟通、容易理解偏差，现在 AI 能自动帮你拆解模块、设计接口，甚至生成代码骨架，效率提升很明显。他们这套系统的核心是多 Agent 协作，不同的小助手各司其职，有的分析需求大纲，有的评估价值，有的画业务流程图，配合起来就能把自然语言输入变成高质量的 PRD。更关键的是用了 RAG 技术，让 AI 能检索公司内部的历史文档和知识库，这样生成的内容更贴合实际业务，不会凭空瞎编。当然现在还有挑战，比如生成速度不够快，模型微调需要高质量数据，但方向挺清晰的，通过持续优化 RAG 链路和增量学习，AI 在产研领域的应用会越来越深入。

3.大厂 P9：为什么大部分程序员成不了架构师？（腾讯云开发者）

最近读到一篇挺有启发的文章，讲的是为什么很多程序员卡在技术岗上不去，成不了架构师。文章说现在AI写代码越来越厉害，但真正理解业务、做架构决策这事儿，机器还真替代不了。关键点在于，程序员和架构师干的活儿本质就不一样——一个追求把事做对，一个得先判断什么事值得做。更扎心的是，学校不教怎么设计架构，公司里能上手的机会也少得可怜，全靠自己摸索。不过文章也给了出路：别光埋头写代码，得主动去学架构方法论，找机会参与设计，甚至自己创造机会去优化现有系统。说到底，想往上走，光有技术深度不够，还得有战略眼光和主动破局的劲儿。

4.SPEC 为什么会失败？（腾讯云开发者）

最近大家都在聊AI怎么帮我们写代码，但你知道吗，光把需求扔给AI可能根本行不通。这篇文章就戳破了SPEC驱动开发里的五个大坑：AI不懂你项目的背景知识，写出来的规约可能跑偏；很多人把AI当甩手掌柜，生成啥就信啥，结果漏洞百出；还有那种想把所有细节都塞进SPEC的过度设计，最后搞得谁也动不了手。更常见的是，需求一变就直接改代码，SPEC成了摆设，项目越做越乱。最要命的是，一赶进度就把SPEC流程扔了，短期好像快了，后面全是返工。文章给的解法特别实在：先定好项目级的指导原则给AI打底，把AI的产出当草稿自己认真审，大需求拆成小块的、可验证的子任务，任何改动必须先更新SPEC，哪怕时间紧也要用SPEC来驱动决策而不是跳过它。说到底，SPEC不是银弹，得和Vibe Coding搭配着用，关键是我们得学会怎么跟AI一起干活，而不是指望它全包了。

5.让 AI Agent 实时生成个性化交互式可视化体验（阿里云开发者）

最近看到一篇挺有意思的文章，讲的是怎么让AI Agent不再只是干巴巴地输出文字，而是能实时生成带图带动画、还能互动的可视化界面。核心思路其实挺巧妙的：先把设计规范转化成AI能懂的“设计大师提示词”，让AI直接生成HTML原型图；然后再把这些高质量的原型压缩成更精简的“运行时提示词”，这样Agent收到数据后就能立刻渲染出动态的前端组件。这招直接把传统的前端开发流程给颠覆了，设计师不用再等程序员慢慢写代码，AI自己就能把活儿干了，效率提升得不是一点半点。文章还详细分享了怎么优化这些生成组件的提示词，比如用正反例教学、避免模型死记硬背、规范图标颜色这些细节，实操性很强。感觉这种玩法特别适合需要个性化展示的C端场景，或者保险这类垂直领域，以后跟AI聊天可能就像在玩一个定制化的小程序了。

6.非专业也能看懂的 AI 大模型工作原理！（腾讯云开发者）

嘿，如果你一直觉得AI大模型像个神秘的黑箱，这篇文章就是为你准备的！它把那些听起来高深莫测的技术原理，掰开揉碎了讲给你听。比如，你输入的文字是怎么变成一堆数字让模型‘看懂’的，模型又是怎么像人一样，通过‘注意力’去理解一句话里不同词之间的关系，而不是机械地处理。文章还特别实在，不仅告诉你模型是怎么一个字一个字‘想’出回答的，还点出了关键限制：模型能‘记住’的对话长度是有限的，对话太长或者任务太复杂，它的表现就可能打折扣。为了解决长文本处理的难题，文章介绍了像RoPE这样的位置编码技术，以及一些外推方法，但也坦诚地指出，处理超长文本对模型来说依然是个挑战。最棒的是，后半部分完全落地，全是干货：怎么在实际应用中管理好上下文长度来提升系统稳定性、怎么优化响应速度（因为耗时和上下文长度可是平方关系！），甚至怎么用多Agent协同来拆解复杂任务。读完你会感觉，那些高大上的技术概念，原来背后都有非常具体的工程考量，而且直接关系到我们能用AI做出什么好东西来。

7.让 AI 智能体拥有像人类的持久记忆：基于 LangGraph 的长短期记忆管理实践指南（腾讯技术工程）

如果你正在构建能真正记住事情的AI助手，这篇文章就是为你准备的。它深入拆解了AI智能体的记忆机制，解释了为什么让AI拥有像人类一样的持久记忆如此关键——这直接决定了交互是否连贯、个性化。文章重点展示了如何在LangGraph框架里落地这套记忆系统：用Checkpointer管理单次对话的短期记忆，确保状态不丢失；用Store实现跨对话共享的长期记忆，还能结合语义搜索，让AI根据概念相似性而非死板的关键词来回忆知识。更棒的是，它详细介绍了修剪、删除、总结等具体策略，帮你巧妙控制传给大模型的对话历史长度，避免上下文窗口爆炸。最后还通过实战案例，演示了如何构建一个融合长短期记忆的多智能体系统。读完你会对AI记忆的工程实现有非常清晰、可操作的认知。

8.大模型开发实战从入门到入坑：动手写一个 MCP Server 去理解 MCP 背后的技术原理（阿里云开发者）

如果你正在捣鼓大模型应用，特别是想让AI调用外部工具或数据，那这篇文章简直是为你量身定做的。它深入浅出地拆解了MCP这个核心协议，它就像是大模型和外部世界沟通的‘标准插座’。文章不仅讲清楚了MCP怎么让Agent开发和工具开发分家，还挖出了它的两大技术老底：用SSE搞实时数据推送，用JSON-RPC 2.0定消息格式。最带劲的是，它手把手带你用Spring Boot WebFlux从零写一个MCP Server，把‘两通道四步骤’的通信生命周期掰开揉碎了讲。看完你不仅能明白原理，还能立刻动手实践，彻底搞懂大模型和业务系统是怎么‘对上暗号’协同工作的。

9.OpenAI are quietly adopting skills， now available in ChatGPT and Codex CLI（Simon Willison’s Weblog）

OpenAI最近悄悄搞了个大动作，在ChatGPT和Codex CLI里塞进了“技能”这个新玩意儿。这可不是小打小闹，它让AI模型能直接调用外部工具，就像给它们装上了瑞士军刀。ChatGPT现在能处理PDF和DOCX文件了，最妙的是处理PDF时会把文档转成PNG图片，让视觉增强型GPT模型看清楚排版和图表，再也不怕格式乱掉了。Codex CLI那边也能从Git仓库安装技能，有人就用它做了个Datasette插件。这种技能机制设计得特别轻巧，就是个文件夹结构，想加新功能分分钟的事。OpenAI这种巨头都开始用这套方法，说明AI和工具结合这条路真的走对了，以后AI能干的事肯定会多到超乎想象。

10.Z-Image Turbo LoRA 训练魔法：如何保持加速生图能力（魔搭ModelScope社区）

如果你正在用 Z-Image Turbo 模型做 LoRA 微调，是不是发现微调后模型原本引以为傲的 8 步极速生图能力就没了？用默认加速配置生成的图变得模糊，只能切回传统配置才能正常出图，这加速特性简直像被“封印”了一样。别急，DiffSynth 团队这次带来了四种训练方案，专门解决这个痛点。他们分析了直接训练导致加速能力丧失的问题，然后给出了从只关注生成质量到兼顾加速能力的多种策略。比如差分 LoRA 训练能在保持 8 步加速的同时降低显存占用，而标准 SFT 训练则更通用但可能牺牲加速。最推荐的是方案 4：先用标准 SFT 流程微调你的模型，然后在推理时加载一个叫 Z-Image-Turbo-DistillPatch 的蒸馏加速 LoRA。这样你既不用改变原有的训练习惯，又能快速恢复模型的加速能力，灵活又高效，简直是开发者的福音。文章里还详细对比了各方案的优缺点和操作步骤，连代码示例都准备好了，就等你来试试了。

11.AgentScope 1.0 全面进化，从原型走向产业落地！（通义大模型）

AgentScope 1.0这次真的来了个大升级，直接从实验室原型冲向了产业落地！它围绕场景、基建和交付三个核心方向全面进化，彻底解决了智能体在企业里“好看不好用”的老大难问题。最让人兴奋的是那些开箱即用的应用，比如能玩转金融交易的EvoTraders、用自然语言就能搞数据工程的Data-Juicer Agent，还有集成的语音交互能力，感觉智能体一下子就在真实业务里活起来了。开发体验也大幅提升，新的Agent Skill系统让你能像搭积木一样动态加载功能，加上AgentScope-Studio这个可视化平台，调试和构建智能体变得直观又高效。为了确保能稳稳地交付给企业，他们推出了白盒化的运行环境和多种沙箱，安全可控性拉满，甚至还贴心地发布了Java版本来拥抱主流技术栈，联合推出的SparkChat专业对话前端更是补上了产品化的最后一环。这波操作，实实在在地把Agentic AI从概念推向了业务前线。

12.智谱多模态开源周收官：四项视频生成核心技术开源（智谱）

智谱GLM这波开源动作真是干货满满！他们一口气放出了四项视频生成的核心技术，直接把影视级角色动画、实时视频对话、多主体生成这些难题的工程方案给开源了。SCAIL框架能生成复杂的人物动作和多人交互场景，RealVideo把视频生成延迟压到两三秒，让AI实时视频聊天不再是幻想。Kaleido专门解决视频里多个角色身份混乱的问题，SSVAE更是把模型训练速度直接提升三倍。这些技术不仅展示了智谱在视频生成领域的深厚积累，也为整个行业提供了实实在在的工具和思路，感觉视频AI的实用化进程又要加速了。

13.OpenAI Teases GPT-5.2 ‘Thinking Evals’（OpenAI(@OpenAI)）

OpenAI最近在社交媒体上悄悄放了个大招，虽然只是短短一条推文，但信息量可不小。他们提到了‘GPT-5.2 Thinking evals’这个关键词，这可不是普通的版本更新通知。‘Thinking evals’直译过来就是‘思维评估’，听起来就很有料对吧？这意味着OpenAI正在测试GPT模型的新版本5.2，而且重点不是语言生成这种基础能力，而是更高级的认知功能——比如解决问题、逻辑推理这些真正体现智能的方面。这让我们看到大语言模型正在往更深层次的智能迈进，说不定很快就会有能真正‘思考’的AI模型问世了。虽然推文很短，但配图可能藏着更多线索，整个AI圈都在盯着这个动向呢。

14.从百万流量中提炼Nana Banana Pro提示词写作经验（宝玉(@dotey)）

宝玉在二次元AI绘画领域摸爬滚打，用Nana Banana Pro画了几百张图，积累了百万浏览量，现在他把这些实战经验都掏出来了。很多人觉得写提示词特别玄乎，但他用实际案例告诉你，这事儿其实没那么复杂，关键是要掌握方法。如果你对AI绘画感兴趣，或者总觉得自己写的提示词效果不理想，这篇分享绝对能给你带来实实在在的启发，帮你少走弯路。

15.GLM‑TTS 开源：3 秒复刻，情绪万变（智谱）

智谱这次开源的GLM-TTS语音合成系统可太厉害了！它能在短短3秒内就学会你的声音特点，连说话习惯都能模仿得惟妙惟肖，生成的语音自然流畅得就像真人说话一样。更让人惊喜的是，它用了一种叫GRPO的强化学习方法，在发音准确度和情感表达上都达到了开源模型里的顶尖水平，而且只用10万小时数据就能训练出来，比那些动辄需要海量数据的商用模型省多了。想想看，以后电子书朗读能根据情节变换情绪，智能客服能模仿你的声音风格，教育应用还能准确读出各种生僻字，这技术简直是为实际应用量身定做的。最棒的是，模型权重和代码都开源了，还有在线体验入口，想试试的话随时都能上手。

16.GLM-TTS 技术报告：基于多奖励强化学习的可控发音语音合成（智谱）

智谱这次发布的GLM-TTS语音合成系统，可以说是把工业级语音合成推到了一个新高度。它采用了两阶段生成范式，先通过文本到语音单元的自回归建模语义，再用扩散模型重建高保真波形，保证了语音的准确性和连贯性。最让人眼前一亮的是那个多奖励融合强化学习框架，它把发音准确度、音色相似度、情感表达甚至笑声都纳入奖励机制，让合成出来的语音听起来特别自然、有感情，不再是冷冰冰的机器音。对于开发者来说，LoRA精品音色定制简直是福音，只需要微调15%的参数和少量数据，就能快速定制出高质量的专属音色，大大降低了落地成本。系统还能精细控制多音字和生僻字的发音，通过音素级控制和动态词典，确保在教育评测这类高精度场景下也能准确无误。创新的2D-Vocos声码器通过混合高质量歌声数据训练，显著提升了音质和声音类型的适应性。整体来看，GLM-TTS在发音准确度、音色相似度和情感表达上都达到了开源模型的顶尖水平，部分指标甚至接近闭源系统，而且提供了在线体验、API调用和开源模型，真正让这项技术变得触手可及。

17.Useful patterns for building HTML tools（Simon Willison’s Weblog）

最近看到一篇挺有意思的文章，讲的是怎么用最简单的方式构建那些实用的网页小工具。核心思路就是把所有东西——HTML、JavaScript、CSS——都塞进一个文件里，完全不需要复杂的构建步骤，就像以前写个网页那样直接。这种单文件结构特别适合让AI来生成和维护，复制粘贴就能用，部署起来超级方便。文章还分享了一些很实用的技巧，比如用URL参数来保存状态，这样就能生成可以分享的链接；用浏览器的localStorage来安全地存点敏感信息或者大一点的数据。更酷的是，这些小工具还能直接调用外部API，甚至操作本地文件，实现图片处理或者数据下载这些功能。整体感觉就是，在AI的帮助下，用这种轻量级的方式快速做出好用又便携的工具，正在成为一种很高效的开发模式。

18.Claude Opus 4.5 Saves Tokens， White House Boosts AI-Powered Science， Amazon Exposes Nova 2 Pro Checkpoints， and more…（deeplearning.ai）

嘿，这期内容挺有意思的！Anthropic 的 Claude Opus 4.5 现在用更少的分词就能达到同样甚至更好的效果，成本也降了，感觉 AI 模型之间的性能差距正在慢慢缩小。白宫那边搞了个‘创世纪任务’，打算把 AI 和超级计算机结合起来，加速生物技术和材料科学这些关键领域的研究，虽然数据收集可能有点挑战。亚马逊一口气推出了 Nova 2 系列的四个模型，包括 Pro、Lite、Omni 和 Sonic，它们都有多模态能力，还配套了 Nova Forge 和 Nova Act 这些新服务，看来亚马逊是下定决心要在 AI 领域追上来。最让人惊讶的是那个微型递归模型，它参数比大模型少得多，但通过迭代精炼，居然在数独和迷宫这些复杂视觉谜题上表现更出色，这让我们重新思考小模型在某些任务上的潜力。

19.只用 10%的算力，这个团队做到了大厂做不到的事（深思圈）

最近有个团队干了一件挺酷的事，他们只用传统方法10%的GPU资源，就在万亿参数的开源模型上实现了高效的强化学习训练，连NVIDIA和字节跳动都采纳了他们的技术。这背后其实是对当前AI行业的一个反思——大家都在拼命堆算力、做大模型，但做出来的AI就像个静态的“大脑”，部署后就没法从真实交互中学习了，缺乏真正的“心智”。Mind Lab团队提出了“经验智能”的理念，主张AI应该像人类一样通过真实经验来学习和适应。他们为AI构建“心智”设定了四个关键要素：内部模型、价值观、适应机制和社交界面，让AI不仅能理解环境、判断优劣，还能从经验中持续改进。更厉害的是他们开发的Memory Diffusion算法，模仿人类的“智慧遗忘”机制，动态优化上下文窗口，只保留重要信息，解决了传统记忆碎片化和计算成本高的问题。这些技术突破已经落地到Macaron AI产品中，显著提升了Mini-app生成速度，实现了记忆打通和个性化推荐，把AI从工具变成了真正的智能伙伴。

20.Under the hood of Canada Spends with Brendan Samek（Simon Willison’s Weblog）

嘿，最近看到一个超酷的项目叫“加拿大开支”，它正在用技术撬动政府财政数据的黑箱。这个由志愿者驱动的项目，核心是让普通人也能轻松探索加拿大政府的开支明细——想想那些动辄几百万行的复杂数据，现在通过 Datasette 界面就能搜索、筛选，简直是把数据透明化玩出了新高度。更厉害的是，他们居然用上了谷歌的 Gemini 大模型来对付那些最难啃的审计 PDF 报表，传统上这些文件锁在格式里，数据提取费时费力，但 AI 驱动的提取技术不仅高效，还能通过交叉核对会计数字来验证准确性，这招真是既聪明又务实。整个项目不只是技术展示，它实实在在地推动开放政府、公民参与，甚至可能激发创业灵感——毕竟，当合同和财务数据变得可操作，公众监督和问责就有了扎实的基础。如果你对 AI 在工程实践中的落地、开源工具链的应用，或者数据民主化感兴趣，这个故事绝对值得一读。

21.Agent Engineering: A New Discipline（LangChain Blog）

最近大家都在讨论AI智能体，但你知道吗？要让这些聪明的家伙在生产环境里稳定工作，可不是简单写几行代码就能搞定的。传统软件开发那套方法面对不可预测的输入和行为时，简直就像用算盘去算火箭轨道一样力不从心。于是，一个叫“智能体工程”的新学科应运而生，它专门解决如何让LLM赋能的智能体在生产中变得可靠。这个学科的核心是一个循环的生命周期：构建、测试、发布、观察、优化，然后不断重复。有意思的是，发布在这里不是终点，而是学习的一步——因为智能体在发布前根本做不到完美，必须通过观察真实世界的行为来持续改进。更酷的是，智能体工程需要产品、工程和数据科学三个领域的专家联手：产品经理定义范围和塑造行为，工程师搭建基础设施和工具，数据科学家则负责监控和分析性能。他们共同应对LLM智能体带来的独特挑战，比如“每个输入都可能是边缘案例”这种头疼问题。说到底，这不是要创造新的职位，而是让现有团队用新的协作方式来驾驭AI的强大能力，同时确保系统稳定可靠。

22.SteadyDancer 开源：首个实现首帧保留的 I2V 人像动画框架，告别身份漂移！（魔搭ModelScope社区）

最近有个叫SteadyDancer的开源框架火了，它专门解决人像动画里那个让人头疼的身份漂移问题。简单说，就是以前用参考视频生成动画时，人物脸和动作经常对不上，看着特别假。SteadyDancer直接换了个思路，用单张图片就能生成视频，而且第一帧完全保留原图，身份再也不漂移了。它靠的是三个核心技术：条件协调机制让外观和动作完美平衡，协同姿态调制模块处理时空错位，分阶段训练流程还特别省资源。更厉害的是，团队还搞了个新测试基准X-Dance，专门考验模型在复杂场景下的表现。这框架已经在多个测试里碾压现有方法，看来高质量人像动画的门槛要降低了。

23.Jina-VLM：可在笔记本上跑的多语言视觉小模型（Jina AI）

嘿，最近看到一个特别有意思的模型叫Jina-VLM，它是个只有24亿参数的小家伙，但本事可不小。它最厉害的地方是，既能看懂图片，又能用29种语言跟你聊天回答问题，而且在多语言视觉问答任务上达到了顶尖水平。更棒的是，它不需要昂贵的专业显卡，在普通的消费级显卡甚至Macbook上就能跑得挺流畅，这让很多想自己动手试试AI应用的朋友看到了希望。它解决了一个大难题：很多小模型为了增强看图片的能力，往往就忘了怎么好好说话，但Jina-VLM通过一种巧妙的训练方法，既学会了看图，又没丢掉强大的语言和推理能力。它还特别擅长处理高分辨率的图片，比如复杂的PPT或者扫描件，因为它用了一种叫‘注意力池化’的技术，能大幅减少计算量，让处理又快又省资源。感觉这种能在普通电脑上跑、能力又全面的模型，真的为AI走进更多日常场景打开了新的大门。

24.Andrej Karpathy：将LLM视为“模拟器”以优化交互，避免“你”的提问方式（宝玉(@dotey)）

嘿，最近看到一篇挺有意思的讨论，讲的是怎么跟大语言模型聊天才能聊出真东西。核心观点来自AI大牛Andrej Karpathy，他建议咱们别把模型当成一个有独立想法的“人”去问“你怎么看”，而是把它看作一个超级强大的“模拟器”。具体怎么做呢？比如你想探讨某个话题，别直接问模型意见，而是引导它模拟这个领域的专家群体会怎么讨论——问问“如果要探讨这个，最合适的一群人会是谁？他们会说些什么？”。这样能激活模型训练数据里高质量的知识分布，让它基于统计规律给出更深入、更精准的回答，而不是简单模仿某个预设的“人格”。说白了，就是破除对模型的神秘感，用对方法让它发挥真正实力。这对经常需要调教模型的朋友来说，简直是实战宝典啊。

25.AutoGLM 开源：每台手机，都可以成为 AI 手机（智谱）

智谱团队把AutoGLM开源了，这项目挺有意思的，它让AI不再只是跟你聊天，而是能像人一样直接操作手机应用。从最初只会乱点屏幕，到现在能精准完成外卖下单、批量处理通知这些任务，背后是他们对手机操作做了抽象，还搞了个Phone Use能力框架。去年11月，AI甚至成功发出了手机红包，算是个里程碑。最新的AutoGLM 2.0更厉害，用上了云手机和强化学习，既解决了AI在不同手机上操作不稳定的问题，又把用户数据安全放在了云端，隐私不用担心了。智谱开源这个，就是想打破大厂对AI手机能力的垄断，让数据和隐私都留在用户手里，给开发者一个公共底座去创新。感觉这波操作挺有格局的，Agent时代真要来了，每台手机都可能变成AI手机。

26.智谱 GLM-4.6V 开源！能看、能想还能执行「百变」任务（魔搭ModelScope社区）

智谱这次开源的 GLM-4.6V 系列可太有意思了！它直接把 Function Call 能力塞进了视觉模型里，让模型不仅能看懂图片，还能根据看到的东西直接调用工具去执行任务，这相当于给 AI 装上了眼睛和手，打通了从感知到行动的完整链路。更厉害的是，它支持 128K 的超长上下文，能一口气分析 150 页文档或者一小时视频，在文档理解和视频处理上简直是降维打击。性能方面也相当能打，9B 的小模型就超越了同规模的竞品，106B 的大模型更是能和参数量翻倍的对手掰手腕。最实在的是，API 调用价格直接砍半，性价比拉满，看来智谱这次是铁了心要让更多开发者用上他们的技术。从智能图文排版到识图购物，再到前端代码复刻，这模型的应用场景多得让人眼花缭乱，感觉又要掀起一波多模态应用开发的热潮了。

27.GLM-4.6V 开源：从看懂图片到自动完成任务（智谱）

智谱这次开源的GLM-4.6V系列真的挺让人兴奋的！它不只是个能看懂图片的模型，而是把视觉理解和实际执行能力打通了——你可以直接给模型一张截图，它就能调用相应的工具完成任务，这种从“看到”到“做到”的闭环设计太实用了。更厉害的是，它的上下文窗口扩展到128k tokens，处理长视频或大量文档都没问题，在多个评测基准上都达到了顶尖水平。最让人惊喜的是价格策略，轻量版完全免费，API调用还降价50%，这明显是想让更多开发者和企业能用上高性能的多模态AI。想想看，从智能图文创作到识图购物，再到前端代码复刻，这个模型的应用场景覆盖得相当全面，感觉多模态AI真的要进入实用阶段了。

28.144: 从「大而强」到「小而强」，密度法则、RL 的 Scaling Law 和智能的分布式未来（晚点聊 LateTalk）

最近听了一期播客，清华大学的两位专家聊了个特别有意思的话题：大模型发展正在从一味追求“大而强”转向“小而强”。他们提出了“密度法则”这个概念，简单说就是怎么用更少的算力和数据，让模型变得更聪明。这可不是简单的压缩，而是从模型架构、数据质量、算法设计到软硬件协同的全面优化。比如用MOE架构、精炼训练数据、建立模型风洞来预测性能，这些方法都在让AI变得更高效。他们还提到强化学习现在面临一些瓶颈，泛化能力还不够理想。最让人兴奋的是未来展望——高密度模型能让AI能力直接跑在你的手机、眼镜上，每个人都能拥有个性化的专属助手，形成一个真正的分布式智能社会。这波效率革命对创业公司特别重要，避免大家盲目堆算力最后陷入资源浪费的困境。

29.在画了几百张 nano banana pro 图片收获了几百万流量之后的一些提示词写作经验（宝玉的分享）

嘿，如果你也玩AI绘图，肯定遇到过那种怎么调提示词都出不来想要效果的抓狂时刻吧？最近看到一篇特别实在的经验分享，作者靠画“nano banana pro”系列图爆火，流量都几百万了，但他没讲什么玄乎的理论，反而说提示词就是个工具，别把它当目的。他的方法挺反直觉的：一开始别纠结专业术语，直接用大白话描述你想画啥，重点是你的审美和判断力。如果效果不行，别自己硬想，直接把图和优化方向扔给Gemini、ChatGPT这些AI，让它们帮你改提示词，多试几个模型，成功率更高。还有个妙招，当你卡壳时，去找张高质量的参考图，让AI分析特征并反向生成提示词，瞬间打开新思路。最实用的是，他把成功的提示词做成了模板，设定几个变量，就能快速套用到不同场景，批量产出系列作品。说白了，这就是把提示词工程变成了一个系统化的设计、测试、优化循环，核心是不断迭代和善用AI能力，而不是死磕那几个关键词。

30.Prompt Claude Opus 4.5 better than 99% of people（Greg Isenberg）

如果你还在用那种模糊不清的指令跟AI聊天，那真是亏大了！Greg Isenberg把Anthropic官方没公开的秘诀整理成了10条黄金法则，专门教你如何把Claude Opus 4.5调教成超级思考伙伴。核心就是别把AI当工具人，得用协作语气跟它对话，明确告诉它你想要什么格式、多长篇幅、甚至扮演什么专家角色。比如让它‘一步一步思考’或者‘批判自己的回答’，这种强力短语能瞬间激活它的高级模式。更妙的是，把复杂任务拆成起草、规划、执行几个阶段，边做边调整，比一次性要完美结果靠谱多了。分享请求背后的原因也很关键——让AI知道你的真实意图，它才能给出真正有用的答案。这些技巧用在写作、研究、教学里，效果立竿见影，赶紧试试吧！

其他

行业前沿与开源生态，整合行业深度洞察与开源技术动态的复合型主题，技术哲学、AGI讨论、领袖观点

1.极致体验无小事：Weex 购物车基础优化实践（阿里云开发者）

手机淘宝购物车团队最近分享了他们从Native架构升级到Weex平台后，如何通过一系列精细化的打磨，把基础体验做到极致。他们遇到的挑战可真不少：安卓暗黑模式适配得针对不同厂商定制策略，还得构建动态框架；上线初期因为热区对齐问题导致业务数据轻微下滑，团队通过数据大盘分析和可视化工具，精准定位到是Weex版本SKU热区范围引发误触，调整后立马恢复正常。视觉方面，他们重建了样式生成规则，优化了皮肤和大促氛围，解决了截断、对比度不足和加载闪动问题，让购物场景更有情感温度。更值得点赞的是，团队还推进了适老化与无障碍改造，放大关键信息、简化操作路径，并针对iPad等大屏设备做了多终端适配，这不仅履行了社会责任，也拓展了用户群体。整个体验治理过程，他们形成了“发现问题-优先级评估-方案落地-验证效果”的闭环，靠舆情驱动、数据驱动和用户视角模拟三大方法论，把体验从“能用”提升到“好用”。最后，文章还提到了未来可能与AI技术结合，构建智能导购助手，展现了前瞻性的思考。

2.#357.乔布斯：创造非凡，活出自我——《Make Something Wonderful》解读（跨国串门儿计划）

这期播客带我们走进了乔布斯的精神世界，不只是那个创造iPhone的天才，更是一个对生命有着深刻思考的哲学家。他坚信产品要“满怀关心和爱意”去创造，把艺术和科技完美融合，这种极致追求让苹果的产品超越了工具本身。乔布斯对团队要求严苛，因为他觉得卓越是一种习惯，只有对自己狠，才能做出真正改变世界的东西。他的人生经历也特别打动人——被自己创立的公司开除后，他没有放弃，反而在NeXT和皮克斯重新站起来，最终王者归来。他提醒我们世界是可塑的，别被现状困住，要敢于想象事物“应有”的样子。招聘顶尖人才、建立真诚的人际关系被他看作超能力，而面对失败，他视之为塑造性格的宝贵过程。最触动我的是他对生命的看法：把死亡当作激励，鼓励我们追随内心直觉，别活在他人的期待里，把热爱的事业当成天职去享受。听完感觉不只是学了几条商业经验，更像上了一堂关于如何活出自我、创造意义的人生课。

3.#356.Huberman Lab: 冥想的科学与实践——定制你的冥想以提升专注、情绪与睡眠（跨国串门儿计划）

这期Huberman Lab播客彻底刷新了我对冥想的认知！原来冥想不是随便找个姿势闭眼就行，而是要根据你当下的状态来定制——如果你容易胡思乱想，就该做专注外部的冥想；如果总被外界干扰，反而要练习关注内在。这种‘对抗’自己弱点的练习才能真正激发大脑的可塑性。最戳中我的是‘走神的大脑是不快乐的大脑’这个研究结论，原来不管想的是开心还是烦恼的事，只要思绪不在当下，幸福感就会下降。播客还分享了超实用的工具：想改善睡眠就用NSDR或瑜伽休息术，它们比传统冥想更能放松身心；还有个酷炫的‘时空桥接冥想’，能训练你在内在感受和外部世界之间灵活切换注意力。最棒的是，冥想不需要很长时间，每天三五分钟，重点是在思绪飘走时一次次温柔地拉回来，每次回归都是大脑在悄悄改变。

4.深度｜AI 教母李飞飞：在 AI 时代，信任绝不能外包给机器，它本质上属于人类，存在于个体、社区与社会层面（Z Potentials）

李飞飞这次聊得真挺深的，她认为AI的下一个突破点不再是语言，而是空间智能和世界建模——让AI真正理解并交互于包含视觉、语义、物理动作的多维世界。这不仅是AGI的必经之路，还能为娱乐、设计、医疗、教育带来前所未有的沉浸式创造体验。她还特别强调，空间智能是机器人的“大脑”，完善了感知到行动的闭环，让AI能像人类一样进行三维推理和复杂任务规划。尽管AI作为文明级技术前景广阔，但李飞飞提醒我们，信任绝不能外包给机器，它根植于人类个体、社区和社会的主动构建与治理。最后，她鼓励所有探索者保持“智识上的无畏精神”，勇敢冲向不确定性，因为真正的创造力往往在极限挑战中被激发出来。

5.From Pivot Hell To $1.4 Billion Unicorn（Y Combinator）

PostHog的故事太有启发了！创始人James Hawkins从六个失败想法里爬出来，发现开发者们和自己一样，被分析工具折腾得够呛，干脆做了个自托管开源版本，结果成了14亿美金独角兽。早期被160多家投资机构拒绝，反而让他们更坚定地走自己的路，那句“与众不同比正确更重要”真是说到点子上了。他们玩营销也特别有一套，透明分享运营细节、用幽默感做广告牌，搞“公开构建”拉近和开发者的距离，信任感一下就上来了。最近E轮融资后，他们正全力投入AI，想搞个能自动分析数据、提解决方案的“AI产品经理”，让产品自己跑起来，这野心可真不小。

6.Vol.80｜罗永浩的十字路口：做播客学会了克制天分，还能再折腾十几年（开始连接LinkStart）

罗永浩这次聊得挺坦诚的，原来他做播客一开始是为了解决智能硬件项目缺钱的燃眉之急，没想到靠着个人影响力和独特的打法，反而成了个意外成功的项目。他特别强调做播客得“克制天分”，别老想着自己多能说，核心是把嘉宾的价值挖出来，坚持内容纯净，连有偿访谈都拒绝，这在现在动不动就标题党的环境里真是一股清流。他对年轻创业者感情挺复杂，既欣赏他们敢想敢干、资源又好，有时也带点“羡慕嫉妒”，但自己那颗做操作系统级软硬件的心一直没死，还惦记着AI手机的创新。更关键的是，他不想只当个播客主，正筹划搞“罗永浩的十字路口”年度科技大会，想当科技创新的“加速器”，专门去发现和推广优秀的年轻人跟产品，鼓励大家别怕，中国科技出海机会大着呢。

7.Make $$ with SaaS in 2026 (might delete this…)（Greg Isenberg）

嘿，如果你正在做SaaS或者想入局，这篇对话干货可别错过。Greg Isenberg和Rob Hoffman聊了六种2026年还能打的获客策略，全是实打实的案例。比如Kleo用等待列表玩“隐性推销”，53天MRR冲到6.1万美元；TrustMRR更猛，蹭了个病毒推文热度，48小时上线产品，30天赚2.4万美元。还有Teachizy在法国市场打出“100%法国制造”的招牌，MRR做到6.5万美元，证明非英语市场机会真不少。AI搜索这块，Tally优化“替代品”页面，靠ChatGPT推荐把MRR拉到33.8万美元，转化率比传统搜索高好几倍。LocalRank测试个“热力图”功能，第一天就收5千美元，80%订单来自一条观看量不高的YouTube视频。最后MailScale提醒，低价SaaS打广告容易亏，得靠高价产品或者设计“收入阶梯”才能跑通。这些策略核心就一句话：别蛮干，找准时机、渠道和定价，小步快跑验证需求。

8.罗永浩的十字路口：播客、年轻人和 AI 浪潮（Founder Park）

罗永浩最近在极客公园的对话挺坦诚的，他做播客《罗永浩的十字路口》其实是为了给新的AI硬件项目筹钱，用他自己的话说就是“补贴家用”。有意思的是，他在这过程中反而找到了“克制天分”的自洽方式，不争不抢，把舞台留给精英嘉宾。他坚持做视频播客，全平台分发，而且绝不接受付费上节目，哪怕牺牲短期利益也要保证内容的纯粹和独立性。聊到年轻人，罗永浩挺欣赏这一代创业者的高起点和优秀表现，觉得他们赶上了一个好时代，父母也更开明，这都促成了他们的成长。他对AI浪潮特别兴奋，认为这是比工业革命还大的机遇，自己可不想错过，还在执着地探索“AI手机”这类软硬件结合的产品。面对巨头林立的局面，他的策略是选那些“中不溜”的赛道，先积累再发展，同时利用自己的影响力帮硬科技团队被市场看见。整场对话下来，能感受到他对产品的热情和对年轻人的鼓励，那句“不要怕”说得挺有力量的。