第一时间捕获有价值的信号
⼤家好,Weekly Gradient第 81 期已送达,本期内容深入探讨2026年AI行业核心趋势,涵盖垂直行业应用爆发、世界模型技术突破、AI智能体工程化落地、开源生态竞争以及投资策略转向。分析包括GPT-5.2、GLM系列等模型进展,AgentScope、AutoGLM等工具演进,以及a16z、朱啸虎等行业领袖对AI创业、市场回调与效率提升的深度洞察。
AI 商业化
聚焦AI行业的商业化路径、市场竞争格局和商业模式创新,包含投资趋势、GTM策略、SaaS转型等商业分析
1.GPT-5.2(Simon Willison’s Weblog)
嘿,OpenAI这次真的放大招了!面对谷歌Gemini 3的步步紧逼,他们直接亮出了GPT-5.2和Pro版本,号称是专门为专业知识工作打造的最强系列。最让人惊讶的是,这些模型的知识库竟然更新到了2025年8月,这更新速度简直像坐火箭。虽然价格涨了不少,特别是Pro版,但性能提升确实惊人——GDPval测试达到了70.9%,ARC-AGI-2也有52.9%。更夸张的是,Pro版在ARC-AGI-1任务上的效率比一年前提升了390倍,这背后的技术优化肯定不简单。还有个亮点是视觉能力的大幅增强,OCR识别和图像生成都变得更准更细,以后处理图表和界面应该会顺手很多。现在可以通过OpenAI的界面、Codex工具和新API来用这些模型了,感觉专业领域的AI应用又要迎来一波升级潮。
2.124. 年终回顾【站在 2025 年之外】和戴雨森聊 2026 年预期、The Year of R、回调、我们如何下注(张小珺Jùn|商业访谈录)
真格基金戴雨森在播客里聊得挺实在的,他复盘了2025年AI行业的发展,说模型能力确实进步很大,特别是中国公司在开源生态里追得很快。但更值得关注的是他对2026年的判断——他称之为“回报与研究之年”,意思是大家不能再光砸钱搞模型了,得开始看实际回报,同时研究上也得有新突破才行。他还提到AI Agent已经开始落地,但离完全自主还远着呢,现在真正跑出来的反而是那些帮你提升效率的C端工具。戴雨森特别提醒,模型公司光靠API服务可能不够,得自己下场做应用或者在垂直领域建护城河。最后他泼了盆冷水,说行业可能有泡沫,2026年市场说不定会回调,创业者得准备好应对高质量增长的压力。整体听下来,既有对技术进展的肯定,也有对商业现实的冷静提醒,挺有启发的。
3.喝点 VC|a16z 专访百亿美金 AI 语音独角兽 11Labs CEO :首要之务是深入行业内部,花时间理解他们的核心诉求与激励机制(Z Potentials)
a16z 这次专访了 AI 语音独角兽 ElevenLabs 的 CEO Mati Stanizewski,聊得特别实在。这家公司最让人佩服的是,他们能让 5-10 人的小团队完全自主决策,产品迭代快得惊人,这在 AI 领域简直是超能力。他们还在全球招顶尖人才,搞扁平化、没头衔的管理,员工可以身兼多职,这种模式真的挺酷的。更关键的是,Mati 分享了他们怎么从服务个人创作者成功转向企业级市场,秘诀就是深入行业内部,真正理解客户的痛点和激励机制。他们通过声音市场、授权合作这些方式,让 AI 语音技术在配音、音乐这些创意产业里落地,同时保护各方权益。最后他还提醒,公司大了以后,激励机制设计特别重要,得小心别让团队行为跑偏。整篇专访干货满满,既有实战经验,又有深度思考,值得细读。
4.123. 对 ONE2X 创始人王冠 3 小时访谈:生成系统、没有中间商赚差价、平台的权力分配(张小珺Jùn|商业访谈录)
ONE2X创始人王冠在访谈中分享了他对AI浪潮的深刻洞察,核心观点直击要害:数据才是AI智能的根基,决定了模型能力的上限。他把AI发展分为三个阶段,特别强调产品内生数据是应用层创业成功的关键——通过设计新的语言体系和环境,产生独有的高质量数据,这才是真正的产品壁垒。他选择AI视频生成作为创业方向,不仅因为视频的商业价值高、技术可控,更预见到AI将让视频创作像发朋友圈一样简单,彻底改变内容生态。最颠覆的是,他认为未来的AI公司将是生成系统公司,直接连接生产与消费,消除中间商赚差价,让消费者获得个性化内容,创作者则从“生产者”变成“表达者”,平台权力向用户端倾斜。这背后,产品经理的角色也被放大,既要定义模型能力,又要优化工作流释放价值。听着就让人兴奋,这不仅是技术演进,更是一场商业和权力结构的重塑!
5.a16z 年度预测:2026 年,AI 创业的新机会都在垂直行业,AI 产品会走向定制化(Founder Park)
a16z对2026年AI行业的预测挺有意思的,他们觉得AI要彻底变天了。不再是简单的效率工具,而是会像空气一样渗透到各行各业,从工厂生产线到个人生活,整个思考模式都会被重塑。最值得关注的是,真正的创业机会不在硅谷那些科技公司扎堆的地方,反而藏在物流、医疗、金融这些传统行业里,那里有大量杂乱的非结构化数据等着AI去处理。消费级产品也在悄悄转型,以前是帮你完成任务,现在要变成懂你心思的伙伴,这样才能留住用户。企业软件更是要大变样,传统的数据库系统地位会下降,取而代之的是能自主执行工作流的智能体,交互界面变得动态又主动。感觉未来几年,谁能把AI和具体行业场景结合得深,谁就能抓住最大的市场蛋糕。
6.He Built a $3B+ Company. This is his next BIG IDEA.(a16z)
嘿,读到一篇超有启发的访谈!Thumbtack和Athena创始人Jonathan Swanson聊了他如何把授权玩成生产力核武器。很多人总觉得“自己做更快”,结果把自己困在琐事里,他却从白宫实习时就学会了靠行政助理解放时间——现在更猛,直接搞AI助理来民主化这套玩法。从每月20块的ChatGPT到专业服务,不同预算都能开始把任务丢出去,专注真正重要的事。他还分享了怎么从“按任务授权”进化到“按算法授权”:把偏好和流程写成清晰SOP,让助理像执行代码一样自主工作,效率直接拉满。当然,光靠工具不够,Swanson特别强调创始人的心理韧性——公司出问题、招聘翻车时,你得学会对杂事说“不”,甚至搞个“人生董事会”来管理关键关系,才能一直“留在牌桌上”。最后,他的野心是打造一个融合人类同理心和AI效率的助理系统,帮所有创始人打破时间枷锁,把野心撑到更大。如果你也老觉得时间不够用,或者好奇AI怎么真正改变工作方式,这篇绝对值得细读。
7.快手正悄悄地把可灵做成一个世界模型(硅星人Pro)
快手的可灵视频生成工具,野心可不止是做做特效那么简单。他们正悄悄布局一个更宏大的目标——打造能理解物理世界的“世界模型”。虽然现在产品看起来像个AI影视创作助手,但背后那堆密集的科研论文,比如研究导航模式、提升空间动态感知,都在指向一个方向:让模型真正学会推演世界变化,而不只是画像素。这背后藏着快手真正的商业算盘。影视工具的市场天花板有限,但要是模型能实时理解物理规律、与人或环境交互,那价值就大了去了——具身智能、自动驾驶、游戏引擎,这些才是未来可能爆发的蓝海。当然,路还长着呢,最大的坎儿就是实时性。现在生成一段5秒视频还得等两分钟,这哪够“交互”啊?不过,快手已经在琢磨怎么压缩上下文、优化架构,试图让模型从“离线渲染器”变成能即时反应的智能体。看来,这场从视频生成迈向世界模型的竞赛,快手是铁了心要押注到底了。
8.122. 朱啸虎现实主义故事的第三次连载:人工智能的盛筵与泡泡(张小珺Jùn|商业访谈录)
朱啸虎这期播客聊得挺实在,直接给当前火热的 AI 领域泼了盆冷水,但又不是那种纯粹的悲观。他判断至少未来三年内,AI 产业还不会形成泡沫,那些唱衰的声音更像是为未来的爆发做准备。有意思的是,他发现 OpenAI 已经悄悄变了,不再只盯着遥不可及的通用人工智能,而是开始拼命做应用,搞群聊、做 POS 系统,目标很明确——抢用户、抢时间,想成为下一个超级入口。他还特别看好咱们中国,觉得在数据中心和开源生态上有独特优势,甚至大胆预测未来 5 到 10 年,中国 AI 产业有可能超越美国。对于想投钱或者创业的朋友,他的建议很直接:别去挤那些巨头扎堆的热门赛道了,机会藏在那些又苦又累的垂直领域里,比如 AI 玩具、洗船机器人这些,大厂看不上,但做好了就是一片蓝海。这背后其实是个残酷的现实:AI 时代,创业公司的生存空间被挤压得更厉害了,必须得更聪明、更聚焦,才能找到自己的活路。
9.Khosla 继 OpenAI 后的最大赌注,General Intuition 凭 38 亿个游戏高光片段做世界模型(海外独角兽)
最近看到一家叫 General Intuition 的初创公司,他们做的事情挺有意思的。简单来说,他们从游戏高光剪辑平台 Medal 那儿拿到了 38 亿个游戏短视频片段,这些可不是随便录的,都是玩家们打出来的精彩瞬间,还同步记录了当时的操作数据。他们就用这些数据来训练一个能理解物理世界“直觉”的 AI 模型。这个模型和咱们熟悉的 ChatGPT 那种处理文字和逻辑的大语言模型不一样,它专门负责理解物理世界的连续变化和因果关系,比如一个球扔出去会怎么飞,门怎么开。他们发现,用消费级的显卡就能跑这种复杂的模型,成本一下子降下来了,而且还能直接在玩家的电脑上运行,不用老往云端传数据,延迟低,反应快。更厉害的是,这个 AI 学人类玩家学得特别像,操作很细腻,甚至能在视野被挡住的时候,还能准确判断目标在哪,说明它真的理解了物体不会凭空消失这个物理概念。他们的商业计划也很清晰,先从游戏行业入手,比如做个 AI 替补玩家或者智能游戏控制器;然后扩展到自动驾驶的模拟训练,用游戏数据来预训练模型,能省下大量真实路测的成本和风险;最终目标是让 AI 能驱动现实世界里 80% 的基础物理交互,成为未来机器人时代的智能标准。感觉他们是在下一盘大棋,想把 AI 从屏幕后面带到咱们身边的物理世界里来。
10.YC F25 Demo Day:83 个 AI 项目完整盘点(硅星人Pro)
最近YC的F25批次Demo Day简直太震撼了,156家公司里竟然有83家都是AI驱动的,占比超过一半!这可不是简单的AI热潮,而是标志着AI已经彻底从单一赛道变成了各行各业的底层能力,成了创业项目的默认前提。你看,AI Agent的基础设施正在快速成熟,从记忆层到安全认证再到可观测性,整个技术栈都完善起来了,为下一代智能系统打下了坚实基础。更让人兴奋的是,AI不再只是聊天助手,而是变成了能自主完成任务的“数字员工”,在IT支持、法律合规、医疗账单这些垂直领域大显身手,24小时在线提升效率。开发者工具依然是最大热点,AI编码助手和无代码平台持续火爆,而且超过80%的AI公司都采用了PLG策略,通过免费试用和快速部署来加速市场拓展。不过竞争也越来越激烈,同质化产品不少,未来的创新点得转向行业深度、价值链位置和自动化程度,创业者得有深厚的产业经验才能脱颖而出。
11.#352.AI 时代的财富密码:四年十亿营收,不玩硅谷规则,Surge AI 创始人揭示 AI 发展的真相与未来(跨国串门儿计划)
这期播客聊得太有料了!Surge AI 的创始人 Edwin Chen 直接开炮,把硅谷那套烧钱扩张、追逐估值的玩法批了个遍。人家公司四年做到十亿营收,团队不到百人,全靠自有资金,这效率简直颠覆认知。他反复强调,AI 模型想真正厉害,光堆数据没用,关键得靠高质量数据和人类专家的“品味”来定义好坏。现在很多 AI 公司为了刷排行榜或者互动率,把模型优化成了“垃圾内容生成器”,完全跑偏了。Edwin 还提到强化学习环境这个新思路,让 AI 在模拟场景里学习完整过程,而不是只看结果,这更接近人类的学习方式。他认为 AGI 还得等上几十年,创业者别老想着短期套现,应该沉下心做点真正解决大问题的产品。听完感觉,AI 行业确实需要更多这种清醒的声音,别光顾着热闹,忘了初心。
AI 产品设计
探索AI原生产品的设计范式与用户体验革新,强调产品哲学、交互模式、Agent设计等
1.PayPal 黑帮成员下场重新创业:融资 2000 万美元,要用 AI Agent 干掉 Slack(深思圈)
PayPal黑帮成员David Sacks带着他的新项目Glue杀回来了,直接瞄准了Slack和Teams这些老牌协作工具。Glue最酷的地方在于,它把传统的频道模式彻底颠覆了,改用“线程”作为协作的基本单位,每个线程都是独立的对话,可以精准发送给需要的人,再也不用在几十个频道里大海捞针了。更厉害的是,Glue把AI Agent深度集成进来,让它像一个真正的团队成员一样,能理解上下文、跨应用访问数据,主动帮你总结信息、回答问题,甚至推荐专家。背后支撑这一切的是Model Context Protocol(MCP),这个协议让AI能安全地连接35+个应用,实现工作流自动化。Glue还特别强调数据隐私,承诺不用客户数据训练模型,这和Slack之前的争议形成了鲜明对比。他们的终极目标是让AI从“需要提问”走向“主动参与”,让协作变得更智能、更自然。这波操作,看起来是要重新定义企业协作的未来啊。
2.OpenAI Begins Public Rollout of GPT-5.2(OpenAI(@OpenAI))
嘿,OpenAI这次真的放大招了!GPT-5.2正式全面推出,这可是他们旗舰AI模型的新一代版本。虽然推文里只给了个官网链接让大家自己去挖细节,但明摆着这是一次重量级更新。据说这次会带来不少增强功能,肯定比之前的版本更聪明、更好用。作为AI圈的重磅消息,这波更新值得咱们好好关注一下,看看OpenAI又给AI产品设定了什么新标杆。
3.GLM-ASR 开源,智谱 AI 输入法发布(智谱)
智谱AI这次动作不小,直接把语音识别和大模型能力打包进了一个桌面输入法里。他们不仅开源了GLM-ASR系列模型,包括云端和端侧两个版本,还推出了基于这些模型的智谱AI输入法。最吸引人的是,这个输入法不只是把语音转成文字那么简单,它能让用户直接用语音指令完成翻译、改写、情绪转化甚至写代码这些复杂任务。想象一下,在电脑前说句话就能搞定一堆工作,这交互方式确实挺酷的。而且他们还考虑得很周到,支持耳语识别和个性化词汇导入,连开发者和设计师的需求都照顾到了。感觉这产品是想彻底改变我们在PC上的工作方式,让语音成为真正的生产力工具。
4.下一代 AI 交互,会长成什么样子?| 42 章经 AI Newsletter(42章经)
嘿,最近读到一篇挺有意思的讨论,讲的是下一代 AI 交互会变成什么样。文章从创业公司的角度切入,认为个性化软件是 AI 时代最大的机会,但光靠独立开发还不够,平台化才是关键——它能解决信任、集成和分发这些头疼的问题。深度个性化被看作 AI 最厉害的超能力,甚至催生了“软件即内容”这种新玩法。另一个亮点是 AI 语音输入法,它正在从简单的工具进化成潜在的语音操作系统,通过减负、提供上下文、代用户表达,成为用户和 AI 之间最高频的接口,当然也绕不开隐私和权限的挑战。文章还列举了五种优秀的 AI 交互设计,比如参数滑块让控制更量化,反向 Onboarding 减少用户初始投入,善用等待时间优化体验,通过“命名”管理预期,还有视角滤镜提供可复用的思维工具。最后,作者把产品设计比作建筑设计,强调未来的核心是系统思维——产品得像建筑一样,构建能包容矛盾、适应多重时间尺度的结构,用“节奏分层”来平衡快慢层级,保持系统的韧性。整体来看,这不仅是技术层面的探讨,更是在思考如何让 AI 产品更人性化、更可持续。
5.Z Potentials|26 岁连续创业者陈锴杰:Scale Agentic RL 开启模型下半场,但决胜点在于产品 Taste(Z Potentials)
26岁的连续创业者陈锴杰分享了他的AI创业故事,从自动驾驶到智能家居,再到现在的Macaron AI。他坚信AI的下半场在于Scale Agentic RL,但真正决定胜负的是产品的“Taste”。Macaron AI不再只是帮你写邮件,而是让你创建小应用来解决生活中的实际问题,比如管理日程或提醒喝水。它更像一个朋友,主动、有活力,而不是冷冰冰的助理。初期他们关注用户创建了多少应用,未来会更看重这些应用是否真的被用起来、是否值得分享。在巨头环伺的AI市场,陈锴杰认为技术和产品必须紧密协同,才能打造出既有深度又有温度的产品。
6.朱啸虎投资,Refly.AI 黄巍:n8n、扣子太难用,Vibe Workflow 才是更大众的解决方案(Founder Park)
Refly.AI 创始人黄巍聊得挺实在,直接点出 n8n、扣子这些 AI 工作流工具对普通人来说太难上手了。他们做的 Vibe Workflow 想解决的就是这个痛点——把每个节点都设计成智能体,用户用自然语言就能搭出复杂流程,既保留工作流的可控性,又降低使用门槛。有意思的是,他们不光在做工具,还在悄悄收集用户的“思维链行为数据”,说是能推动产品自我进化,甚至未来让 AI 直接帮我们完成物理世界的任务。黄巍还分享了团队怎么招人、产品怎么跟着模型升级迭代,听起来野心不小,但思路挺清晰:AI 越复杂,用户体验越得简单。
7.本科生造火箭,博士做饭搭子:这届奇绩创坛的这 10 个项目,不太讲道理(硅星人Pro)
奇绩创坛这届项目太有意思了,完全不是我们印象中那种追求规模和效率的传统创业。一群顶尖高校的年轻人,有的辍学造火箭,有的用AI做情绪饭搭子,还有的把AI宠物扛在肩上。他们创业的出发点特别个人化,要么是解决自己真实遇到的痛点,要么是把热爱的事情做到极致,甚至就是想突破某个领域的边界。你看那个FoodPal,用AI当你的饭搭子,不只是推荐餐厅,还能陪你聊天解闷;Blinkko做个肩上AI宠物,主打的就是陪伴感。还有两款AI游戏,一个让你改写三国历史,一个模拟人类文明发展,玩的就是深度个性化。这些项目把AI技术用出了人情味,不再是冷冰冰的工具,而是能提供情绪价值、创造沉浸式体验的伙伴。同时,硬科技也没落下,低成本可回收火箭、仿生扑翼机器人这些项目,展示了顶尖的科研实力和前沿技术应用。他们都在非常垂直的细分市场里挖掘机会,比如水下机器人、二次元AI社区,虽然领域小众,但潜力巨大。这波创业者,用技术实现个人热爱,正在悄悄重塑很多行业的玩法。
AI 工程实践
涵盖AI系统技术实现与场景化开发的全流程,包含工程架构、工具链实践、提示工程等核心技术环节
1.AI 研发新范式:基于技术方案全链路生成代码(腾讯技术工程)
腾讯广告审核团队最近分享了一个特别有意思的实践:他们搞出了一套让AI真正能在企业里写代码的方法。现在很多AI编程工具在简单场景还行,但一到复杂的业务系统就掉链子,生成的代码根本没法用。他们的秘诀是把技术方案彻底标准化——不是给人看的文档,而是专门给AI设计的执行模板。比如把代码分成控制器、业务逻辑、持久层这些模块,每个模块都做成清晰的Prompt模板,AI一看就知道该怎么写。更聪明的是,他们还让AI写完代码后自己总结归档,配合内部的CodeBuddy工具链,整个流程变得可控多了。结果挺惊人的:在审核中心这个复杂业务里,AI生成的代码有超过50%能被直接采用,需求覆盖率达到70%以上,所有研发人员都用上了这套系统。这让我觉得,AI编程要真正落地,光有模型能力不够,关键得把人的工程经验和AI的执行方式打通。他们现在正朝着全链路协同的方向探索,虽然还有挑战,但这条路子确实让人看到了AI赋能研发的实在可能性。
2.产品研发 AI 提效实践:PRD 智能体在需求领域的提效探索(阿里云开发者)
阿里云团队最近搞了个挺有意思的探索,他们用 AI 智能体来优化产品研发流程,特别是那个最让人头疼的需求文档环节。传统写 PRD 和做系统分析,经常要反复沟通、容易理解偏差,现在 AI 能自动帮你拆解模块、设计接口,甚至生成代码骨架,效率提升很明显。他们这套系统的核心是多 Agent 协作,不同的小助手各司其职,有的分析需求大纲,有的评估价值,有的画业务流程图,配合起来就能把自然语言输入变成高质量的 PRD。更关键的是用了 RAG 技术,让 AI 能检索公司内部的历史文档和知识库,这样生成的内容更贴合实际业务,不会凭空瞎编。当然现在还有挑战,比如生成速度不够快,模型微调需要高质量数据,但方向挺清晰的,通过持续优化 RAG 链路和增量学习,AI 在产研领域的应用会越来越深入。
3.大厂 P9:为什么大部分程序员成不了架构师?(腾讯云开发者)
最近读到一篇挺有启发的文章,讲的是为什么很多程序员卡在技术岗上不去,成不了架构师。文章说现在AI写代码越来越厉害,但真正理解业务、做架构决策这事儿,机器还真替代不了。关键点在于,程序员和架构师干的活儿本质就不一样——一个追求把事做对,一个得先判断什么事值得做。更扎心的是,学校不教怎么设计架构,公司里能上手的机会也少得可怜,全靠自己摸索。不过文章也给了出路:别光埋头写代码,得主动去学架构方法论,找机会参与设计,甚至自己创造机会去优化现有系统。说到底,想往上走,光有技术深度不够,还得有战略眼光和主动破局的劲儿。
4.SPEC 为什么会失败?(腾讯云开发者)
最近大家都在聊AI怎么帮我们写代码,但你知道吗,光把需求扔给AI可能根本行不通。这篇文章就戳破了SPEC驱动开发里的五个大坑:AI不懂你项目的背景知识,写出来的规约可能跑偏;很多人把AI当甩手掌柜,生成啥就信啥,结果漏洞百出;还有那种想把所有细节都塞进SPEC的过度设计,最后搞得谁也动不了手。更常见的是,需求一变就直接改代码,SPEC成了摆设,项目越做越乱。最要命的是,一赶进度就把SPEC流程扔了,短期好像快了,后面全是返工。文章给的解法特别实在:先定好项目级的指导原则给AI打底,把AI的产出当草稿自己认真审,大需求拆成小块的、可验证的子任务,任何改动必须先更新SPEC,哪怕时间紧也要用SPEC来驱动决策而不是跳过它。说到底,SPEC不是银弹,得和Vibe Coding搭配着用,关键是我们得学会怎么跟AI一起干活,而不是指望它全包了。
5.让 AI Agent 实时生成个性化交互式可视化体验(阿里云开发者)
最近看到一篇挺有意思的文章,讲的是怎么让AI Agent不再只是干巴巴地输出文字,而是能实时生成带图带动画、还能互动的可视化界面。核心思路其实挺巧妙的:先把设计规范转化成AI能懂的“设计大师提示词”,让AI直接生成HTML原型图;然后再把这些高质量的原型压缩成更精简的“运行时提示词”,这样Agent收到数据后就能立刻渲染出动态的前端组件。这招直接把传统的前端开发流程给颠覆了,设计师不用再等程序员慢慢写代码,AI自己就能把活儿干了,效率提升得不是一点半点。文章还详细分享了怎么优化这些生成组件的提示词,比如用正反例教学、避免模型死记硬背、规范图标颜色这些细节,实操性很强。感觉这种玩法特别适合需要个性化展示的C端场景,或者保险这类垂直领域,以后跟AI聊天可能就像在玩一个定制化的小程序了。
6.非专业也能看懂的 AI 大模型工作原理!(腾讯云开发者)
嘿,如果你一直觉得AI大模型像个神秘的黑箱,这篇文章就是为你准备的!它把那些听起来高深莫测的技术原理,掰开揉碎了讲给你听。比如,你输入的文字是怎么变成一堆数字让模型‘看懂’的,模型又是怎么像人一样,通过‘注意力’去理解一句话里不同词之间的关系,而不是机械地处理。文章还特别实在,不仅告诉你模型是怎么一个字一个字‘想’出回答的,还点出了关键限制:模型能‘记住’的对话长度是有限的,对话太长或者任务太复杂,它的表现就可能打折扣。为了解决长文本处理的难题,文章介绍了像RoPE这样的位置编码技术,以及一些外推方法,但也坦诚地指出,处理超长文本对模型来说依然是个挑战。最棒的是,后半部分完全落地,全是干货:怎么在实际应用中管理好上下文长度来提升系统稳定性、怎么优化响应速度(因为耗时和上下文长度可是平方关系!),甚至怎么用多Agent协同来拆解复杂任务。读完你会感觉,那些高大上的技术概念,原来背后都有非常具体的工程考量,而且直接关系到我们能用AI做出什么好东西来。
7.让 AI 智能体拥有像人类的持久记忆:基于 LangGraph 的长短期记忆管理实践指南(腾讯技术工程)
如果你正在构建能真正记住事情的AI助手,这篇文章就是为你准备的。它深入拆解了AI智能体的记忆机制,解释了为什么让AI拥有像人类一样的持久记忆如此关键——这直接决定了交互是否连贯、个性化。文章重点展示了如何在LangGraph框架里落地这套记忆系统:用Checkpointer管理单次对话的短期记忆,确保状态不丢失;用Store实现跨对话共享的长期记忆,还能结合语义搜索,让AI根据概念相似性而非死板的关键词来回忆知识。更棒的是,它详细介绍了修剪、删除、总结等具体策略,帮你巧妙控制传给大模型的对话历史长度,避免上下文窗口爆炸。最后还通过实战案例,演示了如何构建一个融合长短期记忆的多智能体系统。读完你会对AI记忆的工程实现有非常清晰、可操作的认知。
8.大模型开发实战从入门到入坑:动手写一个 MCP Server 去理解 MCP 背后的技术原理(阿里云开发者)
如果你正在捣鼓大模型应用,特别是想让AI调用外部工具或数据,那这篇文章简直是为你量身定做的。它深入浅出地拆解了MCP这个核心协议,它就像是大模型和外部世界沟通的‘标准插座’。文章不仅讲清楚了MCP怎么让Agent开发和工具开发分家,还挖出了它的两大技术老底:用SSE搞实时数据推送,用JSON-RPC 2.0定消息格式。最带劲的是,它手把手带你用Spring Boot WebFlux从零写一个MCP Server,把‘两通道四步骤’的通信生命周期掰开揉碎了讲。看完你不仅能明白原理,还能立刻动手实践,彻底搞懂大模型和业务系统是怎么‘对上暗号’协同工作的。
9.OpenAI are quietly adopting skills, now available in ChatGPT and Codex CLI(Simon Willison’s Weblog)
OpenAI最近悄悄搞了个大动作,在ChatGPT和Codex CLI里塞进了“技能”这个新玩意儿。这可不是小打小闹,它让AI模型能直接调用外部工具,就像给它们装上了瑞士军刀。ChatGPT现在能处理PDF和DOCX文件了,最妙的是处理PDF时会把文档转成PNG图片,让视觉增强型GPT模型看清楚排版和图表,再也不怕格式乱掉了。Codex CLI那边也能从Git仓库安装技能,有人就用它做了个Datasette插件。这种技能机制设计得特别轻巧,就是个文件夹结构,想加新功能分分钟的事。OpenAI这种巨头都开始用这套方法,说明AI和工具结合这条路真的走对了,以后AI能干的事肯定会多到超乎想象。
10.Z-Image Turbo LoRA 训练魔法:如何保持加速生图能力(魔搭ModelScope社区)
如果你正在用 Z-Image Turbo 模型做 LoRA 微调,是不是发现微调后模型原本引以为傲的 8 步极速生图能力就没了?用默认加速配置生成的图变得模糊,只能切回传统配置才能正常出图,这加速特性简直像被“封印”了一样。别急,DiffSynth 团队这次带来了四种训练方案,专门解决这个痛点。他们分析了直接训练导致加速能力丧失的问题,然后给出了从只关注生成质量到兼顾加速能力的多种策略。比如差分 LoRA 训练能在保持 8 步加速的同时降低显存占用,而标准 SFT 训练则更通用但可能牺牲加速。最推荐的是方案 4:先用标准 SFT 流程微调你的模型,然后在推理时加载一个叫 Z-Image-Turbo-DistillPatch 的蒸馏加速 LoRA。这样你既不用改变原有的训练习惯,又能快速恢复模型的加速能力,灵活又高效,简直是开发者的福音。文章里还详细对比了各方案的优缺点和操作步骤,连代码示例都准备好了,就等你来试试了。
11.AgentScope 1.0 全面进化,从原型走向产业落地!(通义大模型)
AgentScope 1.0这次真的来了个大升级,直接从实验室原型冲向了产业落地!它围绕场景、基建和交付三个核心方向全面进化,彻底解决了智能体在企业里“好看不好用”的老大难问题。最让人兴奋的是那些开箱即用的应用,比如能玩转金融交易的EvoTraders、用自然语言就能搞数据工程的Data-Juicer Agent,还有集成的语音交互能力,感觉智能体一下子就在真实业务里活起来了。开发体验也大幅提升,新的Agent Skill系统让你能像搭积木一样动态加载功能,加上AgentScope-Studio这个可视化平台,调试和构建智能体变得直观又高效。为了确保能稳稳地交付给企业,他们推出了白盒化的运行环境和多种沙箱,安全可控性拉满,甚至还贴心地发布了Java版本来拥抱主流技术栈,联合推出的SparkChat专业对话前端更是补上了产品化的最后一环。这波操作,实实在在地把Agentic AI从概念推向了业务前线。
12.智谱多模态开源周收官:四项视频生成核心技术开源(智谱)
智谱GLM这波开源动作真是干货满满!他们一口气放出了四项视频生成的核心技术,直接把影视级角色动画、实时视频对话、多主体生成这些难题的工程方案给开源了。SCAIL框架能生成复杂的人物动作和多人交互场景,RealVideo把视频生成延迟压到两三秒,让AI实时视频聊天不再是幻想。Kaleido专门解决视频里多个角色身份混乱的问题,SSVAE更是把模型训练速度直接提升三倍。这些技术不仅展示了智谱在视频生成领域的深厚积累,也为整个行业提供了实实在在的工具和思路,感觉视频AI的实用化进程又要加速了。
13.OpenAI Teases GPT-5.2 ‘Thinking Evals’(OpenAI(@OpenAI))
OpenAI最近在社交媒体上悄悄放了个大招,虽然只是短短一条推文,但信息量可不小。他们提到了‘GPT-5.2 Thinking evals’这个关键词,这可不是普通的版本更新通知。‘Thinking evals’直译过来就是‘思维评估’,听起来就很有料对吧?这意味着OpenAI正在测试GPT模型的新版本5.2,而且重点不是语言生成这种基础能力,而是更高级的认知功能——比如解决问题、逻辑推理这些真正体现智能的方面。这让我们看到大语言模型正在往更深层次的智能迈进,说不定很快就会有能真正‘思考’的AI模型问世了。虽然推文很短,但配图可能藏着更多线索,整个AI圈都在盯着这个动向呢。
14.从百万流量中提炼Nana Banana Pro提示词写作经验(宝玉(@dotey))
宝玉在二次元AI绘画领域摸爬滚打,用Nana Banana Pro画了几百张图,积累了百万浏览量,现在他把这些实战经验都掏出来了。很多人觉得写提示词特别玄乎,但他用实际案例告诉你,这事儿其实没那么复杂,关键是要掌握方法。如果你对AI绘画感兴趣,或者总觉得自己写的提示词效果不理想,这篇分享绝对能给你带来实实在在的启发,帮你少走弯路。
15.GLM‑TTS 开源:3 秒复刻,情绪万变(智谱)
智谱这次开源的GLM-TTS语音合成系统可太厉害了!它能在短短3秒内就学会你的声音特点,连说话习惯都能模仿得惟妙惟肖,生成的语音自然流畅得就像真人说话一样。更让人惊喜的是,它用了一种叫GRPO的强化学习方法,在发音准确度和情感表达上都达到了开源模型里的顶尖水平,而且只用10万小时数据就能训练出来,比那些动辄需要海量数据的商用模型省多了。想想看,以后电子书朗读能根据情节变换情绪,智能客服能模仿你的声音风格,教育应用还能准确读出各种生僻字,这技术简直是为实际应用量身定做的。最棒的是,模型权重和代码都开源了,还有在线体验入口,想试试的话随时都能上手。
16.GLM-TTS 技术报告:基于多奖励强化学习的可控发音语音合成(智谱)
智谱这次发布的GLM-TTS语音合成系统,可以说是把工业级语音合成推到了一个新高度。它采用了两阶段生成范式,先通过文本到语音单元的自回归建模语义,再用扩散模型重建高保真波形,保证了语音的准确性和连贯性。最让人眼前一亮的是那个多奖励融合强化学习框架,它把发音准确度、音色相似度、情感表达甚至笑声都纳入奖励机制,让合成出来的语音听起来特别自然、有感情,不再是冷冰冰的机器音。对于开发者来说,LoRA精品音色定制简直是福音,只需要微调15%的参数和少量数据,就能快速定制出高质量的专属音色,大大降低了落地成本。系统还能精细控制多音字和生僻字的发音,通过音素级控制和动态词典,确保在教育评测这类高精度场景下也能准确无误。创新的2D-Vocos声码器通过混合高质量歌声数据训练,显著提升了音质和声音类型的适应性。整体来看,GLM-TTS在发音准确度、音色相似度和情感表达上都达到了开源模型的顶尖水平,部分指标甚至接近闭源系统,而且提供了在线体验、API调用和开源模型,真正让这项技术变得触手可及。
17.Useful patterns for building HTML tools(Simon Willison’s Weblog)
最近看到一篇挺有意思的文章,讲的是怎么用最简单的方式构建那些实用的网页小工具。核心思路就是把所有东西——HTML、JavaScript、CSS——都塞进一个文件里,完全不需要复杂的构建步骤,就像以前写个网页那样直接。这种单文件结构特别适合让AI来生成和维护,复制粘贴就能用,部署起来超级方便。文章还分享了一些很实用的技巧,比如用URL参数来保存状态,这样就能生成可以分享的链接;用浏览器的localStorage来安全地存点敏感信息或者大一点的数据。更酷的是,这些小工具还能直接调用外部API,甚至操作本地文件,实现图片处理或者数据下载这些功能。整体感觉就是,在AI的帮助下,用这种轻量级的方式快速做出好用又便携的工具,正在成为一种很高效的开发模式。
18.Claude Opus 4.5 Saves Tokens, White House Boosts AI-Powered Science, Amazon Exposes Nova 2 Pro Checkpoints, and more…(deeplearning.ai)
嘿,这期内容挺有意思的!Anthropic 的 Claude Opus 4.5 现在用更少的分词就能达到同样甚至更好的效果,成本也降了,感觉 AI 模型之间的性能差距正在慢慢缩小。白宫那边搞了个‘创世纪任务’,打算把 AI 和超级计算机结合起来,加速生物技术和材料科学这些关键领域的研究,虽然数据收集可能有点挑战。亚马逊一口气推出了 Nova 2 系列的四个模型,包括 Pro、Lite、Omni 和 Sonic,它们都有多模态能力,还配套了 Nova Forge 和 Nova Act 这些新服务,看来亚马逊是下定决心要在 AI 领域追上来。最让人惊讶的是那个微型递归模型,它参数比大模型少得多,但通过迭代精炼,居然在数独和迷宫这些复杂视觉谜题上表现更出色,这让我们重新思考小模型在某些任务上的潜力。
19.只用 10%的算力,这个团队做到了大厂做不到的事(深思圈)
最近有个团队干了一件挺酷的事,他们只用传统方法10%的GPU资源,就在万亿参数的开源模型上实现了高效的强化学习训练,连NVIDIA和字节跳动都采纳了他们的技术。这背后其实是对当前AI行业的一个反思——大家都在拼命堆算力、做大模型,但做出来的AI就像个静态的“大脑”,部署后就没法从真实交互中学习了,缺乏真正的“心智”。Mind Lab团队提出了“经验智能”的理念,主张AI应该像人类一样通过真实经验来学习和适应。他们为AI构建“心智”设定了四个关键要素:内部模型、价值观、适应机制和社交界面,让AI不仅能理解环境、判断优劣,还能从经验中持续改进。更厉害的是他们开发的Memory Diffusion算法,模仿人类的“智慧遗忘”机制,动态优化上下文窗口,只保留重要信息,解决了传统记忆碎片化和计算成本高的问题。这些技术突破已经落地到Macaron AI产品中,显著提升了Mini-app生成速度,实现了记忆打通和个性化推荐,把AI从工具变成了真正的智能伙伴。
20.Under the hood of Canada Spends with Brendan Samek(Simon Willison’s Weblog)
嘿,最近看到一个超酷的项目叫“加拿大开支”,它正在用技术撬动政府财政数据的黑箱。这个由志愿者驱动的项目,核心是让普通人也能轻松探索加拿大政府的开支明细——想想那些动辄几百万行的复杂数据,现在通过 Datasette 界面就能搜索、筛选,简直是把数据透明化玩出了新高度。更厉害的是,他们居然用上了谷歌的 Gemini 大模型来对付那些最难啃的审计 PDF 报表,传统上这些文件锁在格式里,数据提取费时费力,但 AI 驱动的提取技术不仅高效,还能通过交叉核对会计数字来验证准确性,这招真是既聪明又务实。整个项目不只是技术展示,它实实在在地推动开放政府、公民参与,甚至可能激发创业灵感——毕竟,当合同和财务数据变得可操作,公众监督和问责就有了扎实的基础。如果你对 AI 在工程实践中的落地、开源工具链的应用,或者数据民主化感兴趣,这个故事绝对值得一读。
21.Agent Engineering: A New Discipline(LangChain Blog)
最近大家都在讨论AI智能体,但你知道吗?要让这些聪明的家伙在生产环境里稳定工作,可不是简单写几行代码就能搞定的。传统软件开发那套方法面对不可预测的输入和行为时,简直就像用算盘去算火箭轨道一样力不从心。于是,一个叫“智能体工程”的新学科应运而生,它专门解决如何让LLM赋能的智能体在生产中变得可靠。这个学科的核心是一个循环的生命周期:构建、测试、发布、观察、优化,然后不断重复。有意思的是,发布在这里不是终点,而是学习的一步——因为智能体在发布前根本做不到完美,必须通过观察真实世界的行为来持续改进。更酷的是,智能体工程需要产品、工程和数据科学三个领域的专家联手:产品经理定义范围和塑造行为,工程师搭建基础设施和工具,数据科学家则负责监控和分析性能。他们共同应对LLM智能体带来的独特挑战,比如“每个输入都可能是边缘案例”这种头疼问题。说到底,这不是要创造新的职位,而是让现有团队用新的协作方式来驾驭AI的强大能力,同时确保系统稳定可靠。
22.SteadyDancer 开源:首个实现首帧保留的 I2V 人像动画框架,告别身份漂移!(魔搭ModelScope社区)
最近有个叫SteadyDancer的开源框架火了,它专门解决人像动画里那个让人头疼的身份漂移问题。简单说,就是以前用参考视频生成动画时,人物脸和动作经常对不上,看着特别假。SteadyDancer直接换了个思路,用单张图片就能生成视频,而且第一帧完全保留原图,身份再也不漂移了。它靠的是三个核心技术:条件协调机制让外观和动作完美平衡,协同姿态调制模块处理时空错位,分阶段训练流程还特别省资源。更厉害的是,团队还搞了个新测试基准X-Dance,专门考验模型在复杂场景下的表现。这框架已经在多个测试里碾压现有方法,看来高质量人像动画的门槛要降低了。
23.Jina-VLM:可在笔记本上跑的多语言视觉小模型(Jina AI)
嘿,最近看到一个特别有意思的模型叫Jina-VLM,它是个只有24亿参数的小家伙,但本事可不小。它最厉害的地方是,既能看懂图片,又能用29种语言跟你聊天回答问题,而且在多语言视觉问答任务上达到了顶尖水平。更棒的是,它不需要昂贵的专业显卡,在普通的消费级显卡甚至Macbook上就能跑得挺流畅,这让很多想自己动手试试AI应用的朋友看到了希望。它解决了一个大难题:很多小模型为了增强看图片的能力,往往就忘了怎么好好说话,但Jina-VLM通过一种巧妙的训练方法,既学会了看图,又没丢掉强大的语言和推理能力。它还特别擅长处理高分辨率的图片,比如复杂的PPT或者扫描件,因为它用了一种叫‘注意力池化’的技术,能大幅减少计算量,让处理又快又省资源。感觉这种能在普通电脑上跑、能力又全面的模型,真的为AI走进更多日常场景打开了新的大门。
24.Andrej Karpathy:将LLM视为“模拟器”以优化交互,避免“你”的提问方式(宝玉(@dotey))
嘿,最近看到一篇挺有意思的讨论,讲的是怎么跟大语言模型聊天才能聊出真东西。核心观点来自AI大牛Andrej Karpathy,他建议咱们别把模型当成一个有独立想法的“人”去问“你怎么看”,而是把它看作一个超级强大的“模拟器”。具体怎么做呢?比如你想探讨某个话题,别直接问模型意见,而是引导它模拟这个领域的专家群体会怎么讨论——问问“如果要探讨这个,最合适的一群人会是谁?他们会说些什么?”。这样能激活模型训练数据里高质量的知识分布,让它基于统计规律给出更深入、更精准的回答,而不是简单模仿某个预设的“人格”。说白了,就是破除对模型的神秘感,用对方法让它发挥真正实力。这对经常需要调教模型的朋友来说,简直是实战宝典啊。
25.AutoGLM 开源:每台手机,都可以成为 AI 手机(智谱)
智谱团队把AutoGLM开源了,这项目挺有意思的,它让AI不再只是跟你聊天,而是能像人一样直接操作手机应用。从最初只会乱点屏幕,到现在能精准完成外卖下单、批量处理通知这些任务,背后是他们对手机操作做了抽象,还搞了个Phone Use能力框架。去年11月,AI甚至成功发出了手机红包,算是个里程碑。最新的AutoGLM 2.0更厉害,用上了云手机和强化学习,既解决了AI在不同手机上操作不稳定的问题,又把用户数据安全放在了云端,隐私不用担心了。智谱开源这个,就是想打破大厂对AI手机能力的垄断,让数据和隐私都留在用户手里,给开发者一个公共底座去创新。感觉这波操作挺有格局的,Agent时代真要来了,每台手机都可能变成AI手机。
26.智谱 GLM-4.6V 开源!能看、能想还能执行「百变」任务(魔搭ModelScope社区)
智谱这次开源的 GLM-4.6V 系列可太有意思了!它直接把 Function Call 能力塞进了视觉模型里,让模型不仅能看懂图片,还能根据看到的东西直接调用工具去执行任务,这相当于给 AI 装上了眼睛和手,打通了从感知到行动的完整链路。更厉害的是,它支持 128K 的超长上下文,能一口气分析 150 页文档或者一小时视频,在文档理解和视频处理上简直是降维打击。性能方面也相当能打,9B 的小模型就超越了同规模的竞品,106B 的大模型更是能和参数量翻倍的对手掰手腕。最实在的是,API 调用价格直接砍半,性价比拉满,看来智谱这次是铁了心要让更多开发者用上他们的技术。从智能图文排版到识图购物,再到前端代码复刻,这模型的应用场景多得让人眼花缭乱,感觉又要掀起一波多模态应用开发的热潮了。
27.GLM-4.6V 开源:从看懂图片到自动完成任务(智谱)
智谱这次开源的GLM-4.6V系列真的挺让人兴奋的!它不只是个能看懂图片的模型,而是把视觉理解和实际执行能力打通了——你可以直接给模型一张截图,它就能调用相应的工具完成任务,这种从“看到”到“做到”的闭环设计太实用了。更厉害的是,它的上下文窗口扩展到128k tokens,处理长视频或大量文档都没问题,在多个评测基准上都达到了顶尖水平。最让人惊喜的是价格策略,轻量版完全免费,API调用还降价50%,这明显是想让更多开发者和企业能用上高性能的多模态AI。想想看,从智能图文创作到识图购物,再到前端代码复刻,这个模型的应用场景覆盖得相当全面,感觉多模态AI真的要进入实用阶段了。
28.144: 从「大而强」到「小而强」,密度法则、RL 的 Scaling Law 和智能的分布式未来(晚点聊 LateTalk)
最近听了一期播客,清华大学的两位专家聊了个特别有意思的话题:大模型发展正在从一味追求“大而强”转向“小而强”。他们提出了“密度法则”这个概念,简单说就是怎么用更少的算力和数据,让模型变得更聪明。这可不是简单的压缩,而是从模型架构、数据质量、算法设计到软硬件协同的全面优化。比如用MOE架构、精炼训练数据、建立模型风洞来预测性能,这些方法都在让AI变得更高效。他们还提到强化学习现在面临一些瓶颈,泛化能力还不够理想。最让人兴奋的是未来展望——高密度模型能让AI能力直接跑在你的手机、眼镜上,每个人都能拥有个性化的专属助手,形成一个真正的分布式智能社会。这波效率革命对创业公司特别重要,避免大家盲目堆算力最后陷入资源浪费的困境。
29.在画了几百张 nano banana pro 图片收获了几百万流量之后的一些提示词写作经验(宝玉的分享)
嘿,如果你也玩AI绘图,肯定遇到过那种怎么调提示词都出不来想要效果的抓狂时刻吧?最近看到一篇特别实在的经验分享,作者靠画“nano banana pro”系列图爆火,流量都几百万了,但他没讲什么玄乎的理论,反而说提示词就是个工具,别把它当目的。他的方法挺反直觉的:一开始别纠结专业术语,直接用大白话描述你想画啥,重点是你的审美和判断力。如果效果不行,别自己硬想,直接把图和优化方向扔给Gemini、ChatGPT这些AI,让它们帮你改提示词,多试几个模型,成功率更高。还有个妙招,当你卡壳时,去找张高质量的参考图,让AI分析特征并反向生成提示词,瞬间打开新思路。最实用的是,他把成功的提示词做成了模板,设定几个变量,就能快速套用到不同场景,批量产出系列作品。说白了,这就是把提示词工程变成了一个系统化的设计、测试、优化循环,核心是不断迭代和善用AI能力,而不是死磕那几个关键词。
30.Prompt Claude Opus 4.5 better than 99% of people(Greg Isenberg)
如果你还在用那种模糊不清的指令跟AI聊天,那真是亏大了!Greg Isenberg把Anthropic官方没公开的秘诀整理成了10条黄金法则,专门教你如何把Claude Opus 4.5调教成超级思考伙伴。核心就是别把AI当工具人,得用协作语气跟它对话,明确告诉它你想要什么格式、多长篇幅、甚至扮演什么专家角色。比如让它‘一步一步思考’或者‘批判自己的回答’,这种强力短语能瞬间激活它的高级模式。更妙的是,把复杂任务拆成起草、规划、执行几个阶段,边做边调整,比一次性要完美结果靠谱多了。分享请求背后的原因也很关键——让AI知道你的真实意图,它才能给出真正有用的答案。这些技巧用在写作、研究、教学里,效果立竿见影,赶紧试试吧!
其他
行业前沿与开源生态,整合行业深度洞察与开源技术动态的复合型主题,技术哲学、AGI讨论、领袖观点
1.极致体验无小事:Weex 购物车基础优化实践(阿里云开发者)
手机淘宝购物车团队最近分享了他们从Native架构升级到Weex平台后,如何通过一系列精细化的打磨,把基础体验做到极致。他们遇到的挑战可真不少:安卓暗黑模式适配得针对不同厂商定制策略,还得构建动态框架;上线初期因为热区对齐问题导致业务数据轻微下滑,团队通过数据大盘分析和可视化工具,精准定位到是Weex版本SKU热区范围引发误触,调整后立马恢复正常。视觉方面,他们重建了样式生成规则,优化了皮肤和大促氛围,解决了截断、对比度不足和加载闪动问题,让购物场景更有情感温度。更值得点赞的是,团队还推进了适老化与无障碍改造,放大关键信息、简化操作路径,并针对iPad等大屏设备做了多终端适配,这不仅履行了社会责任,也拓展了用户群体。整个体验治理过程,他们形成了“发现问题-优先级评估-方案落地-验证效果”的闭环,靠舆情驱动、数据驱动和用户视角模拟三大方法论,把体验从“能用”提升到“好用”。最后,文章还提到了未来可能与AI技术结合,构建智能导购助手,展现了前瞻性的思考。
2.#357.乔布斯:创造非凡,活出自我——《Make Something Wonderful》解读(跨国串门儿计划)
这期播客带我们走进了乔布斯的精神世界,不只是那个创造iPhone的天才,更是一个对生命有着深刻思考的哲学家。他坚信产品要“满怀关心和爱意”去创造,把艺术和科技完美融合,这种极致追求让苹果的产品超越了工具本身。乔布斯对团队要求严苛,因为他觉得卓越是一种习惯,只有对自己狠,才能做出真正改变世界的东西。他的人生经历也特别打动人——被自己创立的公司开除后,他没有放弃,反而在NeXT和皮克斯重新站起来,最终王者归来。他提醒我们世界是可塑的,别被现状困住,要敢于想象事物“应有”的样子。招聘顶尖人才、建立真诚的人际关系被他看作超能力,而面对失败,他视之为塑造性格的宝贵过程。最触动我的是他对生命的看法:把死亡当作激励,鼓励我们追随内心直觉,别活在他人的期待里,把热爱的事业当成天职去享受。听完感觉不只是学了几条商业经验,更像上了一堂关于如何活出自我、创造意义的人生课。
3.#356.Huberman Lab: 冥想的科学与实践——定制你的冥想以提升专注、情绪与睡眠(跨国串门儿计划)
这期Huberman Lab播客彻底刷新了我对冥想的认知!原来冥想不是随便找个姿势闭眼就行,而是要根据你当下的状态来定制——如果你容易胡思乱想,就该做专注外部的冥想;如果总被外界干扰,反而要练习关注内在。这种‘对抗’自己弱点的练习才能真正激发大脑的可塑性。最戳中我的是‘走神的大脑是不快乐的大脑’这个研究结论,原来不管想的是开心还是烦恼的事,只要思绪不在当下,幸福感就会下降。播客还分享了超实用的工具:想改善睡眠就用NSDR或瑜伽休息术,它们比传统冥想更能放松身心;还有个酷炫的‘时空桥接冥想’,能训练你在内在感受和外部世界之间灵活切换注意力。最棒的是,冥想不需要很长时间,每天三五分钟,重点是在思绪飘走时一次次温柔地拉回来,每次回归都是大脑在悄悄改变。
4.深度|AI 教母李飞飞:在 AI 时代,信任绝不能外包给机器,它本质上属于人类,存在于个体、社区与社会层面(Z Potentials)
李飞飞这次聊得真挺深的,她认为AI的下一个突破点不再是语言,而是空间智能和世界建模——让AI真正理解并交互于包含视觉、语义、物理动作的多维世界。这不仅是AGI的必经之路,还能为娱乐、设计、医疗、教育带来前所未有的沉浸式创造体验。她还特别强调,空间智能是机器人的“大脑”,完善了感知到行动的闭环,让AI能像人类一样进行三维推理和复杂任务规划。尽管AI作为文明级技术前景广阔,但李飞飞提醒我们,信任绝不能外包给机器,它根植于人类个体、社区和社会的主动构建与治理。最后,她鼓励所有探索者保持“智识上的无畏精神”,勇敢冲向不确定性,因为真正的创造力往往在极限挑战中被激发出来。
5.From Pivot Hell To $1.4 Billion Unicorn(Y Combinator)
PostHog的故事太有启发了!创始人James Hawkins从六个失败想法里爬出来,发现开发者们和自己一样,被分析工具折腾得够呛,干脆做了个自托管开源版本,结果成了14亿美金独角兽。早期被160多家投资机构拒绝,反而让他们更坚定地走自己的路,那句“与众不同比正确更重要”真是说到点子上了。他们玩营销也特别有一套,透明分享运营细节、用幽默感做广告牌,搞“公开构建”拉近和开发者的距离,信任感一下就上来了。最近E轮融资后,他们正全力投入AI,想搞个能自动分析数据、提解决方案的“AI产品经理”,让产品自己跑起来,这野心可真不小。
6.Vol.80|罗永浩的十字路口:做播客学会了克制天分,还能再折腾十几年(开始连接LinkStart)
罗永浩这次聊得挺坦诚的,原来他做播客一开始是为了解决智能硬件项目缺钱的燃眉之急,没想到靠着个人影响力和独特的打法,反而成了个意外成功的项目。他特别强调做播客得“克制天分”,别老想着自己多能说,核心是把嘉宾的价值挖出来,坚持内容纯净,连有偿访谈都拒绝,这在现在动不动就标题党的环境里真是一股清流。他对年轻创业者感情挺复杂,既欣赏他们敢想敢干、资源又好,有时也带点“羡慕嫉妒”,但自己那颗做操作系统级软硬件的心一直没死,还惦记着AI手机的创新。更关键的是,他不想只当个播客主,正筹划搞“罗永浩的十字路口”年度科技大会,想当科技创新的“加速器”,专门去发现和推广优秀的年轻人跟产品,鼓励大家别怕,中国科技出海机会大着呢。
7.Make $$ with SaaS in 2026 (might delete this…)(Greg Isenberg)
嘿,如果你正在做SaaS或者想入局,这篇对话干货可别错过。Greg Isenberg和Rob Hoffman聊了六种2026年还能打的获客策略,全是实打实的案例。比如Kleo用等待列表玩“隐性推销”,53天MRR冲到6.1万美元;TrustMRR更猛,蹭了个病毒推文热度,48小时上线产品,30天赚2.4万美元。还有Teachizy在法国市场打出“100%法国制造”的招牌,MRR做到6.5万美元,证明非英语市场机会真不少。AI搜索这块,Tally优化“替代品”页面,靠ChatGPT推荐把MRR拉到33.8万美元,转化率比传统搜索高好几倍。LocalRank测试个“热力图”功能,第一天就收5千美元,80%订单来自一条观看量不高的YouTube视频。最后MailScale提醒,低价SaaS打广告容易亏,得靠高价产品或者设计“收入阶梯”才能跑通。这些策略核心就一句话:别蛮干,找准时机、渠道和定价,小步快跑验证需求。
8.罗永浩的十字路口:播客、年轻人和 AI 浪潮(Founder Park)
罗永浩最近在极客公园的对话挺坦诚的,他做播客《罗永浩的十字路口》其实是为了给新的AI硬件项目筹钱,用他自己的话说就是“补贴家用”。有意思的是,他在这过程中反而找到了“克制天分”的自洽方式,不争不抢,把舞台留给精英嘉宾。他坚持做视频播客,全平台分发,而且绝不接受付费上节目,哪怕牺牲短期利益也要保证内容的纯粹和独立性。聊到年轻人,罗永浩挺欣赏这一代创业者的高起点和优秀表现,觉得他们赶上了一个好时代,父母也更开明,这都促成了他们的成长。他对AI浪潮特别兴奋,认为这是比工业革命还大的机遇,自己可不想错过,还在执着地探索“AI手机”这类软硬件结合的产品。面对巨头林立的局面,他的策略是选那些“中不溜”的赛道,先积累再发展,同时利用自己的影响力帮硬科技团队被市场看见。整场对话下来,能感受到他对产品的热情和对年轻人的鼓励,那句“不要怕”说得挺有力量的。