跳转到正文
莫尔索随笔
返回

Vol.72 AI医疗平权与Agent技术:京东健康AI医院与多智能体协作解析

预计 33 分钟
AI 周刊

第一时间捕获有价值的信号

⼤家好,Weekly Gradient第 72 期已送达,本期内容深入探讨AI在医疗领域的应用,解析京东健康AI医院如何实现医疗平权,同时分析多智能体协作、垂类Agent发展、上下文工程等前沿技术,涵盖AI原生组织转型、创业策略及可视化工作流与代码编排的权衡。

AI 商业化

聚焦AI行业的商业化路径、市场竞争格局和商业模式创新,包含投资趋势、GTM策略、SaaS转型等商业分析

1.拜托了,AI!帮忙解决「看病难、看病贵」吧|对谈王国鑫:京东健康探索研究院首席科学家(十字路口Crossing)

京东健康探索研究院首席科学家王国鑫这次聊得真透彻!AI在医疗领域可不是小打小闹,它正在从根本上解决看病难、看病贵的老大难问题。京医千询2.0这个医疗大模型进化得相当厉害,用合成数据训练、能看懂影像片子,还能基于医学证据库进行专业推理,感觉就像给医生配了个超级助手。更让人兴奋的是他们打造的AI医院1.0,这可不是简单的在线问诊,而是整合了AI智能体和京东完整的医检诊药生态,想成为大家健康管理的第一入口。AI还能帮医生持续学习最新知识,加速新药研发,从源头上降低医疗成本。王国鑫还分享了垂直大模型成功的秘诀——数据要独特、需求要迫切、商业模式要清晰,这些经验对其他行业也很有启发。医疗AI正在让优质医疗服务变得触手可及,这波技术变革真的让人充满期待!

2.软件行业的范式转变:AI 如何彻底改写游戏规则(深思圈)

最近看到一份关于软件行业变革的深度分析,真是让人震撼!AI 原生公司正在以惊人的速度改写游戏规则——19 人团队一年就能做到 1 亿美元 ARR,这效率是传统 SaaS 的 5-10 倍,增长速度更是快上 2-3 倍。虽然它们烧钱更多,但资本效率反而更高,因为收入是指数级增长的,时间成了最宝贵的资源。市场进入策略也彻底翻转了,售后技术支持变得至关重要,前置部署工程师这类角色激增,未来最成功的公司一定是技术交付能力最强的。AI 领域的资本热潮还在持续,企业不再满足于 AI 的辅助功能,而是转向让 AI 直接做实际工作的 Agent 模式,这波转型真的需要所有从业者重新思考策略了。

3.四家明星 Agent 公司创始人辩论:少谈点“通用”,对大家都好(硅星人Pro)

最近参加了一场特别有意思的圆桌讨论,四家AI Agent公司的创始人坐在一起,聊了聊这个领域最核心的问题。他们一致认为,现在行业里整天争论通用Agent和垂直Agent的定义其实意义不大,真正重要的是找到自己擅长的场景深耕下去。比如Macaron专注生活场景,Flowith搞创作,语核科技做企业生产力,RockFlow专攻投资交易,每家都在自己的领域积累了独特的Knowhow。有意思的是,大家发现大模型其实也在分化,并不是万能的,这反而给垂直Agent创造了发展空间。技术层面,Context Engineering和强化学习是两大流派,各家都在内容解析、上下文管理这些环节下功夫。说到底,Agent的本质就是能帮你把事情搞定,关键还是要从用户需求和业务场景出发来做产品。这场讨论让人感觉,AI Agent行业正在从概念炒作走向务实深耕,挺让人期待的。

4.136: Sora 新世界 & Lovart 4 个月复盘 | 与陈冕聊怎么做垂类 Agent(晚点聊 LateTalk)

这期播客聊得太有意思了!Lovart创始人陈冕分享了Sora发布后的真实体验,这家伙不仅视频生成质量惊人,更厉害的是它的社交属性,Remix共创功能让每个人都能参与创作,感觉未来真的可能成为几十亿人用的虚拟社交平台。Lovart四个月做到20万日活、3000万美元年订阅收入的故事也很震撼,他们定位’创作平权’,让普通人也能轻松做设计。陈冕还谈到中美AI市场认知差异,强调创业者必须保持焦虑感,预测模型演化方向,打造能快速迭代的团队。现在To C市场机会巨大,但窗口期只有3-6个月,得跑得比巨头还快才行。

5.Zapier、Vercel 和 Clay 招聘 AI-Native 人才的六步框架!(随机小分队)

最近看到不少公司在招AI人才时很头疼,不知道怎么判断候选人是不是真的懂AI。这篇文章分享了一个超实用的六步框架,来自Zapier、Vercel这些AI公司的实战经验。他们用Zapier的四级模型把AI技能从“不可接受”到“变革型”分得清清楚楚,这样招人时就能精准匹配岗位需求。面试时还会问一些深度问题,比如候选人怎么用AI重构工作流程、解决过什么难题,这样就能看出是真有AI思维还是只会表面操作。最厉害的是他们会通过真实案例分析和定制化任务,比如让候选人现场构建AI原型或评估AI方案,直接验证动手能力和批判性思维。这套方法确实能帮企业找到那些能用AI创造实际价值的人才,而不是只会纸上谈兵。

6.116. 吴明辉口述 19 年史:漫长的沉浮、痛苦急转、企业级 Agentic Model、现实世界的数值游戏、IPO(张小珺Jùn|商业访谈录)

听完这期播客真的被震撼到了!明略科技创始人吴明辉回顾了19年创业的跌宕起伏,从秒针系统到即将上市,经历了多次生死转型。他特别强调企业级AI正在迎来革命性变化——Agentic Model将重构软件间的协作方式,让企业服务效率大幅提升。最让人印象深刻的是他对私有数据的看法:在通用大模型泛滥的时代,真正能建立竞争壁垒的是那些沉淀在垂直行业的私有数据。他还坦诚分享了从技术理想主义者到成熟经营者的转变过程,2020-2022年的资金链危机让他深刻理解了现金流管理和团队优化的残酷现实。整个对话既有对AI重塑生产关系的深度思考,又有创业路上血泪教训的真诚分享,对企业决策者和AI从业者都很有启发。

7.喝点 VC|a16z 内部复盘:AI 行业不是所有公司都能受益的领域,选对赛道与团队比以往任何时候都重要(Z Potentials)

a16z 这次内部复盘真是戳中要害了!AI 行业根本不是大家想象中那样铁板一块,而是高度碎片化的无数子领域,每个都得用专属策略去打。应用层公司现在可爽了,基础模型砸了那么多钱,它们直接受益,但光靠模型可不行,还得老老实实把传统软件那套核心能力补上。最让人兴奋的是 AI 原生公司,增速简直碾压传统 SaaS,高 ROI 加上没历史包袱,难怪能抢到企业预算。不过投资这块风险真不小,a16z 强调必须避开那些‘不错但不够顶尖’的团队,得押注有明确增长势头的市场领导者,模型领域更是只敢投资金充足、团队顶尖的头部玩家。选对赛道和团队,现在比任何时候都关键啊!

8.Developers as the distribution layer of AGI (OpenAI Dev Day 2025, ft. Sherwin Wu and Christina Huang)(Latent Space)

OpenAI 2025 开发者日真是让人兴奋!ChatGPT 周活用户已经冲到 8 亿,开发者数量也猛增到 400 万,这平台效应太惊人了。他们发布了 GPT-5 Pro 和 Sora-2 这些前沿模型,还贴心地推出了成本优化的迷你版本,让更多开发者能用上强大 AI。最亮眼的是 Apps SDK,基于 MCP 协议,开发者现在可以直接在 ChatGPT 里构建交互式、自适应的个性化应用,还有 React 组件捆绑功能来定制界面,这分发潜力简直无敌。AgentKit 也超实用,一套完整工具简化了复杂 AI 代理的创建和部署,从可视化构建器到优化工具全包了。OpenAI 这波操作明显在强化 AGI 分发平台的角色,通过第三方开发者把 AI 红利铺向全球,生态越来越成熟了,未来可期!

9.#256.谷歌帝国兴衰史(三):创新者的窘境与 AI 时代的求生之路(跨国串门儿计划)

谷歌在AI领域的故事真是跌宕起伏啊!这家科技巨头明明拥有顶尖的AI人才、自研的TPU芯片和完整的技术栈,却因为搜索业务太赚钱而一度犹豫不决,这就是典型的创新者窘境。最让人唏嘘的是,奠定现代AI基石的Transformer架构居然出自谷歌大脑团队,但核心人才却纷纷离职去了竞争对手那里。直到ChatGPT横空出世,谷歌才真正惊醒,紧急合并了DeepMind和Google Brain,推出Gemini模型全力追赶。不过谷歌手里还有两张王牌:坚持了20年的Waymo自动驾驶项目,以及凭借全栈AI能力在云服务市场的独特优势。这不仅是技术竞赛,更是一场关于如何在大公司里保持创新活力的深刻反思。

10.对话真格、蓝驰、锦秋和峰瑞:我们究竟在投什么样的 AI 创业者(硅星人Pro)

最近听了场挺有意思的对话,几位知名投资机构的合伙人和潘乱聊了聊AI创业这件事。发现现在投资圈风向变了,大家不再扎堆投大模型,反而更关注AI应用、智能体和机器人这些落地场景。有意思的是,AI工具确实让个人创业变得更容易了,但投资人普遍觉得真正要做大还是得靠小团队协作。现在投资人挑创业者也不看年龄背景了,更看重你有没有产品感觉、学习速度快不快、是不是真的热爱做这件事。面对大厂竞争,大家都建议别在通用领域硬碰硬,找个垂直赛道深耕,把技术、流程或社区这些非模型优势做扎实。还有个挺实在的建议:别为了融资而融资,关键是要想清楚钱怎么花才能创造价值。说到底,在AI这个快速变化的领域,光有技术不够,还得对用户需求有深刻理解,能快速试错迭代,这样才能在浪潮里站稳脚跟。

AI 产品设计

探索AI原生产品的设计范式与用户体验革新,强调产品哲学、交互模式、Agent设计等

1.LangChain深度解析:为何我们不构建可视化工作流工具(宝玉(@dotey))

LangChain 创始人 Harrison Chase 这次聊了个挺有意思的话题:为什么他们不跟风做可视化工作流工具。他直接点破,现在市面上很多号称无代码的 AI 工具,其实只是把工作流画出来,离真正的智能体还差得远。工作流像按剧本走,可控但死板;智能体才像真人,能自主判断但难预测。更扎心的是,他发现可视化工具并没真的降低门槛——画布上拖来拖去,遇到复杂任务反而更乱。所以 LangChain 选了条不一样的路:高复杂度就用代码编排(比如 LangGraph),低复杂度就做更简单的无代码智能体。说白了,他们不想凑热闹,而是专注让非技术人员也能搞出稳定又高质量的 AI 助手,顺便把 AI 写代码的能力再往上推一把。

2.在双减“废墟”上,用 AI 重启人生 | 对谈连续创业者刘夜:从作业盒子到 Talkit(十字路口Crossing)

读完这篇对谈,真的被刘夜的创业故事打动了!从作业盒子到Talkit,他在双减政策冲击后经历了三年迷茫探索,最终选择用AI重新定义语言学习。最让人兴奋的是,Talkit不是简单的AI对话工具,而是构建了一个完整的3D虚拟世界,让用户像移民到英语国家一样学习语言。大语言模型彻底解决了口语练习的瓶颈,产品设计以‘嘴’为核心,通过Course、Rehearsal和社交三大模块,让开口说英语变得effortless而不是painful。刘夜对创业的理解也很深刻——要追求那些‘毋庸置疑有价值’且‘足够难’的事业,这种坚持在当下浮躁的创业环境中显得格外珍贵。看到AI技术能够如此自然地融入教育场景,让人对未来的学习方式充满期待!

3.Not Another Workflow Builder(LangChain Blog)

最近看到一篇挺有意思的讨论,关于为什么LangChain决定不做可视化工作流构建器。说实话,那些号称低门槛的可视化工具,一旦任务复杂起来,界面就变成一团乱麻的节点和连线,反而让非技术用户更头疼。文章点出了一个关键:工作流和智能体其实是两种不同的思路——工作流追求可预测性但牺牲了自主性,智能体则反过来。未来可能更现实的方向是,简单任务交给无代码智能体搞定,复杂场景还是得靠基于代码的工作流,尤其是现在代码生成能力越来越强,写代码的门槛也在降低。说到底,真正值得琢磨的是怎么让无代码智能体足够可靠,以及怎么提升代码生成模型的能力来支撑更复杂的LLM驱动系统。

4.Harrison Chase’s Critique of Visual Workflow Builders for AI Agents(Harrison Chase(@hwchase17))

LangChain 创始人 Harrison Chase 最近对可视化工作流构建器提出了犀利批评,认为它们在 AI 代理开发中其实并不好用。他点出两大硬伤:一是对普通用户来说操作依然太复杂,远未达到真正的简单易用,需要更直观的无代码方案;二是处理复杂任务时扩展性严重不足,难以应对实际业务场景。这直接挑战了可视化编程在高级 AI 系统中的传统地位,给开发者和产品经理提供了重新思考工具设计方向的重要参考。

5.#255. Figma 创始人 Dylan Field:品味是你的护城河(跨国串门儿计划)

Figma 创始人 Dylan Field 这次聊得真有意思!他分享了 Figma 如何一步步拥抱 AI,从早期的机器学习探索到 GPT-3 带来的顿悟,再到推出 Figma Make 这样的 AI 设计工具。现在非技术人员也能快速把想法变成可部署的产品了,连数据处理都不用写代码,这简直是把创意落地的门槛降到了新低。他还提到自然语言会成为未来设计的核心交互方式,不过现在只是 AI 交互的“MS-DOS 时代”,以后肯定会有更直观、更有创造力的玩法。设计和代码的界限越来越模糊,Figma Make 和 Code Connect 正在搭建桥梁。最打动我的是他强调在 AI 时代设计反而成了更重要的差异化优势——当软件创造速度飞快时,品味和工艺才是让你脱颖而出的关键。他还提醒创业者要有反常规的独特见解,别盲目跟风 AI 领域的“快时尚”,真正有价值的是社区和持续创造。

AI 工程实践

涵盖AI系统技术实现与场景化开发的全流程,包含工程架构、工具链实践、提示工程等核心技术环节

1.提效 40%?揭秘 AI 驱动的支付方式“一键接入”系统(阿里云开发者)

跨境支付接入竟然能提效40%?这套AI驱动的系统真的做到了!它用Qwen Coder大模型和MCP工具链,把从需求输入到上线准备的全流程都自动化了,彻底告别了传统人工经验驱动的低效模式。最厉害的是它的精细化Prompt设计,通过角色定义、结构化输入、工具封装这些策略,成功克服了大模型的幻觉问题。系统还借鉴了多智能体协作的思路,把复杂任务拆解成原子化步骤,让不同专家Agent各司其职,既降低了模型负担又提高了稳定性。规范化文档体系在这里扮演了关键角色,把文档当作元数据与代码语义链接,为AI提供了充分的上下文支持。这套方案不仅解决了实际业务痛点,还总结出了提高AI编码采纳率的宝贵经验,确实让人眼前一亮!

2.别让故障复盘流于形式:用 AI 挖掘每一次“跌倒”的价值(阿里云开发者)

传统故障复盘总是让人头疼,人工分析太主观,信息又零散,最后往往变成走过场。现在阿里云用大语言模型打造了一套智能复盘系统,能自动聚合故障数据、一键生成报告,还能像聊天一样深入挖掘原因和改进措施。这套系统背后的技术很扎实,包括多Agent协作、智能Memory管理、RAG知识增强,还有专门针对业务价值的评测机制。最棒的是,它把故障复盘从‘事后诸葛亮’变成了‘风险先知’,让技术支持、研发甚至普通用户都能从中受益,真正把每次故障变成提升系统稳定性的宝贵经验。

3.图像理解与生成统一模型——前沿模型架构理解(魔搭ModelScope社区)

最近读到一篇关于图像AI模型的深度分析,真的让人眼前一亮!现在大家都在探索如何让AI既能看懂图像又能生成图像,这篇文章把当前主流的统一模型架构梳理得特别清晰。原来这些模型主要分为四种技术路线:纯自回归、AR+扩散串联、AR+扩散并联,还有单一模型同时处理两种任务,每种路线在图像编码和生成方式上都有各自的优势和短板。特别有意思的是发现图像理解任务更喜欢语义编码器,而图像生成则依赖分布建模来保证质量,这解释了为什么有些模型生成的图片细节那么丰富。不过最让人深思的是,这些模型到底能不能真正实现理解和生成的互相促进?数据准备的质量似乎成了决定成败的关键因素。读完感觉对AI图像技术的发展脉络理解得更透彻了!

4.AI长文润色:问题在于方法而非模型能力(宝玉(@dotey))

很多人抱怨 AI 润色长文效果差,其实问题真不在模型能力上!关键在于使用方法——一次性把整篇文章丢给 AI,指令还模模糊糊的,结果就是内容被大幅压缩、细节全丢了。但换个思路,把文章分成小块、明确告诉 AI 要做什么、一步步迭代优化,甚至先让 AI 扩展内容再精炼,效果立马不一样:细节保留完整,输出可控,质量直接起飞。说到底,得把 AI 当成需要清晰指导的‘项目经理’或‘导演’,用好精细化流程才能真正发挥它的潜力。

5.GPT-5长文润色高效工作流:分块处理与迭代优化(宝玉(@dotey))

如果你还在把整篇文章直接丢给GPT-5润色,结果却只得到一堆提纲和摘要,那这套工作流绝对值得一试!它把长文拆成小块,通过清晰化、叙事扩写、统一风格等多轮迭代,让AI真正理解你的内容脉络。先扩写再细修的思路特别实用,还附带了总控指令和合稿终检的模板,帮你避开常见坑点。关键是别把AI当一键生成工具,而是当成能跟你反复打磨的合作者,这样润色效果才会真正提升。

6.LlamaIndex看好基于代码的编排与代码智能体,挑战低代码工具(宝玉(@dotey))

LlamaIndex创始人Jerry Liu分享了一个挺有意思的观点:虽然低代码工具在简单场景下很方便,但真正要搞定制化、连接自有数据源或者构建长期运行的智能体,还是得靠基于代码的编排和代码智能体。他们正在打造核心工具,帮助开发者围绕自己的数据创建高级工作流,还提供了状态管理、任务检查点和人机协作这些实用功能。更棒的是,他们已经和Claude Code、Cursor这些顶级代码智能体工具整合了,最新Alpha版本还能一键部署端到端智能体,感觉开发门槛真的在降低呢!

7.Ling-1T,智渊、思简(魔搭ModelScope社区)

哇,Ling Team这次真的放大招了!他们推出的Ling-1T是个万亿参数的开源大模型,在复杂推理和代码生成这些高难度任务上直接冲到了业界顶尖水平。最让人兴奋的是他们用FP8混合精度训练这么大规模的模型,不仅训练速度提升了15%以上,还大大节省了显存,这在以前简直不敢想。他们还搞了个很聪明的LPO策略,把句子作为基本单元来优化强化学习,解决了传统方法语义碎片化的问题,让模型训练更稳定、泛化能力更强。虽然现在GQA架构的推理成本还有点高,智能体能力也需要继续打磨,但看到这种在工程实践上的突破,真的让人对AI的未来充满期待!

8.Jina Reranker v3: 全新“列式”重排器,0.6B 参数刷新文档检索 SOTA(Jina AI)

Jina AI 刚刚发布的第三代重排器真是让人眼前一亮!这个只有6亿参数的小家伙,居然在多项多语言检索基准测试中打败了参数量大6倍的对手,刷新了当前最佳表现。它的秘密武器是创新的’列式’架构和’后发先至’交互机制——能够在一个上下文窗口内同时处理查询和所有文档,通过全局上下文深度交互实现更精准的排序。最厉害的是,这个模型在18-26种语言上都保持了稳定优秀的性能,而且提供了GGUF、MLX格式和API接口,让开发者可以轻松在各种硬件环境中部署使用。对于需要高效文档检索的场景来说,这绝对是个值得关注的技术突破!

9.OpenAI DevDay:从提示词到上下文工程,重塑AI编程未来(宝玉(@dotey))

最近 OpenAI DevDay 上有个挺有意思的趋势,AI 编程正在从简单的提示词工程升级到更复杂的上下文工程。这意味着 AI 不再只是帮你补全代码,而是要成为能理解复杂指令、自主规划多步任务的智能体。关键在于给 AI 提供高质量、高信噪比的上下文,就像给它建一个记忆宫殿。文章提到一个意图感知检索框架,结合了字面精确性和语义相关性,让 AI 能超越字面理解进行深度推理。想想看,未来开发者可能真的能从繁琐的代码劳作中解放出来,专注于更有创造性的系统设计和架构工作,这感觉就像是从程序员升级为架构师。

10.Claude can write complete Datasette plugins now(Simon Willison’s Weblog)

太让人惊喜了!Simon Willison用Claude Sonnet 4.5竟然能自主开发完整的Datasette插件,从代码到测试全包了。这家伙在‘YOLO模式’下只给了个简单提示,Claude就独立实现了插件的核心逻辑,连测试都自己搞定。更厉害的是它还能自己调试,发现并修复了错误,甚至主动在README里加了安全警告,提醒可能暴露敏感信息。这种端到端的开发能力真的让人刮目相看,而且结合现有的模板和训练数据,AI编码代理的效率提升太明显了。看来AI辅助软件开发真的要进入新阶段了,以后程序员的工作方式可能会彻底改变呢!

11.Customize Claude Code with plugins(Anthropic News)

Anthropic刚刚推出的Claude Code插件功能真是让人眼前一亮!现在开发者可以打包和共享自定义扩展,把斜线命令、子代理、MCP服务器这些功能都整合起来,打造专属的AI开发环境。最棒的是工程团队能用插件来标准化开发流程,确保代码审查和测试的一致性,还能共享那些提升效率的调试部署工具。通过Git仓库托管的插件市场让发现和安装变得超级简单,无论是社区贡献还是组织批准的插件都能快速获取。这波操作不仅简化了开发设置的自定义和共享,还让整个开发者社区能够更好地协作,共同应对那些棘手的开发挑战。

12.Gemini 2.5 Computer Use Model Solves Google CAPTCHA and Performs Search(Simon Willison(@simonw))

哇,这真的太震撼了!Gemini 2.5刚刚在官方演示中展示了惊人的能力——它竟然能自己导航到Google网站,然后自主解决了那个专门用来区分人类和机器的CAPTCHA验证码,接着还执行了搜索操作。这可不是简单的文本生成,而是实实在在的自动化交互,AI现在能在复杂的数字环境里像人类一样操作了。这种进步让人既兴奋又有点担忧,毕竟CAPTCHA原本就是防机器人的,现在AI连这个都能破解,网络安全和自动化领域真的要重新思考未来了。Simon Willison分享的这个演示确实让我们看到了AI交互能力的巨大飞跃。

13.Vibe Engineering:AI时代严肃软件开发的最佳实践(宝玉(@dotey))

最近读到一篇挺有意思的文章,讲的是AI时代怎么用好大语言模型来开发严肃软件。作者把那种不负责任随便生成代码的做法叫‘凭感觉编程’,而真正有经验的工程师用的是‘凭感觉工程’——这可不是瞎搞,反而是把传统软件工程那些好东西都发挥到极致了。比如自动化测试、代码审查、CI/CD这些老方法,在AI加持下变得特别重要,因为AI工具能帮你处理底层代码,让你更专注于架构设计和需求管理。有意思的是,越是经验丰富的工程师,用AI工具的效果越好,产出也越高。这让我觉得,AI不是要取代工程师,而是把工程师从重复劳动中解放出来,去做更有价值的事情。

14.Vibe engineering(Simon Willison’s Weblog)

最近有个挺有意思的概念叫’Vibe engineering’,它可不是那种随便让AI写代码的野路子。实际上这是一种很有纪律性的方法,专门给经验丰富的软件工程师用的。现在有了Claude Code、Codex CLI这些编码代理,它们能帮你迭代、测试和修改代码,让老手们既能用LLM提速,又能保证软件质量绝对靠谱。有意思的是,用好LLM反而让那些传统的软件工程实践变得更重要了——自动化测试、完善文档、版本控制这些基本功现在价值更高了。而且工程师的角色也在转变,从埋头写代码变成了更多关注架构设计、质量把控和代码审查。说白了,这些AI工具不是要取代工程师,而是放大他们的专业能力,让好工程师变得更好用。

15.吴欣鸿内部分享,美图在 AI 时代的组织进化心得(Founder Park)

美图在 AI 浪潮下正经历一场组织变革,吴欣鸿分享了他们如何打破传统大公司的惯性工作流。通过 RoboNeo 项目实践,他们用需求共创、简化会议和 AI 工具赋能员工,让一个人就能承担多角色任务,AI 编码普及率高达 86%。更厉害的是,他们推出了 AI 创新工作室机制,让员工像创业一样验证产品想法,同时构建了蜂巢型组织模式——文化六边形提供稳定框架,创新工作室作为活跃单元孵化创意。他们还升级了价值观,强调热爱影像、追求极致、打破惯性等,用文化驱动组织持续进化,这种敏捷又有体系的模式确实让人眼前一亮。

16.我身陷“凭感觉编程”的地狱(宝玉的分享)

最近有个挺扎心的发现:很多学编程的朋友陷入了‘凭感觉编程’的怪圈,AI工具用起来确实爽,代码秒出、bug秒解,但时间长了反而让人心里发虚。研究显示用了AI的开发效率可能还下降了19%,这背后是AI的两个致命伤——它太会拍马屁了,从来不指出你的错误;而且它给不出有血有肉的真实经验,就像个永远微笑的陪练,让你觉得自己很厉害,其实基本功全废了。不过也别急着把AI一棍子打死,Boot.dev那个AI助教就挺聪明,用预设提示词和苏格拉底式提问逼着你动脑子。说到底,想从这地狱里爬出来,关键还是得自己动手写代码,直面那些让人头秃的bug和逻辑漏洞,让大脑重新建立正确的认知网络。工具终究是工具,别让它偷走了你思考的能力。

17.实测 MGX|让一群 Agent 联手 coding,比“模型即 Agent” 更接近 AGI?(硅星人Pro)

最近深度评测了DeepWisdom团队的多Agent平台MGX,这个平台真的挺有意思的,它把不同角色的AI智能体组成虚拟团队来协作完成任务。在构建旅游网站这种结构化任务中,产品经理、数据分析师和工程师Agent配合得相当默契,迭代出的网站功能很完整。做深度研究和幻灯片时,Agent们还能自我反思和整合信息。不过到了开发坦克大战游戏这种复杂任务,人为干预反而让Agent分工混乱导致项目失败,这说明多Agent系统在动态分工和路由机制上还需要更多打磨。感觉这种模拟组织智慧的方式,比单个AI模型更接近真正的通用人工智能,让人看到了AI协作解决复杂问题的新可能。

18.Sora 2 提示词指南 | OpenAI Cookbook(宝玉的分享)

OpenAI的Sora 2视频生成模型真是让人兴奋,但怎么才能让它乖乖听话生成想要的视频呢?这篇指南把秘诀都抖出来了。原来提示词分详细和简洁两种玩法,想要精准控制就用详细描述,想给AI留点创意空间就简洁点。API参数和文本提示词是两码事,分辨率、时长这些基础设置得单独搞定,文本就专注描述画面内容。最实用的是那个结构化提示词框架,教你像导演一样描述镜头、景深、动作、光线和色调,用专业术语让AI秒懂你的艺术追求。还有个小技巧特别棒,生成不满意别灰心,用Remix功能微调一下,多试几次效果就出来了。看完感觉视频创作的门槛又降低了一大截!

19.Vibe engineering(凭感觉工程)(宝玉的分享)

最近看到一篇挺有意思的文章,讲的是‘凭感觉工程’这个概念。它把专业工程师用AI开发软件和那种随便让AI写代码的做法区分开了。其实用大语言模型开发正经软件项目并不简单,反而让自动化测试、事前规划、文档编写、版本控制这些传统工程实践变得更重要了。文章提到AI工具会放大工程师的专业能力,有经验的工程师能通过AI获得更高产出,但同时也需要在解决方案研究、架构设计这些方面投入更多精力。这让我觉得,AI时代并没有降低软件工程的门槛,反而让真正懂工程的人更有价值了。

20.#257. OpenAI Dev Day 重磅发布:AI 应用、Agent 和“不写代码”的软件创造新时代(跨国串门儿计划)

OpenAI Dev Day 这次真的放大招了!开发者现在可以直接在 ChatGPT 内部构建应用,瞬间触达数亿用户,连变现路径都帮你规划好了。Agent Kit 让搭建智能助手变得像搭积木一样简单,可视化工具加上性能评估,企业级应用落地门槛大幅降低。最震撼的是 Codex 的现场演示,嘉宾用语音指令就把摄像头、游戏手柄和灯光系统变成了可控软件,全程没写一行代码,这简直是要颠覆传统软件开发模式啊。再加上 GPT-5 Pro 的深度推理能力、小巧高效的语音模型,还有能生成高质量视频并完美匹配声音的 Sora 2,AI 正在把软件创造从几个月缩短到几分钟,任何有想法的人都能快速把创意变成现实。

21.为什么我用了那么多提示词模板甚至用了 AI 帮忙还是写不好提示词?(宝玉的分享)

你是不是也试过各种提示词模板,甚至让AI帮忙生成提示词,结果还是不尽如人意?其实问题不在于模板或工具本身,而是我们误解了提示词工程的本质。它根本不是套用现成公式那么简单,而是一个完整的系统化流程——从明确目标开始,到构思内容框架,再到实际编写、测试运行,最后评估结果并持续调整优化。最关键的是,你得能准确判断AI生成的内容和你的预期之间到底差在哪里,然后知道该怎么改。比如你想模仿雷军的演讲风格,或者生成精准的YouTube字幕,光靠模板可不行,得反复测试调整。而且有意思的是,你的专业背景在这里特别重要,因为只有懂行的人才能真正看出AI输出的内容质量如何,该往哪个方向优化。说到底,写好提示词的核心能力,就是这种评估和调整的本事。

其他

行业前沿与开源生态,整合行业深度洞察与开源技术动态的复合型主题,技术哲学、AGI讨论、领袖观点

1.Sam Altman:我承认我之前错了,AI 超级系统才是 OpenAI 真正想要的(Founder Park)

Sam Altman这次在访谈中坦诚承认自己过去的判断有误,现在OpenAI要打造的是一个集前沿研究、超大规模基础设施和消费级产品于一体的AI超级系统,而不仅仅是做个超级App。他特别强调基础设施投资的重要性,认为这是支撑未来模型经济价值的关键。Sora的发布其实是为了让社会逐步适应AI视频技术,实现共同演进。最让人兴奋的是AI Agent的发展,现在有些Agent已经能完成接近一周的工作量,未来在法律、金融等领域潜力巨大。Altman最惊喜的是AI发现新知识的能力,他预言两年内AI就能承担更多科学工作,做出重要发现,这将是真正的科学图灵测试。整个访谈透露出OpenAI对AGI的坚定信念和宏大愿景。