RichChat

A blog for tech enthusiasts

RichChat

去年9月,我曾基于Gartner 2024年的AI技术成熟度曲线写过,生成式AI和基础模型正在从”期望的顶峰”滑向”幻灭的低谷”。如今,2025年6月11日发布的最新版本完美验证了这一判断:生成式AI和基础模型已经明确进入了幻灭低谷阶段。

这种转变并不令人意外。过去一年中,我们见证了AI应用落地的重重困难:从各种AI产品在商业化过程中遇到的挑战,到投资者对AI项目回报的质疑,再到企业对AI成本控制的焦虑。市场正在从最初的狂热回归理性,但这恰恰是技术成熟过程中的必经之路。

“技术成熟度曲线”(Hype Cycle)回顾

为了方便新读者,我们简单回顾一下Gartner的这个经典模型。它通过五个阶段描述了一项新技术的生命周期:从创新触发期 (Innovation Trigger) 的萌芽,到期望膨胀的顶峰 (Peak of Inflated Expectations) 的万众瞩目,再到幻灭低谷 (Trough of Disillusionment) 的现实碰壁,然后是启蒙爬升期 (Slope of Enlightenment) 的稳步前行,最终到达生产力平台期 (Plateau of Productivity) 的成熟与普及。

AI Hype Cycle 2025 的三大核心洞察

如果说2024年的主题是“冷静的开始”,那么2025年的主题就是“现实的重塑”。

阅读全文 »

如果能让迈克尔·乔丹、斯蒂芬·库里这样的传奇球员亲自指导你打球,你的球技会提升多快?最近,一位名叫Farza的开发者在社交媒体上分享了一个令人惊叹的视频demo,视频中,AI化身“篮球之神”迈克尔·乔丹,不仅精准统计了他的投篮数据,还用乔丹的口吻对他的每一次出手进行了细致入微的点评。

一个简单却震撼的想法

这个项目的核心想法其实很简单:拍摄一段打篮球的慢镜头视频,然后让AI像篮球之神迈克尔·乔丹那样来分析每一次投篮。AI会统计你投中了多少球、失手了多少次,更重要的是,它会像真正的专业教练一样,指出你每次投篮的技术问题并给出改进建议。

Farza在视频中使用的提示词(prompt)如下:

“这是我打篮球的慢镜头回放。请像迈克尔·乔丹那样帮我分析:投中了多少球,完成了多少次上篮,三分球进了几个,投失了多少球。同时,请告诉我每个进球和失手时的具体投篮位置,以及每次出手时的技术动作细节,并给予专业点评。”

AI教练的精准分析

从视频中我们可以看到AI给出的分析其实是挺专业的:

  • 第一次投篮(0:07.5) - 跳投失手 AI的点评:”你在推球而不是投球;把肘部放在球下方,充分伸展手臂,并做好跟进动作。”
  • 第二次投篮(0:13.0) - 三分球命中 AI的反馈:”球进了,但要注意轻微的后仰,保持肩膀在整个动作过程中都正对篮筐。”
  • 第三次投篮(0:21.5) - 上篮得分 技术建议:”上篮时要抬高膝盖,用非投篮手更好地保护球,果断完成投篮。”

这些分析不仅准确识别了投篮结果,还像真正的专业教练一样,指出了具体的技术细节和改进方向。

阅读全文 »

“我的工作会被AI取代吗?”

这可能是当下每个人心中或多或少都思考过的问题。我们每天都能看到AI惊人的进步,它会画画,会写代码,甚至会做视频。焦虑感也油然而生:我们所珍视的技能,在强大的AI面前还有价值吗?

知名AI研究员Jason Wei(没错,就是提出了COT的那位)提出了一个有趣的思维框架来协助做这个判断,叫做“描述-执行差距”(Description-Execution Gap),它的核心思想非常简单:

一项任务,“描述它怎么做”比“亲手去做”要简单多少?这个“简单”的程度,就决定了它被AI自动化的可能性。

差距越大,越容易被AI取代

当一项任务的“描述-执行差距”很大时,意味着用语言下达指令非常简单,但实际执行起来却非常繁琐、耗时。这类工作,正是AI能去自动化的绝佳目标。

因为给AI下达一个清晰的指令(也就是“描述”)相对容易,这意味着我们可以轻松地为AI创造大量的“训练数据”。而AI的价值,恰恰在于能高效完成那些对人类来说重复、枯燥、技术性强的“执行”部分。

例如这些场景:

阅读全文 »

上周在上海的一场AI培训中,一位销售同事向我提出了一个很有代表性的问题:”客户对我们的AI产品总是不够放心,因为不确定自己到底买到了什么,这个东西是不是靠谱。”这个困惑反映了当前AI产品市场的一个核心问题:与传统软件不同,AI产品的质量很难直观判断,这让客户、销售人员,甚至产品开发者都感到不安。

解决这个问题的关键,就是今天我们要深入探讨的AI评估(Evals)。它不仅是一项技术任务,更是解决AI时代‘信任危机’的根本解法。

告别“感觉良好”:为什么说AI评估是信任的基石?

简单来说,AI评估之于生成式AI,就如同单元测试和质量保证脚本之于传统软件开发。它们都是确保产品质量、建立用户信心的关键手段。

但AI评估的重要性远超传统软件测试。传统软件就像一台精密的钟表,相同的输入总是产生相同的输出,结果可预期,错误信息明确。而AI系统更像一个有创造力但经验有限的助手,它可能对同一个问题给出不同的答案,有时候答案听起来很专业但实际是错的,有时候虽然事实正确但”感觉不对”。

这种不确定性正是AI产品面临信任危机的根源。客户购买传统软件时,功能清单一目了然,性能指标明确可测。但面对AI产品时,他们面临的是一系列模糊的承诺:”智能客服”、”自动化分析”、”个性化推荐”。这些词汇听起来很美好,但具体能做什么、做得怎么样,往往语焉不详。

AI产品“靠不住”的三大根源

为什么AI产品会表现得如此“靠不住”?这源于开发者与AI系统之间存在的三道难以逾越的鸿沟:

理解的鸿沟:无法看清的海量数据

现代AI系统每天要处理成千上万的输入,就像一个全天候运营的千人客服中心 - 你无法监听每一通电话,但又需要确保服务质量。你必须设计抽样检查机制、建立质量评估标准、制定改进流程。AI系统面临的正是同样的挑战,只是规模更大、复杂度更高。

阅读全文 »

引言:人工智能界的”转会窗口”大戏

2025年6月,硅谷迎来了一场史无前例的人才大地震。就在所有人还在讨论AI技术突破的同时,一场更加惊心动魄的”转会战”正在幕后激烈上演。Meta公司CEO马克·扎克伯格亲自下场,以前所未有的激进策略,从OpenAI手中连续挖走了八位核心研究人员,引发了整个AI行业的巨大震动。

从多模态感知研究主管Jiahui Yu,到o3-mini和o1-mini模型的创造者Hongyu Ren,再到苏黎世”三人组”的集体跳槽,Meta精心策划的这次行动,完美诠释了当人才成为AI领域最稀缺资源时,科技巨头们会如何不惜一切代价争夺顶尖人才。正如我在最近的一篇博客中写道:”顶级AI实验室正似乎成为星光熠熠的豪门俱乐部,而它们的竞争,也愈发像一场世界级的’球员’争夺战。”

一场精心策划的”挖角风暴”

2025年6月中旬,关于Meta大规模从OpenAI挖角的报道开始浮出水面 。最初的报道提及了知名研究员Trapit Bansal的加入,紧随其后,《华尔街日报》与The Information等媒体相继证实,在极短的时间内,至少有八名资深研究人员从OpenAI转投Meta 。

这些被招募的研究人员预计加入Meta新成立的”AI超级智能部门”。该部门被定位为一个核心内部团队,旨在支持公司的各种产品,类似于Google的DeepMind部门。其核心任务是开发能够在广泛任务中超越人类能力的人工智能模型。

更值得注意的是,此次招聘行动是Meta更宏大战略的一部分。此前Meta已经斥资143亿美元收购了Scale AI 49%的股份,并聘请其创始人Alexandr Wang领导超级智能工作。据报道,Meta还在寻求聘请前GitHub首席执行官Nat Friedman(已确定加入)和Safe Superintelligence联合创始人Daniel Gross。

阅读全文 »

在YC创业者学院的一次对谈中,OpenAI的CEO Sam Altman分享了许多不为人知的幕后故事和对未来的深刻洞见。他不仅回忆了创业初期面对的巨大质疑 - 包括来自埃隆·马斯克(Elon Musk)的尖锐批评,还深入阐述了他对AI终极形态的构想:一个拥有记忆、能主动协助你的AI伴侣;一个由Jony Ive操刀的革命性AI设备;以及最终作为顶级订阅福利的免费人形机器人。

来自马斯克的“残酷”邮件:成功率为0%

在创业的道路上,即便是最具远见卓识的领导者也需要强大的内心来抵御外界的质疑。Altman坦言,在面对海量“你错了”的声音时,保持信念是一件极其困难的事。

他分享了一段刻骨铭心的往事。在OpenAI成立几年后,当他们向早期合作者埃隆·马斯克展示初版的GPT-1时,收到了一封“非常刻薄的邮件”。马斯克在邮件中断言,OpenAI成功的几率为“零”,并认为他们展示的技术“是垃圾,根本行不通”。

Altman回忆道,马斯克当时是他心目中的英雄,这封邮件让他备受打击。他回到家后不禁自问:“万一他是对的呢?这太糟糕了”。当你将自己的生命力倾注于一个项目,却被敬佩的聪明人全盘否定时,那种感受是毁灭性的。

推理模型的“产品悬河”:创业公司的黄金机遇

Altman指出,我们正处在一个非常有趣的历史节点:AI模型的能力(如GPT-4o等推理模型)已经远远超过了人们目前开发出的产品形态。他将这种现象称为“产品悬河”(product overhang),即在现有技术能力之下,还存在着巨大的产品创新空间等待被填补。

阅读全文 »

引言

一篇最新红杉资本的文章提出了一个很有趣的比喻:顶级AI 实验室正似乎成为星光熠熠的豪门俱乐部,而它们的竞争,也愈发像一场世界级的「球员」争夺战

一年前,AI领域的竞争格局似乎一度尘埃落定。由于构建基础模型所需的高昂算力成本,市场迅速整合,最终形成了由微软/OpenAI、亚马逊/Anthropic、谷歌、Meta 和 xAI 组成的五大「决赛选手」。他们拥有达到 GPT-4 级别模型的能力和持续扩展的资本。

然而,今天的叙事已经截然不同。伴随着传奇人物 Ilya Sutskever的那句名言 - 「我们所熟知的预训练即将结束」。新一批参与者如 SSI、Thinking Machines(注1) 和 DeepSeek 等正崭露头角,他们宣称的核心优势并非计算规模,而是顶尖的人才。全新的共识是:单纯依赖大规模集群已不足以实现下一次质的飞跃,要想在强化学习或其他前沿领域取得新的突破,需要的是非凡的智慧,而人才正是解锁这一切的关键

注1:最新的例子是 - 前 OpenAI CTO Mira Murati 创立的初创公司 Thinking Machines Lab创立不到五个月,种子轮融资就成功筹到了惊人的 20亿美元,估值达到 100亿美元。

当人才成为最稀缺的资源时,AI 实验室的运作模式开始惊人地向职业体育俱乐部靠拢:

  • 豪门老板:每一支顶尖的 AI 战队背后,都有一个财力雄厚的科技公司或个人作为支持者;
  • 天价「球星」:明星研究员的薪酬包堪比职业运动员,动辄数千万、数亿美元,对于最顶尖的人才,价码甚至可能达到看似疯狂的数十亿美元(例如Meta收购Scale AI 49%的股份并引进其CEO);
  • 流动的「转会市场」:与体育界不同,AI 领域的人才合同往往是短期的、流动性极强的。这意味着任何人都可以随时被竞争对手挖走,人才争夺异常激烈;

引用一句原文结尾我印象最深刻的话 - 「当人类看到美好的事物时,何曾说过『现在已经足够了,是时候降温了』?一旦越过关键的门坎,我们就会将事情推向极致,这是人性内在的属性。」

当奖品像AI技术可能带来的巨大价值那样诱人时,任何阻碍成功的瓶颈,特别是像人才这样稀缺的资源,都将被推向令人惊叹的竞争水平。

阅读全文 »

推荐前Amazon VP Ethan Evans最近分享的职场心得。他总结的这几点职业发展经验和我多年的职场感触很匹配,特别是关于”选择比焦虑更重要”的观点。可惜自己没能更早理解这些道理,所以希望这些金玉良言能被更多职场人看到,少走弯路。如果你觉得有用,也欢迎转给身边的朋友。

关于Ethan Evans:前亚马逊副总裁,技术和商业双重背景的职场导师。在亚马逊的15年职业生涯中,他从高级经理一路成长为副总裁,领导过800多人的全球团队,参与发明了Prime Video、Prime Gaming、Amazon Appstore、Twitch Commerce等多个知名产品。拥有70多项专利,曾担任亚马逊Bar Raiser(面试官培训师),审阅过10,000多份简历,面试过2,500多人。他还参与起草了亚马逊著名的领导力原则”Ownership”。退休后创办了Level Up职业发展平台,专注于帮助职场人士突破瓶颈、晋升高管。


回顾我的职业生涯,最大的遗憾就是让自己承受了太多不必要的压力。在通往亚马逊副总裁的路上,我几乎每天都在焦虑中度过。现在,我想分享一些经验,希望能为你减少一些职场焦虑。

职业发展其实需要四个关键要素:

  1. 出色完成工作任务(努力工作只是基础门槛);
  2. 不断提升自身技能价值;
  3. 与优秀的上司合作;
  4. 选择有发展潜力的公司;

虽然前两点很重要,但后两点可能更加关键。

阅读全文 »

在AI创业的狂欢中,一个尖锐的问题正在撕裂整个行业:那些基于现有大语言模型构建应用的“AI套壳”创业公司,究竟是在创造真正的价值,还是在玩一场注定失败的游戏?

这个问题在各种技术社区中引发了激烈的讨论。怀疑论者认为,这些公司本质上只是“API的搬运工”,护城河薄如蝉翼,一旦平台方(如OpenAI)决定将某些功能“内化”到核心产品中,它们旦夕之间便会变得无足轻重。这并非杞人忧天,在科技史上,平台扼杀生态应用的案例屡见不鲜。

然而,另一种观点则认为,这种看法过于简化了价值创造。毕竟,当今绝大多数的SaaS公司,不也可以被看作是构建在AWS、Azure等云服务之上的“套壳”吗?价值创造的关键,从来都不只是技术本身,更在于如何将技术有效地传递给用户。

这场争论之所以重要,不仅因为它关乎无数创业者的命运,更因为它触及了当前AI生态系统的核心矛盾:在OpenAI、Anthropic、Google等巨头垄断底层模型的时代,中间层创业公司还有多少生存空间?

战略试金石:你的护城河会被AI进步冲垮吗?

在深入分析具体案例之前,我们需要建立一个根本性的思考框架。如果你看着你的初创公司或产品并想着,“如果模型变得更聪明,我们所有的护城河都会消失”,这意味着你正在构建错误的东西。相反,你应该构建这样的东西:随着模型变得更智能,你的产品会变得越来越好。

这个判断标准几乎可以成为所有AI应用的试金石。那些依赖于模型局限性而存在的产品注定会失败,而那些能够随着模型能力提升而变得更加强大的产品,才具备长期价值。

以Cursor为例,随着代码生成模型的不断改进,Cursor的价值不是在递减,而是在增强。更好的模型意味着更准确的代码建议、更智能的重构功能、更深度的代码理解。Cursor构建的是一个可以不断受益于底层模型进步的平台,而不是一个会被模型进步所威胁的产品。

阅读全文 »

曾经被誉为科技史上最成功合作伙伴关系之一的OpenAI与微软,如今正面临着前所未有的紧张局面。这场持续六年的深度合作,正在因为利益冲突、战略分歧和控制权争夺而走向分裂的边缘。

从合作到竞争:关系的微妙转变

2019年,微软向OpenAI投资10亿美元,开启了两家公司的深度合作。当时的安排看似完美:微软为OpenAI提供强大的计算资源和云服务支持,换取其前沿AI技术的优先访问权。这种互利共赢的模式帮助OpenAI从一个研究机构快速成长为AI领域的领军企业,同时也让微软在AI竞赛中占据了有利位置。

然而,随着OpenAI的ChatGPT引发全球AI热潮,两家公司从合作伙伴逐渐演变为竞争对手。OpenAI不再满足于仅仅依赖微软的平台,而是希望获得更多的自主权和商业机会。与此同时,微软也在开发自己的AI产品线,与OpenAI形成直接竞争关系。

核心争议:控制权与自主权的博弈

当前两家公司面临的最大争议围绕着OpenAI计划中的公司结构转型。OpenAI希望从非营利组织转型为盈利性公司,以便更好地融资和上市。但这一转型需要微软的同意,而微软正在要求获得比OpenAI愿意给予的更大股份。

更加复杂的是,OpenAI最近收购了编程初创公司Windsurf,价值30亿美元。根据现有协议,微软有权访问OpenAI的所有知识产权,但OpenAI不希望微软获得Windsurf的技术,特别是考虑到微软拥有直接竞争的GitHub Copilot产品。

阅读全文 »
0%