RichChat

100万次对话背后的真相: Claude 3.7 Sonnet 如何改变AI使用模式

发表于 2025-03-30 更新于 2026-06-14 分类于 AI

Anthropic最近发布了第二份Economic Index研究报告，分析了Claude 3.7 Sonnet模型发布后人们使用AI的最新数据（我之前整理过这篇报告的第一篇内容在此）。这份报告通过分析100万条匿名用户和Claude对话的大数据，揭示了AI如何被应用于实际工作场景，以及与先前版本相比的变化趋势。

阅读全文 »

窥探AI大脑：Anthropic首次解密大语言模型的"思维链条"

发表于 2025-03-30 更新于 2026-06-14 分类于 AI

当我们与Claude、GPT或者DeepSeek这样的大语言模型对话时，你是否曾好奇过它们在”思考”些什么？它们如何在几秒钟内从问题到回答，中间经历了怎样的过程？

在之前我整理的这篇《懒人版大语言模型入门》中，提到过“可以将大模型想象为一种绝大部分人无法理解的神秘产物”，也就是说过往哪怕是顶级的AI研究学者也对于“AI大脑”的具体运作方式不清楚。而最近Anthropic公司发布了两篇重要研究论文，首次深入揭示了大语言模型(LLM)的内部运作机制，让我们得以一窥这些AI系统如何”思考”的奥秘：

大模型的多语言处理能力究竟是如何工作的？当我们用中文提问时，是否有一个专门的”中文Claude”被激活，还是在大模型内部存在着某种跨语言处理的核心机制？
当大模型写出一首完美押韵的诗歌时，它是像人类一样提前规划，还是仅仅依靠一个接一个词的预测来”碰巧”达成押韵？
当模型进行心算时，它是否像人类一样思考，还是采用了完全不同的方法？
大模型是否只会”死记硬背”大量答案，而不具备类似人类一样的真正推理能力？
为什么模型有时会产生”幻觉”，编造出看似可信但完全虚构的信息？
模型在遇到可能违反安全规则的请求时，内部究竟发生了什么？

让我们一起深入了解Anthropic的这项开创性研究，探索大语言模型思考过程中的几个令人惊讶的发现：从跨语言的概念共享，到诗歌创作中的提前规划，再到心算、多步推理，甚至是幻觉产生和安全漏洞的内部机制 - 这些发现将重塑大家对于AI的理解。

阅读全文 »

会说话就能出图的新纪元 - GPT-4o彻底革新AI图片生成

发表于 2025-03-27 更新于 2026-06-14 分类于 AI

2025年3月27日，OpenAI发布了GPT-4o的原生图片生成功能，迅速在海外社交媒体平台掀起热潮。这不仅是一次普通的技术升级，而是对AI图片生成领域的一次革命性冲击。无论是生成结果的质量与易用性，还是背后端到端多模态技术的突破，GPT-4o都展现出了碾压传统模型的潜力，让”会说话就能出图”的梦想触手可及。

我从两个核心维度深入探讨为什么这次的”完全体GPT-4o”堪称AI模型发布里程碑的事件之一：

生成质量与易用性：从”人适应工具”到”工具理解人”

GPT-4o的图片生成功能甫一亮相，便以其惊艳的质量和无与伦比的易用性征服了用户。这标志着AI创作工具从要求”人适应工具”到实现”工具理解人”的关键转折。

阅读全文 »

数字"队友"：AI如何改变我们的协作与专业知识版图

发表于 2025-03-26 更新于 2026-06-14 分类于 AI

在企业界，我们常说，一流人才与二流人才的差距往往不在于能力本身，而在于协作的艺术。几十年来，企业管理学界也将团队协作视为现代组织的基石。无论是打造一款新产品，解决战略难题，还是策划大型创新，人类之间的协作一直是实现高质量成果的核心路径。

但如今，一个新的”队友”正悄然改变着这一格局 - 人工智能/AI。

三大协作支柱的数字重构

近日，哈佛商学院、宾夕法尼亚大学沃顿商学院等一众顶尖学府的研究团队，携手宝洁公司，开展了一项名为”网络队友”的大规模实证研究。他们探究了AI如何重塑协作的三大核心支柱：绩效表现、专业知识共享，以及社交互动。

研究团队以776名宝洁公司的专业人士为对象，开展了预先注册的现场实验。参与者在处理真实产品创新挑战时，被随机分配到不同工作模式：单独工作不用AI、组队工作不用AI、单独工作使用AI，或者组队工作并使用AI。

阅读全文 »

声音的稀缺价值：从Lex Fridman到小宇宙，思考播客生态的两地差异

发表于 2025-03-24 更新于 2026-06-14 分类于 readings

引言：饱和时代中的稀缺价值

硅谷，周一早晨。Lex Fridman刚刚发布了与特斯拉掌门人Elon Musk的访谈播客。不到24小时，播放量已突破100万，评论区里挤满了来自各地网友的讨论。

与此同时，国内顶流播客《乱翻书》在小宇宙app发布了最新一期科技圆桌。虽然同样制作精良、内容深刻，但一周后播放量只有大约一万出头，评论区活跃的几乎都是圈内人。

这种反差背后，隐藏着一个播客世界的核心洞察：正如小宇宙CEO Kyth所言，”播客是在丰饶的时代，提供稀缺价值的东西。”在信息爆炸的今天，播客以其独特的亲密感、深度和陪伴性，成为了一种反潮流的文化现象。但为何同样的媒介形态，在两地呈现如此不同的发展路径？

阅读全文 »

（深度技术向）HuggingFace良心出品"超大规模训练攻略" – 让LLM训练不再神秘

发表于 2025-03-23 更新于 2026-06-14 分类于 AI

为对LLM训练的技术细节方面感兴趣的朋友们强烈推荐这个免费资源：经过6个多月的制作和消耗超过一年的GPU计算时间，HuggingFace发布了“Ultra-Scale Playbook”（超大规模训练攻略）—— 一本免费、开源的书籍，为大模型训练技术揭秘。

HuggingFace的LLM训练三部曲

这本《超大规模训练攻略》是HuggingFace正在推出的LLM训练三部曲系列中的第二部分，旨在为开源社区提供全面的大模型训练知识：

第一部分：FineWeb - 高质量预训练数据集的创建（已发布）
第二部分：Ultra-Scale Playbook - 分布式训练技术详解（本文重点）
第三部分：数据混合和架构选择（即将推出）

Ultra-Scale Playbook：核心内容与价值

这本书在讲什么

正如作者所说：

“我们的目标是将所有使当今大语言模型扩展成为可能的技术集中在一起，用连贯且易懂的方式讲述其中的来龙去脉。”
阅读全文 »

深度译读《Stratechery - OpenAI CEO Sam Altman访谈》- 打造一家消费科技公司

发表于 2025-03-22 更新于 2026-06-14 分类于 AI

引言：Stratechery最新出的这篇Sam Altman专题访谈的质量不错，专门做了一个全文精翻版供参考。有兴趣的话也可以延展阅读一下之前我整理过的Stratechery谈DeepSeek这篇 - 深度译读《DeepSeek FAQ》- 关于 DeepSeek 的答疑解惑。

老规矩，先总结个人印象深刻的几点：

OpenAI作为”意外的”消费科技公司的诞生 - Altman坦言当初创立OpenAI时，它只是一个研究实验室，完全没有明确的产品方向，甚至连具体想法的雏形都没有。感觉这个从”在荒野中迷失的学术研究实验室”到如今的科技巨头的发展历程描述还挺真实的；

ChatGPT惊人爆发期的真实描述 - Sam描述推出ChatGPT后的那段高速增长期的发言完全可以当脱口秀来看：”每天都是这样：用户暴涨，服务器崩溃；到了晚上，用户量下降，大家就说’完了完了，就这么一阵风’；结果第二天峰值更高，又跌下来，大家又说’这回真完了’。”这种循环持续了数天，直到他意识到：”得，这情况我再熟悉不过了，接下来会怎样我都知道”；

对过去过于谨慎保守策略的反思 - 在访谈中，Altman多次提到OpenAI早期的保守策略，例如如GPT-2发布时对安全性的过度担忧。他坦言：”现在回想起来，我完全后悔我们当时使用的一些措辞。我也理解为什么人们会说：”这不过是炒作和制造恐慌”，但这真的不是我们的本意”。

关于AI商业模式的思考 – 在被问到“五年后什么会更有价值 - 是一个拥有十亿日活跃用户、不需要做客户获取的目标网站，还是最顶尖的模型？”，Altman的回答是“那个拥有十亿用户的网站”，他的逻辑是认为未来的战略优势将体现在三个方面：建立大型互联网公司提供统一的AI服务套件（包括软件和硬件的完整生态）、发展推理基础设施（或者说如何实现最经济和最充足的推理能力），以及持续进行前沿研究保持能开发出最优秀的模型。

此外，他对传统广告模式显示出明显的抵触，甚至说“我们绝不会接受付费调整排名”；

对AI未来的展望 - 当被问及OpenAI是否会开源其模型以应对DeepSeek等竞争对手时，Altman意味深长地说：”我已经在尽可能地暗示了，就差明说了。你懂的。”这暗示了OpenAI可能正在重新考虑其封闭战略，同时他也透露了GPT-5即将推出，并将为免费用户提供。

关于创造力本质的哲学思考 - Altman引用了David Deutsch的观点，认为创造力本质上就是把已有的东西稍作修改，然后不断改进。而这种渐进式的创新恰恰是AI所擅长的，这也是他相信AI最终能够实现真正创造的基础。

给高中毕业生的实用建议 - 当被问及对即将高中毕业的学生有什么职业建议时，Altman给出了两条有价值的建议：首先是要学会熟练使用AI工具，就像他高中毕业那会儿最实用的建议是学会编程一样；其次是培养适应力、韧性以及理解他人需求这些通用技能，就像他认为自己在学校学到最重要的东西是”如何学习的能力”一样。

阅读全文 »

Helix — 一个让机器人像人类一样思考和行动的"超级大脑"

发表于 2025-03-13 更新于 2026-06-14 分类于 AI

大家应该都看过春晚上宇树科技的机器人能灵活地跳秧歌，这一夜让所有人都看到了人性化机器人已经不只存在于科幻电影中。那么，到底还要多久我们才能看到这些机器人出现在工厂或者家庭中呢？行业专家对此意见不一，许多人认为即使在未来5-10年内也难以实现大规模应用。

而今天我要为大家介绍的Figure公司推出的Helix AI系统，它展示了一个令人振奋的可能性——也许这些机器人进入工厂和家庭的时间比我们想象的要近得多。

一个能像你一样学习新工作的机器人

你有没有想过，一个机器人能像你一样快速学会新工作？比如在仓库中识别杂乱的包裹，理解口头指令，然后精准高效地完成任务；或者在汽车工厂里，像熟练工人一样协助组装车身？

过去，这听起来像是遥远的梦想。传统机器人往往笨重、反应迟缓，需要工程师花费数月甚至一年的时间来编程、测试和调整，才能让它们适应新任务。Helix系统的出现彻底改变了这一现状。

Helix是Figure这家人形机器人公司开发的”超级大脑”。可以将其视为一个全能的认知系统——具备视觉感知、听觉理解和行动能力，类似于人类的大脑，只是被装在金属躯体中。这也是为什么Figure的联合创始人Brett Adcock说：

“人形机器人是实现通用人工智能（AGI）的最佳载体”。

阅读全文 »

小学生都在学AI了，你还等什么？

发表于 2025-03-10 更新于 2026-06-14 分类于 AI

就在前天，北京市教委发布了《北京市推进中小学人工智能教育工作方案（2025—2027年）》，我读了以后除了对这份执行方案的详尽程度大受感触外，更重要是发现这个方案：

不是试点，而是在北京市全面铺开。

从2025年秋季学期起，北京市所有中小学生 – 是的，包括那些刚刚学会系鞋带的小学生– 每学年将接受至少8课时的AI教育。这场教育变革悄然降临，却又轰轰烈烈。

1 翻开这份方案，细节之处令人惊叹

北京的AI教育不是简单地在课表上加一门课那么简单。它像一条精心设计的成长曲线：

小学阶段以兴趣培养为主，让孩子们在游戏中认识AI；
初中开始动手应用，学生能用简单工具解决实际问题；
到了高中，则已经具备AI实践能力，同时开始思考技术伦理问题。
阅读全文 »

用最通俗易懂的方式解释到底什么是Agent/智能体/代理

发表于 2025-03-06 更新于 2026-06-14 分类于 AI

由于刚发布的Manus这款号称“全球首款通用智能体平台”的刷屏式传播，很多人找我问起到底大模型领域的”agent”（中文被翻译为“代理”或者“智能体”）是什么？在本文中，我将使用”智能体”这一翻译，并尝试用最通俗易懂的方式来解释它的概念和意义。

简单来说，智能体可以理解为具有一定自主能力的AI助手或AI执行者，它不仅能理解你的需求，还能主动采取行动帮你完成任务。

智能体与普通AI的区别

智能体本质上是普通AI助手的进化版本，其区别主要体现在行动能力上：

阅读全文 »