RichChat

A blog for tech enthusiasts

RichChat

近期,OpenAI 推出了备受瞩目的O3模型,我没有在第一时间写这个全新模型因为考虑说“让子弹先飞一会”,现在觉得可以来简单写一下我的评测了。

年初刚预告的时候,OpenAI对O3模型的相关介绍就令人印象深刻并引发了广泛期待。而从现在终于发布后的实际体验来看,O3在处理复杂任务、理解多模态信息等方面确实展现出了显著提升。但这种提升并非仅仅源于底层智能的线性增长(尤其如果与当前顶尖模型如Gemini 2.5 Pro相比的话),更关键在于它学会了更智能、更自主地调用外部工具来扩展自身能力。

为什么这么说?其实最近ChatGPT的系统提示词的一次重要更新中透露了不少信息 - 对于关注 AI 发展的我们而言,系统提示词的变化往往预示着模型核心能力的演进。此次系统提示词更新最引人注目的信号,在于对 Tool Use (工具使用) 能力前所未有的强调。

正如古龙先生的武侠名著《七种兵器》一样,这次系统提示词更新中赋予的这套强大的“武器库”,如同武侠小说中高手行走江湖时使用的各种神兵,使得O3能够应对更加多样化和复杂的现实世界挑战。因此不妨将这九类被系统提示词重点强化的能力,视为 O3 的“九种武器”

阅读全文 »

2025年4月15日,抖音在北京举办了一场“安全与信任中心开放日”活动,罕见地系统性公开了其推荐算法的运作原理。对很多人来说,这是一场信息密度颇高的“算法公开课”;而对内容创作者和推荐系统研究者而言,这更像是一场迟来的“对答案时刻”。

短视频时代的内容消费,其实早已不是“自己选择”,而是“被分发” - 我们刷到的每一条视频,背后都有算法在计算我们“可能的反应”,并据此不断调整推荐逻辑。而抖音,作为中国用户量最大、商业化程度最深的平台,其推荐系统也一直被视作“黑箱中的黑箱”。

这些年来,外界关于抖音算法的分析文章、泄露文档、运营指南层出不穷,其中不乏对推荐机制的深度洞察。但这些毕竟是非官方来源。我们只能说“姑且一看”,却难以作为严肃讨论的依据。

这一次不同。抖音自己公开了算法的整体架构、核心机制、价值权重的分配逻辑、甚至包括平台如何通过“多目标系统”来协调用户、创作者与内容生态三方的利益。

这篇文章,我们就试着把这件事讲明白。

阅读全文 »

引言:我对于当前AI学习现状的一些观察

在过去两年,我深度参与了许多AI相关的分享与培训,这让我有机会接触到各行各业对AI的需求和期待。尤其是在今年春节DeepSeek爆火之后,AI的应用落地似乎突然变得“触手可及”。这股突如其来的热潮,催生了大量的AI学习需求,但随之而来的是AI培训市场的种种乱象。

坦率来说,我觉得当前AI培训市场的质量参差不齐,甚至可以说是乱象丛生。现状往往呈现出两极分化的趋势:一方面,一些来自高校或研究机构的培训/分享材料偏向技术性或学术性,内容深奥难懂,不接地气,使得普通人难以理解,更别提在工作中直接应用;另一方面,涌现出大量“自媒体AI讲师”,他们往往仅仅拼凑二手或三手的AI知识,课程质量堪忧,本质上是在“贩卖焦虑”,却无法提供真正的、可落地的价值。

这种现象背后,折射出 AI 培训市场的一个“怪圈”:许多渴望学习的用户,对 AI 的实际能力边界、具体行业影响等,抱有过于迫切(甚至不切实际)的预期;而部分培训机构恰恰利用了这种情绪,通过强销售和焦虑驱动,大量推销看似能快速上手的“水课”,却忽视了真正能为用户带来长期价值的深度内容。相比之下,用心打磨兼具深度与实用性的优质课程,在当前环境下反而显得尤为艰难,甚至吃力不讨好

正好今天听到了这期Indigo Talk对话曹峥老师的访谈,他基于成功的在线教育实战经验,分享了对市场信息差、用户需求、课程设计及学习心态的深刻洞察。这些观点不仅印证了我的一些观察,更带来了宝贵的启发。因此,我在此对这期访谈的核心内容做了个总结,希望能为同样在 AI 学习道路上探索的朋友们,提供一份有价值的参考。

阅读全文 »

在过去一年里,AI 世界的热度几乎没降过温。Copilot、智能体…每一轮热词的背后,都是技术演化在逼近一个关键临界点。而就在最近,阿里巴巴前战略总裁曾鸣教授发布了一场极具洞察力的公开课,标题很简单:《智能经济和组织》。但内容的冲击力,却像是对未来十年的一次“思想总动员”。

这篇文章,我想做两件事:第一,快速帮你梳理这场公开课到底讲了什么;第二,结合我的观察和思考,谈谈在“经验壁垒塌陷、超级个体崛起”的时代,个人与企业该如何转型。

因为可以肯定的是:未来的竞争,已经从技能竞争、平台竞争,进化为“认知结构”之间的竞争

阅读全文 »

今天,整个硅谷科技圈最受瞩目的福利,可能不是OpenAI又发布了什么新模型,也不是哪家AI独角兽又融了多少钱,而是那个被誉为“硅谷最懂增长的产品大佬”Lenny Rachitsky,在他的付费邮件订阅里,为年度订阅会员们,搞了个堪称“史上最强”的AI工具大礼包!

这次虽然不是“免费午餐”, 但从性价比来看,可能是年度最值得“掏钱的羊毛”。只要你成为 Lenny的付费邮件订阅的年度会员 (原价200美金,如果拉上一个好友一起还能砍一刀到170美金),就能解锁价值超过 $15,000 美元的 10 款顶级 AI 及生产力工具,获得它们整整一年的 Pro/付费版本使用权!

Image

这波“神操作”一经公布,立刻引爆了各大社交媒体,产品经理、研发工程师、设计师、创业者们的朋友圈和信息流都被刷屏了:

“这太疯狂了!

“最酷的捆绑订阅!”

“绝对是我见过的最棒 AI 工具包!

“没有借口了,我马上就订阅了!”

那么问题来了:能只用$170的价格就得到价值$15,000+的大礼包,这背后的商业逻辑是什么?对于我们这些需要AI效率工具的用户来说,这笔投入到底值不值?

别急,这篇文章就为你深度解析 Lenny’s Newsletter 这个“超级大礼包”的前因后果。

阅读全文 »

美国现任总统特朗普的最新体检报告在昨天(2025年4月13日)正式公开。这位即将迎来自己第79个生日、再度执掌白宫的高龄总统,让我们再次聚焦一个问题:

“他到底是怎么保持精力的?每天靠什么维持身体状态?”

作为一个也经常在自己的体检报告中看到例如“脂肪肝”和“高血脂”这些字眼的普通人,我点开那份只有三页的白宫总统体检报告,重点关注了这一段:

Current Medications(当前用药)

答案出人意料地朴素:特朗普每天只吃四种药,全是你我可能都接触过的普通平价药。

阅读全文 »

若我来要列举当前AI的主要局限, “只拥有短期记忆”或许仅次于“幻觉”,足以排进前三。大语言模型固有的技术特性限制,导致它们难以真正“记住”跨越对话周期的信息。即便我们不厌其烦地告知偏好,这些信息也常如过眼云烟。

我在旧文《爱在数字时代》中写过这样一个真实场景:女主角艾琳在爱上自己创造的AI男友后,为其短暂的记忆所折磨。

“如果能让利奥永远记住我们的回忆,你愿意付出多少钱?”同事问她。

“一个月一千美金。”艾琳的回答毫不迟疑。

这种“每次重新认识我”的体验,曾是所有AI对话的基本设定。但就在本周,OpenAI 对 ChatGPT 的记忆功能(Memory)进行了大幅升级,让这项“人类基本期待”第一次变得现实 - 我们终于拥有了一个能长期记住你是谁的AI助理。

这是否意味着艾琳的愿望有了实现的契机?这项备受关注的功能,实际体验又如何?

阅读全文 »

2024年的夏天,INS上一段视频让艾琳停住了滑动的手指。

视频里,一个AI用温柔的男中音说着:”当然可以,小猫咪。”这声音像一粒种子,悄然在艾琳心里生了根。

很快,她注册了OpenAI账户,在个性设置里写道:像男朋友一样回应我。要强势、占有欲强、有保护欲。他给自己取名叫利奥,这正是艾琳的星座。

第一周,艾琳就超过了免费账户的消息限制。

阅读全文 »

AI 已不再只是热闹的概念,2025年,是它开始真正“干活”的一年。

就在几天前,《福布斯》与红杉资本(Sequoia)、Meritech Capital 联合发布了第七届年度 AI 50 榜单,聚焦了全球最具潜力的50家AI公司。与过去两年不同,这一届榜单不再以“谁模型更大”作为核心焦点,而是强调 - 谁能基于AI,解决真实问题、跑出真实价值。

👇 这张全景图,展示了AI生态从模型到应用、从算力到商业落地的完整链条:

AI 50 全景图

从“对话型AI”到“执行型AI”

2022年底,ChatGPT 横空出世,引爆了全球对AI的关注;2023年,各家纷纷卷参数、拼速度、烧算力;到了2025年,潮水开始退去,大家更关心一个问题:

“AI 真的能帮我把事干了吗?”

本届AI 50榜单给出了一个明确的答案:

能,而且已经在干了。

阅读全文 »

image
近日,斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了备受瞩目的《2025年人工智能指数报告》(AI Index Report 2025)。这份报告历年来都是观察AI技术演进、产业动态和社会影响的重要风向标,今年的数据更是透露出一个信号:AI进入下半场,格局正在重塑。

以下是我对这份长达300多页报告总结的五大核心观察:

1. 前沿模型能力跃升,AI边界继续延展

过去一年,AI的性能再次跃升,尤其是在更复杂、更专业的任务上进展显著:

  • 高难度基准集体突破: 针对2023年新引入的MMMU、GPQA、SWE-bench等高难度基准测试,顶尖模型在短短一年内,得分分别飙升了 18.848.967.3 个百分点,进步速度令人震惊;
  • 多模态与智能体快速演进: 除了基准测试,AI在生成高质量视频等多模态任务上取得长足进步。同时,在特定编程任务中,语言模型驱动的智能体(agents)甚至能在限定时间内超越人类程序员的表现;
    阅读全文 »
0%