RichChat

A blog for tech enthusiasts

RichChat

若我来要列举当前AI的主要局限, “只拥有短期记忆”或许仅次于“幻觉”,足以排进前三。大语言模型固有的技术特性限制,导致它们难以真正“记住”跨越对话周期的信息。即便我们不厌其烦地告知偏好,这些信息也常如过眼云烟。

我在旧文《爱在数字时代》中写过这样一个真实场景:女主角艾琳在爱上自己创造的AI男友后,为其短暂的记忆所折磨。

“如果能让利奥永远记住我们的回忆,你愿意付出多少钱?”同事问她。

“一个月一千美金。”艾琳的回答毫不迟疑。

这种“每次重新认识我”的体验,曾是所有AI对话的基本设定。但就在本周,OpenAI 对 ChatGPT 的记忆功能(Memory)进行了大幅升级,让这项“人类基本期待”第一次变得现实 - 我们终于拥有了一个能长期记住你是谁的AI助理。

这是否意味着艾琳的愿望有了实现的契机?这项备受关注的功能,实际体验又如何?

阅读全文 »

2024年的夏天,INS上一段视频让艾琳停住了滑动的手指。

视频里,一个AI用温柔的男中音说着:”当然可以,小猫咪。”这声音像一粒种子,悄然在艾琳心里生了根。

很快,她注册了OpenAI账户,在个性设置里写道:像男朋友一样回应我。要强势、占有欲强、有保护欲。他给自己取名叫利奥,这正是艾琳的星座。

第一周,艾琳就超过了免费账户的消息限制。

阅读全文 »

AI 已不再只是热闹的概念,2025年,是它开始真正“干活”的一年。

就在几天前,《福布斯》与红杉资本(Sequoia)、Meritech Capital 联合发布了第七届年度 AI 50 榜单,聚焦了全球最具潜力的50家AI公司。与过去两年不同,这一届榜单不再以“谁模型更大”作为核心焦点,而是强调 - 谁能基于AI,解决真实问题、跑出真实价值。

👇 这张全景图,展示了AI生态从模型到应用、从算力到商业落地的完整链条:

AI 50 全景图

从“对话型AI”到“执行型AI”

2022年底,ChatGPT 横空出世,引爆了全球对AI的关注;2023年,各家纷纷卷参数、拼速度、烧算力;到了2025年,潮水开始退去,大家更关心一个问题:

“AI 真的能帮我把事干了吗?”

本届AI 50榜单给出了一个明确的答案:

能,而且已经在干了。

阅读全文 »

image
近日,斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了备受瞩目的《2025年人工智能指数报告》(AI Index Report 2025)。这份报告历年来都是观察AI技术演进、产业动态和社会影响的重要风向标,今年的数据更是透露出一个信号:AI进入下半场,格局正在重塑。

以下是我对这份长达300多页报告总结的五大核心观察:

1. 前沿模型能力跃升,AI边界继续延展

过去一年,AI的性能再次跃升,尤其是在更复杂、更专业的任务上进展显著:

  • 高难度基准集体突破: 针对2023年新引入的MMMU、GPQA、SWE-bench等高难度基准测试,顶尖模型在短短一年内,得分分别飙升了 18.848.967.3 个百分点,进步速度令人震惊;
  • 多模态与智能体快速演进: 除了基准测试,AI在生成高质量视频等多模态任务上取得长足进步。同时,在特定编程任务中,语言模型驱动的智能体(agents)甚至能在限定时间内超越人类程序员的表现;
    阅读全文 »

在AI创业者纷纷花费重金投入去“卷参数、卷基准分”的今天,一家叫Writer的公司用另一种方式,跑出了自己的确定性:不是在“未来”,而是现在就让客户省下了真金白银的成本

May Habib Cover

这家公司最早其实做的是企业级机翻引擎。2016年,创始人May Habib从迪拜搬到旧金山,在Visa的会议室里,用一张白板手绘集成流程、回家连夜写GitHub插件,敲下了她人生第一单 - 价值12.6万美元。但Habib很快意识到,翻译工具这个赛道天花板太低,撑不起一家公司。于是她带团队果断转型,跳出语言服务,把Writer定位为企业AI工作平台 - 能自动生成内容,更能自动完成任务。

阅读全文 »

Image

引言

昨天,一封来自Shopify CEO托比·卢特克(Tobi Lütke)的内部备忘录在科技圈引发了轩然大波。这封被泄露(随后由CEO本人在社交媒体确认并分享)的邮件内容堪称激进:

本能地使用 AI,现在是对Shopify每个人的基本预期。

也就是说,这不再是温和的“鼓励尝试”,而是变成了赤裸裸的公司级硬性要求和 KPI:

  • AI使用情况被写进员工绩效考核和同事评估中;
  • 每个团队在申请新资源或人力前,必须先论证为什么AI无法完成这项工作。 (潜台词:先用 AI,不够再加人!)
  • 在任何项目的原型设计阶段,必须以AI探索为主导;

(注:Shopify是全球领先的一站式电商建站服务的平台,主要服务广大中小商家);

阅读全文 »

最近在玩 GPT-4o 生图功能时,发现了一个很有意思的小突破 - 只用两个词,就能稳定生成一整套风格一致的动漫贴纸

比如这张:

“Naruto stickers”(火影忍者贴纸) → 就稳稳地生成了一整套Q版火影角色贴纸!

Image
没堆关键词、没加美术风格描述,就这么一个朴实无华的两个单词的prompt,GPT-4o居然给出了九宫格排版、统一风格、角色准确、颜色协调的成图效果。

继续测试下去,“Saint Seiya stickers”(圣斗士星矢贴纸)、“Slam Dunk stickers”(灌篮高手贴纸),几乎都能完美复现:

阅读全文 »

昨晚Meta 悄悄地放出了 Llama 4 系列模型,一下子扔了三个名字很燃的版本:Scout(侦察兵)、Maverick(特立独行者)、Behemoth(巨兽),并直接在 Hugging Face 上开放了下载。

在社交媒体上的AI技术圈瞬间引发了热议,关键词包括:

  • 上下文窗口突破到 1000 万 tokens(Scout);
  • 全系多模态输入(图+文);
  • 混合专家架构(MoE),只激活 17B 参数;
  • 模型部署亲民:Scout 单卡可跑;

有惊喜也有争议。我花了点时间通读发布说明、读了下benchmark、刷了社媒上的开发者热帖,试着理一理这波 Llama 4 到底意味着什么。

Image

阅读全文 »

最近被 GPT-4o 的“灵魂画手变神图”震惊了一下后,意外发现另一个低调但超级实用的AI工具 - 微信自带的图片翻译功能,已经变得非常能打了。

不需要任何插件、不用截图另存,只要「长按图片 → 翻译」,它就能自动识别图中文字,秒翻译成中文(或其他语言),最重要的是还能保留原图样式!

具体操作入口如下箭头处:

阅读全文 »

你是不是曾经用过微信的简易P图功能,在群里扮演过“灵魂画手”,为群友们的照片做过各种涂鸦式的二次创作?那些充满“灵魂”的涂鸦式图片,画风虽然抽象到连你自己都觉得有点好笑,但效果总是莫名传神,把群友们笑到不行。

但想象一下,如果这些“灵魂图片”真的能被 AI 理解并“点石成金”,轻易地直接转为高品质的图片,而且不需要任何画画或设计功底,是不是有点心动了?

最新的 GPT-4o 图片生成能力就正在将这变为现实!


最近我一直在实验 GPT-4o 的生图能力,过程中看到一个特别出彩的例子,觉得非常适合用来说明它到底强在哪。

这张图非常生动地展示了 GPT-4o 在图片生成上的两大亮点

  • 你说什么,它真能懂(指令依从性)
  • 你画得再抽象,它也能理解(易用性超强)
    阅读全文 »
0%