RichChat

A blog for tech enthusiasts

RichChat

译者注:再带来一篇关于Meta Ray-Ban的Live AI能力的最新评测文章,依然来自Verge的Victoria Song。几点个人点评:

  • Live AI功能目前的定位确实相对尴尬,应该还需要继续打磨,需要解决当前面临的——比手机麻烦,比真人助手笨拙这个重大挑战;
  • 你必须知道如何问正确的问题才能得到你想要的答案这个点也很重要,因为普通人确实要熟悉和AI的正确交流方式还需要磨合一下;
  • 不过乐观估计随着AI智能的提升,上面这两点问题都能逐步得到自然解决,尤其是目前Meta眼镜还用的是并非业界顶级AI的情况下;

如果对AI眼镜感兴趣的朋友欢迎关注我过往的一些相关系列文章

阅读全文 »

今天Deepseek app在全球应用市场的排名再创新高 - 已在173个国家和地区登顶第一!考虑到全球目前一共只有174个国家/地区的市场分榜,而Deepseek唯一一个没有登顶的国家是汤加(第二名),这几乎就是完美的全球制霸!

这种势头可谓空前绝后,我们确实在见证一个历史性的时刻。

如果要想深入了解为什么Deepseek能取得这样的成绩,以及回应一些关于质疑Deepseek的创新点到底在哪儿的声音,我下面尝试深入浅出的来讲讲:

DeepSeek-R1的出现为AI领域带来了一个重要启示:

通过创新的训练方法,开源模型也能在推理能力上达到与顶级闭源模型相当的水平*。*

阅读全文 »

Deepseek新发布的模型引发了AI圈的强烈关注:仅用竞争对手十分之一的GPU算力,就达到了顶级闭源模型的智力水平。这一突破迅速引发媒体广泛报道,在短短24小时内,Deepseek从43个国家应用市场榜首扩展到了160个国家,这家中国AI公司彻底出圈了。华尔街对这一消息反应激烈 - 英伟达股价暴跌17%,市值蒸发近6000亿美金。投资者似乎在传递一个明确信号:科技巨头们不计成本地投入巨资提升算力的策略可能走入了死胡同。

1/27/2025 Nvidia drops nearly 17% as China's cheaper AI model DeepSeek sparks global tech sell-off Intraday trading session on Jan. 27, 2025

但是,作为一个长期观察AI发展的研究者,我认为这个结论过于简单化了AI进化的复杂性,昨晚也和一些朋友在微信群中做了热烈讨论。今早看到Andrej Karpathy发了一篇关于深度学习与算力关系的推文,感觉他提出的几个观点确实切中了要害,因此再结合一些自己的理解,谈谈为什么市场可能对算力的未来判断过于悲观。

阅读全文 »

查了一下,我是在去年9月开始注册使用Deepseek的。当时最大的感受是它的性价比实在太高了 - 每百万token才收费2元人民币。但很长一段时间里,Deepseek都只在我们AI爱好者/从业者的小圈子里流传。

然而短短几个月后的今天,情况发生了不可思议的变化,甚至比我之前写过的小红书的美国登顶应用市场的案例更富有戏剧性~

一个意想不到的爆发

截至1月27日,Deepseek的应用已经在全球43个国家和地区的应用商店登顶第一,另外还在116个国家和地区进入前十。从美国到英国,从澳大利亚到尼日利亚,这个来自国内的AI应用正在创造一个前所未有的记录。

阅读全文 »

2025年1月的一个清晨,硅谷帕罗奥图的一家咖啡馆里,一位VC投资人正盯着手机屏幕发愣。

“这一定是某种错误,”他喃喃自语,快速刷新了几次App Store排行榜。但那个红底白字的中文图标依然稳稳占据着榜首的位置 —— 小红书。
Image

“这可真是个有趣的转折,”他对同事说,”十年前,我还记得那两个年轻人来见我们时的场景。”

他说的是2013年的那个秋天。在斯坦福校园里,一个名叫毛文超的年轻人正用着浓浓的武汉口音打电话,向家里人报备要带回国的购物清单。这声音吸引了路过的另一位武汉人——时任贝塔斯曼高管的瞿芳。就这样,小红书的创业故事开始了。

“选这个名字,是因为贝恩咨询和斯坦福商学院都用红色做标志。”多年后,毛文超在接受采访时这样解释,他认为这两段经历是他人生中重要的里程碑。那时的他们,满怀着对全球化的憧憬:一份PDF购物指南、两个跨国公司的从业者、三个月内的50万下载量。

但命运总爱开玩笑。

阅读全文 »

计划在今年重点关注一下AI+眼镜这个火热的方向,会实时跟进这个领域的一些海外最新报道和文章,今天先带来下面这篇关于Meta Ray-Ban的AI实时翻译能力的评测文章。如果对AI眼镜感兴趣的朋友欢迎关注我的公众号【檬查查】和视频号【RichChat檬查查】

Meta智能眼镜新推出的实时翻译效果依然参差不齐

  • 我与一位西班牙语使用者对话并尝试观看Emilia Pérez(一部西语电影)的视频片段,结果出现了有趣的差异。

Front view of the Ray-Ban Meta smart glasses on a colorful background

我上一次上西班牙语课还是在初中时期。我只记得一些很基础的短语,比如”洗手间在哪里?”和”我的猫很胖”这样的表达。如果没有翻译工具,要用西班牙语进行有意义的对话是不可能的。所以当我前几天通过Ray-Ban Meta智能眼镜,能够与一位西班牙语使用者进行关于K-pop的基本对话时,我真的感到很惊讶。

阅读全文 »

当我收到微信公众号后台的新功能通知时,我并没有太在意。作为一个经常写AI相关内容的博主,我几乎每周都会收到各种各样的AI产品更新通知。但这次不太一样。

这是我第一次看到微信在其核心产品 - 公众号平台上主动尝试引入AI功能。考虑到微信在中国社交领域的统治地位,这个决定本身就很值得关注。

从功能到体验

我开启这个功能后,等待了大约10分钟让AI学习我的历史文章。然后我做了一件我每次体验新AI产品时都会做的事:系统性地测试它的边界。

最初的测试结果令人惊喜。这个基于混元大模型的”智能回复”助手不仅能准确回答关于我文章内容的问题,而且语气自然,很像我本人在回答。

阅读全文 »

本文改编自Ben Hylak的英文原文 - o1 isn’t a chat model (and that’s the point),之所以要改编主要是原文的写作风格比较跳跃,感觉读起来不太友好。重新改编过的这个版本更符合我喜欢的阅读风格了。

文章揭示了一个容易被忽视但很重要的观点:不是所有的AI都应该用对话的方式来使用。如果你正在使用或计划使用新一代的AI模型(例如o1),这篇文章值得一读。不是因为它告诉你某段具体而神奇的提示词,而是因为它可能改变你对o1这种全新模型的本质理解。这种理解上的转变,比任何具体的使用技巧都重要。


如何正确使用o1 - 给其足够的上下文,而不是足够的对话?

最近我发现了一个有趣的现象:人们在使用o1时犯的最大错误,就是把它当作对话型AI。

就像早期的网页设计 - 当时的设计师们试图让网站看起来像纸质杂志,执着于固定的版面和精确的排版。但后来我们发现网页有着完全不同的交互逻辑和可能性。

我们现在对o1的态度也差不多。

当o1 pro发布时,我立即支付了每月200美元的订阅费。这个决定很简单:如果它能替代工程师一两个小时的工作,这笔钱就值了。但第一天的体验很糟糕。等待5分钟就为了收到一堆冗长的、自相矛盾的内容,这感觉像是在浪费时间。

我在Twitter上抱怨了这一点。有趣的是,一些我很尊重的工程师却持相反意见。他们说o1改变了他们的工作方式。这让我意识到可能是我用错了方法。

经过几周的实验,我明白了问题所在:我们习惯了与AI对话,但o1不是用来对话的。

阅读全文 »

译者注:下文对Chip Huyen在1月初发表在自己博客上的这篇《AI智能体综述》的文章进行了翻译,内容改编自作者刚发表的这本AI Engineering(2025)书的Agents章节。

我读了一下觉得作为一个综述是挺不错的,其价值在于展示了构建真正有用的AI智能体所需的思维方法:如何在工具和规划之间找到平衡,如何处理失败,以及最重要的,如何区分看起来有效和真正有效的方案。如果你想要理解AI智能体的本质,而不仅仅是表象,这篇文章值得你花时间。

许多人认为智能体是人工智能的终极目标。Stuart Russell和Peter Norvig的经典著作《人工智能:一种现代方法》(Prentice Hall,1995)将人工智能研究领域定义为”理性智能体的研究与设计”。

基础模型的前所未有的能力为以前无法想象的智能体应用打开了大门。这些新能力使得开发自主智能体成为可能,它们可以作为我们的助手、同事和教练。它们可以帮助我们创建网站、收集数据、规划旅行、进行市场研究、管理客户账户、自动化数据输入、为面试做准备、面试候选人、谈判交易等。可能性似乎是无限的,而这些智能体的潜在经济价值也是巨大的。

本文将首先概述智能体,然后讨论决定智能体能力的两个方面:工具和规划。智能体有其新的运作模式,也就有了新的失败模式。本文最后将讨论如何评估智能体以发现这些失败。

阅读全文 »

我让五款主流AI(GPT-4o、gemini、claude、豆包、deepseek)来扮演“诸葛亮”,为穿越成崇祯皇帝的我出谋划策,能扭转当时面临内忧外患的巨大挑战吗?结果发现…

实验设计

我选择了目前主流的五款AI:GPT-4o、Claude、Gemini、豆包和Deepseek,给它们相同的提示词:作为一位穿越到明朝末期的崇祯皇帝,需要一些能帮助扭转局势的实用发明。要求这些发明必须使用当时能找到的资源和工具,并能实际制造。

阅读全文 »
0%