RichChat

A blog for tech enthusiasts

RichChat

当人工智能开始改变物理世界

去年是第一次CES(消费电子展)评选出来的创新奖中包含了AI这个全新分类,我也是从这里开始更多关注AI+硬件创新产品这个方向。今年也不例外,我将获得CES创新奖中和AI相关的产品以及其他一些我个人觉得有趣的产品整理成了一个报告材料:

  • 包含了25个获得CES创新金奖(Best of Innovation)的新品;
  • 从获得这次CES创新银奖(Honoree)的新品中,选择了包含了AI分类下的全部(55个),还精选了数字健康分类下的26款和其他分类下的11款;

今年的CES创新奖展现了一个明显的趋势:人工智能正从纯软件应用走向深度的硬件融合。在获奖产品中,我们看到AI不再仅仅是添加在产品上的一个功能标签,而是开始真正改变产品的核心价值与使用体验。从医疗诊断设备到家庭伴侣机器人,从工业设计工具到农业管理系统,AI正在以更加实质性的方式融入各个领域。

在接下来的内容中,我将从医疗健康、智能家居和产业技术三个维度举例,为你解析CES 2025创新奖中最值得关注的一些创新,文章结尾也附上了如何获取完整版的125页PDF报告。

阅读全文 »

“在软件工程领域,AI的真实价值究竟几何?OpenAI用100万美元的真实项目给出了答案。”

在评估AI编程能力时,我们一直面临着一个问题:那些学术基准真的能反映现实世界中的软件工程工作吗?

今天OpenAI发布了一个新基准测试SWE-Lancer,用一种前所未有的方式评估AI的编程能力 - 直接用真实的自由职业者软件项目来考验AI。整个测试数据集包含了近1500个来自Upwork(这是一家线上接活的平台)的软件工程项目,总价值100万美元!

阅读全文 »

DeepSeek 这款AI大模型是最近炙手可热的话题之一,但突然一下子的大规模出圈导致了DeepSeek官方的服务器总是拥挤不堪。以至于现在,每个人都想知道如何才能稳定地使用 R1 模型。

每次当身边的朋友们问到我这个问题的时候,我会给他们推荐腾讯旗下的元宝 AI这款产品,因为其中也提供了DeepSeek R1的模型(包括联网搜索!),而且无论从服务稳定性还是响应速度来说都显著比不堪重负的DS官网版要强。

但从这一段时间的实用后,我感觉元宝版DeepSeek R1输出的结果质量似乎会比官网版DeepSeek R1要差一些? 所以就做了次实验,这篇内容主要想讨论三个问题:

  1. 元宝的 R1 回答结果是否真的比官网 R1 的差?

  2. 如果有,为什么会有这种差异? 大家不都是用的同样DeepSeek R1模型嘛?

  3. 由于测试的时候用了一个和金融市场相关的例子,引发了最后这点 - 对于金融数据这种对结果精度要求极高的内容,R1+联网搜索的模式是否靠谱?

Disclaimer:下面的实验方式显然还不够严谨,其中也包含了一些个人猜测,仅供抛砖引玉作为辅助参考

阅读全文 »

在科技产品零售这条路上,Meta 终于找到了一位”懂行”的老司机。前奢侈品二手电商 The RealReal 的 CEO John Koryl 刚刚加入 Meta,担任零售业务副总裁,直接向 CTO Andrew Bosworth 汇报。

有趣的是,这份任命是和另一个重磅人事一起宣布的 - Meta 同时成立了机器人产品部门,并请来了前 Cruise CEO Marc Whitten 担任副总裁 - 这表明 Meta 正在构建一个完整的未来科技生态系统。

想想看,Quest 头显、Ray-Ban Meta 智能眼镜这类产品,和一般的消费电子品有很大不同。你不能像卖手机那样,把它放在柜台里让顾客看看参数表就完事。这些产品需要”试戴体验”,需要面对面的讲解和演示。简单说,它们需要一种全新的零售体验。

阅读全文 »

🔥又到了刷论文比刷短剧爽的AI论文导读专题了,我会尝试尽量用普通人也能理解的方式来讲一些最新的AI领域论文~

这次要讲的这篇来自OpenAI的最新论文非常有趣,尤其是将其结合之前DeepSeek R1的技术论文中提到的对强化学习(RL)的使用部分一起来看的时候,你会明显地觉得RL的里程碑时刻真的要来了(而且也从另一个角度再次说明了DeepSeek团队独立发现了如何训练推理模型的配方),这意味着大模型们真的能更快更高效地自我进化了 我们将更快看到更强大的新模型出现

论文名为Competitive Programming with Large Reasoning Models,核心思想可以一句话总结为:

在竞赛编程这个高度专业化的领域,所有精心设计的人类知识最终都败给了纯粹的强化学习

阅读全文 »

虽然大家都在猜测AI会如何影响就业,但直到现在还没有确切的数据支持。Anthropic通过分析了数百万条真实的Claude对话,首次揭示了人们实际上是如何使用AI的。

  • 这里是采用了一套名为Clio的研究工具,简单说是用AI来分析用户与Claude的对话内容的大盘情况的系统(也是目前全球独家有公开用户实际使用大数据的),同时严格保护用户隐私。当Anthropic去年底第一次公布来自Clio的发现的时候我也写过一篇数据总结

最引人注目的发现是:AI并没有完全取代某些工作,而是在特定任务中被选择性使用。只有约4%的职业在其大部分(75%以上)的工作任务中使用AI。但是有36%的职业在至少四分之一的任务中使用AI。这表明AI更多是在增强人类工作,而不是完全自动化某个职位

阅读全文 »

译者注:将来自Jay Alammar的这篇《DeepSeek-R1 图解》做了全文翻译,属于技术向的内容了,如果想看相对门槛较低的“说人话”总结版本可以参考我写过的这篇 - DeepSeek-R1的创新到底在哪儿? - 重新定义AI推理能力的培养之道

DeepSeek-R1 图解版

一个推理型 LLM 的训练方法

DeepSeek-R1 是 AI 发展进程中最新的重要突破。对机器学习研发社区而言,这是一个具有重大意义的发布:

  1. 这是一个开放权重模型,并提供更小的蒸馏版本;
  2. 它分享并深入探讨了一种训练方法,用于复现类似 OpenAI O1 的推理模型;

在这篇文章中,我们将用图形化的方式来详细介绍R1是如何被构建的。

阅读全文 »

引言

翻译自Verge的Victoria Song最新一篇关于智能眼镜体验的文章。一些个人点评和总结如下:

  • 文中提到的智能眼镜最大的痛点在于电池续航这点确实有道理,尤其是提到的那个在滑雪场的具体例子 - 老公戴着 Ray-Ban Meta 智能眼镜要录下大家玩雪橇的欢乐时刻,眼镜却突然没电关机了。这一幕让她意识到,在寒冷天气下,智能眼镜的电池显得特别脆弱;
  • 目前Ray-Ban的正常续航就是4小时,而且如果打开了AI助手功能后甚至会缩短到30分钟,这对于原本是计划要打造为一个用户可以全天佩戴的智能产品来说是差距有点太大了。对于有近视度数的用户会更麻烦一些,因为目前无论采用何种充电方式,几乎不可能在佩戴时同时进行充电 - 导致当充电时用户将会失去正常视物的能力…
  • 目前市面上的智能眼镜的电池基本都是无法更换的,虽说保修期内电池出问题可以免费换新,但随着使用时间增加,电池性能必然衰退,到时候除了买新款眼镜外,就别无选择了;
  • 和文中结尾的感触一样,我也觉得用户是很讨厌频繁充电的,尤其在可穿戴设备上。在百镜大战爆发的2025年,期待能看到针对智能眼镜续航能力的创新和突破;
    阅读全文 »

从意大利多洛米蒂山区的一间小工作室,到市值突破1,000亿欧元的全球巨头 - 依视路陆逊梯卡(EssilorLuxottica)的故事,或许就是下一个计算平台革命的预演。

上周,这家全球最大的眼镜制造商市值达到1,015亿欧元,实现了已故创始人莱昂纳多·德尔维基奥的终极目标。推动股价上涨的一个关键因素,是他们与Meta合作开发的智能眼镜产品。

Line chart of Share price and index rebased showing EssilorLuxottica reached a €100bn valuation last week

阅读全文 »

引言

在硅谷,1000亿美元的投资往往预示着两种可能:要么是在下一盘大棋,要么就是在纯烧钱。Meta的CEO扎克伯格显然认为自己属于前者。

就在上周,Meta为其Ray-Ban智能眼镜砸下重金,在超级碗中(热门程度可以将其想象为美国的“春晚”)投放了两支广告。在广告中两位克里斯(分别是漫威电影中雷神和星爵的演员)在用AI识别艺术品和翻译外语,而詹纳在香蕉艺术品事故后用眼镜助手来联系律师。这些场景传达的信息很清楚:这不是一个让你看起来像科技极客的设备,而是一个能让你的生活更轻松、更有趣的工具。

如果说第一代Ray-Ban智能眼镜还只是个'会拍照的墨镜',那么即将推出的新款就开始展露Meta的真实野心。加入显示屏、强化AI能力,这副眼镜正在悄悄化身为你的第二块屏幕。而这,不过是通往Meta终极目标的第一步:

打造取代智能手机的下一代计算平台

1000亿美元,就为了一副眼镜?不,是为了重新定义我们与数字世界的交互方式。

阅读全文 »
0%