RichChat

A blog for tech enthusiasts

RichChat

引言:最新这篇来自Anthropic的关于如何构建智能体的文章很有实战意义,因此将全文及其图片都精翻了一下,推荐在考虑构建LLM应用的技术方向朋友们都可以看看。其中印象最深刻的地方应该是官方在文中至少强调了四五次 - 不要过度构建,能用简单方法解决的就不要额外添加复杂性!尤其不要因为看到有个方便的智能体系统开发框架就忍不住直接上~


过去一年里,我们与数十个团队合作,帮助他们在各个行业中构建大语言模型(LLM)智能体。有趣的是,最成功的实现往往不是使用复杂的框架或专门的库,而是采用简单、可组合的模式

在这篇文章中,我们将分享从客户合作和自身构建智能体的过程中获得的经验,并为开发者提供构建高效智能体的实用建议。

阅读全文 »

近期,硅谷著名风投机构 a16z 的50位合伙人分享了他们对2025年科技创新方面的深度洞察。内容包括人工智能”外脑”、生物制药重大突破、无限游戏、核能复兴、”无面”创作者、谷歌搜索的挑战者等等,让我们一起来深入探讨看看。

(注:下面的科技趋势分类和底层观点均来自a16z原文,虽然视角更多站在美国的科技创新角度,但部分观点也有参考价值)

美国活力:硬科技驱动的新未来

能源革命:AI时代的动力之源

2025年的数据中心耗电量堪比一座小城市。正是这种前所未有的能源需求,让核能站在了临界点上。监管改革、公众支持、资本涌入,再加上AI数据中心对清洁稳定能源的渴求,共同推动着核能复兴。宾夕法尼亚州的三里岛核电站就是最好的例证 - 这个曾经因事故闻名的设施将在2028年重获新生,肩负起为AI时代提供源源不断算力支持的重任。

阅读全文 »

还记得去年ChatGPT刚刚爆火时的情形吗?那时候,每个人都在谈论AI,似乎人类要被取代的一天即将到来。而到了2024年,当知名研究机构Gartner说AI正在进入”幻灭低谷”的时候,一些人开始怀疑:这是不是又一个泡沫即将破裂的征兆?但就在这一年即将结束的时候,AI领域却迎来了一波令人瞩目的爆发式增长。让我们一起回顾这不平凡的一年。

让我们一起盘点和回顾一下2024年底的AI到底同比2023年发生了哪些巨大变化:

智能已不再稀缺

去年这个时候,提起顶级AI模型,GPT-4是唯一一家能打的,远远领先于所有竞争对手。但现在,形势已经发生了翻天覆地的变化。就在六月,Anthropic的Claude Sonnet 3.5横空出世,一出场就技惊四座,在模型测试超越了GPT-4o(从我个人实用角度来说也已经离不开Claude了)。这就像是班里突然出现了第二个学霸,打破了一家独大的局面。

阅读全文 »

本文总结自花旗银行 GPS 于 2024 年 12 月发布的《人工智能机器人崛起》报告,深入剖析了AI机器人领域的技术突破、市场机遇与挑战。这份报告传递了一个清晰的信号:AI机器人正在从实验室和工厂加速走向我们的日常生活,预计到2035年将有13亿台,2050年更将达到40亿台。

阅读全文 »

AI使用指南:它比你想象的更强大,也更笨拙

在这个AI工具爆发的时代,你有没有对AI的表现感到困惑?让我从一个有趣的例子说起 - 如果你让AI数”strawberry(草莓)”这个单词里有多少个字母”r”,它可能会数错。但如果你让它创作一首关于数这个单词有多难的莎士比亚风格十四行诗,并且每行首字母还要拼成一个和草莓相关的藏头诗,它却能完美完成。这种迷人的反差,恰恰揭示了AI作为一个”数字助手”的独特本质。

AI:一个特立独行的天才同事

想象一下,AI就像办公室里那个特别的同事 - 在日常小事上可能会手忙脚乱,搞不清订书针和回形针的区别,但转眼间却能用五种语言流畅地写出一份令人惊叹的商业计划。这让我想起了《生活大爆炸》里的Sheldon - 在最简单的社交礼仪上可能犯糊涂,却能轻松解答复杂的理论物理问题。

阅读全文 »

近期,一场始于社交媒体的讨论在科技圈引发了广泛关注。有人揭露了一个令人震惊的现象:在一些大型科技公司中,存在着一群特殊的“幽灵工程师”,他们每周仅工作约5小时,每月代码提交次数屈指可数,却能获得20万至30万美元的年薪。这种现象不仅存在于Oracle、Salesforce和Adobe等传统科技企业,更已蔓延至FAANG(Meta、Apple、Amazon、Netflix、Google)等科技巨头和一些中型科技创业公司。

此外,还有另外一类可以被称为”多面打工人”的工程师们正在多家公司间游刃有余地周旋。在Reddit一个名为overemployed(过度就业)社区中,超过38万名成员正在公开讨论如何同时经营多份工作的策略。其中很多都能通过多份技术岗位的工作,轻松实现50万美元以上的年收入。

这两类人都在公司管理的雷达之下活动,给企业管理带来了前所未有的挑战。

阅读全文 »

还记得第一次看《钢铁侠》时,我们如何惊叹于托尼·斯塔克与他的人工智能助手贾维斯的互动?那种科技与人完美融合的场景,在我们心中种下了一颗关于未来的种子。而现在,在一个平凡的周五下午,当你和我一样看完这段Google的新一代AR眼镜的演示视频后,你也会觉得这个场景突然变得触手可及。

当昔日梦想照进现实

十年前,Google Glass的失败几乎击碎了科技界对AR眼镜的憧憬。但科技从不会停滞不前,除了最近在海外大火的Meta Ray-ban这款智能眼镜已经出货200万台的好消息以外,Google带着Android XR(专门为XR设备设计的安卓系统,配合应用商店模式)和Gemini AI重返战场。这一次,他们不再是简单地在人们眼前放置一个显示屏,而是重新思考了人类与科技互动的方式。

阅读全文 »

引言:AI大牛Karpathy今天在社交媒体上公开推荐了一些他特别推荐的书,我翻译整理了一下他的原文并配上了对应的豆瓣链接,有兴趣的朋友可以收藏阅读:

Karpathy:在我读过的约200本书中,以下是那些令我印象深刻、经常回想或引用的几本(排名不分先后):

Ted Chiang(特德·姜)的所有短篇小说 —— 尤其是《呼吸》(Exhalation)、《除零》(Division By Zero)、《领悟》(Understand)、《你一生的故事》(Story of Your Life)、《审美观》(Liking What You See)、《软件生命周期》(The Lifecycle of Software Objects)、《对我们的期望》(What’s Expected of us)等,主题新颖独特,思想深邃,阅读体验极佳。

阅读全文 »

看了一下今天发布的正式版o1,虽然确实也挺不错,只是没有那么惊艳了… 写几点个人印象深刻的内容吧:

  • o1终于能支持图片作为输入了!在测试一些只有图片数据的问题的时候更方便了;
  • 在数学竞赛问题和博士级别的科学问题能力方面有了相当的提升,已经比普通的人类专家要厉害了;
    Image
    阅读全文 »

最近有篇论文通过随机临床实验评估了AI大语言模型(LLM)对医生诊断的影响,其结果相对有趣:医生在使用AI辅助做诊断时,与仅使用传统电脑工具(例如搜索引擎)相比,准确率表现差异不显著(得分76% vs 74%),这是否说明AI在医疗诊断方面完全没有用?但实验中还引入了第三组纯用AI来做诊断的对照组,而这个组的诊断得分(92%)竟然显著高于前两组的准确率。这个看似矛盾的现象揭示了一个值得深思的问题:为什么专业人士没能从如此先进的AI工具中受益?

我们是否真的会用AI?

根据一篇来自纽约时报的更详细的研究报道细节中写出,研究者在阅读参与实验的医生的使用AI记录时,发现其实很多人不太会“和AI说话”,例如医生们会像使用搜索引擎一样对AI提出简单的事实性问题:”肝硬化是癌症的危险因素吗?””眼痛可能的诊断是什么?”只有极少数医生意识到,他们其实可以把整个病例复制粘贴给AI,请它进行全面分析。也因此,实验中只有少数医生真正见识到了AI聊天机器人能给出的既全面又智能的惊人答案。

这个例子完美地展示了很多人使用AI时的常见误区。我们习惯了过去二十多年与计算机工具的互动方式是:输入指令,获取结果。但AI并不是传统的软件工具,也不就是个更智能的搜索引擎。

阅读全文 »
0%