RichChat

A blog for tech enthusiasts

RichChat

译者注:下文对Chip Huyen在1月初发表在自己博客上的这篇《AI智能体综述》的文章进行了翻译,内容改编自作者刚发表的这本AI Engineering(2025)书的Agents章节。

我读了一下觉得作为一个综述是挺不错的,其价值在于展示了构建真正有用的AI智能体所需的思维方法:如何在工具和规划之间找到平衡,如何处理失败,以及最重要的,如何区分看起来有效和真正有效的方案。如果你想要理解AI智能体的本质,而不仅仅是表象,这篇文章值得你花时间。

许多人认为智能体是人工智能的终极目标。Stuart Russell和Peter Norvig的经典著作《人工智能:一种现代方法》(Prentice Hall,1995)将人工智能研究领域定义为”理性智能体的研究与设计”。

基础模型的前所未有的能力为以前无法想象的智能体应用打开了大门。这些新能力使得开发自主智能体成为可能,它们可以作为我们的助手、同事和教练。它们可以帮助我们创建网站、收集数据、规划旅行、进行市场研究、管理客户账户、自动化数据输入、为面试做准备、面试候选人、谈判交易等。可能性似乎是无限的,而这些智能体的潜在经济价值也是巨大的。

本文将首先概述智能体,然后讨论决定智能体能力的两个方面:工具和规划。智能体有其新的运作模式,也就有了新的失败模式。本文最后将讨论如何评估智能体以发现这些失败。

阅读全文 »

我让五款主流AI(GPT-4o、gemini、claude、豆包、deepseek)来扮演“诸葛亮”,为穿越成崇祯皇帝的我出谋划策,能扭转当时面临内忧外患的巨大挑战吗?结果发现…

实验设计

我选择了目前主流的五款AI:GPT-4o、Claude、Gemini、豆包和Deepseek,给它们相同的提示词:作为一位穿越到明朝末期的崇祯皇帝,需要一些能帮助扭转局势的实用发明。要求这些发明必须使用当时能找到的资源和工具,并能实际制造。

阅读全文 »

AI相关岗位是美国就业市场上增长最快速的岗位,这是LinkedIn周二发布的2025年度就业趋势报告的核心发现。同时这份揭露了近年增长最快的前25个岗位中的一个要点是:榜单上60%的职位都是今年新上榜,而近一半的职位在25年前甚至还不存在 - 很明显就业市场正在经历一场深刻的结构性变革。根据调研,64%的职场人士表示感到工作变革带来的压力,美国职工的就业安全感也降至疫情以来的最低点。

具体数据来源:LinkedIn分析了2022年1月至2024年7月期间新增的数百万个工作岗位。

增长最快的前25位职业中的亮点总结:

  • AI相关职位占据前两位,分别是AI工程师和AI顾问,AI研究员也排名第12位;
  • 医疗保健领域表现强劲,物理治疗师位列第3,高级执业医师排名第22;
  • 技术和工程类职位也很受欢迎,桥梁工程师(第18位)、核工程师(第21位)和仪器与控制工程师(第24位)都上榜了;
  • 旅游和活动相关职位在榜单上也排名很高,包括旅游顾问(第5位)和活动协调员(第6位);
  • 可持续发展专家的崛起(第9位)表明企业对环境和社会责任的重视程度提升;
  • 财务主管(第13位)、首席增长官(第17位)和首席收入官(第23位)等高管职位的上榜反映了企业对收入增长的关注;
    阅读全文 »

基于2024年12月《AI and Freelancers: Has the Inflection Point Arrived?》这篇最新论文的研究,本文总结了其中提到的AI对网页开发、翻译等自由职业领域的影响,揭示了一个关键问题:**不同职业正在经历截然不同的AI影响轨迹,而理解这种差异的关键在于”拐点”**。

一、研究核心发现

这项研究通过分析大规模在线劳动市场数据,揭示了一个引人深思的现象:AI的影响呈现出一个有趣的双面性。在某些领域,它就像一位得力助手,帮助提升工作效率;而在另一些领域,它更像是一位竞争者,开始替代人工。

阅读全文 »

最近,微软研究科学家Victor Dibia(AutoGen多智能体框架的核心开发者)发表了一篇深度总结文章,回顾了2024年AI智能体技术的发展。在探讨这些趋势之前,我们先来理解什么是AI智能体(AI Agent)。

简单来说,AI智能体是一种能够自主理解、规划并执行任务的AI系统。不同于传统的AI模型,智能体能够根据具体情况做出决策,使用各种工具,并且可以持续学习和适应。它就像是一个数字助手,不仅能理解你的需求,还能主动采取行动来完成任务。

阅读全文 »

分享一篇最新来自卡内基梅隆大学研究人员的论文 - The Agent Company: Benchmarking LLM Agents on Consequential Real World Tasks.

Paper中的key points和一些我印象深刻的点如下:

- 这个名为TheAgentCompany的基准测试平台可以将其理解为 为AI智能体搭建的一个微型公司,在这里AI需要处理从编写代码到安排会议、分析数据等各种真实的工作任务。换句话说,这就是为AI智能体创造了一个”职场模拟器”,让我们能够真实地观察AI在办公环境中的表现

阅读全文 »

引言:最新这篇来自Anthropic的关于如何构建智能体的文章很有实战意义,因此将全文及其图片都精翻了一下,推荐在考虑构建LLM应用的技术方向朋友们都可以看看。其中印象最深刻的地方应该是官方在文中至少强调了四五次 - 不要过度构建,能用简单方法解决的就不要额外添加复杂性!尤其不要因为看到有个方便的智能体系统开发框架就忍不住直接上~


过去一年里,我们与数十个团队合作,帮助他们在各个行业中构建大语言模型(LLM)智能体。有趣的是,最成功的实现往往不是使用复杂的框架或专门的库,而是采用简单、可组合的模式

在这篇文章中,我们将分享从客户合作和自身构建智能体的过程中获得的经验,并为开发者提供构建高效智能体的实用建议。

阅读全文 »

近期,硅谷著名风投机构 a16z 的50位合伙人分享了他们对2025年科技创新方面的深度洞察。内容包括人工智能”外脑”、生物制药重大突破、无限游戏、核能复兴、”无面”创作者、谷歌搜索的挑战者等等,让我们一起来深入探讨看看。

(注:下面的科技趋势分类和底层观点均来自a16z原文,虽然视角更多站在美国的科技创新角度,但部分观点也有参考价值)

美国活力:硬科技驱动的新未来

能源革命:AI时代的动力之源

2025年的数据中心耗电量堪比一座小城市。正是这种前所未有的能源需求,让核能站在了临界点上。监管改革、公众支持、资本涌入,再加上AI数据中心对清洁稳定能源的渴求,共同推动着核能复兴。宾夕法尼亚州的三里岛核电站就是最好的例证 - 这个曾经因事故闻名的设施将在2028年重获新生,肩负起为AI时代提供源源不断算力支持的重任。

阅读全文 »

还记得去年ChatGPT刚刚爆火时的情形吗?那时候,每个人都在谈论AI,似乎人类要被取代的一天即将到来。而到了2024年,当知名研究机构Gartner说AI正在进入”幻灭低谷”的时候,一些人开始怀疑:这是不是又一个泡沫即将破裂的征兆?但就在这一年即将结束的时候,AI领域却迎来了一波令人瞩目的爆发式增长。让我们一起回顾这不平凡的一年。

让我们一起盘点和回顾一下2024年底的AI到底同比2023年发生了哪些巨大变化:

智能已不再稀缺

去年这个时候,提起顶级AI模型,GPT-4是唯一一家能打的,远远领先于所有竞争对手。但现在,形势已经发生了翻天覆地的变化。就在六月,Anthropic的Claude Sonnet 3.5横空出世,一出场就技惊四座,在模型测试超越了GPT-4o(从我个人实用角度来说也已经离不开Claude了)。这就像是班里突然出现了第二个学霸,打破了一家独大的局面。

阅读全文 »

本文总结自花旗银行 GPS 于 2024 年 12 月发布的《人工智能机器人崛起》报告,深入剖析了AI机器人领域的技术突破、市场机遇与挑战。这份报告传递了一个清晰的信号:AI机器人正在从实验室和工厂加速走向我们的日常生活,预计到2035年将有13亿台,2050年更将达到40亿台。

阅读全文 »
0%