RichChat

A blog for tech enthusiasts

RichChat

之前在很多个场合做过AI主题分享,针对应该如何应对这波AI大潮带来的影响,我给出建议中的第一点就是鼓励大家多尝试新一代的各种AI产品,无论是在工作中提效还是生活中for fun。很多时候我发现大家对于有哪些常用的AI工具并不熟悉,因此在这里整理一份我自己用过并推荐的一个AI产品集,标准是求精不求多,并且将其中对国内使用友好的产品做了特殊标注,可以收藏本文后优先考虑试用这些标注过的产品

文本生成AI推荐(顾名思义,能帮你写各种文章,回答各种问题的通用型AI)

  • ChatGPT - https://chatgpt.com/
    • 最知名的AI,“GPT”已经一定意义上成为了新一代AI的代名词,不过使用起来门槛比较高;
  • Claude - https://claude.ai/
    • 个人目前最常使用的AI,在长文本任务和复杂任务上的表现很多时候会比GPT更好,使用门槛较高;
  • 友好产品)腾讯元宝 - https://yuanbao.tencent.com/chat
    • 除了网页版和app版,还可以很方便地通过微信小程序使用;
  • 友好产品)通义千问 - https://tongyi.aliyun.com/qianwen/
    • 来自阿里的AI产品,值得提出的一点是,通义千问也是唯一能从全球大模型排行榜上看到名字的国内大厂产品;
      阅读全文 »

引言和核心要点

最近看了这篇Verge的Nilay Patel采访Rabbit R1的创始人吕骋的文章,感觉对于AI+硬件领域感兴趣的同行是个很好的参考 – 尤其考虑到R1这款AI+硬件的先驱型产品在目前普遍被认为已经失败的情况下,这次长达一个半小时访谈确实能从全新的视角发现一些产品和团队上的亮点。之前Founder Park也就此写过一篇,但是我发现其并未翻译全文,因此个人重新翻译了一下访谈全文,并在前面附上我整理的核心要点:

  • 吕骋的愿景是打造一个设备+生态系统,能够理解用户请求并代表用户在任何平台上采取行动。这里的前面一部分是通过LLM来进行意图分类,后面一部分则需要一套通用的跨平台智能体系统。最近推出的 LAM Playground 是实现这一愿景的重要一步,使用户能够通过语音命令控制网页浏览,甚至可以在不同网站之间自动化多步骤任务。吕骋自己特别喜欢的一个案例是 - “嘿,先去Reddit(海外大型论坛)搜索人们推荐的2024年最佳4K HDR电视是什么。获取那个型号,然后去百思买(美国知名线下+线上消费电子零售平台),把它加入我的购物车。如果百思买缺货,那就在亚马逊上搜索。如果它们都缺货,就给我第二推荐的型号”;
  • 针对上述功能的具体技术实现,过往其实非常类似传统的机器人流程自动化技术(RPA),首先给每个用户提供了一个云上的虚拟机,然后模拟人类操作网页来实现跨平台功能,而不是依赖API。吕骋认为这种方法更灵活,能够绕过API限制和谈判障碍(很多大平台并不官方提供API)。但这种网页自动化模式引发了关于其可持续性和潜在法律影响的争议。虽然吕骋承认Spotify和DoorDash等公司后续可能会抵制智能体访问其服务,但他认为,行业最终将适应这种新范式;
  • R1 售价 199 美元,吕骋表示硬件利润率超过 40%,也就是每台大约 80 - 90 美元。但考虑到用户使用云服务和大模型都不需要额外付费,「我们绝对不想收取订阅费,我认为这样的想法是非常愚蠢的。」,主持人质疑这样的商业模式是否长久,而吕骋则认为未来的收入会源自类似应用商店的生态系统(目前叫Teach Mode),包括用户创建的”课程”或智能体;
  • 在主持人有技巧的追问用户数据下,吕骋在接受采访的时候直接上后台查了Rabbit的当前用户人数,说是实时在线能有5000人,采访前两天的日活分别是20000和33000(因为这一天发布了LAM游乐场,所以用户数显著上涨)。考虑到吕骋也承认Rabbit R1的出货量超过10 万台+退货率只有5%,也就是说其实只有20-30%的用户依然活跃(开着机)
    阅读全文 »

虽然在基座模型能力上OpenAI已经不是那个“我要打十个”的遥不可及存在,而且最近内部的人员动荡也令人担心… 但好消息是,根据Similarweb发的最新ChatGPT流量数据,从流量和品牌层面看ChatGPT依然是业界王者。一些核心要点如下:

ChatGPT流量持续攀升

从数据来看,ChatGPT的流量增长势头非常强劲。2024年9月,ChatGPT的访问量达到了历史新高的31亿次,同比增长112%。更值得注意的是,自2024年5月以来,ChatGPT每个月都在刷新自己的流量记录

Chart: rise in ChatGPT's worldwide traffic since launch

阅读全文 »

引言:作为OpenAI的CEO和Y Combinator的前总裁,Sam Altman在科技创新和创业投资方面无疑具有丰富的经验。他在自己的博客中分享了“希望有人早点告诉他”的17条创业建议。这些箴言不仅适用于创业者,对于任何希望在事业和生活中取得进步的人都具有启发意义。

  1. 起步的关键要素:乐观、专注、自信和人脉
    • 创业之初,最重要的是保持乐观、专注和自信。你需要用坚定不移的信念,全身心地投入工作,并充分利用人脉。这些都是项目起步的关键推动力。
  2. 完成目标的秘诀 - 然而,仅有热情是不够的。要真正完成目标,你需要:
    • 一个团结一致的团队;
    • 适度平衡紧迫感和冷静;
    • 超乎寻常的承诺和决心;
      记住,保持长远眼光至关重要。不要过分在意短期内他人的看法,随着时间推移,这会变得越来越容易。
      阅读全文 »

本文总结自Air Street Capital 在10月10日推出的《2024年人工智能状况报告》,也附上了一些个人点评;

4个方面的核心发现:

研究/Research

  • 性能趋同: OpenAI的早期领先优势正在缩小,Claude(Anthropic公司的AI助手)和Gemini(谷歌的AI模型)等模型正在迎头赶上。”在这一年的大部分时间里,基准测试和社区排行榜都指向GPT-4与其他最佳模型之间存在显著差距。然而,Claude 3.5 Sonnet、Gemini 1.5和Grok 2(特斯拉的AI模型)已经几乎消除了这一差距,模型性能现在开始趋同”;
  • 开源模型的崛起: Meta的Llama系列已显著缩小了与专有模型的性能差距。”这标志着开源模型首次缩小了与闭源前沿模型的差距”。然而,关于这些模型的真正开放性存在争议;
  • 模型基准测试的挑战: 数据集污染和基准测试中的错误正在影响进展评估并引发安全担忧。”研究人员越来越多地关注数据集污染问题”。”一些最流行的基准测试中存在惊人的高错误率,这可能导致我们低估了某些模型的能力,并带来安全隐患”;
  • 关注推理计算: OpenAI的o1模型展示了将计算转移到推理层以解决复杂问题的潜力,但同时使用成本也显著增加;
  • 多模态和新架构: 多模态模型正在获得发展动力,同时研究人员正在探索Transformer的替代方案(当然目前transformer仍是绝对主流)和混合架构,以提高效率并解决特定任务;
    阅读全文 »

下文来自对红杉资本最新发布的这篇“Generative AI’s Act o1”报告的总结和个人点评。


在生成式AI革命开始两年后,我们正站在一个新的转折点上。AI正在经历一次重大的进化,从主要依赖于预训练数据的快速反应系统,转变为能够进行更深入、更复杂推理的智能体。这种转变正在重新定义我们对AI能力的理解和期望。

市场格局的稳定与新的竞争前沿

生成式AI的基础层已经形成了相对稳定的格局,主要参与者包括微软/OpenAI、AWS/Anthropic、Meta和谷歌/DeepMind - “只有拥有经济引擎和获取巨额资本的规模化参与者才能继续参与。” 这意味着,虽然竞争仍在继续,但入场门槛已经大幅提高。

阅读全文 »

引言

近期,字节跳动旗下的”智能体耳机”Ola Friend引发了广泛讨论,但看了目前的一些官方约稿都没有说到点子上。我简单查了一下背后的这家oladance公司的发展历程整理了些个人点评。也欢迎熟悉耳机硬件的朋友一起来讨论:

Oladance背景相关

  • 他们是最早在市面上创造ows(Open Wearable Stereo)耳机这个新词的公司,虽然其实Bose的开放式耳机Sport Open Earbuds在更早就有了(oladance是由前BOSE高管李浩乾与多名BOSE工程师共同创立),但这个创造新词占领一个全新赛道的心智塑造确实挺成功;
  • 过往的入耳式耳机确实戴久了会不舒服,而且也有各种研究说明对长期使用对听力会有影响。所以之前韶音的骨传导耳机几乎是不想用入耳式耳机的唯一选择(韶音也是成功塑造了骨传导耳机这个全新赛道);
  • 估计是因为韶音在骨传导这个赛道实在不好绕过去和超越,ows耳机这个品类等于是从另一个方向为大家提供了新的选择。所以从2023下半年开始,ows这个赛道就开始快速爆发。由于很快就卷得超乎想象,从我看到的情况oladance并没有在销量方面做到大幅领先(无论是国内还是海外)。因此在今年5月被字节用5000万美金收购可能是oladance的最好选择;
    阅读全文 »

继上次介绍过这款近期最惊艳的AI产品Google Notebooklm后,今天又发掘了一个新的应用场景,正好也匹配官方定位的“你的私人 AI研究助理/your personalized AI research assistant” - 将自己想了解的某款产品的信息(例如产品规格、用户评论或官网链接)输入到Notebooklm中后,即可获得深入的产品洞察,非常高效实用。这种方法有多种用途:

  • 审视自家产品:通过两位AI播客主持人的视角,他们会详细讨论产品的各个方面,包括功能、易用性和市场定位等,并以开放且充满好奇心的态度评估产品的优缺点。能帮助您从第三方角度重新审视自己的产品,这有助于验证我们认为的产品卖点与主持人发现的是否一致;
  • 分析竞品和新品:快速获得关于竞争对手产品或行业新品的洞察,为市场分析和战略决策提供参考;

实际应用案例

AI硬件产品分析

阅读全文 »

近期,我尝试将自己翻译过的《勇敢新词》这本书输入Google Notebooklm并自动生成播客。结果令人惊艳,这无疑是一个引人注目的大模型应用,特别适合那些充满好奇心又热爱阅读的人。

关于Notebooklm这款产品

这款产品的定位是“你的私人AI研究助理/your personalized AI research assistant”,能够方便地将任何内容提炼出重点,这在当前信息过载的年代尤为有用。无论你要的是针对某个产品说明文档生成问答形式的FAQ,还是针对教科书生成学习指南,或者是生成大纲、目录还是直接和他聊这个文档相关的任何问题都不在话下。

虽然Notebooklm的基础功能已经很强大,但最近新增的功能更是令人眼前一亮 -自动生成podcast/播客功能。有趣的是,这个自动生成的播客会由一男一女两位主持人就你提供的文档的内容进行深入讨论,而且可以基于任何内容!除了我列出的让其对某本书进行讨论这种容易想到的场景外,AI专家Karpathy甚至直接将训练GPT的C代码给了过去,结果也得到了一个很有趣的“如何训练GPT”的深度播客讨论。

阅读全文 »

AI对教育和职业发展方面的影响是个很多人感兴趣的话,推荐一篇刚看到的文章,其核心思想是:在生成式 AI 时代,通才——那些在多个领域都拥有广泛知识的个人——将比专才更具价值

关键观点:

  • 历史视角:以古雅典为例,社会从早期的通才主导逐渐过渡到一个需要更多专业知识的复杂系统。然而,作者认为,在 AI 的助力下,我们可能正在经历一次”通才精神”的回归。这种通才精神强调全面发展、跨界思考和灵活应变
  • 「棘手」vs「友善」环境:这是David Epstein 在自己的一本书中提出的框架,棘手环境特点是规则模糊且反馈滞后。相比之下,AI 和专才更适合在规则明确、反馈及时的「友善」环境中发挥作用;
  • 大语言模型成为通才的得力助手:LLMs使得通才们能够快速获取、加深和整合各个领域的信息和知识,从而进一步提升解决问题的能力;
  • 提出正确问题、洞察问题本质、在未知领域开辟新路——这些能力仍将是人类独有的。通才凭借其广博的知识背景和灵活的思维方式,将在这样的环境中脱颖而出;

个人感触:

我也觉得在AI使得传统的“技能”变得门槛更低了以后,通才才是教育和职业发展方面应该更受鼓励的方向,需要注意的是:

  • 通才的“通”并不是说在每个领域只懂10%-20%,而是能在很多领域能有个“半桶水”的50-60%的水平了;
  • 而且,如果能达到了一个或多个专业领域方面的专家能力,将有助于你知道在学习新事物时应该问什么问题(例如某个前端研发专家能将他的领域专长转化为广泛的领域理解能力)。再配合“通才”能力的话能事半功倍;
    阅读全文 »
0%