RichChat

A blog for tech enthusiasts

RichChat

最近才有空看完了这场来自Anthropic的圆桌讨论,多位来自不同岗位的AI专家深入探讨了提示工程(Prompt Engineering)的本质、技巧与未来发展。参与者包括负责开发团队关系的Alex、主要与客户打交道的David Hershey、领导微调团队的Amanda Askell,以及提示工程师Zack Witten。一些核心重点总结如下:

什么是提示工程?

提示工程本质上是一门关于如何与AI模型进行有效沟通的艺术。正如Zack所说,这项工作的核心在于”指导模型完成特定任务,致力于挖掘模型的最大潜力。通过与模型协同合作,我们得以完成那些原本难以实现的目标”,”从根本上说,与模型交互就像与人对话一样。我们需要深入理解模型的运作机制和反应模式。”

为什么称之为”工程”?

  • 迭代过程:提示工程最大的特点在于其试错和迭代的特性。与人类交谈不同,你可以随时”重启”对话,从头开始尝试不同的方法;
  • 系统思维:需要考虑数据来源、系统延迟等技术因素;
  • 版本控制:就像编程一样,需要追踪不同版本的提示词效果;
  • 整体规划:特别是在企业应用中,需要考虑如何将提示词整合到整个系统中;
    阅读全文 »

我两天前刚写过Bloomberg报道的《AI 检测器误判学生作弊,严重后果令人担忧》,其中提到“OpenAI 近期表示,出于对特定群体可能受到负面影响的考虑,公司决定暂不发布 AI 写作检测工具。其中特别提到了英语非母语(ESL, English as Second Language)学生群体可能会受到影响。”

因此今天看到DeepMind公布他们这款名为SynthID的AI内容水印工具觉得一定要挖掘一下背后的原理,这是否也会造成教育公平方面的问题?

可以先看看Google官方的SynthID产品宣传视频:

考虑到为声音、图片和视频打水印这个事情相对容易理解,所以重点就放在SynthID是如何能对文字打水印上:

阅读全文 »

目前已经在维护一个针对AI初学者的推荐产品集,但最近因为有朋友问到专门针对AI做多媒体相关内容方面的产品推荐,因此在这里继续整理一份我自己用过并推荐的音频、图片、视频相关的AI产品集,偏进阶使用场景,但标准依然是求精不求多,并且将其中对国内使用友好的产品做了特殊标注,可以收藏本文后优先考虑试用这些标注过的产品

图片生成AI推荐(能让人人都会画画)

  • Mid Journey - https://www.midjourney.com/
    • MJ曾经几乎是图片生成AI的代名词之一,如果不介意较麻烦的使用方式而且愿意去折腾提示词的话,整体图片效果是相当优秀的。由于最近受到了激烈的竞争,重新开放新用户能免费生成25张图片的福利;
  • Freepik - https://www.freepik.com/pikaso/ai-image-generator
    • 在Freepik这边一方面能很方便地使用最新的flux文生图模型,以及自研的Mystic文生图模型;另一方面还整合了收购的Magnific来提供不错的AI图片增强工具;
  • Ideogram - https://ideogram.ai/t/explore
    • 这款文生图产品主要的强项在图文混搭的图片生成上,基本能直接生成常用的图文海报了(仅限英文);
  • 友好产品)腾讯元宝、通义千问、文心一言或者豆包都整合了图片生成能力到其中,可以写出自己想要的图片描述直接生成,例如“请画一只在太阳下喝牛奶的猫”;
  • 友好产品) 即梦AI - https://jimeng.jianying.com/ai-tool/home
    • 剪映旗下的文生图产品,现在也支持了视频生成,虽然都不够出色但也能用。值得提出的是这些友好产品目前在支持中文提示词生图方面都做得还不错了(不同于海外产品基本都需要用英文来写提示词);
      阅读全文 »

当三分之二的教师都依赖AI检测工具时,我们失去了什么?

在ChatGPT掀起的AI革命中,教育界似乎找到了一个看似完美的解决方案:AI文本检测工具。然而,当我们深入探讨这些工具的实际应用效果时,一系列令人忧虑的问题逐渐浮出水面。这些问题不仅关乎技术的准确性,更涉及教育公平的根本。

近日,彭博(Bloomberg)发布了一篇深度报道,揭示了AI检测工具在教育领域应用的诸多隐忧。据统计,有三分之二的教师表示经常使用AI生成内容检测工具。在如此大规模的应用中,即便是极小的错误率也可能导致大量误判案例,进而造成严重的教育公平问题。

看似完美的解决方案背后

24岁的大学生Moira Olmsted的经历,深刻揭示了这个问题的严重性。作为一名自闭症谱系障碍者,她在重返校园后遭遇了一个意想不到的困境:她那结构严谨、逻辑清晰的个人写作风格,竟然让她的作业被AI检测工具错误标记为”人工智能生成”,被老师打了个零分。这不仅是对她个人努力的否定,更暴露出了AI检测工具在实际应用中的深层次问题。

阅读全文 »

之前在很多个场合做过AI主题分享,针对应该如何应对这波AI大潮带来的影响,我给出建议中的第一点就是鼓励大家多尝试新一代的各种AI产品,无论是在工作中提效还是生活中for fun。很多时候我发现大家对于有哪些常用的AI工具并不熟悉,因此在这里整理一份我自己用过并推荐的一个AI产品集,标准是求精不求多,并且将其中对国内使用友好的产品做了特殊标注,可以收藏本文后优先考虑试用这些标注过的产品

文本生成AI推荐(顾名思义,能帮你写各种文章,回答各种问题的通用型AI)

  • ChatGPT - https://chatgpt.com/
    • 最知名的AI,“GPT”已经一定意义上成为了新一代AI的代名词,不过使用起来门槛比较高;
  • Claude - https://claude.ai/
    • 个人目前最常使用的AI,在长文本任务和复杂任务上的表现很多时候会比GPT更好,使用门槛较高;
  • 友好产品)腾讯元宝 - https://yuanbao.tencent.com/chat
    • 除了网页版和app版,还可以很方便地通过微信小程序使用;
  • 友好产品)通义千问 - https://tongyi.aliyun.com/qianwen/
    • 来自阿里的AI产品,值得提出的一点是,通义千问也是唯一能从全球大模型排行榜上看到名字的国内大厂产品;
      阅读全文 »

引言和核心要点

最近看了这篇Verge的Nilay Patel采访Rabbit R1的创始人吕骋的文章,感觉对于AI+硬件领域感兴趣的同行是个很好的参考 – 尤其考虑到R1这款AI+硬件的先驱型产品在目前普遍被认为已经失败的情况下,这次长达一个半小时访谈确实能从全新的视角发现一些产品和团队上的亮点。之前Founder Park也就此写过一篇,但是我发现其并未翻译全文,因此个人重新翻译了一下访谈全文,并在前面附上我整理的核心要点:

  • 吕骋的愿景是打造一个设备+生态系统,能够理解用户请求并代表用户在任何平台上采取行动。这里的前面一部分是通过LLM来进行意图分类,后面一部分则需要一套通用的跨平台智能体系统。最近推出的 LAM Playground 是实现这一愿景的重要一步,使用户能够通过语音命令控制网页浏览,甚至可以在不同网站之间自动化多步骤任务。吕骋自己特别喜欢的一个案例是 - “嘿,先去Reddit(海外大型论坛)搜索人们推荐的2024年最佳4K HDR电视是什么。获取那个型号,然后去百思买(美国知名线下+线上消费电子零售平台),把它加入我的购物车。如果百思买缺货,那就在亚马逊上搜索。如果它们都缺货,就给我第二推荐的型号”;
  • 针对上述功能的具体技术实现,过往其实非常类似传统的机器人流程自动化技术(RPA),首先给每个用户提供了一个云上的虚拟机,然后模拟人类操作网页来实现跨平台功能,而不是依赖API。吕骋认为这种方法更灵活,能够绕过API限制和谈判障碍(很多大平台并不官方提供API)。但这种网页自动化模式引发了关于其可持续性和潜在法律影响的争议。虽然吕骋承认Spotify和DoorDash等公司后续可能会抵制智能体访问其服务,但他认为,行业最终将适应这种新范式;
  • R1 售价 199 美元,吕骋表示硬件利润率超过 40%,也就是每台大约 80 - 90 美元。但考虑到用户使用云服务和大模型都不需要额外付费,「我们绝对不想收取订阅费,我认为这样的想法是非常愚蠢的。」,主持人质疑这样的商业模式是否长久,而吕骋则认为未来的收入会源自类似应用商店的生态系统(目前叫Teach Mode),包括用户创建的”课程”或智能体;
  • 在主持人有技巧的追问用户数据下,吕骋在接受采访的时候直接上后台查了Rabbit的当前用户人数,说是实时在线能有5000人,采访前两天的日活分别是20000和33000(因为这一天发布了LAM游乐场,所以用户数显著上涨)。考虑到吕骋也承认Rabbit R1的出货量超过10 万台+退货率只有5%,也就是说其实只有20-30%的用户依然活跃(开着机)
    阅读全文 »

虽然在基座模型能力上OpenAI已经不是那个“我要打十个”的遥不可及存在,而且最近内部的人员动荡也令人担心… 但好消息是,根据Similarweb发的最新ChatGPT流量数据,从流量和品牌层面看ChatGPT依然是业界王者。一些核心要点如下:

ChatGPT流量持续攀升

从数据来看,ChatGPT的流量增长势头非常强劲。2024年9月,ChatGPT的访问量达到了历史新高的31亿次,同比增长112%。更值得注意的是,自2024年5月以来,ChatGPT每个月都在刷新自己的流量记录

Chart: rise in ChatGPT's worldwide traffic since launch

阅读全文 »

引言:作为OpenAI的CEO和Y Combinator的前总裁,Sam Altman在科技创新和创业投资方面无疑具有丰富的经验。他在自己的博客中分享了“希望有人早点告诉他”的17条创业建议。这些箴言不仅适用于创业者,对于任何希望在事业和生活中取得进步的人都具有启发意义。

  1. 起步的关键要素:乐观、专注、自信和人脉
    • 创业之初,最重要的是保持乐观、专注和自信。你需要用坚定不移的信念,全身心地投入工作,并充分利用人脉。这些都是项目起步的关键推动力。
  2. 完成目标的秘诀 - 然而,仅有热情是不够的。要真正完成目标,你需要:
    • 一个团结一致的团队;
    • 适度平衡紧迫感和冷静;
    • 超乎寻常的承诺和决心;
      记住,保持长远眼光至关重要。不要过分在意短期内他人的看法,随着时间推移,这会变得越来越容易。
      阅读全文 »

本文总结自Air Street Capital 在10月10日推出的《2024年人工智能状况报告》,也附上了一些个人点评;

4个方面的核心发现:

研究/Research

  • 性能趋同: OpenAI的早期领先优势正在缩小,Claude(Anthropic公司的AI助手)和Gemini(谷歌的AI模型)等模型正在迎头赶上。”在这一年的大部分时间里,基准测试和社区排行榜都指向GPT-4与其他最佳模型之间存在显著差距。然而,Claude 3.5 Sonnet、Gemini 1.5和Grok 2(特斯拉的AI模型)已经几乎消除了这一差距,模型性能现在开始趋同”;
  • 开源模型的崛起: Meta的Llama系列已显著缩小了与专有模型的性能差距。”这标志着开源模型首次缩小了与闭源前沿模型的差距”。然而,关于这些模型的真正开放性存在争议;
  • 模型基准测试的挑战: 数据集污染和基准测试中的错误正在影响进展评估并引发安全担忧。”研究人员越来越多地关注数据集污染问题”。”一些最流行的基准测试中存在惊人的高错误率,这可能导致我们低估了某些模型的能力,并带来安全隐患”;
  • 关注推理计算: OpenAI的o1模型展示了将计算转移到推理层以解决复杂问题的潜力,但同时使用成本也显著增加;
  • 多模态和新架构: 多模态模型正在获得发展动力,同时研究人员正在探索Transformer的替代方案(当然目前transformer仍是绝对主流)和混合架构,以提高效率并解决特定任务;
    阅读全文 »

下文来自对红杉资本最新发布的这篇“Generative AI’s Act o1”报告的总结和个人点评。


在生成式AI革命开始两年后,我们正站在一个新的转折点上。AI正在经历一次重大的进化,从主要依赖于预训练数据的快速反应系统,转变为能够进行更深入、更复杂推理的智能体。这种转变正在重新定义我们对AI能力的理解和期望。

市场格局的稳定与新的竞争前沿

生成式AI的基础层已经形成了相对稳定的格局,主要参与者包括微软/OpenAI、AWS/Anthropic、Meta和谷歌/DeepMind - “只有拥有经济引擎和获取巨额资本的规模化参与者才能继续参与。” 这意味着,虽然竞争仍在继续,但入场门槛已经大幅提高。

阅读全文 »
0%