RichChat

A blog for tech enthusiasts

RichChat

在巴黎的VivaTech技术大会上,一场关于人工智能未来的激烈交锋,将科技界两种截然不同的哲学推向了聚光灯下。Nvidia首席执行官黄仁勋(Jensen Huang)公开宣称,他“几乎完全不同意”Anthropic首席执行官达里奥·阿莫代(Dario Amodei)的观点。这句充满火药味的表态,揭示了AI发展十字路口上的两条路线之争。

核心分歧:开放的民主化 vs. “看门人”的精英主义

黄仁勋在新闻发布会上毫不掩饰地表达了对阿莫代观点的质疑。他将阿莫代的立场总结为三个要点:第一,认为AI过于危险,只有少数公司(如Anthropic)才能安全地开发;第二,AI开发成本过高,其他公司难以承担;第三,AI威力巨大,将导致大规模失业。

对此,黄仁勋发起了毫不留情的反击。他强调:”我认为AI是一项非常重要的技术,我们应该安全负责地构建和推进它。如果你想要安全负责地做事,就应该公开进行,而不是在暗室中告诉我这是安全的。”这一表态清晰地表明了他对开源AI发展模式的支持。

尽管Anthropic迅速澄清,表示其CEO从未声称“只有他们”能构建安全的AI,并倡导建立国家级的透明度标准。这种澄清虽然听起来合情合理,但其内核依然是一种“看门人”的精英主义思维。它实际上预设了一个前提:AI的未来应该由一小部分拥有先进技术和“正确价值观”的公司来定义和守护。这种模式虽然可能在短期内规避某些风险,但长期来看,可能会导致技术权力的过度集中,扼杀开源社区的创新活力,并让AI的发展方向被少数商业利益所左右

阅读全文 »

继上次为大家解读了来自OpenAI的Karina Nguyen在斯坦福CS25这门课上做的名为《RL as a Co-Design of Product and Research》的精彩分享(如果你错过了,可以点击这里回顾:AI时代产品经理能力大不同:Karina Nguyen 解读 OpenAI 产品经理的“进化”之路)后,我最近又翻到一篇她在今年二月的时候在 Lenny’s Podcast 上的深度对话

关于Karina Nguyen:她是在两大顶尖AI实验室 - OpenAI和Anthropic - 都担任过核心研究+产品角色的专家,除了是ChatGPT中Canvas、Tasks等创新功能的关键贡献者,也曾主导Claude 3模型的后训练与评估工作。

这期访谈信息量巨大,对于我们理解AI如何重塑工作,特别是产品经理岗位,具有极强的指导意义。因此,我将其中精华总结出来,并加入一些个人观点与大家分享。

一、模型训练的艺术:为什么数据质量比数量更重要

当谈到人们对模型训练最大的误解时,Karina指出:

阅读全文 »

她突然凑近问我:”你做产品的,具体负责哪块呀?”

我后背一凉,支支吾吾道:”就……大家都做的那……”

女生眼睛亮起来:”是AI产品经理吗?现在最火的赛道,大模型、agent,技术含量超高,薪资也是顶级!”

我声音发虚:”不是……”

“那肯定是B端SaaS产品咯?”她兴致勃勃,”企业级产品,商业价值高,需要很强的行业理解和商业嗅觉。”

“不……”

我死死盯着手机屏幕,恨不得把它盯出个洞。

“是大厂核心业务线的产品经理吗?这有啥不好意思说的?”她歪头轻笑,”虽然很卷,但胜在影响力大,能一手定义亿级用户的关键路径……”

“我不喜欢这些……”我喉结滚动,声音像卡了壳的子弹。

女生沉默两秒,突然瞪大眼睛:”你该不会……是做数据产品的吧?”

她探究的目光像探照灯打在我脸上,我浑身不自在,心跳开始错拍。

“还是做增长产品的?A/B测试、运营活动、转化漏斗优化?”她继续猜测。

我死死掐住大腿,从牙缝里挤出蚊子般的颤音:”都……都不是!”

空气突然安静。

阅读全文 »

a16z的2C AI团队刚刚上线了一期时长一小时的播客,分享了她们当前的研究心得,以及对创业公司的期待与展望。我整理了其中的八大发展态势如下:

Image

  1. 现在正是开发消费级应用的黄金时期。无论是语音、图像还是视频等多模态技术,AI模型都已达到足够成熟的水平,可以作为应用开发的基础。这些模型既可以通过开源方式获取,也可以通过应用程序接口(API)调用。

  2. 不过,目前大多数消费级AI工具还未能很好地整合社交分享功能。用户用AI创作出优秀作品后,往往会选择在X、Reddit或Facebook等社交平台上分享,而非在创作工具本身的平台上分享。

  3. 相比上一代面向消费者的创业公司,AI企业普遍拥有更优质的商业模式。用户愿意为服务付费,企业无需通过广告或后期交易来实现变现。

    阅读全文 »

五月中旬,AI设计工具Lovart在社交媒体上掀起了一轮营销热潮。这款号称”全球首个专注于设计领域的AI智能体”声称基于先进的思维链(MCoT)技术构建,能够”像经验丰富的专业人士一样理解设计概要,像创意总监一样思考,并一次性交付多个极具影响力的概念”。各种软文中展示的案例效果令人印象深刻,从复杂的广告分镜设计到精美的海报制作,Lovart似乎无所不能,弹指间就能产出专业级的设计作品。

鉴于此前Manus等AI工具过度营销后实际体验不佳的教训,我选择等待官方放开更多访问权限后再进行实测。经过近两周的等待,我终于获得了邀请码并进行了深度测试。

测试结论:Lovart在简单设计任务上表现尚可,但处理复杂需求时明显力不从心,实际效果与营销宣传存在显著差距。

案例1:测试为某个香水品牌生成30秒的广告视频
阅读全文 »

Google的Veo 3视频生成模型自上周发布以来掀起了一场堪比去年Sora最初“发布”时的AI视频革命 - 大量用户涌入体验,创作者们制作出了令人惊叹的内容,甚至有人用它探讨了哲学问题:如果AI生成的角色知道自己是由提示词创造的,会发生什么?

我来为大家总结一些Veo 3最新的动态和自己的相关观察。

令人印象深刻的技术突破

从技术表现来看,Veo 3确实展现出了令人惊叹的视频生成能力,除了明显的生成视频更逼真外,生成视频时可以自带相关声音效果、背景噪音和对话等音频元素也是亮点 - 彻底告别了”先生成无声视频再配音”的繁琐流程。

根据DeepMind CEO Demis Hassabis透露的数据,仅在发布后的几天内,用户就通过Veo 3生成了”数以百万”的视频。考虑到目前该服务仍面临诸多使用限制,这个数字相当可观,足以说明其技术魅力和用户需求的旺盛程度。

由于Veo 3大幅提升了AI生成视频的上限,很快就有创作者做出了各种高质量的视频,我个人最喜欢的一个作品,巧妙地构思了这样一个场景:假设AI生成的视频人物发现自己是由提示词创造出来的后会如何反应?

阅读全文 »

一个值得深思的开局:这不是巧合,这是战略

本周,AI编程领域同时上演了两幕戏剧:一边是AI编程助手Cursor的开发商Anysphere宣布以惊人的99亿美元估值完成9亿美元融资,其年度经常性收入(ARR)据称已突破5亿美元,并且大约每两个月翻一番;而几乎就在同一时间,另一家AI编程工具Windsurf的CEO Varun Mohan却公开表示,其核心依赖的AI模型提供商Anthropic,在不到五天的通知期内,切断了其对关键的Claude 3.x系列模型的直接访问权限。

冰火两重天。但这绝非简单的巧合,其背后是两种截然不同的战略路径及其必然结果。

第一性原理:AI编程的真实价值何在?

要理解这场变革的本质,我们需要回归第一性原理:AI编程助手究竟创造了什么核心价值?

Cursor的成功给出了一个响亮的答案。就在它刚刚发布“1.0版本” - 一个在传统软件行业通常仅代表“刚刚成年”的里程碑 - 之时,其年度经常性收入(ARR)已经达到了5亿美元的惊人规模。这背后是无数开发者用真金白银的订阅(个人版每月20美元,企业版40美元)投下的信任票。

这清晰地表明:AI的价值不在于其技术的炫技或复杂性,而在于其对现有工作流程的根本性改善程度。 Cursor之所以能实现火箭般的增长,正是因为它精准地解决了开发者在效率、代码质量和创新速度上的痛点。这种生产力的提升是真实可感、可量化的,足以让用户认为所支付的订阅费物超所值。

阅读全文 »

传统NLP的各个细分领域最终都败给了简单粗暴的规模化。ChatGPT团队在没做任何chatbot研究的情况下,却做出了最成功的对话AI。这背后发生了什么?

推荐一下刚读到Jason Wei(OpenAI研究员,Chain-of-Thought推理方法的提出者)这条关于问题驱动 vs 方法驱动研究的推文 - 核心观点:方法驱动研究正在全面超越问题驱动研究

简单来说,问题驱动研究是先有具体问题(如机器翻译、文本摘要),然后针对性地设计解决方案;而方法驱动研究则是先开发通用方法(如Transformer、大规模预训练),再寻找能应用这些方法的问题。

ChatGPT就是最好的例子:

   “ChatGPT 并不是从 chatbot 研究中诞生的,甚至不是 OpenAI 原本2022年的目标,而是因为 Schulman 团队找到了把大模型‘打包成产品’的方式。”

这与我观察到的AI产品经理领域的一个重要趋势不谋而合:当AI模型(这些“方法驱动”研究的产物)展现出颠覆性的新能力时,PM的核心任务之一便是将这些最初可能“陌生”的技术力量,通过巧妙的产品设计,“翻译”并“封装”成用户熟悉且能创造价值的形式。这同样要求从技术可能性出发,主动寻找产品机会。

说回Jason的观点,这背后,其实是 Sutton 所说的 The Bitter Lesson:通用方法 + 计算资源 + 大规模训练,终将胜出。

而DeepMind的AlphaEvolve项目(使用进化算法来发现更有效的强化学习算法)带来的是更进一步的”方法范式”:

“最新的“锤子”,其实就是对奖励函数的无情搜索和优化。”

阅读全文 »

昨天在社交媒体上看到有人分享了一张令人印象深刻的图片 - 一只完全由白色百合花构成的老虎,栩栩如生却又充满艺术感。更让人惊讶的是生成这张图片的prompt:UltraRealisticPhoto(3, Photo(0, Scene(tiger), 3, MadeEntirelyOutOf(lillies)))

Image

这段看起来像编程代码的提示词能够成功生成如此精美的图片,背后反映的其实是GPT-4o作为原生多模态模型的独特优势。

拆解这段”代码式”的Prompt

让我们先来理解一下这段结构化prompt的含义。虽然看起来很技术化,但其实逻辑很清晰:

阅读全文 »

一年前的今天,苹果以Apple Intelligence的名义踏入生成式AI的战场,当时的库克和费德里吉意气风发地向世界宣告:苹果虽然迟到,但绝不会缺席这场AI革命。华尔街买账了,消费者也满怀期待。然而一年过去,当我们即将迎来WWDC 2025时,现实却相当的“骨感” - 当初那份“绝不缺席”的豪情,正在AI飞速发展的现实面前接受严峻考验。

一张在社媒上被网友们广泛转发的吐槽apple intelligence梗图

创新引擎的失速与竞争压力的加剧

AI的困境只是苹果当前面临挑战的一个缩影。从更宏观的角度来看,这家曾经以颠覆性创新著称的公司,似乎已经很久没有推出真正令人惊艳的产品了。iPhone 16虽然是市场上最优秀的智能手机之一,但与前四代产品相比并无本质性突破;Vision Pro头显虽然技术先进,但市场反响平平,已经让人怀疑其长期前景;就连Apple Watch这个曾经的明星产品,去年也遭遇了14%的收入下滑。

数据不会说谎:iPhone的销量已经低于两年前的水平,整体营收在经历了一段停滞期后也只是缓慢复苏。更严峻的是,苹果正面临着前所未有的竞争压力 - 华为、小米等厂商不断推出折叠屏等创新设计,各国政府和第三方开发者对苹果的商业模式施压,关税威胁更是可能进一步压缩利润空间。

正如苹果服务业务高级副总裁埃迪·库伊在谷歌反垄断案庭审中的感叹:”硅谷那些曾经最成功的公司,要么已经不存在,要么规模大幅缩小、影响力大不如前 - 从惠普到太阳计算机系统,从硅图公司到天腾电脑。技术的频繁变化为新企业取代现有领导者创造了机会。我为苹果感到担忧。我们现在非常成功,但这并不意味着10年或20年后我们还会存在。”

阅读全文 »
0%