RichChat

A blog for tech enthusiasts

RichChat

下面的12条建议来自OpenAI官方最近发布的ChatGPT学生使用指南,其中部分的例子我做了一些延伸,供学生和家长们参考:

  1. 将繁重的引用格式工作交给AI
  • “这是我的参考文献列表。请将所有引用从MLA格式转换为APA格式”
  • “请阅读我的论文,告诉我是否所有来源都有适当的引注,包括页码引用”
  • “我的教授要求论文采用芝加哥格式。请检查我的脚注是否符合最新的芝加哥手册规范”
  1. 快速建立对新主题的基础认识
  • “请解释凯恩斯经济学的核心原则,以及它如何挑战了古典经济理论的假设?具体来说,它对市场自我调节能力的看法有什么不同?”
  • “我需要了解不同的动机理论。能否概述主要的理论流派,包括行为主义、人本主义和认知理论的关键区别?每种理论是如何解释人类行为的?”
    阅读全文 »

你是否想过,有朝一日AI不仅能帮你写代码、画图,还能直接帮你打游戏、刷日常任务?新加坡国立大学的研究团队最近发表了一篇有趣的论文,他们在20多个不同场景下测试了业界目前最强AI Claude 3.5新推出的Computer Use(让AI操纵电脑)功能,包括网页浏览、办公软件操作和游戏任务等,发现成功率竟然高达80%以上!让我们来具体看看让AI能操作电脑后能做些什么有趣的事情~

AI会玩游戏?还真不是说着玩的!

研究团队测试了这款AI在两个热门游戏中的表现:炉石传说和崩坏:星穹铁道。别以为AI只会像传统外挂那样机械操作,它可是能理解游戏规则和目标的”智能外挂”!

阅读全文 »

TL;DR:发现孩子对传统作业兴趣不大?这里分享一个实用方案:用AI生成孩子喜欢的故事情境并创作四格漫画,把日常作业练习变成孩子期待的游戏!

作为一名研究深入AI领域两年多的从业人士,同时也是一个四年级男孩的父亲,AI+教育一直是个我重点关注的方向。最近在X上看到一位家长分享的做法让我很受启发——用AI生成个性化的四格漫画来辅助孩子学习数学,真正实现寓教于乐。经过一定尝试后,我整理了一套完整的方法分享如下,希望能帮助更多想要尝试AI辅助教育的家长。

灵感的火花

刷X时看到这个帖子立刻引起了我的注意:

YUE - “为了帮孩子巩固数学概念。每天晚上用GPT根据我设计的题目快速的生成4格漫画。图形质量和准确性不高,但已经足够吸引孩子了。现在小家伙每天回家进门就问:今天的数学题在哪里?”

Image

由于经常和AI打交道,我很清楚这个想法的可行性,而且觉得确实会对孩子有帮助。更重要的是,在之前我做的一些AI培训和分享中,一直都建议大家能够更多将AI“用起来”,而儿童教育无疑是个很可行的应用场景。但原作者只是分享了一个大致思路,没有具体的操作方法。于是我决定基于自己的AI经验,用产品经理的思路来设计一套完整而有效的解决方案。

阅读全文 »

来自Google的NotebookLM这款AI产品本质上是一个智能笔记本,用户可以将PDF、音频、视频等各类素材输入其中,NotebookLM就能够理解并提炼出重点。最引人注目的是它还能生成自然、专业的对话式音频播客内容,具体可以参考我之前写过的这篇专题博客。最近看到十字路口Crossing播客也发了一期关于NotebookLM的内容,将其中的一些重点做了整理和总结如下:

NotebookLM的十个最具代表性的使用案例

  1. 将简历转为”夸夸”播客 有用户尝试将简历上传至NotebookLM,系统自动生成了一段对话式播客。两位AI主播以充满热情和真诚的语气讨论简历中的每个细节,展现出强烈的兴趣和情感投入。有用户表示,听到这样热情洋溢的赞美效果,”简直堪比去看了一次心理医生”;
    阅读全文 »

最近才有空看完了这场来自Anthropic的圆桌讨论,多位来自不同岗位的AI专家深入探讨了提示工程(Prompt Engineering)的本质、技巧与未来发展。参与者包括负责开发团队关系的Alex、主要与客户打交道的David Hershey、领导微调团队的Amanda Askell,以及提示工程师Zack Witten。一些核心重点总结如下:

什么是提示工程?

提示工程本质上是一门关于如何与AI模型进行有效沟通的艺术。正如Zack所说,这项工作的核心在于”指导模型完成特定任务,致力于挖掘模型的最大潜力。通过与模型协同合作,我们得以完成那些原本难以实现的目标”,”从根本上说,与模型交互就像与人对话一样。我们需要深入理解模型的运作机制和反应模式。”

为什么称之为”工程”?

  • 迭代过程:提示工程最大的特点在于其试错和迭代的特性。与人类交谈不同,你可以随时”重启”对话,从头开始尝试不同的方法;
  • 系统思维:需要考虑数据来源、系统延迟等技术因素;
  • 版本控制:就像编程一样,需要追踪不同版本的提示词效果;
  • 整体规划:特别是在企业应用中,需要考虑如何将提示词整合到整个系统中;
    阅读全文 »

我两天前刚写过Bloomberg报道的《AI 检测器误判学生作弊,严重后果令人担忧》,其中提到“OpenAI 近期表示,出于对特定群体可能受到负面影响的考虑,公司决定暂不发布 AI 写作检测工具。其中特别提到了英语非母语(ESL, English as Second Language)学生群体可能会受到影响。”

因此今天看到DeepMind公布他们这款名为SynthID的AI内容水印工具觉得一定要挖掘一下背后的原理,这是否也会造成教育公平方面的问题?

可以先看看Google官方的SynthID产品宣传视频:

考虑到为声音、图片和视频打水印这个事情相对容易理解,所以重点就放在SynthID是如何能对文字打水印上:

阅读全文 »

目前已经在维护一个针对AI初学者的推荐产品集,但最近因为有朋友问到专门针对AI做多媒体相关内容方面的产品推荐,因此在这里继续整理一份我自己用过并推荐的音频、图片、视频相关的AI产品集,偏进阶使用场景,但标准依然是求精不求多,并且将其中对国内使用友好的产品做了特殊标注,可以收藏本文后优先考虑试用这些标注过的产品

图片生成AI推荐(能让人人都会画画)

  • Mid Journey - https://www.midjourney.com/
    • MJ曾经几乎是图片生成AI的代名词之一,如果不介意较麻烦的使用方式而且愿意去折腾提示词的话,整体图片效果是相当优秀的。由于最近受到了激烈的竞争,重新开放新用户能免费生成25张图片的福利;
  • Freepik - https://www.freepik.com/pikaso/ai-image-generator
    • 在Freepik这边一方面能很方便地使用最新的flux文生图模型,以及自研的Mystic文生图模型;另一方面还整合了收购的Magnific来提供不错的AI图片增强工具;
  • Ideogram - https://ideogram.ai/t/explore
    • 这款文生图产品主要的强项在图文混搭的图片生成上,基本能直接生成常用的图文海报了(仅限英文);
  • 友好产品)腾讯元宝、通义千问、文心一言或者豆包都整合了图片生成能力到其中,可以写出自己想要的图片描述直接生成,例如“请画一只在太阳下喝牛奶的猫”;
  • 友好产品) 即梦AI - https://jimeng.jianying.com/ai-tool/home
    • 剪映旗下的文生图产品,现在也支持了视频生成,虽然都不够出色但也能用。值得提出的是这些友好产品目前在支持中文提示词生图方面都做得还不错了(不同于海外产品基本都需要用英文来写提示词);
      阅读全文 »

当三分之二的教师都依赖AI检测工具时,我们失去了什么?

在ChatGPT掀起的AI革命中,教育界似乎找到了一个看似完美的解决方案:AI文本检测工具。然而,当我们深入探讨这些工具的实际应用效果时,一系列令人忧虑的问题逐渐浮出水面。这些问题不仅关乎技术的准确性,更涉及教育公平的根本。

近日,彭博(Bloomberg)发布了一篇深度报道,揭示了AI检测工具在教育领域应用的诸多隐忧。据统计,有三分之二的教师表示经常使用AI生成内容检测工具。在如此大规模的应用中,即便是极小的错误率也可能导致大量误判案例,进而造成严重的教育公平问题。

看似完美的解决方案背后

24岁的大学生Moira Olmsted的经历,深刻揭示了这个问题的严重性。作为一名自闭症谱系障碍者,她在重返校园后遭遇了一个意想不到的困境:她那结构严谨、逻辑清晰的个人写作风格,竟然让她的作业被AI检测工具错误标记为”人工智能生成”,被老师打了个零分。这不仅是对她个人努力的否定,更暴露出了AI检测工具在实际应用中的深层次问题。

阅读全文 »

之前在很多个场合做过AI主题分享,针对应该如何应对这波AI大潮带来的影响,我给出建议中的第一点就是鼓励大家多尝试新一代的各种AI产品,无论是在工作中提效还是生活中for fun。很多时候我发现大家对于有哪些常用的AI工具并不熟悉,因此在这里整理一份我自己用过并推荐的一个AI产品集,标准是求精不求多,并且将其中对国内使用友好的产品做了特殊标注,可以收藏本文后优先考虑试用这些标注过的产品

文本生成AI推荐(顾名思义,能帮你写各种文章,回答各种问题的通用型AI)

  • ChatGPT - https://chatgpt.com/
    • 最知名的AI,“GPT”已经一定意义上成为了新一代AI的代名词,不过使用起来门槛比较高;
  • Claude - https://claude.ai/
    • 个人目前最常使用的AI,在长文本任务和复杂任务上的表现很多时候会比GPT更好,使用门槛较高;
  • 友好产品)腾讯元宝 - https://yuanbao.tencent.com/chat
    • 除了网页版和app版,还可以很方便地通过微信小程序使用;
  • 友好产品)通义千问 - https://tongyi.aliyun.com/qianwen/
    • 来自阿里的AI产品,值得提出的一点是,通义千问也是唯一能从全球大模型排行榜上看到名字的国内大厂产品;
      阅读全文 »

引言和核心要点

最近看了这篇Verge的Nilay Patel采访Rabbit R1的创始人吕骋的文章,感觉对于AI+硬件领域感兴趣的同行是个很好的参考 – 尤其考虑到R1这款AI+硬件的先驱型产品在目前普遍被认为已经失败的情况下,这次长达一个半小时访谈确实能从全新的视角发现一些产品和团队上的亮点。之前Founder Park也就此写过一篇,但是我发现其并未翻译全文,因此个人重新翻译了一下访谈全文,并在前面附上我整理的核心要点:

  • 吕骋的愿景是打造一个设备+生态系统,能够理解用户请求并代表用户在任何平台上采取行动。这里的前面一部分是通过LLM来进行意图分类,后面一部分则需要一套通用的跨平台智能体系统。最近推出的 LAM Playground 是实现这一愿景的重要一步,使用户能够通过语音命令控制网页浏览,甚至可以在不同网站之间自动化多步骤任务。吕骋自己特别喜欢的一个案例是 - “嘿,先去Reddit(海外大型论坛)搜索人们推荐的2024年最佳4K HDR电视是什么。获取那个型号,然后去百思买(美国知名线下+线上消费电子零售平台),把它加入我的购物车。如果百思买缺货,那就在亚马逊上搜索。如果它们都缺货,就给我第二推荐的型号”;
  • 针对上述功能的具体技术实现,过往其实非常类似传统的机器人流程自动化技术(RPA),首先给每个用户提供了一个云上的虚拟机,然后模拟人类操作网页来实现跨平台功能,而不是依赖API。吕骋认为这种方法更灵活,能够绕过API限制和谈判障碍(很多大平台并不官方提供API)。但这种网页自动化模式引发了关于其可持续性和潜在法律影响的争议。虽然吕骋承认Spotify和DoorDash等公司后续可能会抵制智能体访问其服务,但他认为,行业最终将适应这种新范式;
  • R1 售价 199 美元,吕骋表示硬件利润率超过 40%,也就是每台大约 80 - 90 美元。但考虑到用户使用云服务和大模型都不需要额外付费,「我们绝对不想收取订阅费,我认为这样的想法是非常愚蠢的。」,主持人质疑这样的商业模式是否长久,而吕骋则认为未来的收入会源自类似应用商店的生态系统(目前叫Teach Mode),包括用户创建的”课程”或智能体;
  • 在主持人有技巧的追问用户数据下,吕骋在接受采访的时候直接上后台查了Rabbit的当前用户人数,说是实时在线能有5000人,采访前两天的日活分别是20000和33000(因为这一天发布了LAM游乐场,所以用户数显著上涨)。考虑到吕骋也承认Rabbit R1的出货量超过10 万台+退货率只有5%,也就是说其实只有20-30%的用户依然活跃(开着机)
    阅读全文 »
0%