人工智能决策中的偏见问题:Anthropic的Claude模型最新研究结果
Anthropic最近发布了一项关于Claude是否存在歧视的研究报告。结果 - Claude更倾向于非白人和非男性申请人(你没有看错…),并对 60 岁以上的申请人存有偏见。好消息是,通过简单的prompt引导就能很大程度上克服这种倾向。
Anthropic最近发布了一项关于Claude是否存在歧视的研究报告。结果 - Claude更倾向于非白人和非男性申请人(你没有看错…),并对 60 岁以上的申请人存有偏见。好消息是,通过简单的prompt引导就能很大程度上克服这种倾向。
牛津大学出版社(对,就是那个出版牛津词典的机构)每年都会进行一轮年度代表词的评选。今年在收集了三万多个网络投票+语言专家评选后,2023年的结果刚刚出来 - 获得年度热词的最终是 “rizz”。
说起AI圈的“网红”,Andrej Karpathy是大家很熟悉的名字,他不仅是OPENAI的创始成员,也曾经担任特斯拉的AI总监长达五年。他最近做了一个关于大模型的分享,我将其内容浓缩整理成为一个太长不看/TLDR版,正好为迟些要主讲的内部大模型培训做个准备,希望能让没有技术基础的同学们也能了解大模型是什么和大模型的发展方向这两个重要的议题。
当大环境红利不在,大家只能卷到极致的今天,如何获得增长这件事情将是所有公司的战略重点之一。但是很多时候你会发现,不同团队中的员工对于产品如何增长都有各自看法,例如:
Despite all the craziness at OpenAI this weekend… 继之前的两篇OpenAI Devday闭门会ppt分享后:
今天再带来最后这篇讲述OpenAI内部研究团队和产品团队的工作内幕的ppt,其中的一些内容对于无论是做大模型研究的同学还是传统做产品经理的同学都会有些启示,尤其是这可能是OpenAI梦之队最后一次高质量分享…:
继昨天分享的OpenAI DevDay的闭门会“A Survey of Techniques for Maximizing LLM Performance (精进大型语言模型性能的各种技巧)“后,今天再带来当天另外一场的技术实操闭门会ppt分享 - “The New Stack and Ops for AI/新一代的技术堆栈和AI的运营管理”。这场中也讲了大量如何从工程实操的层面来更好地将AI用到实际生产力场景中的最新经验。
实际有真正深度用过AI的研发者都知道,你可以很轻松地做出一些原型项目,甚至是很酷的demo,但是如果真要将AI用到实际生产力场景中的话,还是挺难的。这次OpenAI的专项分享的一些重点内容如下:
OpenAI刚刚放出了他们在不久前的DevDay上面几个闭门会的视频全程内容,其中一个名为”A Survey of Techniques for Maximizing LLM Performance”(精进大型语言模型性能的各种技巧)是我觉得最有意思的一场,因此专门将这个演讲ppt的核心重点分享如下:
NASA旗下有个名为petal的项目,是一个开源的人工智能设计工具,旨在跨学科地利用自然与科技的数据和信息,以推动仿生学的研发进步。
这个项目不久前开源了他们在discord上的一个AI Chatbot的mega-prompt,这应该是我见过最长的prompt之一。感觉写的非常好,因此专门发一下供大家参考(要是大家有兴趣我迟些再补一篇针对这个mega prompt设计逻辑的整理)。而且值得指出的是,对于很多在做产品设计的朋友(尤其是实体产品)来说,完全可以直接用这个prompt来尝试开拓设计思路。
人工智能的影响已经覆盖很广了,包括在教育方面,尤其在作业评估和防止作弊方面提出了新的挑战。在Reddit的一个教授讨论区,我看到了一篇站在教育者视角来看应该如何调整教学方式以适应AI时代的帖子,感觉说的还不错,不是仅仅思考防止作弊,而是站在了如何让学生在AI时代更好获得成长的角度上。整理和分享一些贴中的核心内容如下:
之前在X上看过宝玉老师提出的多角色多轮翻译质量优化思路,以此为基础,尝试让AI同时模拟设计场景中的甲方“爸爸”和乙方(设计师)两个角色,用左右互搏的方式,利用ChatGPT+DALLE3来为大湾区国际创客峰会(Maker Faire Shenzhen 2023)创造海报,结果远远超出我的预期了!
一些感慨: