RichChat

A blog for tech enthusiasts

RichChat

在如今这个快速发展的AI时代,大语言模型(LLM)的研究论文数量呈指数级增长,几乎到了人力无法一一阅读和消化的地步。然而,对这些研究成果的归纳和总结至关重要,因为它们描绘了LLM领域的未来发展轮廓。在近期的LLM研究中,有三个趋势尤为引人注目:

合成训练数据:

利用LLM生成它们自己的训练数据一直是一个热门话题。目前这个话题在AI研究界引发了极大的关注,一些重点研究如下:

阅读全文 »

说起AI圈的“网红”,Andrej Karpathy是大家很熟悉的名字,他不仅是OPENAI的创始成员,也曾经担任特斯拉的AI总监长达五年。他最近做了一个关于大模型的分享,我将其内容浓缩整理成为一个太长不看/TLDR版,正好为迟些要主讲的内部大模型培训做个准备,希望能让没有技术基础的同学们也能了解大模型是什么和大模型的发展方向这两个重要的议题。

阅读全文 »

当大环境红利不在,大家只能卷到极致的今天,如何获得增长这件事情将是所有公司的战略重点之一。但是很多时候你会发现,不同团队中的员工对于产品如何增长都有各自看法,例如:

  • 市场营销人员认为产品增长是因为“我们有最好的AARRR漏斗指标”。(AARRR漏斗包括获取/Acquisition、激活/Activation、留存/Retention、收入/Revenue和推荐/Referral);
  • 产品经理认为是因为“优秀的产品框架、’突然顿悟’时刻和用户习惯形成的速度”;
    阅读全文 »

Despite all the craziness at OpenAI this weekend… 继之前的两篇OpenAI Devday闭门会ppt分享后:

今天再带来最后这篇讲述OpenAI内部研究团队和产品团队的工作内幕的ppt,其中的一些内容对于无论是做大模型研究的同学还是传统做产品经理的同学都会有些启示,尤其是这可能是OpenAI梦之队最后一次高质量分享…:

阅读全文 »

继昨天分享的OpenAI DevDay的闭门会“A Survey of Techniques for Maximizing LLM Performance (精进大型语言模型性能的各种技巧)“后,今天再带来当天另外一场的技术实操闭门会ppt分享 - “The New Stack and Ops for AI/新一代的技术堆栈和AI的运营管理”。这场中也讲了大量如何从工程实操的层面来更好地将AI用到实际生产力场景中的最新经验。

实际有真正深度用过AI的研发者都知道,你可以很轻松地做出一些原型项目,甚至是很酷的demo,但是如果真要将AI用到实际生产力场景中的话,还是挺难的。这次OpenAI的专项分享的一些重点内容如下:

阅读全文 »

NASA旗下有个名为petal的项目,是一个开源的人工智能设计工具,旨在跨学科地利用自然与科技的数据和信息,以推动仿生学的研发进步。

这个项目不久前开源了他们在discord上的一个AI Chatbot的mega-prompt,这应该是我见过最长的prompt之一。感觉写的非常好,因此专门发一下供大家参考(要是大家有兴趣我迟些再补一篇针对这个mega prompt设计逻辑的整理)。而且值得指出的是,对于很多在做产品设计的朋友(尤其是实体产品)来说,完全可以直接用这个prompt来尝试开拓设计思路

阅读全文 »
0%