RichChat

A blog for tech enthusiasts

RichChat

如果你浏览各种提示语/prompt,你会注意到它们在风格和方式上各不相同,而不是固守某一个特定模板。要理解这背后的原因,我想先问你一个问题:要怎样才能最有效地引导Meta的开源Llama 2准确完成数学题呢?请你花点时间猜一猜

不管你怎么猜,我可以很有信心地告诉你答案是错的。正确的答案居然是 - 根据你想让AI解答的数学题数量,你需要假装成正在《星际迷航》的剧集里或者是在一部政治惊悚片中

阅读全文 »

我由于一直在密切跟进大模型领域的发展,因此每次看到有新的大模型发布号称“超越GPT4”的时候都会去试一下,但是基本都是以失望告终(包括寄予了厚望的Gemini Ultra) - 直到使用了上周的Claude 3 Opus。虽然依然不能说Opus全面超越GPT4,但是从个人的实际试用上发现确实在不少方面体现了不弱于甚至超过GPT4的智商。

那么,我们能如何更好地使用Claude 3呢?Anthropic编写了一本非常详尽的Prompt操作指南(依然,我查了一下目前网上现有的少量翻译,感觉质量还不够高,因此重新翻译整理了下面的内容)。如果你仍旧采用与GPT4相同的prompt技巧,那么你可能还没能充分发挥Claude3的全部潜力!

阅读全文 »

译者按:这是一篇硅谷创业教父Paul Graham在2005年的好文,名字叫做“What you’ll wish you’d known - 有什么是你会希望在年轻的时候就知道的事情“?是他原本计划在一个高中毕业典礼上使用的演讲稿,内容还是挺不错的,推荐高中生/大学生或者是相关家长们都可以看看想看英文原版的也可以点击这里)。

我查了一些网上现有的翻译感觉质量都还不太行,所以就重新翻译了一次,并且将原来附在末尾的一些批注也整合到了正文中。尤其是在“保持上风位/Stay Upwind”这段给年轻人建议应该如何选择未来发展方向的话是个人印象最深刻的,确实属于只有过来人才能给能给出的建言。我将其总结如下:

阅读全文 »

interviewing.io是一家专门提供在线模拟技术面试的网站,他们最近做了一个有趣的研究 - 面试者使用ChatGPT的话,是否能在面试中获得更好成绩?以及是否会被面试官轻松发现?

先说结论:

  • 根据测试结果,能熟练使用ChatGPT的面试者确实在技术面试中会取得更好成绩,而且几乎很难被面试官发现
  • 这里引发的思考是:大家在做研发招聘的时候的面试题要考虑更新一轮了,而不能像过往一样直接从LeetCode中取现成的问题
    阅读全文 »

由于自己最近在HR这个领域上做了更多的一些工作和思考,推荐一下本文,内容翻译+整理自一家名为Contrarian Thinking(逆向思维)的市场营销初创公司负责人的发帖,觉得写得还不错。我印象比较深刻的是:

1、建立一套符合自己公司特色的通用面试评价体系(或者至少在HR面的时候的通用体系)+ 高质量的面试问题库;

2、一定要重视招聘工作,用类似市场营销增长漏斗的模式来不断吸引优秀面试者(例如岗位描述如何更有吸引力来增加前端引流?过往创业者们会对自己的市场营销团队做严格的漏斗考核,为什么在更重要的人才招募上不也同样精益求精?)

最出色的创业者在一件事情上表现出色…

那就是招聘。

这听起来很简单,其实远不止于此。

阅读全文 »

在如今这个快速发展的AI时代,大语言模型(LLM)的研究论文数量呈指数级增长,几乎到了人力无法一一阅读和消化的地步。然而,对这些研究成果的归纳和总结至关重要,因为它们描绘了LLM领域的未来发展轮廓。在近期的LLM研究中,有三个趋势尤为引人注目:

合成训练数据:

利用LLM生成它们自己的训练数据一直是一个热门话题。目前这个话题在AI研究界引发了极大的关注,一些重点研究如下:

阅读全文 »

说起AI圈的“网红”,Andrej Karpathy是大家很熟悉的名字,他不仅是OPENAI的创始成员,也曾经担任特斯拉的AI总监长达五年。他最近做了一个关于大模型的分享,我将其内容浓缩整理成为一个太长不看/TLDR版,正好为迟些要主讲的内部大模型培训做个准备,希望能让没有技术基础的同学们也能了解大模型是什么和大模型的发展方向这两个重要的议题。

阅读全文 »
0%