大模型揭示词进阶 Thought Chain 一次性样本揭示和少样本揭示以及思想链 Cot of 零样本揭示

2024-11-14

“技术的外围只要两点，一个是把技术做好，一个是把技术用好”

在之前的文章中曾经说过，预训练和微调是为了打造一个更好用的大模型，而揭示学习是为了更好的经常使用大模型，激起大模型的潜能。

而基于揭示学习开展起来的揭示词工程，也就是怎样写一个更好的揭示词；网络上曾经有很多经过测验的揭示词框架，比如APE，BROKE等。

揭示词工程是一门基于阅历的迷信，因此没有最好的揭示词框架，只要不同义务下最适合的揭示词框架。

而经过钻研发现了揭示词愈加初级的玩法——样本揭示和思想链。

样本揭示包含Zero-Shot,One-Shot,Few-Shot等多种方式，便捷来说就是在揭示词中参与一些例子。

比如

“whatpu” 是一种成长在坦桑尼亚的小型毛茸茸的生物。经常使用 whatpu 这个词的一个例子是：咱们在非洲游览，看到了这些十分可恶的 whatpu。--举例“farduddle” 的意思是极速腾跃。经常使用 farduddle 这个词的一个例子是：

这就是一个少样本揭示的例子，上局部是例子，浅绿色局部就是大模型的回答。

依据不同的大模型和义务类型，可以适当的给出一个到多个例子，而咱们平时间接问大模型的疑问属于零样本揭示，也就是不给出案例，间接让大模型回答。

因此样本揭示就相似于咱们人类平时探讨疑问，或者对方对你的疑问不是很了解，这时咱们下看法的反响就是，我给你举个例子。

这就是样本揭示的作用，在经常使用样本揭示的环节中，可以适当的参与多个样本，Few-Shot中的few就是大于等于1的意思。

以下就是一个给出三个例子的少样本揭示：

思想链是为了处置复杂疑问而推出的一种方式，就是在揭示词中参与思索环节。

举例如下：

这个是没用思想链的方式

问：小明有三个苹果，他的妈妈又给他买了两个苹果，小明吃掉了一个，小明还剩几个苹果？

答：4个

这个是经常使用思想链的方式

问：小明有三个苹果，他的妈妈又给他买了两个苹果，小明吃掉了一个，还剩几个苹果？

答：小明后来有三个苹果，他的妈妈又买了两个，之后又吃掉一个，因此3 + 2 - 1 = 4，所以小明有四个苹果。

问：小丽有三个网球，她又购置了两罐网球，每罐三个，这时小丽有几个网球？

在某些大模型中，假设不经常使用思想链的方式，对于小丽的疑问，或者就会回答失误，而经常使用了思想链可以优化大模型回答的准确率，当然也不能齐全防止回答失误的状况。

这里只是举个便捷的例子，假设咱们在口头愈加复杂的义务时，经常使用思想链可以大大优化大模型的输入品质。特意是在Agent中，Agent应用思想链来优化大模型的推理布局才干和环节，这样就可以让Agent成功愈加复杂的义务。

样本揭示和思想链是两种不同的优化大模型体现才干的方式，一个是给出案例，一个是逐渐拆解，但它们的最终目标都是为了更好的经常使用大模型。

因此，在实践的运行环节中处置复杂义务时，普通会把样本揭示与思想链两者相联合，即给出案例，又给出思索环节。

如下图所示：

在一些问答系统中，经常使用样本揭示+思想链的方式能够更好的回答疑问，以及做一些复杂义务的拆解。

而假设把样本揭示+思想链的方式，再经常使用大模型的function call的方式来成功Agent，就可以让大模型成功一些愈加复杂的义务，比如经常使用思想链做完布局之后，调用工具来成功每一步的义务。

经过这样的方式，就可以把大模型与详细的垂直畛域相联合，创立垂直畛域的智能体。

大模型技术的外围只要两点，一是怎样把模型做的更好，更弱小；二是怎样用好大模型，让大模型处置详细畛域的疑问。

思想链和样本学习是处置两种不同疑问而提出的技术，而且可以把两者联合起来，使得模型体现的更好。

原文链接：