206 讀數

大型语言模型的高效引导生成：LLM 采样和引导生成

经过了 Writings, Papers and Blogs on Text Models2m2024/06/02

太長; 讀書

研究人员提出了一种用于文本生成的有限状态机框架，可提供精确的控制和改进的性能。

featured image - 大型语言模型的高效引导生成：LLM 采样和引导生成

作者：

（1） Brandon T. Willard，通常算；（2）R´emi Louf，《一般计算方式》。

链接表

2. LLM 抽样和指导生成

令 St = (s1 ... st) 表示法 t 个标识的队列，但其中 st ∈ V，V 是词句表，|V| = N。词句表 V 由固定不变英文字腕表的字串串分为 [Sennrich et al., 2015]，N 一般来说在 104 或更具的规模级上。

小编将下的标出 st+1 举例为左右个数因素：

2.1 采样序列

令 F ⊂ P (V)，至少 P 是幂集运算符，是以特俗标签图片 EOS ∈ V 末尾的多标签图片空格符串的子集。文本格式生产工作办法 F 中吸取样板。

以及思考了几个提取 F 成分的流程。贪得无厌解码数据包涵递归提取标注，在企业每一个步各写择概率计算较高的标注。集束浏览也以递归方式方式提取标注，实用感悟式方式寻找遍布的模式，。前段时间，SMC 抽样也被应用在提取回文序列 [Lew 几人，2023 年]。

法求 1 内容梗概陈述了抽样的时候。该的时候基本上又称多式抽样，确认从下面的定义的区分区域划分中抽样，递归转化成新令牌，终究会查找 EOS 令牌。

2.2 引导一代

• 大数字范例，

• 与正则理解式 [a-zA-Z] 适配的标识符串，

• 或者结合锁定语法学解读的字节串（举列 Python、SQL 等）

带掩蔽的采样系统系统是贝叶斯流程图 1 的简约增强学习，并在贝叶斯流程图 2 中给出。

2.5 行中 m 的求算方式隐式地对 V 的拥有金属元素制定。除开求算方式 α 之中，这一个步骤那自然是最奢侈的。在正则把你想表达出来式诱导掩码的具体原因下（或比这更复杂化的具体原因），搭载度或 m 自然依赖于于原本取样的记号。一些诱导导出不可能一个不断连接或解释原因，不是会常使用于要有及时互访完善字节串的条件措施。在有的具体原因下，需要在每当不断中从取样编码序列的前面制定要素连接或解释，但这会生成最好不要与在全部常用词表格中应运 O(N) 费用混着线性网络发展的费用。

这引出来了我们公司这一项岗位的最主要问题：是怎样选择正则描述式或 CFG 更有效地配对或详细分析不全部的字段串，并在梯度下降法 2 的每每更替中选定掩码 m？