151 讀數

大型语言模型的高效引导生成：讨论、参考文献和致谢

要经过 Writings, Papers and Blogs on Text Models4m2024/06/02

太長; 讀書

研究人员提出了一种用于文本生成的有限状态机框架，可提供精确的控制和改进的性能。

featured image - 大型语言模型的高效引导生成：讨论、参考文献和致谢

作者：

（1） Brandon T. Willard，硬性算起；（2）R´emi Louf，《平民确定》。

链接表

5.讨论

此文解释的词汇大全数据库索引消掉了引导和帮助转成中展开时突出的缺陷。此外，它在处置和运存当中展开了考量，但他们表示运存成本低均匀相应较低，即便并非是，也能能凭借常规的形式变低。

在人们公司用稍稍提升的 Python 语法知识型号展开的测试仪中，人们公司得知虽然是比较简单搭建的检索（即涉及到未用和亢余解密器和 FSM 的情况性能的检索）也只 50 MB 之间。前者，这个检索是用未消减的 DFA 搭建的，这后果着普遍存在大量的亢余的情况，不能要地增长了检索的粗细。都，要是的情况机的准确度透露有的是个难题，现在其它都具有较低内存空间特殊要求的的情况机数学公式也许就足以了（诸如 NFA）。

这种深入分析的重大意义不包括但不限于脑神经文字转化成。譬如，当需成分化读取时，还能够利用小编表述的目录工艺来积极配合 LLM 的魔鬼体能训练方法或调节。公司还还能够猜测，在魔鬼体能训练方法流程中确定协助转化成有机会会削减模特学会句法细节点的需。

不仅，该最简单的的方式还作为半个种监测现行仿真三维仿真模型的取代最简单的的方式。列如，就能去尝试考评你们的最简单的的方式合成的掩码方式与仿真三维仿真模型合成的原始社会方式中的性别差异。这反过去又就能为仿真三维仿真模型的培养总体目标作为内容。

还是可以将经由此类具体方法折算出的掩码“升降”到语言表达类别使用价值中。基础上，掩码隐式地判别了一些折算不须要执行力。我现有的表格函数只在评均职务级别运作掩码，不过，经由将掩码进一大步升降到类别的构架中，我将会能够在对类别叁数展开并非要的运作在之前调低须要一些类别叁数电影片段。这有将会进一大步消减折算成本低。

参考

Luca Beurer-Kellner、Marc Fischer 和 Martin Vechev。提升即程序文学言语：新型文学言语模式的验证文学言语。ACM 程序文学言语文学言语文献集，7(PLDI)：1946-1969，2023 年。

董一红、李革和金志。CODEP：应用在通用性二维码提取的语法学 Seq2Seq 模式。第 32 届 ACM SIGSOFT 香港国际应用检验与定量分析研究讨论会小论文集 ISSTA 2023，第 188-198 页，新西兰波士顿州波士顿，2023 年 7 月。算出机针灸学会。ISBN 9798400702211。doi：10.1145/3597926。3598048。

Saibo Geng、Martin Josifosky、Maxime Peyrard 和 Robert West。对于灵巧语法结构的编程语言模式定义解密，2023 年 5 月。

Michael Kuchnik、Virginia Smith 和 George Amvrosiadis。食用 relm 验证通过大语音型号。机器人借鉴与整体文章集，第 5 卷，2023 年。

Alexander K. Lew、Tan Zhi-Xuan、Gabriel Grand 和 Vikash K. Mansinghka。选用几率程序流程对较大型语种绘图展开方式蒙特卡罗把控好。arXiv 预印本 arXiv:2306.03081，2023 年。

R´emi Louf 和 Brandon T. Willard。目录：转换实体模型和程序编写。网站地址 //github.com/normal-computing/outlines。

微软系统官网。指引。微软系统官网，2023 年 7 月。URL //github.com/microsoft/guidance。

Gabriel Poesia、Oleksandr Polozov、Vu Le、Ashish Tiwari、Gustavo Soares、Christopher Meek 和 Sumit Gulwani。Synchromesh：从预培养语言表达对模型转换成靠得住的编号。arXiv 预印本 arXiv:2201.11227，2022a。

Gabriel Poesia、Oleksandr Polozov、Vu Le、Ashish Tiwari、Gustavo Soares、Christopher Meek 和 Sumit Gulwani。Synchromesh：进行预体能训练计算机语言建模转为可靠性的编号，2022 年 1 月。

Maxim Rabinovich、Mitchell Stern 和 Dan Klein。用做源代码转换和语义解释的虚语法学微信网络。arXiv 预印本 arXiv:1704.07535，2017 年。

Alec Radford、Jeffrey Wu、Rewon Child、David Luan、Dario Amodei 和 Ilya Sutskever。言语模形是无监督检查的多任務学习培训者。OpenAI 博客或网站，1(8):9，2019 年。

Matt Rickard。parserLLM，2023 年 7 月。URL //github.com/r2d4/parserllm。

Matt Rickard。R2d4/rellm：任何人文学语言类别已完成的精密结构类型。，2023b。URL //github.com/r2d4/rellm。

Torsten Scholak、Nathan Schucher 和 Dzmitry Bahdanau。PICARD：从言语建模方法来受制约自归队编解码的增长辨析。arXiv 预印本 arXiv:2109.05093，2021 年。

Rico Sennrich、Barry Haddow 和 Alexandra Birch。施用子词象限对少有词进行神经系统机器人翻译资料。arXiv 预印本 arXiv:1508.07909，2015 年。

Michael Sipser。《计算学说导论》。International Thomson Publishing，1996 年。

Ashish Vaswani、Noam Shazeer、Niki Parmar、Jakob Uszkoreit、Llion Jones、Aidan N. Gomez、\Lukasz Kaiser 和 Illia Polosukhin。关注力即是需用要的任何事物。精神资料处里系统性的进行，2017 年 30 日。

Bailin Wang、Zi Wang、Xuezhi Wang、Yuan Cao、Rif A. Saurous 和 Yoon Kim。选择魔幻语气模形通过域某一语气形成的汉语语法提升，2023 年 5 月。

Lilian Weng。可以控制感觉神经文档转成，2021 年 1 月。URL //lilianweng.github.io/posts/ 2021-01-02-controllable-text-generation/。