燧原科技“一种大语言模型中的推测性解码方法、装置、设备及介质”专利公布

来源:爱集微 #燧原科技#
1.6w

天眼查显示,上海燧原科技股份有限公司“一种大语言模型中的推测性解码方法、装置、设备及介质”专利公布,申请公布日为2024年10月1日,申请公布号为CN118734970A。

本发明实施例公开了一种大语言模型中的推测性解码方法、装置、设备及介质。该方法包括:在内存中读取历史文本信息,并传输至计算单元;在计算单元中执行:将历史文本信息输入至预设长度预测器,得到推理长度;将推理长度以及历史文本信息输入至预设推测性解码模型,得到与推理长度相同个数的预测文本信息;将历史文本信息输入至大语言模型中,得到大语言模型输出的目标文本信息;将历史文本信息、目标文本信息以及各预测文本信息输入至大语言模型进行验证,得到推理正确的目标预测文本信息;根据历史文本信息与目标预测文本信息进行迭代训练,得到目标长度预测器和目标推测性解码模型。该方法在推测性解码中考虑了推理长度,可提高模型推理性能。

责编: 赵碧莹
来源:爱集微 #燧原科技#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...