腾讯公布大模型训练专利

天眼查

App显现,2月7日,腾讯科技(深圳)有限公司请求的“大言语模型的练习办法、设备、计算机设备及存储介质”专利发布。

摘要显现,在该办法中,经过在大言语模型的练习过程中引进榜首摘要文本和第二摘要文本,为模型练习供给了更多可学习信息,一起因为榜首摘要文本和第二摘要文本包括的信息量不同,且榜首摘要文本中包括正确句子和过错句子,经过对同一样本文本的两个不同摘要文本进行比照学习,并区别学习榜首摘要文本中的正确句子和过错句子,避免了因为摘要文本单一而导致的模型过拟合和生成不精确等问题,不只提高了模型的泛化功能,还提高了模型的精确性。

返回资讯列表