2024年11月11日消息,國家知識產權局信息顯示,淘寶(中國)軟件有限公司申請一項名為“一種序列化模型編輯的方法和裝置”的專利,公開號CN 118917399 A,申請日期為2024年8月。
專利摘要顯示,本發明實施例公開了一種序列化模型編輯的方法和裝置。本發明實施例中,通過獲取待編輯知識三元組數據,定位到大規模語言模型的多層感知器層,確定第一參數和待編輯的第二參數;根據待編輯知識三元組數據、第一參數和待編輯的第二參數,確定結構編輯損失函數;根據結構編輯損失函數更新待編輯的第二參數;將更新后的待編輯的第二參數保存到知識參數隊列;根據更新后的所述待編輯的第二參數對知識參數隊列中的多個已編輯的第二參數進行更新;將更新后的待編輯的第二參數和更新后的所述多個已編輯的第二參數對所述大規模語言模型的多層感知器層進行更新。通過上述方法,可以降低大規模語言模型在序列化編輯過程中產生的能力退化問題。