技術編號:40284120
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明屬于大語言模型安全,具體涉及一種用于大語言模型安全防御的自動紅隊演練方法。背景技術、大語言模型,如chatgpt、llama等,擁有復雜的結構和大量的參數,其強大的計算能力和豐富的儲備知識使其在自然語言處理中顯示出強大的功能,并已經成為了各種應用領域的通用人工智能解決方案。但同時,大語言模型的道德問題和安全問題也出現了。一些對大語言模型的錯誤的、惡意的使用,可能引發(fā)嚴重的危害。開發(fā)安全可靠的大語言模型已成為了模型提供商的重要社會責任。、為了解決這些問題,人們利用各種技術使大語言模型與人...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。