C3PO
C
C3PO
簡介 :
C3PO 是一種基於用戶反饋的 LLM 模型對齊技術,可以從單個反饋句子中對 LLM 進行調整,避免過度概括化。該技術提供了參考實現、相關基準線和必要組件,方便研究論文中提出的技術。
需求人群 :
用於從單個句子的用戶反饋中微調 LLM 模型,實現更符合用戶偏好且不過度概括化的結果。
總訪問量: 0
本站瀏覽量 : 74.0K
產品特色
從反饋中樣本化相關類別、提示和完成
訓練基準模型以微調每個反饋
比較方法和基準響應
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase