Motif
M
Motif
簡介 :
Motif 是一個基於 PyTorch 的項目,通過從 LLM(大型語言模型)的偏好中獲取獎勵函數,訓練 AI 代理在 NetHack 上進行。它可以生成與人類行為直覺一致的行為,並且可以通過提示修改進行引導。
需求人群 :
Motif 可以用於訓練 AI 代理在開放式且程序生成的遊戲中獲取內在動機。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 51.9K
使用場景
使用 Motif 訓練 AI 代理在 NetHack 遊戲中獲取內在動機
使用 Motif 生成與人類行為直覺一致的行為
使用 Motif 通過提示修改來引導 AI 代理的行為
產品特色
使用 LLM 的偏好創建一組註釋對的註釋數據集
使用交叉熵將 LLM 的偏好轉化為獎勵函數
使用強化學習訓練代理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase