Motif : 從人工智能反饋中獲得內在動機

Motif

簡介 :

Motif 是一個基於 PyTorch 的項目，通過從 LLM（大型語言模型）的偏好中獲取獎勵函數，訓練 AI 代理在 NetHack 上進行。它可以生成與人類行為直覺一致的行為，並且可以通過提示修改進行引導。

需求人群 :

Motif 可以用於訓練 AI 代理在開放式且程序生成的遊戲中獲取內在動機。

總訪問量： 474.6M

佔比最多地區： US(19.34%)

本站瀏覽量： 51.9K

使用場景

使用 Motif 訓練 AI 代理在 NetHack 遊戲中獲取內在動機

使用 Motif 生成與人類行為直覺一致的行為

使用 Motif 通過提示修改來引導 AI 代理的行為

產品特色

使用 LLM 的偏好創建一組註釋對的註釋數據集

使用交叉熵將 LLM 的偏好轉化為獎勵函數

使用強化學習訓練代理

流量來源

直接訪問	51.61%	外鏈引薦	33.46%	郵件	0.04%
自然搜索	12.58%	社交媒體	2.19%	展示廣告	0.11%

最新流量情況

總流量趨勢圖

地理流量分佈情況

地理流量分佈全球圖

同類開源產品