Motif : 从人工智能反馈中获得内在动机

Motif

简介 :

Motif 是一个基于 PyTorch 的项目，通过从 LLM（大型语言模型）的偏好中获取奖励函数，训练 AI 代理在 NetHack 上进行。它可以生成与人类行为直觉一致的行为，并且可以通过提示修改进行引导。

需求人群 :

Motif 可以用于训练 AI 代理在开放式且程序生成的游戏中获取内在动机。

总访问量： 474.6M

占比最多地区： US(19.34%)

本站浏览量： 52.7K

使用场景

使用 Motif 训练 AI 代理在 NetHack 游戏中获取内在动机

使用 Motif 生成与人类行为直觉一致的行为

使用 Motif 通过提示修改来引导 AI 代理的行为

产品特色

使用 LLM 的偏好创建一组注释对的注释数据集

使用交叉熵将 LLM 的偏好转化为奖励函数

使用强化学习训练代理

流量来源

直接访问	51.61%	外链引荐	33.46%	邮件	0.04%
自然搜索	12.58%	社交媒体	2.19%	展示广告	0.11%

同类开源产品