Motif
M
Motif
简介 :
Motif 是一个基于 PyTorch 的项目,通过从 LLM(大型语言模型)的偏好中获取奖励函数,训练 AI 代理在 NetHack 上进行。它可以生成与人类行为直觉一致的行为,并且可以通过提示修改进行引导。
需求人群 :
Motif 可以用于训练 AI 代理在开放式且程序生成的游戏中获取内在动机。
总访问量: 474.6M
占比最多地区: US(19.34%)
本站浏览量 : 52.7K
使用场景
使用 Motif 训练 AI 代理在 NetHack 游戏中获取内在动机
使用 Motif 生成与人类行为直觉一致的行为
使用 Motif 通过提示修改来引导 AI 代理的行为
产品特色
使用 LLM 的偏好创建一组注释对的注释数据集
使用交叉熵将 LLM 的偏好转化为奖励函数
使用强化学习训练代理
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase