C3PO
C
C3PO
简介 :
C3PO 是一种基于用户反馈的 LLM 模型对齐技术,可以从单个反馈句子中对 LLM 进行调整,避免过度概括化。该技术提供了参考实现、相关基准线和必要组件,方便研究论文中提出的技术。
需求人群 :
用于从单个句子的用户反馈中微调 LLM 模型,实现更符合用户偏好且不过度概括化的结果。
总访问量: 0
本站浏览量 : 77.3K
产品特色
从反馈中样本化相关类别、提示和完成
训练基准模型以微调每个反馈
比较方法和基准响应
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase