ALMA-13B-R
A
ALMA 13B R
简介 :
ALMA-R模型,通过Contrastive Preference Optimization (CPO)进行了进一步的LoRA微调,超越了GPT-4和WMT获奖者。用户可以在GitHub仓库中下载ALMA(-R)模型和数据集。ALMA-R建立在ALMA模型的基础上,采用了我们提出的Contrastive Preference Optimization (CPO)进行微调,而不是ALMA中使用的Supervised Fine-tuning。CPO微调需要我们的三元组偏好数据进行偏好学习。ALMA-R现在可以匹配甚至超越GPT-4或WMT获奖者!
需求人群 :
用户可以使用ALMA-R模型进行机器翻译,也可以下载相关数据集进行训练和微调,还可以部署模型进行实际应用。
总访问量: 29.7M
占比最多地区: US(17.94%)
本站浏览量 : 58.5K
使用场景
使用ALMA-R模型进行中文到英文的机器翻译
下载ALMA-R模型进行自定义微调
部署ALMA-R模型进行实时翻译服务
产品特色
ALMA(-R)模型下载
数据集下载
机器翻译
模型微调
模型部署
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase