LongRoPE
L
Longrope
简介 :
LongRoPE是微软推出的技术,可以将预训练大型语言模型(LLM)的上下文窗口扩展到2048k(200万)令牌,实现从短上下文到长上下文的扩展,降低训练成本和时间,同时保持原有短上下文窗口性能。适用于提高语言模型在长文本上的理解和生成能力,提升机器阅读理解、文本摘要和长篇文章生成等任务。
需求人群 :
适用于需要处理极长文本的任务,提高语言模型在长文本上的理解和生成能力,提升机器阅读理解、文本摘要和长篇文章生成等任务的性能。
总访问量: 474.6M
占比最多地区: US(19.34%)
本站浏览量 : 61.0K
使用场景
用于机器阅读理解任务,提高模型在长文本上的理解能力。
应用于文本摘要生成,提升自动摘要生成效果。
支持长篇文章生成,使模型能够更好地处理大篇幅文本。
产品特色
扩展上下文窗口至200万令牌
低成本微调
保持短上下文性能
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase