Easycontext : EasyContext演示了如何利用现有技术组合，来训练700K和1M上下文的语言模型。

Easycontext

EasyContext

Easycontext

AI模型 #语言模型 #上下文长度 #内存优化 #深度学习普通产品开源

简介 :

EasyContext是一个开源项目,旨在通过结合多种技术手段,实现使用普通硬件训练语言模型的上下文长度达到100万词元。主要采用的技术包括序列并行、Deepspeed zero3离载、Flash注意力以及激活checkpoint等。该项目不提出新的创新点,而是展示如何组合现有的技术手段来实现这一目标。已成功训练出Llama-2-7B和Llama-2-13B两个模型,分别在8块A100和16块A100上实现了700K和1M词元的上下文长度。

需求人群 :

用于训练具有超长上下文的语言模型

总访问量： 474.6M

占比最多地区： US(19.34%)

本站浏览量： 55.5K

使用场景

使用EasyContext在8块A100上训练Llama-2-7B模型,实现了700K词元的上下文长度

使用EasyContext在16块A100上训练Llama-2-13B模型,实现了1M词元的上下文长度

通过组合现有技术手段,EasyContext大幅提升了语言模型的上下文长度,为视频生成等应用奠定了基础

产品特色

序列并行

Deepspeed zero3离载

Flash注意力和融合交叉熵核心

激活checkpoint

精选AI产品推荐

Deepmind Gemini

Deepmind Gemini

Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态,成为迄今为止最强大的AI系统之一。它有三个不同规模的版本,可满足从边缘计算到云计算的各种需求。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。

LiblibAI

LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase