MambaByte
M
Mambabyte
简介 :
曼巴字节是一种无标记的语言模型,直接从原始字节中学习,消除了子词标记化的偏见。它在字节上运行,但会导致序列显著变长,标准的自回归Transformer在这种情况下的扩展性较差。我们在字节序列上自回归训练了曼巴字节,这是Mamba状态空间模型的无标记适应。我们的实验表明,与其他字节级模型相比,曼巴字节具有较高的计算效率。我们还发现,曼巴字节在与最先进的子词Transformer的竞争中表现出色,甚至超越其性能。此外,由于长度的线性扩展,曼巴字节在推理过程中比Transformer具有更快的速度。我们的发现证实了曼巴字节在实现无标记语言建模方面的可行性。
需求人群 :
曼巴字节适用于需要消除子词标记化偏见、提高计算效率的语言建模任务。
总访问量: 29.7M
占比最多地区: US(17.94%)
本站浏览量 : 46.9K
使用场景
用于自然语言处理任务的曼巴字节模型
曼巴字节在文本生成应用中的使用示例
使用曼巴字节进行情感分析的案例
产品特色
无标记语言建模
消除子词标记化偏见
字节级模型训练
提高计算效率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase