MambaByte
M
Mambabyte
簡介 :
曼巴字節是一種無標記的語言模型,直接從原始字節中學習,消除了子詞標記化的偏見。它在字節上運行,但會導致序列顯著變長,標準的自迴歸Transformer在這種情況下的擴展性較差。我們在字節序列上自迴歸訓練了曼巴字節,這是Mamba狀態空間模型的無標記適應。我們的實驗表明,與其他字節級模型相比,曼巴字節具有較高的計算效率。我們還發現,曼巴字節在與最先進的子詞Transformer的競爭中表現出色,甚至超越其性能。此外,由於長度的線性擴展,曼巴字節在推理過程中比Transformer具有更快的速度。我們的發現證實了曼巴字節在實現無標記語言建模方面的可行性。
需求人群 :
曼巴字節適用於需要消除子詞標記化偏見、提高計算效率的語言建模任務。
總訪問量: 29.7M
佔比最多地區: US(17.94%)
本站瀏覽量 : 44.4K
使用場景
用於自然語言處理任務的曼巴字節模型
曼巴字節在文本生成應用中的使用示例
使用曼巴字節進行情感分析的案例
產品特色
無標記語言建模
消除子詞標記化偏見
字節級模型訓練
提高計算效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase