# 注意力機制

FlexHeadFA
Flexheadfa
FlexHeadFA 是一個基於 FlashAttention 的改進模型,專注於提供快速且內存高效的精確注意力機制。它支持靈活的頭維度配置,能夠顯著提升大語言模型的性能和效率。該模型的主要優點包括高效利用 GPU 資源、支持多種頭維度配置以及與 FlashAttention-2 和 FlashAttention-3 兼容。它適用於需要高效計算和內存優化的深度學習場景,尤其在處理長序列數據時表現出色。
模型訓練與部署
49.4K
MoBA
Moba
MoBA(Mixture of Block Attention)是一種創新的注意力機制,專為長文本上下文的大語言模型設計。它通過將上下文劃分為塊,並讓每個查詢令牌學習關注最相關的塊,從而實現高效的長序列處理。MoBA 的主要優點是能夠在全注意力和稀疏注意力之間無縫切換,既保證了性能,又提高了計算效率。該技術適用於需要處理長文本的任務,如文檔分析、代碼生成等,能夠顯著降低計算成本,同時保持模型的高性能表現。MoBA 的開源實現為研究人員和開發者提供了強大的工具,推動了大語言模型在長文本處理領域的應用。
模型訓練與部署
51.6K
FlashInfer
Flashinfer
FlashInfer是一個專為大型語言模型(LLM)服務而設計的高性能GPU內核庫。它通過提供高效的稀疏/密集註意力機制、負載平衡調度、內存效率優化等功能,顯著提升了LLM在推理和部署時的性能。FlashInfer支持PyTorch、TVM和C++ API,易於集成到現有項目中。其主要優點包括高效的內核實現、靈活的自定義能力和廣泛的兼容性。FlashInfer的開發背景是為了滿足日益增長的LLM應用需求,提供更高效、更可靠的推理支持。
開發與工具
58.8K
Star-Attention
Star Attention
Star-Attention是NVIDIA提出的一種新型塊稀疏注意力機制,旨在提高基於Transformer的大型語言模型(LLM)在長序列上的推理效率。該技術通過兩個階段的操作顯著提高了推理速度,同時保持了95-100%的準確率。它與大多數基於Transformer的LLM兼容,無需額外訓練或微調即可直接使用,並且可以與其他優化方法如Flash Attention和KV緩存壓縮技術結合使用,進一步提升性能。
模型訓練與部署
48.0K
MotionCLR
Motionclr
MotionCLR是一個基於注意力機制的運動擴散模型,專注於人類動作的生成和編輯。它通過自注意力和交叉注意力機制,分別模擬模態內和模態間的交互,實現對動作序列的精細控制和編輯。該模型的主要優點包括無需訓練即可進行編輯,具有較好的解釋性,能夠通過操作注意力圖來實現多種運動編輯方法,如動作的強調或減弱、就地替換動作、基於示例的動作生成等。MotionCLR的研究背景是解決以往運動擴散模型在細粒度編輯能力上的不足,通過清晰的文本-動作對應關係,提高動作編輯的靈活性和精確性。
AI模型
46.6K
MobileLLM
Mobilellm
MobileLLM是一種針對移動設備優化的小型語言模型,專注於設計少於十億參數的高質量LLMs,以適應移動部署的實用性。與傳統觀念不同,該研究強調了模型架構在小型LLMs中的重要性。通過深度和薄型架構,結合嵌入共享和分組查詢注意力機制,MobileLLM在準確性上取得了顯著提升,並提出了一種不增加模型大小且延遲開銷小的塊級權重共享方法。此外,MobileLLM模型家族在聊天基準測試中顯示出與之前小型模型相比的顯著改進,並在API調用任務中接近LLaMA-v2 7B的正確性,突出了小型模型在普通設備用例中的能力。
AI模型
47.7K
FlashAttention
Flashattention
FlashAttention是一個開源的注意力機制庫,專為深度學習中的Transformer模型設計,以提高計算效率和內存使用效率。它通過IO感知的方法優化了注意力計算,減少了內存佔用,同時保持了精確的計算結果。FlashAttention-2進一步改進了並行性和工作分配,而FlashAttention-3針對Hopper GPU進行了優化,支持FP16和BF16數據類型。
AI模型
46.6K
優質新品
Mamba-2
Mamba 2
Mamba-2是Goomba AI Lab開發的一種新型序列模型,旨在提高機器學習社區中序列模型的效率和性能。它通過結構化狀態空間對偶(SSD)模型,結合了狀態空間模型(SSM)和注意力機制的優點,提供了更高效的訓練過程和更大的狀態維度。Mamba-2的設計允許模型在訓練時利用矩陣乘法,從而提高了硬件效率。此外,Mamba-2在多查詢關聯記憶(MQAR)等任務中表現出色,顯示出其在複雜序列處理任務中的潛力。
AI模型
51.9K
Era3D
Era3d
Era3D是一個開源的高分辨率多視角擴散模型,它通過高效的行注意力機制來生成高質量的圖像。該模型能夠生成多視角的顏色和法線圖像,支持自定義參數以獲得最佳結果。Era3D在圖像生成領域具有重要性,因為它提供了一種新的方法來生成逼真的三維圖像。
AI圖像生成
62.9K
Gemma-2B-10M
Gemma 2B 10M
Gemma 2B - 10M Context是一個大規模的語言模型,它通過創新的注意力機制優化,能夠在內存使用低於32GB的情況下處理長達10M的序列。該模型採用了循環局部注意力技術,靈感來源於Transformer-XL論文,是處理大規模語言任務的強大工具。
AI模型
55.2K
Mixture-of-Attention (MoA)
Mixture Of Attention (MoA)
Mixture-of-Attention (MoA) 是一種用於個性化文本到圖像擴散模型的新架構,它通過兩個注意力路徑——個性化分支和非個性化先驗分支——來分配生成工作負載。MoA 設計用於保留原始模型的先驗,同時通過個性化分支最小干預生成過程,該分支學習將主題嵌入到先驗分支生成的佈局和上下文中。MoA 通過一種新穎的路由機制管理每層像素在這些分支之間的分佈,以優化個性化和通用內容創建的混合。訓練完成後,MoA 能夠創建高質量、個性化的圖像,展示多個主題的組成和互動,與原始模型生成的一樣多樣化。MoA 增強了模型的先有能力與新增強的個性化干預之間的區別,從而提供了以前無法實現的更解耦的主題上下文控制。
AI圖像生成
62.9K
LLM Transparency Tool
LLM Transparency Tool
LLM Transparency Tool(LLM-TT)是一個開源的交互式工具包,用於分析基於Transformer的語言模型的內部工作機制。它允許用戶選擇模型、添加提示並運行推理,通過可視化的方式展示模型的注意力流動和信息傳遞路徑。該工具旨在提高模型的透明度,幫助研究人員和開發者更好地理解和改進語言模型。
AI模型
62.9K
國外精選
Flash-Decoding
Flash Decoding
Flash-Decoding是一種針對長上下文推理的技術,可以顯著加速推理中的注意力機制,從而使生成速度提高8倍。該技術通過並行加載鍵和值,然後分別重新縮放和組合結果來維護正確的注意力輸出,從而實現了更快的推理速度。Flash-Decoding適用於大型語言模型,可以處理長文檔、長對話或整個代碼庫等長上下文。Flash-Decoding已經在FlashAttention包和xFormers中提供,可以自動選擇Flash-Decoding或FlashAttention方法,也可以使用高效的Triton內核。
AI模型
95.2K
精選AI產品推薦
中文精選
騰訊混元圖像 2.0
騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
80.6K
國外精選
Lovart
Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
63.8K
FastVLM
Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.1K
KeySync
Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
48.3K
Manus
Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M
Trae國內版
Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
137.7K
國外精選
Pika
Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選
LiblibAI
Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase