

EXAONE 3.5 32B Instruct GGUF
簡介 :
EXAONE-3.5-32B-Instruct-GGUF是LG AI Research開發的一系列指令調優的雙語(英語和韓語)生成模型,包含2.4B至32B參數的不同版本。這些模型支持長達32K令牌的長上下文處理,展現了在真實世界用例和長上下文理解中的最前沿性能,同時在與近期發佈的類似規模模型相比,在通用領域保持競爭力。該模型系列通過技術報告、博客和GitHub提供了詳細信息,並且包含了多種精度的指令調優32B語言模型,具有以下特點:參數數量(不含嵌入)為30.95B,層數為64,注意力頭數為GQA,包含40個Q頭和8個KV頭,詞彙量為102,400,上下文長度為32,768令牌,量化包括Q8_0、Q6_0、Q5_K_M、Q4_K_M、IQ4_XS等GGUF格式(也包括BF16權重)。
需求人群 :
目標受眾為需要高性能語言模型的研究人員、開發者和企業,特別是在需要處理大量數據和長上下文信息的場景中。EXAONE-3.5-32B-Instruct-GGUF因其強大的性能和多語言支持,適合於進行自然語言處理、文本生成、機器翻譯等任務,幫助用戶提高工作效率和處理複雜問題的能力。
使用場景
利用EXAONE-3.5-32B-Instruct-GGUF進行長篇文章的生成和內容理解。
在多語言環境下,使用該模型進行跨語言的文本翻譯和信息檢索。
在對話系統和聊天機器人中,應用該模型以提供更自然和準確的語言交互。
產品特色
支持長上下文處理,上下文長度可達32K令牌。
包含不同精度的模型,如Q8_0、Q6_0、Q5_K_M、Q4_K_M、IQ4_XS和BF16。
優化了模型部署,包括2.4B模型針對小型或資源受限設備優化。
提供預量化模型,使用AWQ和多種量化類型。
支持多種部署框架,如TensorRT-LLM、vLLM、SGLang、llama.cpp和Ollama。
模型訓練考慮了系統提示的使用,提高了對話和交互的效率。
模型生成的文本不反映LG AI Research的觀點,確保了內容的中立性。
使用教程
1. 安裝llama.cpp,具體安裝指南請參考llama.cpp的GitHub倉庫。
2. 下載EXAONE 3.5模型的GGUF格式文件。
3. (可選)如果使用BF16精度,可能需要合併分割的文件。
4. 使用llama.cpp運行模型,並在對話模式下進行測試。
5. 遵循系統提示的使用建議,以獲得最佳的模型性能。
精選AI產品推薦

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。
AI模型
11.4M
中文精選

Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M