對話系統

# 對話系統

Amazon Nova Sonic

Amazon Nova Sonic

Amazon Nova Sonic 是一款前沿的基礎模型，能夠整合語音理解和生成，提升人機對話的自然流暢度。該模型克服了傳統語音應用中的複雜性，通過統一的架構實現更深層次的交流理解，適用於多個行業的 AI 應用，具有重要的商業價值。隨著人工智能技術的不斷發展，Nova Sonic 將為客戶提供更好的語音交互體驗，提升服務效率。

DeepSeek-V3-0324

Deepseek V3 0324

DeepSeek-V3-0324 是一個先進的文本生成模型，具有 685 億參數，採用 BF16 和 F32 張量類型，能夠支持高效的推理和文本生成。該模型的主要優點在於其強大的生成能力和開放源碼的特性，使其可以被廣泛應用於多種自然語言處理任務。該模型的定位是為開發者和研究人員提供一個強大的工具，幫助他們在文本生成領域取得突破。

Dolphin R1

Dolphin R1是一個由Cognitive Computations團隊創建的數據集，旨在訓練類似DeepSeek-R1 Distill模型的推理模型。該數據集包含30萬條來自DeepSeek-R1的推理樣本、30萬條來自Gemini 2.0 flash thinking的推理樣本以及20萬條Dolphin聊天樣本。這些數據集的組合為研究人員和開發者提供了豐富的訓練資源，有助於提升模型的推理能力和對話能力。該數據集的創建得到了Dria、Chutes、Crusoe Cloud等多家公司的贊助支持，這些贊助商為數據集的開發提供了計算資源和資金支持。Dolphin R1數據集的發佈，為自然語言處理領域的研究和開發提供了重要的基礎，推動了相關技術的發展。

Llama-3-Patronus-Lynx-8B-Instruct

Llama 3 Patronus Lynx 8B Instruct

Llama-3-Patronus-Lynx-8B-Instruct是由Patronus AI開發的一個基於meta-llama/Meta-Llama-3-8B-Instruct模型的微調版本，主要用於檢測在RAG設置中的幻覺。該模型訓練於包含CovidQA、PubmedQA、DROP、RAGTruth等多個數據集，包含人工標註和合成數據。它能夠評估給定文檔、問題和答案是否忠實於文檔內容，不提供文檔之外的新信息，也不與文檔信息相矛盾。

模型訓練與部署

Llama-3-Patronus-Lynx-8B-Instruct-v1.1

Llama 3 Patronus Lynx 8B Instruct V1.1

Patronus-Lynx-8B-Instruct-v1.1是基於meta-llama/Meta-Llama-3.1-8B-Instruct模型的微調版本，主要用於檢測RAG設置中的幻覺。該模型經過CovidQA、PubmedQA、DROP、RAGTruth等多個數據集的訓練，包含人工標註和合成數據。它能夠評估給定文檔、問題和答案是否忠實於文檔內容，不提供超出文檔範圍的新信息，也不與文檔信息相矛盾。

模型訓練與部署

Llama-Lynx-70b-4bit-Quantized

Llama Lynx 70b 4bit Quantized

Llama-Lynx-70b-4bit-Quantized是由PatronusAI開發的一個大型文本生成模型，具有70億參數，並且經過4位量化處理，以優化模型大小和推理速度。該模型基於Hugging Face的Transformers庫構建，支持多種語言，特別是在對話生成和文本生成領域表現出色。它的重要性在於能夠在保持較高性能的同時減少模型的存儲和計算需求，使得在資源受限的環境中也能部署強大的AI模型。

Patronus GLIDER

Patronus GLIDER

Patronus GLIDER是一個經過微調的phi-3.5-mini-instruct模型，可以作為通用評估模型，根據用戶定義的標準和評分規則來評判文本、對話和RAG設置。該模型使用合成數據和領域適應數據進行訓練，覆蓋了183個指標和685個領域，包括金融、醫學等。模型支持的最大序列長度為8192個token，但經過測試可以支持更長的文本（高達12000個token）。

POINTS-Yi-1.5-9B-Chat

POINTS Yi 1.5 9B Chat

POINTS-Yi-1.5-9B-Chat是一個視覺語言模型，它集成了最新的視覺語言模型技術和微信AI提出的新技術。該模型在預訓練數據集過濾、模型湯（Model Soup）技術等方面有顯著創新，能夠顯著減少預訓練數據集的大小並提高模型性能。它在多個基準測試中表現優異，是視覺語言模型領域的一個重要進展。

POINTS-Qwen-2-5-7B-Chat

POINTS Qwen 2 5 7B Chat

POINTS-Qwen-2-5-7B-Chat是一個集成了視覺語言模型最新進展和新技巧的模型，由微信AI的研究人員提出。它通過預訓練數據集篩選、模型湯等技術，顯著提升了模型性能。這個模型在多個基準測試中表現優異，是視覺語言模型領域的一個重要進步。

Meta Llama 3.3

Meta Llama 3.3是一個70B參數的多語言大型預訓練語言模型（LLM），專為多語言對話用例優化，並在常見行業基準測試中表現優於許多現有的開源和封閉聊天模型。該模型採用優化的Transformer架構，並使用監督式微調（SFT）和基於人類反饋的強化學習（RLHF）來符合人類的有用性和安全性偏好。

聊天機器人

OLMo-2-1124-13B-Instruct

Olmo 2 1124 13B Instruct

OLMo-2-1124-13B-Instruct是由Allen AI研究所開發的一款大型語言模型，專注於文本生成和對話任務。該模型在多個任務上表現出色，包括數學問題解答、科學問題解答等。它是基於13B參數的版本，經過在特定數據集上的監督微調和強化學習訓練，以提高其性能和安全性。作為一個開源模型，它允許研究人員和開發者探索和改進語言模型的科學。

聊天機器人

Llama-3.1-Tulu-3-70B-DPO

Llama 3.1 Tulu 3 70B DPO

Llama-3.1-Tulu-3-70B-DPO是Tülu3模型家族的一部分，專為現代後訓練技術提供全面指南。該模型家族旨在除了聊天之外的多種任務上實現最先進的性能，如MATH、GSM8K和IFEval。它是基於公開可用的、合成的和人為創建的數據集訓練的模型，主要使用英語，並遵循Llama 3.1社區許可協議。

Llama-3.1-Tulu-3-8B

Llama 3.1 Tulu 3 8B

Llama-3.1-Tulu-3-8B是Tülu3指令遵循模型家族的一部分，專為多樣化任務設計，包括聊天、數學問題解答、GSM8K和IFEval等。這個模型家族以其卓越的性能和完全開源的數據、代碼以及現代後訓練技術的全面指南而著稱。模型主要使用英文，並且是基於allenai/Llama-3.1-Tulu-3-8B-DPO模型微調而來。

Ferret-UI-Llama8b

Ferret UI Llama8b

Ferret-UI是首個以用戶界面為中心的多模態大型語言模型（MLLM），專為指代表達、定位和推理任務設計。它基於Gemma-2B和Llama-3-8B構建，能夠執行復雜的用戶界面任務。這個版本遵循了Apple的研究論文，是一個強大的工具，可以用於圖像文本到文本的任務，並且在對話和文本生成方面具有優勢。

Meta-spirit-lm

Meta-spirit-lm是由Meta公司開發的一款先進的自然語言處理模型，它在Hugging Face平臺上發佈。這款模型在處理語言相關的任務時表現出色，如文本生成、翻譯、問答等。它的重要性在於能夠理解和生成自然語言，極大地推動了人工智能在語言理解領域的進步。該模型在開源社區中受到廣泛關注，可以用於研究和商業用途，但需遵守FAIR Noncommercial Research License。

Llama-3.2-1B

Llama-3.2-1B是由Meta公司發佈的多語言大型語言模型，專注於文本生成任務。該模型使用優化的Transformer架構，並通過監督式微調（SFT）和人類反饋的強化學習（RLHF）進行調優，以符合人類對有用性和安全性的偏好。該模型支持8種語言，包括英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語，並在多種對話使用案例中表現優異。

MiniCPM3-4B

MiniCPM3-4B是MiniCPM系列的第三代產品，整體性能超越了Phi-3.5-mini-Instruct和GPT-3.5-Turbo-0125，與許多近期的7B至9B模型相當。與前兩代相比，MiniCPM3-4B具有更強大的多功能性，支持函數調用和代碼解釋器，使其能夠更廣泛地應用於各種場景。此外，MiniCPM3-4B擁有32k的上下文窗口，配合LLMxMapReduce技術，理論上可以處理無限上下文，而無需大量內存。

Meta-Llama-3.1-405B-Instruct

Meta Llama 3.1 405B Instruct

Meta Llama 3.1是一系列多語言的大型預訓練和指令調整的生成模型，包含8B、70B和405B大小的版本。這些模型專為多語言對話用例而優化，並在常見行業基準測試中表現優於許多開源和閉源聊天模型。模型使用優化的transformer架構，並通過監督式微調(SFT)和強化學習與人類反饋(RLHF)進行調整，以符合人類對有用性和安全性的偏好。

Meta-Llama-3.1-405B-Instruct-FP8

Meta Llama 3.1 405B Instruct FP8

Meta Llama 3.1系列模型是一套預訓練和指令調整的多語言大型語言模型（LLMs），包含8B、70B和405B三種規模的模型，專為多語言對話使用案例優化，性能優於許多開源和閉源聊天模型。

Meta-Llama-3.1-8B

Meta Llama 3.1 8B

Meta Llama 3.1是一系列預訓練和指令調整的多語言大型語言模型（LLMs），包含8B、70B和405B大小的版本，支持8種語言，專為多語言對話用例優化，並在行業基準測試中表現優異。Llama 3.1模型採用自迴歸語言模型，使用優化的Transformer架構，並通過監督式微調（SFT）和強化學習結合人類反饋（RLHF）來提高模型的有用性和安全性。

InternLM-XComposer-2.5

Internlm XComposer 2.5

InternLM-XComposer-2.5是一款支持長上下文輸入和輸出的多功能大型視覺語言模型。它在各種文本圖像理解和創作應用中表現出色，實現了與GPT-4V相當的水平，但僅使用了7B的LLM後端。該模型通過24K交錯圖像文本上下文進行訓練，能夠無縫擴展到96K長上下文，通過RoPE外推。這種長上下文能力使其在需要廣泛輸入和輸出上下文的任務中表現突出。此外，它還支持超高分辨率理解、細粒度視頻理解、多輪多圖像對話、網頁製作以及撰寫高質量圖文文章等功能。

Nemotron-4-340B-Instruct

Nemotron 4 340B Instruct

Nemotron-4-340B-Instruct是由NVIDIA開發的大型語言模型(LLM)，專為英文單輪和多輪對話場景優化。該模型支持4096個token的上下文長度，經過監督式微調(SFT)、直接偏好優化(DPO)和獎勵感知偏好優化(RPO)等額外的對齊步驟。模型在約20K人工標註數據的基礎上，通過合成數據生成管道合成了超過98%的用於監督微調和偏好微調的數據。這使得模型在人類對話偏好、數學推理、編碼和指令遵循方面表現良好，並且能夠為多種用例生成高質量的合成數據。

AI聊天機器人

Dolphin 2.9.1 Mixtral 1x22b

Dolphin 2.9.1 Mixtral 1x22b

Dolphin 2.9.1 Mixtral 1x22b是由Cognitive Computations團隊精心訓練和策劃的AI模型，基於Dolphin-2.9-Mixtral-8x22b版本，擁有Apache-2.0許可。該模型具備64k上下文容量，通過16k序列長度的全權重微調，經過27小時在8個H100 GPU上的訓練完成。Dolphin 2.9.1具有多樣的指令、對話和編碼技能，還具備初步的代理能力和支持函數調用。該模型未進行審查，數據集已過濾去除對齊和偏見，使其更加合規。建議在作為服務公開之前，實施自己的對齊層。

CogVLM2

CogVLM2是由清華大學團隊開發的第二代多模態預訓練對話模型，它在多個基準測試中取得了顯著的改進，支持8K內容長度和1344*1344的圖像分辨率。CogVLM2系列模型提供了支持中文和英文的開源版本，能夠與一些非開源模型相媲美的性能。

Llama3-Aloe-8B-Alpha

Llama3 Aloe 8B Alpha

Aloe是由HPAI開發的一款醫療領域的語言模型，基於Meta Llama 3 8B模型進行優化。它通過模型融合和先進的提示策略，達到了與其規模相匹配的最先進水平。Aloe在倫理和事實性指標上得分較高，這得益於紅隊和對齊工作的結合。該模型提供了醫療特定的風險評估，以促進這些系統的安全使用和部署。

DeepSeek-V2-Chat

Deepseek V2 Chat

DeepSeek-V2是一個由236B參數構成的混合專家（MoE）語言模型，它在保持經濟訓練和高效推理的同時，激活每個token的21B參數。與前代DeepSeek 67B相比，DeepSeek-V2在性能上更強，同時節省了42.5%的訓練成本，減少了93.3%的KV緩存，並提升了最大生成吞吐量至5.76倍。該模型在8.1萬億token的高質量語料庫上進行了預訓練，並通過監督式微調（SFT）和強化學習（RL）進一步優化，使其在標準基準測試和開放式生成評估中表現出色。

Llama3-ChatQA-1.5-70B

Llama3 ChatQA 1.5 70B

Llama3-ChatQA-1.5-70B 是由 NVIDIA 開發的一款先進的對話式問答和檢索增強型生成（RAG）模型。該模型基於 Llama-3 基礎模型，並使用改進的訓練方法，特別增強了表格和算術計算能力。它有兩個變體：Llama3-ChatQA-1.5-8B 和 Llama3-ChatQA-1.5-70B。該模型在多個對話式問答基準測試中取得了優異的成績，顯示出其在處理複雜對話和生成相關回答方面的高效能力。

Llama3-ChatQA-1.5-8B

Llama3 ChatQA 1.5 8B

Llama3-ChatQA-1.5-8B是一款由NVIDIA開發的高級對話問答和檢索增強生成(RAG)模型。該模型在ChatQA (1.0)的基礎上進行了改進，通過增加對話問答數據來增強其表格和算術計算能力。它有兩個變體：Llama3-ChatQA-1.5-8B和Llama3-ChatQA-1.5-70B，都是使用Megatron-LM進行訓練，然後轉換為Hugging Face格式。該模型在ChatRAG Bench的基準測試中表現出色，適用於需要複雜對話理解和生成的場景。

Llama-3 70B Instruct Gradient 1048k

Llama 3 70B Instruct Gradient 1048k

Llama-3 70B Instruct Gradient 1048k是一款由Gradient AI團隊開發的先進語言模型，它通過擴展上下文長度至超過1048K，展示了SOTA（State of the Art）語言模型在經過適當調整後能夠學習處理長文本的能力。該模型使用了NTK-aware插值和RingAttention技術，以及EasyContext Blockwise RingAttention庫，以高效地在高性能計算集群上進行訓練。它在商業和研究用途中具有廣泛的應用潛力，尤其是在需要長文本處理和生成的場景中。

gpt2-chatbot

gpt2-chatbot是一個基於GPT-4架構的大型語言模型，由OpenAI訓練。它在對話中表現出色，能夠提供結構化、有深度的回答，並且在知識存儲方面表現出色。該模型在LMSYS的Direct Chat和Arena (Battle)模式中可供使用，允許用戶無需登錄即可進行交流和評估。

AI聊天機器人

精選AI產品推薦

騰訊混元圖像 2.0

騰訊混元圖像 2.0

騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型，顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構，使得圖像生成速度可達到毫秒級，避免了傳統生成的等待時間。同時，模型通過強化學習算法與人類美學知識的結合，提升了圖像的真實感和細節表現，適合設計師、創作者等專業用戶使用。

Lovart

Lovart 是一款革命性的 AI 設計代理，能夠將創意提示轉化為藝術作品，支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程，節省時間並提升創意靈感。Lovart 當前處於測試階段，用戶可加入等候名單，隨時體驗設計的樂趣。

FastVLM

FastVLM 是一種高效的視覺編碼模型，專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器，減少了高分辨率圖像的編碼時間和輸出的 token 數量，使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力，適用於各種應用場景，尤其在需要快速響應的移動設備上表現優異。

KeySync

KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題，同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果，適用於自動配音等實際應用場景。

Manus

Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品，能夠直接交付完整的任務成果，而不僅僅是提供建議或答案。它採用 Multiple Agent 架構，運行在獨立虛擬機中，能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現，展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’，幫助用戶高效完成各種複雜任務。

Trae國內版

Trae是一款專為中文開發場景設計的AI原生IDE，將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能，顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白，滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具，旨在為專業開發者提供強大的技術支持，目前尚未明確公開價格，但預計會採用付費模式以匹配其高端定位。

開發與工具

Pika

Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase