Starling 7B : 增強 LLM 的可用性和安全性

模型訓練與部署

Starling 7B

Starling-7B

Starling 7B

模型訓練與部署 AI模型 #語言模型 #強化學習 #聊天機器人普通產品商用

簡介 :

Starling-7B 是一個由強化學習從 AI 反饋（RLAIF）訓練的開放大型語言模型（LLM）。它通過我們的新 GPT-4 標記排序數據集 Nectar 和新的獎勵訓練和策略調優流程充分發揮了作用。Starling-7B 在使用 GPT-4 作為評委的 MT Bench 中得分為 8.09，在 MT-Bench 上超過了目前所有模型，除了 OpenAI 的 GPT-4 和 GPT-4 Turbo。我們在 HuggingFace 上發佈了排名數據集 Nectar、獎勵模型 Starling-RM-7B-alpha 和語言模型 Starling-LM-7B-alpha，以及 LMSYS Chatbot Arena 中的在線演示。請期待我們即將發佈的代碼和論文，其中將提供有關整個過程的更多詳細信息。

需求人群 :

用於聊天和問答場景

總訪問量： 0

本站瀏覽量： 59.6K

產品特色

基於 AI 反饋的強化學習

優化 LLM 的可用性和安全性

提供高質量的排名數據集和獎勵模型

精選AI產品推薦

Deepmind Gemini

Deepmind Gemini

Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase