GLM 4V 9B : 開源多模態預訓練模型，具備中英雙語對話能力。

GLM 4V 9B

GLM-4V-9B

GLM 4V 9B

AI模型 AI聊天機器人 #多模態 #預訓練模型 #中英雙語 #視覺理解 #對話生成國外精選開源

簡介 :

GLM-4V-9B是智譜AI推出的新一代預訓練模型，支持1120*1120高分辨率下的中英雙語多輪對話，以及視覺理解能力。在多模態評測中，GLM-4V-9B展現出超越GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max和Claude 3 Opus的卓越性能。

需求人群 :

目標受眾為需要進行多模態語言處理和理解的研究者、開發者以及企業用戶。該產品適合那些尋求高性能、多語言支持和視覺理解能力的AI模型來提升其應用或服務的企業和個人。

總訪問量： 29.7M

佔比最多地區： US(17.94%)

本站瀏覽量： 82.5K

使用場景

用於生成描述圖片內容的文本

在多語言環境下進行自然語言處理任務

作為聊天機器人的底層模型，提供智能對話服務

產品特色

支持8K上下文長度的模型倉庫

具備視覺理解能力，能夠處理圖像並生成描述

中英雙語多輪對話能力

在綜合能力、感知推理、文字識別、圖表理解等方面表現出色

支持使用Python進行模型調用和生成文本

提供模型權重的使用協議，確保合規使用

使用教程

導入必要的Python庫，如torch、PIL和transformers

使用AutoTokenizer從THUDM/glm-4v-9b獲取分詞器

準備輸入的文本和圖像，並將圖像轉換為RGB格式

通過tokenizer應用聊天模板，生成輸入

將輸入轉換為模型需要的格式，並設置生成參數

調用AutoModelForCausalLM生成文本

解碼生成的文本輸出

精選AI產品推薦

Deepmind Gemini

Deepmind Gemini

Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase