AI

模型列表 分享链接/book/zentaopms/1819.html?releaseID=26

作者:张玉洁最后编辑:张玉洁 于 2026-01-30 13:56:41 浏览量:1878
摘要:本文主要介绍模型列表的应用、本地测试过的模型展示以及知识库向量模型实测与推荐。

本文主要介绍模型列表的应用、本地已测试模型展示以及知识库向量模型实测与推荐。


模型列表是ZAI服务控制面板中模型列表的信息同步,在这里您可以查看所有ZAI服务中已接入的模型,点击右侧操作栏中的开始会话按钮,可以快速跟该模型发起智能会话。

一、本地测试过的大模型分类与厂商整理

1.聊天/通用大语言模型(Chat/LLM)

厂商 / 机构 模型名称 主要用途 / 特点
OpenAI gpt-5.2-chat 高质量通用对话、推理、写作
gpt-5-mini 轻量版通用聊天
gpt-4o-mini 多模态、低延迟
gpt-oss 开源 / 生态取向模型
智谱 AI GLM-4.5 通用大模型
GLM-4.5-Air 轻量、高并发
GLM-4.5-X 增强能力版本
GLM-4.6 新一代旗舰
CharGLM-4 角色 / 人设对话
Anthropic claude-4.5-opus 旗舰级、强推理
claude-4.5-sonnet 均衡性能
DeepSeek deepseek-chat 通用聊天
DeepSeek-V3.2 新一代通用模型
deepseek-reasoner 强化推理
Deepseek-R1 推理导向
deepseek-r1_32b 大参数推理模型
阿里巴巴(Qwen) qwen3 通用基础模型
qwen-max 高性能版本
qwen-turbo 高性价比
qwen-flash 低延迟
qwen-coder-plus 代码生成
Moonshot kimi-k2-0905-preview 长文本、推理
kimi-k2-turbo-preview 低延迟版本
Meta Llama-3.2 开源通用 LLM
Google gemma3 轻量通用模型
MiniMax MiniMax-M2 通用对话
mimo-v2-flash 快速响应
xiaomi-mimo-v2-flash 小米生态
Mistral ministral-3 轻量高效
字节跳动 doubao-seed-1.6 通用模型
doubao-seed-code 代码模型

2.向量 / Embedding 模型(文本向量化)

厂商 / 机构 模型名称 主要用途 / 特点
OpenAI text-embedding-3-small 通用语义向量
text-embedding-ada-002 经典 embedding
智谱 AI GLM-Embedding-2 中文 / 通用向量
GLM-Embedding-3 新一代向量模型
阿里巴巴(Qwen) qwen3-embedding 通用向量
qwen-text-embedding-v1 向量 v1
qwen-text-embedding-v2 向量 v2
qwen-text-embedding-v3 向量 v3
qwen-text-embedding-v4 向量 v4(最新)
BAAI(智源) BAAI_bge-large-zh-v1.5 中文高质量向量
bge-m3 多语言 / 多模态
Snowflake snowflake-arctic-embed 通用向量
snowflake-arctic-embed2 升级版
Jina AI jina-embeddings-v2-base-zh 中文向量
Nomic nomic-embed-text 英文为主
MXBAI mxbai-embed-large 高维向量
NLP4All nlp_corom_sentence-embedding_chinese-base 中文句向量
nlp_gte_sentence-embedding_chinese-base GTE 中文 base
nlp_gte_sentence-embedding_chinese-large GTE 中文 large
DeepSeek dmeta-embedding-zh 中文语义向量
字节跳动 doubao-embedding 通用向量
doubao-embedding-large 高精度向量
BCE bce-embedding-base_v1 中文向量

3.混合 / 特殊定位模型

模型 厂商 定位说明
bge-m3 智源 向量 + 多语言 / 跨模态
embeddinggemma Google 以向量为主,可扩展
qwen3 阿里巴巴 基础模型,多任务能力

二、知识库向量模型实测与推荐

本测试基于对内部测试环境上的 589 条禅道对象(包含需求、BUG 单、技术手册)的全局向量化知识库测试,得出针对中文知识库场景的推荐结论与详细测试数据。

1.推荐榜单

场景 模型(含大小) 说明 得分
本地部署(性能之王) qwen3-embedding (8b) 本地最强,追平阿里云云端模型,远超其他本地小模型。 58
本地部署(资源受限) bge-m3 (567m) 轻量级首选,显存有限时得分最高,性价比高。 37
云端 API(追求极致) qwen-text-embedding-v3 全场总冠军,阿里云出品,对中文术语(如“喧喧”、“ZAI”)理解最精准,略胜 OpenAI。 72

2.综合排行榜

以下是各路模型在“实战演练”中的最终得分排名:

排名 模型名称 部署方式 模型大小 总分 简评
1 qwen-text-embedding-v3 阿里云 API - 72 中文能力最强
2 text-embedding-ada-002 OpenAI API - 71 表现非常稳定,仅以1分之差惜败
3 qwen-text-embedding-v4 阿里云 API - 58 新版反而略逊于 v3
3 qwen3-embedding 本地(Ollama) 8b 58 本地模型奇迹,追平云端模型
5 dou-embedding 火山引擎 API - 45 表现中规中矩
6 doubao-embedding-large 火山引擎 API - 40 大模型版本在此数据集下得分较低
7 q-text-embedding-v1 阿里云 API - 37 老版本,逐步被淘汰
7 bge-m3 本地(Ollama) 567m 37 小参数模型之光,资源少时首选
9 mxbai-embed-large 本地(Ollama) 335m 36 紧随 bge-m3 之后
10 text-embedding-3-small OpenAI API - 34 OpenAI 轻量版,中文能力稍弱
返回顶部
客服头像
金娟
高级客户经理
客服微信
18562856230
1826606239
统一服务热线 4006-8899-23
我要提问提问有任何问题,您都可以在这里提问。问题反馈反馈点击这里,让我们聆听您的建议与反馈。