满血版DeepSeek 推理机私有部署方案 - 禅道

核心价值

10-20万的低部署成本

降低运营成本
缩短流程时间
定制化硬件配置降低设备成本
一次性投入

数据主权安全

物理隔离架构，数据本地流转
存储安全可控
信创要求合规

禅道生态深度融合

无缝对接禅道项目管理平台
ZAI引擎加持AI服务
支持智能会话、智能体构建、数据向量化
AI与业务流程深度集成

AI模型私有化部署实战

基于定制化高性能硬件架构，采用"轻量环境隔离+高效推理优化"技术路线，适配中小规模企业AI业务落地需求。

方案概述

双模型并行架构

主模型：DeepSeek-R1-671B-INT4（MOE混合专家）

辅助模型：Qwen3-8B-FP8（官方原生稠密模型）

推理框架：搭载开源推理框架

部署模式：多CPU+单显卡混合部署

性能指标实测

DeepSeek-R1：7并发下45 token/s

Qwen3-8B：单并发上百 token/s

延迟：智能会话实时响应

稳定性：双模型互不影响

硬件配置清单

组件	规格	说明
CPU	9005系列 × 2	高性能计算，支持NUMA架构
主板	双通道高速主板	支持多CPU并行处理
内存	DDR5 1.15TB	大容量内存，支持MOE模型加载
固态硬盘	3.84TB NVMe	高速读写，模型快速加载
显卡	24GB显存 × 2	双卡并行，GPU加速推理
电源	2000W金牌全模组	稳定供电，保障7×24运行
机箱	4U机架式	标准机架部署，便于运维

部署流程详解

1环境准备

安装Ubuntu 24.04.3 LTS
配置CUDA 12.0环境
安装Python 3.12.3
部署Docker & Docker Compose
检查依赖版本兼容性

2DeepSeek-R1部署

创建Python虚拟环境
安装ft推理框架
下载671B模型文件
解除NUMA平衡机制

3服务启动配置

编写Shell启动脚本
指定GPU/NUMA分配
开启GPU共享防OOM
配置API访问密钥
设定主机端口映射

6服务验证

模型列表正常显示
智能会话功能测试
创建智能体验证
浮球入口功能确认
性能指标监控

5ZAI平台集成

Docker Compose拉取镜像
启动ZAI依赖容器
注册登录管理平台
添加模型接口渠道
配置禅道系统集成

4Qwen3-8B部署

创建独立虚拟环境
纯GPU推理部署
调整显卡分配参数
启动API服务
为监控资源消耗

性能实测数据

DeepSeek-R1-671B-INT4

单并发吞吐量45 token/s

7并发处理能力稳定运行

首响应时间< 100ms

Qwen3-8B-FP8

单并发吞吐量>100 token/s

7并发处理能力流畅响应

首响应时间< 50ms

想了解更多解决方案问题

关于更多解决方案咨询，请联系我们销售与技术团队

禅道产品
禅道开源版禅道企业版禅道旗舰版禅道IPD版
核心功能
产品管理项目管理质量管理效能管理
使用文档
基本版手册企业版手册旗舰版手册 IPD版手册开发中心手册
帮助中心
积分问答常见问题论坛交流使用视频 Gitee GitHub
关于我们
关于我们禅道软件最新动态禅道活动
禅道社区
禅道博客积分排行积分商城禅道书院
联系方式
联系人：刘璐电话：18562550650微信：18562550650 Q Q：2845263372
北京、上海、深圳分部

友情链接：ZTF自动化测试框架 ZenData测试数据生成器喧喧渠成软件 ZDOO全协同企业管理软件 ZenDAS数据分析工具 ZenShot跨平台截图工具飞信鼎即时通讯解决方案

我要提问提问有任何问题，您都可以在这里提问。问题反馈反馈点击这里，让我们聆听您的建议与反馈。