DeepSeek本地部署全攻略:Ollama + Docker + Open WebUI搭建自己的ChatGPT(2026最新版)

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

技术栈:DeepSeek + Ollama + Docker + Open WebUI
阅读时间:15分钟
难度:⭐⭐☆☆☆
适用系统:Windows / Linux / macOS


前言

2025年最火的大模型是谁?

很多人的答案已经不是GPT。

而是:

DeepSeek

原因很简单:

✅ 中文能力强

✅ 推理能力优秀

✅ 成本极低

✅ 支持本地部署

很多开发者都在问:

能不能像ChatGPT一样,在自己的电脑运行DeepSeek?

答案是:

完全可以

而且部署过程比你想象的简单得多。

今天我们用:

Ollama
+
Docker
+
Open WebUI

搭建一个属于自己的AI助手。


为什么要本地部署?

很多人第一次接触本地大模型都会问:

直接用网页版不好吗?

当然可以。

但本地部署有几个明显优势。


数据隐私

如果你的内容涉及:

公司代码
客户资料
内部文档

上传到公网存在风险。

本地部署:

数据永不离开电脑

免费使用

云端API:

按Token收费

而本地模型:

一次下载
长期使用

离线运行

即使断网:

AI照样工作

整体架构

今天的方案:

浏览器
 ↓
Open WebUI
 ↓
Ollama
 ↓
DeepSeek

职责:

Open WebUI
=
聊天界面

Ollama
=
模型管理器

DeepSeek
=
大脑

环境准备

最低配置:

配置要求
CPUi5/R5以上
内存16GB
显卡可选
磁盘20GB以上

推荐:

32GB内存
+
RTX 4060以上

体验更好。


第一步:安装Docker

官网下载:

Docker Desktop

安装完成后验证:

docker --version

输出:

Docker version 28.x.x

说明安装成功。


第二步:安装Ollama

官网下载安装:

Ollama

安装完成后:

ollama --version

看到版本号即可。


Ollama是什么?

一句话:

大模型运行时

类似于:

Docker运行容器

Ollama运行模型

第三步:下载DeepSeek

拉取模型:

ollama pull deepseek-r1:7b

下载完成后查看:

ollama list

输出:

NAME

deepseek-r1:7b

模型版本怎么选?

常见版本:

模型推荐配置
1.5B8GB内存
7B16GB内存
14B32GB内存
32B64GB内存

新手推荐:

7B

性能和资源占用比较均衡。


第四步:启动模型

运行:

ollama run deepseek-r1:7b

测试:

你好,请介绍一下自己

如果模型开始回答:

部署成功

第五步:安装Open WebUI

直接启动容器:

docker run -d \
-p 3000:8080 \
--name open-webui \
-v open-webui:/app/backend/data \
ghcr.io/open-webui/open-webui:main

等待启动完成。

浏览器打开:

http://localhost:3000

即可进入界面。


Open WebUI是什么?

简单理解:

ChatGPT界面

支持:

✅ 多模型

✅ 多会话

✅ 文件上传

✅ 知识库

✅ MCP扩展


连接Ollama

进入:

Settings
↓
Connections
↓
Ollama

填写:

http://host.docker.internal:11434

保存。

刷新页面。

即可看到:

DeepSeek-R1

实际效果

现在你拥有了:

自己的ChatGPT

支持:

聊天
写代码
翻译
总结文档
生成报告

完全本地运行。


上传PDF分析

Open WebUI支持:

PDF
Word
Excel
Markdown

上传后直接提问:

总结这份文档

即可分析内容。


搭建个人知识库

很多人最喜欢这个功能。

上传:

公司文档
产品手册
技术资料

之后提问:

根据知识库回答问题

AI即可基于私有数据回答。

这其实就是:

RAG

技术。


性能优化技巧

开启GPU

查看:

nvidia-smi

确认显卡正常。


降低显存占用

选择:

7B模型

而不是:

32B模型

SSD存储

模型文件较大。

建议:

NVMe SSD

加载速度明显更快。


常见问题

模型下载慢

解决:

使用镜像源

或者科学网络环境。


Docker启动失败

检查:

docker ps

查看容器状态。


Open WebUI无法连接Ollama

确认:

ollama serve

已经启动。


本地部署与云端对比

项目本地部署云端
成本⭐⭐⭐⭐⭐⭐⭐
隐私⭐⭐⭐⭐⭐⭐⭐
部署难度⭐⭐⭐⭐⭐⭐⭐⭐
推理速度⭐⭐⭐⭐⭐⭐⭐⭐⭐

适合哪些人?

推荐:

✅ 程序员

✅ 学生

✅ AI开发者

✅ 企业内部团队

不推荐:

❌ 配置过低电脑

❌ 完全不懂电脑操作


总结

如果你想拥有:

自己的ChatGPT

自己的知识库

自己的AI助手

那么:

Ollama
+
DeepSeek
+
Open WebUI

是目前成本最低、效果最好的方案之一。

整个部署过程不到30分钟。

但带来的价值远远超过30分钟。

因为从此以后:

你的AI
由你掌控

⭐ 如果本文对你有帮助,欢迎点赞、收藏、关注。

下一篇:

《RAG知识库实战:让AI学会你的私有文档(PDF+Word+Excel)》

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

内容概要:本文围绕基于风光储能和需求响应的微电网日前经济调度问题,提出了一套完整的Python代码实现方案。研究综合考虑风能、光伏等可再生能源的出力不确定性、储能系统的动态充放电特性以及需求侧响应机制,构建了以最小化系统综合运行成本为目标的优化调度模型。该模型充分体现了对可再生能源的高效消纳、系统经济性提升与供需平衡调控的能力,通过Python编程结合优化求解器实现了模型的求解与仿真验证,为微电网能量管理系统的设计与科研分析提供了可复现的技术路径与实践参考。; 适合人群:具备一定Python编程基础和电力系统优化调度知识的科研人员、工程技术人员及高校电气工程、能源系统等相关专业的研究生。; 使用场景及目标:①应用于微电网、智能配电网及综合能源系统的科研建模与仿真分析;②帮助读者深入理解含高比例可再生能源的电力系统日前调度建模方法、目标函数构造与约束条件处理技巧;③为实际工程中实现低碳、经济、可靠的微电网运行提供算法支持与决策依据。; 阅读建议:建议读者结合文档中的代码实例,系统学习优化模型的数学表达与编程实现过程,重点关注变量定义、目标函数构建、系统约束(如功率平衡、储能动态、机组出力等)的编码实现,并尝试调整负荷、新能源出力等输入数据进行多场景仿真,以深入掌握微电网调度策略的灵敏度分析与优化效果评估方法。
### Spring源码面试终结者:31道核心题,源码级拆解IOC与AOP 这份资源不是“面试八股文”,而是对Spring、Spring Boot核心原理的**源码级深度拆解**。网上面试题答案大多浮于表面,无法应对面试官的连环追问。我结合源码阅读和实战踩坑,整理了这份**近10万字的硬核指南**,系统梳理了大厂面试中最棘手的31道Spring核心题。 **【资源核心内容】** - **IOC与DI王者解析**:深入BeanFactory与ApplicationContext层级设计,对比三种依赖注入方式,并用图文拆解三级缓存解决循环依赖的源码流程。 - **AOP与事务底层原理**:彻底讲透动态代理选择策略,深度分析@Transactional失效的10大经典场景及源码级解决方案。 - **Spring MVC与自动装配**:从DispatcherServlet的9大组件到SpringBoot的SPI机制,理清自动配置的完整加载链路。 - **高频追问与满分话术**:每道题配有“低分vs高分回答”对比,帮你精准拿捏面试官想要的“源码级理解”。 **【特色】** 拒绝罗列概念,每道题都从“核心考点”出发,深入到AbstractApplicationContext、TransactionInterceptor等Spring源码,帮助你在理解设计思想的同时,具备手写简易IOC容器的能力。 **【适合谁看】** 备战阿里、字节、美团等大厂面试的Java开发;对Spring原理一知半解,想系统提升源码阅读能力的开发者;希望从“会用”进阶到“懂原理”的技术人。 希望这份整理能帮你构建完整的Spring知识体系,轻松应对面试官的灵魂追问!
代码下载链接: https://pan.quark.cn/s/a4b39357ea24 二进制补码、小数的补码及运算规则 一、补码的概念和原理 补码是一种普遍的概念,在计算机系统中,所有数值均采用补码形式进行表示(存储)。补码的核心特性在于:借助补码,能够将符号位与其它位进行统一处理;同时,减法运算亦可转化为加法运算来执行。补码的构成方式是在原码的基础上进行适当调整,原码表示法在数值前增加了一位符号位(即最高位用作符号位):正数该位为 0,负数该位为 1(0存在两种形式:+0 和-0),其余位用于表示数值的大小。 二、补码的表示和转换 补码的表示形式可区分为两种:整数的补码和小数的补码。 整数的补码表示方式: 1. 正数的补码与其原码相同(即自身) 2. 负数的补码通过原码取反,然后在最低位加 1,符号位保持不变 小数的补码表示方式: 1. 正小数的补码与其原码一致 2. 负小数的补码通过原码取反,然后在最低位加 1,符号位维持不变 三、补码的运算规则 补码的运算规则可归纳为三种:加法、减法和乘法。 1. 加法运算规则: [X+Y]补 = [X]补 + [Y]补 2. 减法运算规则: [X-Y]补 = [X]补 - [Y]补 = [X]补 + [-Y]补 3. 乘法运算规则: [X*Y]补= [X]补×[Y]补,即乘数(被乘数)相乘的补码等于补码的相乘。 需要强调的是,进行乘法运算时必须执行符号扩展:Nbit 乘数 和 Nbit 被乘数 都需符号扩展到 2Nbit,之后再进行直接相乘。 四、小数 Fraction 的补码表示和运算规则 小数 Fraction 的补码表示方式: 最高位为符号位,小数点位于符号位之后,其后的第一位代表 1/2,再后一位代表1/4,再...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值