WorkBuddy本地Ollama配置指南:离线零积分使用
WorkBuddy 完整部署指南:接入本地 Ollama 模型,实现离线零积分 AI 助手
WorkBuddy 这款腾讯出品的桌面级 AI 助手,多数人只把它当成在线云端工具。但真正高阶玩法在于:它不仅能调用云端模型,还能无缝对接本地离线模型。配置到位后,日常对话完全不消耗积分,对积分紧张的用户来说,解锁了最经济的 AI 使用方案。
接下来一步步拆解:如何本地部署 Ollama 运行环境,再将模型接入 WorkBuddy,彻底实现离线场景下的 AI 助手调用。
一、为什么必须部署本地模型?
| 对比维度 | 云端模型 | 本地 Ollama 模型 |
|---|---|---|
| 积分消耗 | 有(按 Token 计费) | 完全免费✅ |
| 网络要求 | 必须在线 | 全离线运行✅ |
| 数据隐私 | 数据传至云端 | 数据完全留在本机✅ |
| 响应稳定性 | 受网速波动影响 | 本地推理,延迟稳定✅ |
结论一目了然:本地模型配合云端模型混合使用,是目前节省积分的最优策略。
二、安装 Ollama(本地大模型引擎)
步骤 1:下载安装包
前往官网(https://ollama.com/),点击 Download,选择 Windows 版。下载完成后双击安装包,一路默认选项。安装完毕 Ollama 自动在后台启动,系统托盘会显示图标。
步骤 2:验证安装是否成功
按下 Win + R,输入 cmd 打开命令行,执行:
ollama --version若输出版本号,说明安装无误。
三、拉取并运行本地模型
Ollama 支持一键拉取主流开源大模型。以下是根据实际测试,针对不同硬件配置的推荐:
模型选择参考
| 模型 | 内存占用 | 推荐配置 | 中文能力 |
|---|---|---|---|
| qwen3:4b | ~2.5GB | 8GB 内存 ✅ | ⭐⭐⭐⭐⭐ 最优 |
| qwen3:8b | ~5GB | 16GB 内存 ✅ | ⭐⭐⭐⭐⭐ 最优 |
| llama3.2:3b | ~2GB | 8GB 内存 ✅ | ⭐⭐⭐ 一般 |
| phi3:3.8b | ~2.3GB | 8GB 内存 ✅ | ⭐⭐⭐ 一般 |
执行拉取命令
在命令行输入(以 qwen3:4b 为例):
ollama pull qwen3:4b下载完成后,运行测试:
ollama run qwen3:4b "你好,介绍一下你自己"看到模型正常回复,即代表环境就绪。
四、在 WorkBuddy 中对接 Ollama
步骤 1:进入模型配置页
打开 WorkBuddy 客户端,点击左下角头像/用户名,进入设置,找到模型选项卡。
步骤 2:添加本地模型
点击“添加模型/自定义模型”,类型选择“本地部署(Ollama)”,接口地址填入 http://localhost:11434,模型名称填入 qwen3:4b(与之前拉取的名称一致),保存。
步骤 3:切换至本地模型
配置完成后,在 WorkBuddy 对话界面的模型选择器中,选中你添加的 qwen3:4b (Ollama),即可开始离线对话。
五、省积分实操技巧与注意事项
积分管控策略
- 日常问答完全使用本地模型。简单查询、代码解释、文本润色,全部走本地推理,零积分开销。
- 复杂任务临时切换云端模型。需要联网搜索、图片生成、高难度代码处理时,再切回云端。
- 优先消耗即将过期的积分。在「积分余额」→「用量管理」中查看积分有效期,按需排优先级。
常见问题与应对
| 问题 | 说明 |
|---|---|
| 本地模型能力上限 | 4B 模型胜任日常,复杂任务建议换云端 |
| Ollama 需保持后台运行 | 使用本地模型时,Ollama 必须在后台常驻 |
| 首次拉取需要联网 | 模型只下载一次,之后完全离线可用 |
| 内存配置建议 | 8GB 内存推荐 4B 模型,16GB 内存推荐 8B 模型 |
六、硬件配置实测参考
以当前使用的机器为例:CPU 为 Intel i5-11400(6核12线程),内存 8GB(后续计划升级 16GB),显卡为 Intel UHD 730(核显)。运行 qwen3:4b 流畅无卡顿,日常体验完全足够。
总结
通过 Ollama + WorkBuddy 的组合,可以做到:
- 零积分使用离线 AI 助手(覆盖日常 80% 场景)
- 完全离线运行,无网络环境下照常工作
- 数据隐私有保障,所有计算在本机完成
- 云端模型作为弹性补充,应对高难度任务
整个配置流程只需 10 分钟,但长期节省的积分相当可观。
