WorkBuddy本地Ollama配置指南：离线零积分使用

2026-06-08阅读 0热度 0

Buddy

WorkBuddy 完整部署指南：接入本地 Ollama 模型，实现离线零积分 AI 助手

WorkBuddy 这款腾讯出品的桌面级 AI 助手，多数人只把它当成在线云端工具。但真正高阶玩法在于：它不仅能调用云端模型，还能无缝对接本地离线模型。配置到位后，日常对话完全不消耗积分，对积分紧张的用户来说，解锁了最经济的 AI 使用方案。

接下来一步步拆解：如何本地部署 Ollama 运行环境，再将模型接入 WorkBuddy，彻底实现离线场景下的 AI 助手调用。

一、为什么必须部署本地模型？

对比维度	云端模型	本地 Ollama 模型
积分消耗	有（按 Token 计费）	完全免费✅
网络要求	必须在线	全离线运行✅
数据隐私	数据传至云端	数据完全留在本机✅
响应稳定性	受网速波动影响	本地推理，延迟稳定✅

结论一目了然：本地模型配合云端模型混合使用，是目前节省积分的最优策略。

二、安装 Ollama（本地大模型引擎）

步骤 1：下载安装包

前往官网（https://ollama.com/），点击 Download，选择 Windows 版。下载完成后双击安装包，一路默认选项。安装完毕 Ollama 自动在后台启动，系统托盘会显示图标。

步骤 2：验证安装是否成功

按下 Win + R，输入 cmd 打开命令行，执行：

ollama --version

若输出版本号，说明安装无误。

三、拉取并运行本地模型

Ollama 支持一键拉取主流开源大模型。以下是根据实际测试，针对不同硬件配置的推荐：

模型选择参考

模型	内存占用	推荐配置	中文能力
qwen3:4b	~2.5GB	8GB 内存 ✅	⭐⭐⭐⭐⭐ 最优
qwen3:8b	~5GB	16GB 内存 ✅	⭐⭐⭐⭐⭐ 最优
llama3.2:3b	~2GB	8GB 内存 ✅	⭐⭐⭐ 一般
phi3:3.8b	~2.3GB	8GB 内存 ✅	⭐⭐⭐ 一般

执行拉取命令

在命令行输入（以 qwen3:4b 为例）：

ollama pull qwen3:4b

下载完成后，运行测试：

ollama run qwen3:4b "你好，介绍一下你自己"

看到模型正常回复，即代表环境就绪。

四、在 WorkBuddy 中对接 Ollama

步骤 1：进入模型配置页

打开 WorkBuddy 客户端，点击左下角头像/用户名，进入设置，找到模型选项卡。

步骤 2：添加本地模型

点击“添加模型/自定义模型”，类型选择“本地部署（Ollama）”，接口地址填入 http://localhost:11434，模型名称填入 qwen3:4b（与之前拉取的名称一致），保存。

步骤 3：切换至本地模型

配置完成后，在 WorkBuddy 对话界面的模型选择器中，选中你添加的 qwen3:4b (Ollama)，即可开始离线对话。

五、省积分实操技巧与注意事项

积分管控策略

日常问答完全使用本地模型。简单查询、代码解释、文本润色，全部走本地推理，零积分开销。
复杂任务临时切换云端模型。需要联网搜索、图片生成、高难度代码处理时，再切回云端。
优先消耗即将过期的积分。在「积分余额」→「用量管理」中查看积分有效期，按需排优先级。

常见问题与应对

问题	说明
本地模型能力上限	4B 模型胜任日常，复杂任务建议换云端
Ollama 需保持后台运行	使用本地模型时，Ollama 必须在后台常驻
首次拉取需要联网	模型只下载一次，之后完全离线可用
内存配置建议	8GB 内存推荐 4B 模型，16GB 内存推荐 8B 模型

六、硬件配置实测参考

以当前使用的机器为例：CPU 为 Intel i5-11400（6核12线程），内存 8GB（后续计划升级 16GB），显卡为 Intel UHD 730（核显）。运行 qwen3:4b 流畅无卡顿，日常体验完全足够。

总结

通过 Ollama + WorkBuddy 的组合，可以做到：

零积分使用离线 AI 助手（覆盖日常 80% 场景）
完全离线运行，无网络环境下照常工作
数据隐私有保障，所有计算在本机完成
云端模型作为弹性补充，应对高难度任务

整个配置流程只需 10 分钟，但长期节省的积分相当可观。