WorkBuddy实战笔记:自定义模型接入与远程中转31轮精华

2026-05-31阅读 0热度 0
Buddy

今天分享的是 WorkBuddy 用户在一次涉及 31 轮对话的深度实践中总结出的真实经验。如果你在长期使用这款工具时也遇到“对话一长就翻不到头”“积分蹭蹭往下掉”“想用自己的模型但不知从何入手”等痛点,这篇文章会带来不少启发。

先给出几个关键判断:通过自定义模型接入可以彻底摆脱积分消耗;阿里云 DashScope 一套配置即可同时调用通义千问与 DeepSeek;云服务器中转方案虽然需要一定的网络基础,但搭建完成后,能随时随地远程调用本地工作站上的大模型。而一个简单的 HTML 对话纪要文件,辅以自定义指令自动维护,就能从根本上解决“长对话回溯慢”的难题。


前言:为什么要整理这些笔记?

WorkBuddy 用户都有这样的体验:在一个任务中进行多次对话后,内容越堆越多,想回顾之前讨论过的配置参数、踩过的坑,只能不断向上翻找。上下文越长,AI 处理速度越慢,积分消耗也越高。

有人在同一个工作空间里连续进行了 31 轮对话,话题涉及任务管理、自定义模型配置、云服务器中转、积分攻略等,内容越来越丰富,但快速定位之前的信息也越来越难。

于是这位用户和 AI 助手共同设计了一个方案——用 HTML 文件构建“对话纪要”,每轮对话自动追加摘要,随时预览,一秒锁定任意一轮的关键信息。这个方案的效果远超预期。本文从这个方案出发,将 31 轮对话中提炼出的所有实操经验系统整理出来。


设计思路设计思路

一、对话纪要方案:告别无尽滚动

1.1 问题:长对话的三个痛点

痛点

说明

回溯慢

31 轮对话中查找特定话题需花费大量时间

积分浪费

每次发送消息,AI 需重新读取全部历史上下文,对话越长开销越大

跨任务无法共享

WorkBuddy 各任务工作空间互相隔离,切换任务后之前积累的经验无法复用

1.2 解决方案:独立 HTML 对话纪要

核心思路很直接:创建一个独立的 HTML 文件(例如 conversation-log.html),每轮对话结束后,AI 自动追加一条记录——包含轮次、时间戳、你的提问摘要、AI 回复要点。点击任意条目可展开或收起详细内容。预览功能在右侧面板实时刷新,随时查看。

效果示意:

点击前:

【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek?自定义模型

点击后:

【第 12 轮】 15:22 如何让阿里 DashScope 调用 DeepSeek?自定义模型

多宝回复要点:
• 接口地址与通义千问相同
• 仅需修改模型 ID
• 同一 Key 通吃所有模型

1.3 配合自定义指令实现自动维护

在 WorkBuddy 的「设置 → 个性化 → 自定义指令」中添加以下规则:

【规则:对话纪要】每轮对话结束后,更新工作空间下的 conversation-log.html 文件,追加本轮轮次、时间和内容摘要。若文件不存在则自动创建。

新工作空间首次使用时,让 AI 先创建 HTML 模板文件,后续每轮自动追加,无需任何手动操作。

1.4 跨任务的局限

由于 WorkBuddy 每个任务的工作空间目录相互独立,该 HTML 文件仅存在于创建它的工作空间中。其他任务如需类似功能,需单独创建。不过可通过工作空间的记忆文件(MEMORY.md)间接传递关键信息。


二、自定义模型接入:不花积分用 AI

WorkBuddy 内置了多个模型,按积分消耗系数从低到高排列。但如果你有自己的 API Key,完全可以接入外部模型,积分消耗直接变为 0。

2.1 配置方式

配置文件路径为 ~/.workbuddy/models.json(若不存在则手动创建)。

格式如下:

{ "models": [ { "id": "模型ID", "name": "显示名称", "vendor": "OpenAI", "url": "接口地址/v1/chat/completions", "apiKey": "你的API Key", "maxInputTokens": 131072, "maxOutputTokens": 8192 } ] }

配置完成后完全退出 WorkBuddy 再重新启动,底部模型下拉菜单中就会出现自定义模型。

2.2 阿里云 DashScope 接入通义千问

配置项

接口地址

https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions

API Key

阿里云百炼平台的 Key(sk- 开头)

可选模型

qwen-turbo(快速)、qwen-plus(均衡)、qwen-max(最强)、qwen-coder-plus(代码专精)

2.3 同一个 Key 调用 DeepSeek

阿里云百炼已上架 DeepSeek 模型,接口地址和 Key 与通义千问完全一致,仅需修改模型 ID:

模型 ID

特点

deepseek-v4-pro

最新旗舰,编程/数学/通用最强

deepseek-v4-flash

快速且成本低

deepseek-v3.2

综合均衡

deepseek-r1

深度思考模型,回复前先进行推理

换言之,在 models.json 中可以同时配置通义千问和 DeepSeek,共用同一个 Key,在模型下拉菜单中自由切换。

2.4 两个常见坑

错误写法

正确写法

接口地址缺少 /v1

.../compatible-mode

.../compatible-mode/v1

模型名称与平台不一致

Qwen3-4B

qwen-turbo(必须与平台上的模型 ID 完全一致)


三、云服务器中转远程工作站模型

如果你的高性能工作站上部署了大模型,希望其他设备的 WorkBuddy 也能调用,可以通过云服务器做中转——固定 IP,配置一次即可长期使用。

3.1 整体架构

WorkBuddy → 云服务器(公网固定IP:端口) → SSH加密隧道 → 工作站(本地) → 大模型

3.2 第一步:工作站部署模型服务

无论使用哪种工具(Ollama / LM Studio / vLLM),关键是要让模型监听在 0.0.0.0(所有网卡)而非默认的 127.0.0.1(仅本机)。

工具

配置方法

Ollama

设置环境变量 OLLAMA_HOST=0.0.0.0:11434

LM Studio

在 Server Settings 中将 Host 改为 0.0.0.0

3.3 第二步:建立 SSH 反向隧道

在工作站上执行:

ssh -R 0.0.0.0:11434:localhost:11434 -N user@云服务器IP

关键:必须加上 0.0.0.0: 前缀,否则隧道仅在云服务器的 127.0.0.1 上监听,外部无法连接。

同时需在云服务器上修改 SSH 配置:

# 云服务器上 sudo nano /etc/ssh/sshd_config # 添加或取消注释: GatewayPorts yes sudo systemctl restart sshd

3.4 第三步:隧道自动保活

使用 autossh 替代 ssh,配合 systemd 实现开机自启和断线重连:

autossh -M 0 -o ServerAliveInterval=30 -o ServerAliveCountMax=5 -o ExitOnForwardFailure=yes -R 0.0.0.0:11434:localhost:11434 -N user@云服务器IP

3.5 第四步:加 Nginx Basic Auth 防护

端口暴露在公网上,仅靠防火墙限制 IP 并不够(IP 可能变化、同网段可能存在其他主机)。增加一层应用层认证:

server { listen 11434; auth_basic "Model API"; auth_basic_user_file /etc/nginx/.htpasswd; location / { proxy_pass http://127.0.0.1:11434; proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade"; proxy_read_timeout 300s; } }

这样任何连接 11434 的请求都必须先输入密码才能放行,IP 改变不影响,同网段的其他主机也无法进入。

3.6 WorkBuddy 侧配置

{ "id": "qwen3:32b", "name": "工作站远程模型", "vendor": "OpenAI", "url": "http://云服务器固定IP:11434/v1/chat/completions", "apiKey": "任意字符串", "maxInputTokens": 32768, "maxOutputTokens": 8192 }

3.7 安全层级总结

层级

防护对象

防火墙限制 IP

随机扫描

SSH 密钥认证

非法建立隧道

autossh 保活

断线丢失

Nginx Basic Auth

IP 变化、同网段主机——均能有效拦截


四、积分攻略:获取与节省

4.1 免费获取积分的渠道

方式

收益

说明

每月固定福利

500 积分/月

自动发放,永久有效

成长计划任务

900 积分(一次性)

新手 + 进阶任务

邀请好友

双方各 500/人

无上限

腾讯云社区发文

500~3000/篇

心得 500,教程 1000,精选 2000

注意:每日签到已于 2026 年 5 月 10 日永久下线。

4.2 积分消耗的三个阶段

阶段

说明

省积分技巧

你的输入

消息 + 历史上下文 + 工具参数

长对话开新会话;一次性说清需求

网络响应体

网页/接口返回内容全量加载

这是大头,直接给精确 URL 比让 AI 先搜索再开启节约一轮

AI 回复

模型生成回答

关闭深度思考模式可节省 2~3 倍

4.3 模型选择对积分的影响

模型

消耗系数

适用场景

MiniMax M2.5

0.18

简单问答,最省

智谱 GLM-4.7

0.23

中等复杂度

DeepSeek V3.2

0.30

复杂推理,比 M2.5 贵 1.67 倍

自定义模型

0

走自己的 API Key


五、几个踩过的坑

5.1 成长计划"模板达人"任务进度不更新

现象

说明

网页端入口仍存在

任务定义未下线

点击后自动打开 WorkBuddy 新任务

链路正常

使用模板后进度条无变化

追踪逻辑断裂

大概率是版本升级后模板内部标识改变,成长计划读取的是旧标识,无法匹配。这属于客户端与服务器端之间的追踪 bug,建议前往腾讯云开发者社区发帖反馈,等待官方修复。

5.2 自定义指令对新会话才生效

自定义指令在会话创建时注入系统提示。如果先创建会话再写指令,当前会话不会生效。写好指令后必须新建会话才能验证效果。

5.3 对话框底部盾牌图标

盾牌形状并带有勾号的图标,点击后有两个选项:

权限级别

说明

默认权限

沙箱受限模式,仅能操作工作空间目录内文件

完全权限

放开限制,可访问更广范围的文件和操作

日常使用保持默认权限即可,需要操作工作空间外文件时再切换为完全权限。

5.4 CodeBuddy CLI Agent SDK 集成

WorkBuddy 系列还包含 CLI 形态(CodeBuddy Code),并提供了 Agent SDK(TypeScript / Python),可嵌入到自己的应用中。结合外部 ASR 语音识别服务,能够实现“语音输入 → 文字 → AI 处理 → 结果输出”的完整链路。


总结

31 轮对话提炼出的核心经验:

  • 对话纪要:用独立 HTML 文件记录每轮要点,解决长对话回溯慢、积分浪费的问题,配合自定义指令实现自动维护
  • 自定义模型:一个阿里 DashScope Key 同时接入通义千问和 DeepSeek,接口地址相同,仅改模型 ID
  • 远程中转:SSH 反向隧道 + autossh 保活 + Nginx Basic Auth,固定 IP 安全访问工作站模型
  • 积分管理:用便宜模型省积分,自定义模型零积分,社区发文赚积分
  • 避坑:自定义指令需新会话才生效,模板任务有 bug 需反馈官方

希望这些实战经验对你有帮助。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策