VS Code插件：Continue/Kilo丝滑切换Qwen3与Opus 4.6

2026-06-15阅读 0热度 0

Qwen

许多开发者为了提升代码理解能力，同时订阅了多款大模型，结果月底结算时发现预算严重超支。更令人困扰的是，在不同模型之间切换必须手动更换 API 密钥和面板，开发效率和体验大打折扣。对于追求极致效率的开发者，DigitalOcean 推理云平台提供的 Gradient Serverless Inference 服务提供了一个务实方案：通过标准化 API 接口，按实际消耗付费，在编辑器内直接调用 Opus 4.6、Qwen3 等一线大模型，无需管理多个订阅。

简单来说，你不再需要为每个模型单独支付月费。借助 Continue.dev 或 Kilo Code 插件，可以轻松将 Gradient 作为高性能推理后端——复杂架构设计交给 Opus 或 Sonnet，日常逻辑实现交给 Qwen，分工明确且成本可控。

本文会手把手带你彻底打通这条链路，让 VS Code 真正成为“全模型集成”的开发中枢。

操作步骤

第一步，获取 Gradient Serverless Inference 服务的 Model Key。

注册 DigitalOcean 推理云平台账号，登录控制台后，点击侧边栏的 Gradient AI 平台按钮，选择“Serverless Inference”，创建 Access Key。如需通过 API 方式创建，可参考卓普云官网博客的详细教程。

配置 Continue 插件

在 VS Code 扩展市场搜索并安装 Continue 插件，点击安装按钮：

安装完成后，在左侧边栏找到 Continue 插件图标，选中后点击右上角的设置齿轮：

接着点击设置内的 Config，选择 Local Config，打开配置文件：

配置文件内容如下：

name: DO Gradient
version: 1.0.0
schema: v1

models:
  - name: Main Chat Model
    provider: openai
    model: alibaba-qwen3-32b
    apiBase: https://inference.do-ai.run/v1
    apiKey: ${{ secrets.MODEL_ACCESS_KEY }}
    roles:
      - chat
      - edit
      - apply

先用 Qwen3-32b 测试连通性，确认无误后再切换为 Anthropic Claude Opus 4.6，修改配置文件如下：

name: DO Gradient
version: 1.0.0
schema: v1

models:
  - name: Main Chat Model
    provider: openai
    model: anthropic-claude-opus-4.6
    apiBase: https://inference.do-ai.run/v1
    apiKey: ${{ secrets.MODEL_ACCESS_KEY }}
    roles:
      - chat
      - edit
      - apply

你可以根据实际需求，选择 Gradient Serverless Inference 上其他可用模型，无需更换 API Key。示例中 API Key 通过环境变量 MODEL_ACCESS_KEY 管理，直接设置即可。

本例没有配置自动补全模型，直接使用 VS Code 自带的 Copilot 完成代码补全，免费且响应更快。Claude Opus 4.6 更适合代码的 Plan 和 Agent 场景，没必要在补全上浪费 Token。Continue 插件支持在不同角色下使用不同模型，你可以灵活组合；涉及敏感数据时可切换为本地模型。

做一次验证：让 Claude Opus 4.6 生成一个数据迁移脚本：