VITA在腾讯TokenHub平台使用教程

2026-06-24阅读 0热度 0

Vita

概述：

腾讯云TokenHub作为VITA模型的官方入口，为开发者提供了完整的服务开通与调用链路。本文详细拆解了在TokenHub上激活VITA服务、生成API密钥、通过兼容OpenAI协议的接口发起请求，以及利用ADP平台实现零代码集成的完整流程。

一、腾讯云TokenHub平台概览

腾讯云TokenHub本质上是一个模型托管与分发平台。开发者在此处激活VITA多模态理解模型后，即可获取API密钥，并通过与OpenAI API协议完全兼容的接口直接调用模型能力。

在TokenHub环境中，VITA模型的调用标识为youtu-vita。当前提供两个可用的模型版本，选择的关键在于业务场景是否涉及音频处理：

模型名称	功能说明
vita-video-3.0	支持视频画面（不含音频）及图片输入。若无需处理音频，此版本为最优选。
vita-video-long	支持视频（含画面与音频）及图片输入。必须处理音频时，请选用此版本。

二、VITA服务开通流程

2.1 第一步：登录腾讯云控制台

访问腾讯云官网，使用您的账号登录腾讯云控制台。

2.2 第二步：进入TokenHub平台

在控制台导航中，找到并进入“腾讯云TokenHub平台”页面。

2.3 第三步：创建API密钥

进入平台后，创建一个新的API密钥。提醒一下，每个账号自动获赠100万Token免费额度，足以完成VITA各项能力的测试与评估。

2.4 第四步：发起调用

获取密钥后，参照API接入文档即可发起接口调用。VITA的API完全兼容OpenAI协议，直接用OpenAI SDK即可接入。

三、API接入详解

3.1 接口基础信息

配置过程并不复杂，核心参数整理如下：

接口协议：兼容OpenAI Completions API协议
BaseURL：https://tokenhub.tencentmaas.com/v1
接口路径：/chat/completions
请求方式：POST
调用方式：支持流式或非流式，按需选择
授权方式：Bearer Token

3.2 请求参数说明

参数名	必选	类型	描述
model	是	String	模型名称，可选值：`vita-video-3.0`、`vita-video-long`。在TokenHub平台上也可使用`youtu-vita`，二者等价。
messages	是	Array	待理解的内容序列。
stream	否	Boolean	是否启用流式输出，取值范围`true / false`，默认`false`。
temperature	否	Float	输出随机性，取值范围`[0.0, 2.0]`。
top_p	否	Float	输出多样性（核采样），取值范围`[0.0, 1.0]`。
max_tokens	否	Integer	限制最大输出Token数。
stop	否	Array of String	指定输出停止序列，最多4个。

3.3 messages参数结构

messages是一个数组，每个元素包含role和content字段：

字段	必选	类型	描述
role	是	String	角色，固定为`user`（用户）。
content	是	Array	待理解的内容。

而content本身也是一个数组，每个元素包含type字段及对应的内容字段：

字段	必选	类型	描述
type	是	String	输入类型，可选值：`text`（文本指令）、`image_url`（图片）、`video_url`（视频）。
text	是	String	自定义的理解指令。
image_url	否	Object	需要理解的图片信息。
video_url	否	Object	需要理解的视频信息。

四、调用示例

4.1 示例1：视频输入

代码语言：bash

复制

若视频不含音频，建议换用vita-video-3.0模型以节省资源。

4.2 示例2：图片输入

代码语言：bash

复制

curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' -H 'Authorization: Bearer YOUR_API_KEY' -H 'Content-Type: application/json' -d '{"model": "vita-video-3.0","messages": [{"role": "user", "content": [{"type": "image_url", "image_url": {"url": ""}},{"type": "image_url", "image_url": {"url": ""}},{"type": "text", "text": "请描述图片的内容"}]}],"stream": false}'

4.3 示例3：使用OpenAI SDK接入

代码语言：python

复制

from openai import OpenAIclient = OpenAI(api_key="YOUR_API_KEY",base_url="https://tokenhub.tencentmaas.com/v1")response = client.chat.completions.create(model="vita-video-long",messages=[{"role": "user", "content": [{"type": "video_url", "video_url": {"url": "

五、输入文件格式要求

5.1 视频输入限制

封装格式：MP4、MOV、AVI、WebM
编码格式：H.264、H.265
文件大小：默认上限100MB，经白名单授权后可支持最大600MB
单次请求仅能传入1个视频文件

5.2 图片输入限制

封装格式：JPG、JPEG、PNG、WebP
文件大小：单张图片上限10MB
单次请求最多传入10张图片

另外需特别注意：YT-VITA支持一次传入多张图片（最多10张），而HY-Vision系列模型一次仅支持单张图片输入。

六、实践总结

在腾讯云TokenHub平台上调用VITA模型，主要有两种路径：一是直接通过兼容OpenAI API协议的接口进行程序化调用，适合具备开发能力的团队；二是借助ADP平台实现无代码配置接入，适合追求快速上线的业务场景。