VITA在腾讯TokenHub平台使用教程
概述:
腾讯云TokenHub作为VITA模型的官方入口,为开发者提供了完整的服务开通与调用链路。本文详细拆解了在TokenHub上激活VITA服务、生成API密钥、通过兼容OpenAI协议的接口发起请求,以及利用ADP平台实现零代码集成的完整流程。
一、腾讯云TokenHub平台概览
腾讯云TokenHub本质上是一个模型托管与分发平台。开发者在此处激活VITA多模态理解模型后,即可获取API密钥,并通过与OpenAI API协议完全兼容的接口直接调用模型能力。
在TokenHub环境中,VITA模型的调用标识为youtu-vita。当前提供两个可用的模型版本,选择的关键在于业务场景是否涉及音频处理:
模型名称 | 功能说明 |
|---|---|
vita-video-3.0 | 支持视频画面(不含音频)及图片输入。若无需处理音频,此版本为最优选。 |
vita-video-long | 支持视频(含画面与音频)及图片输入。必须处理音频时,请选用此版本。 |
二、VITA服务开通流程
2.1 第一步:登录腾讯云控制台
访问腾讯云官网,使用您的账号登录腾讯云控制台。
2.2 第二步:进入TokenHub平台
在控制台导航中,找到并进入“腾讯云TokenHub平台”页面。
2.3 第三步:创建API密钥
进入平台后,创建一个新的API密钥。提醒一下,每个账号自动获赠100万Token免费额度,足以完成VITA各项能力的测试与评估。
2.4 第四步:发起调用
获取密钥后,参照API接入文档即可发起接口调用。VITA的API完全兼容OpenAI协议,直接用OpenAI SDK即可接入。
三、API接入详解
3.1 接口基础信息
配置过程并不复杂,核心参数整理如下:
接口协议:兼容OpenAI Completions API协议
BaseURL:https://tokenhub.tencentmaas.com/v1
接口路径:/chat/completions
请求方式:POST
调用方式:支持流式或非流式,按需选择
授权方式:Bearer Token
3.2 请求参数说明
参数名 | 必选 | 类型 | 描述 |
|---|---|---|---|
model | 是 | String | 模型名称,可选值: |
messages | 是 | Array | 待理解的内容序列。 |
stream | 否 | Boolean | 是否启用流式输出,取值范围 |
temperature | 否 | Float | 输出随机性,取值范围 |
top_p | 否 | Float | 输出多样性(核采样),取值范围 |
max_tokens | 否 | Integer | 限制最大输出Token数。 |
stop | 否 | Array of String | 指定输出停止序列,最多4个。 |
3.3 messages参数结构
messages是一个数组,每个元素包含role和content字段:
字段 | 必选 | 类型 | 描述 |
|---|---|---|---|
role | 是 | String | 角色,固定为 |
content | 是 | Array | 待理解的内容。 |
而content本身也是一个数组,每个元素包含type字段及对应的内容字段:
字段 | 必选 | 类型 | 描述 |
|---|---|---|---|
type | 是 | String | 输入类型,可选值: |
text | 是 | String | 自定义的理解指令。 |
image_url | 否 | Object | 需要理解的图片信息。 |
video_url | 否 | Object | 需要理解的视频信息。 |
四、调用示例
4.1 示例1:视频输入
代码语言:bash
复制
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' -H 'Authorization: Bearer YOUR_API_KEY' -H 'Content-Type: application/json' -d '{"model": "vita-video-long","messages": [{"role": "user", "content": [{"type": "video_url", "video_url": {"url": "
若视频不含音频,建议换用vita-video-3.0模型以节省资源。
4.2 示例2:图片输入
代码语言:bash
复制
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' -H 'Authorization: Bearer YOUR_API_KEY' -H 'Content-Type: application/json' -d '{"model": "vita-video-3.0","messages": [{"role": "user", "content": [{"type": "image_url", "image_url": {"url": "
4.3 示例3:使用OpenAI SDK接入
代码语言:python
复制
from openai import OpenAIclient = OpenAI(api_key="YOUR_API_KEY",base_url="https://tokenhub.tencentmaas.com/v1")response = client.chat.completions.create(model="vita-video-long",messages=[{"role": "user", "content": [{"type": "video_url", "video_url": {"url": "
五、输入文件格式要求
5.1 视频输入限制
封装格式:MP4、MOV、AVI、WebM
编码格式:H.264、H.265
文件大小:默认上限100MB,经白名单授权后可支持最大600MB
单次请求仅能传入1个视频文件
5.2 图片输入限制
封装格式:JPG、JPEG、PNG、WebP
文件大小:单张图片上限10MB
单次请求最多传入10张图片
另外需特别注意:YT-VITA支持一次传入多张图片(最多10张),而HY-Vision系列模型一次仅支持单张图片输入。
六、实践总结
在腾讯云TokenHub平台上调用VITA模型,主要有两种路径:一是直接通过兼容OpenAI API协议的接口进行程序化调用,适合具备开发能力的团队;二是借助ADP平台实现无代码配置接入,适合追求快速上线的业务场景。
