多语言嵌入模型推荐:Xenova multilingual-e5-small评测
这是一个基于ONNX权重的 multilingual-e5-small 模型,专门面向与 Transformers.js 深度集成而设计。从Hugging Face仓库来看,该模型已打包为即用型部署包——无需二次转换,可直接在浏览器前端或Node.js环境中执行推理。
Transformers.js 调用示例
尚未安装的话,先通过NPM安装核心依赖:
npm i @huggingface/transformers
接下来进入关键环节——特征提取。仅需寥寥几行代码即可完成端到端调用:
import { pipeline } from '@huggingface/transformers';
const extractor = await pipeline('feature-extraction', 'Xenova/multilingual-e5-small');
const output = await extractor('This is a simple test.');
需要补充说明一点:当前将ONNX权重独立存放为单一仓库,属于过渡性方案。待WebML技术生态日渐成熟后,这一流程大概率会被大幅简化。如果你希望自己的模型也能在Web环境中即插即用,建议先借助 Optimum 将其转换为ONNX格式,然后仿照本仓库结构,将权重放入 onnx 子目录。这种组织方式既保证了目录结构清晰,也为后续迁移提供了便利。
