「 AI 」 六月 29, 2025
用 TEI 部署向量嵌入和重排模型,并在 Dify 中使用
文章字数 21k 阅读约需 19 mins.
TEI(Text Embeddings Inference)是 Hugging Face 提供的一个服务框架,用于部署和运行文本嵌入模型,以及序列分类模型(重排模型)。它支持多种模型格式,性能优异,并提供了 RESTful API 接口,方便与其他应用集成。
Benchmark for BAAI/bge-base-en-v1.5 on an Nvidia A10 with a sequence length of 512 tokens:
CPU 环境部署
最新 1.7 版本 CPU 镜像可能存...
查看全文