Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models
该论文提出 Qwen3 Embedding,一个基于 Qwen3 基础模型构建的文本嵌入与重排序模型系列,结合多阶段训练、模型合并和 LLM 合成的多语言数据。该系列覆盖 0.6B、4B 和 8B 规模,并在多语言嵌入、检索、重排序、代码检索和跨语言检索基准上取得领先表现。
研究分类
面向检索、语义匹配、表示学习和嵌入模型训练的研究。
1 篇论文
该论文提出 Qwen3 Embedding,一个基于 Qwen3 基础模型构建的文本嵌入与重排序模型系列,结合多阶段训练、模型合并和 LLM 合成的多语言数据。该系列覆盖 0.6B、4B 和 8B 规模,并在多语言嵌入、检索、重排序、代码检索和跨语言检索基准上取得领先表现。