tasks / embeddings

Hosted embeddings models

91 models · 4 live as APIs · benchmarked & compared

Embeddings models convert text into dense vector representations that capture semantic meaning, enabling machines to compare and retrieve relevant information. Common use cases include semantic search, where queries are matched to documents by vector similarity; retrieval-augmented generation (RAG), where relevant context is fetched before prompting a language model; and clustering or classification of text based on thematic proximity.

In production, embeddings are typically precomputed for a corpus and stored in a vector database. At query time, the input is embedded and a nearest-neighbor search returns the most relevant items. The choice of model involves a trade-off between size, quality, and speed. Larger models like Qwen/Qwen3-Embedding-4B or jinaai/jina-embeddings-v3 often deliver higher accuracy on nuanced tasks, but require more compute and memory. Smaller models such as Xenova/all-MiniLM-L6-v2 or ibm-granite/granite-embedding-small-english-r2 are faster and cheaper to run, making them suitable for latency-sensitive or high-volume applications.

For most call volumes, calling a hosted API beats self-hosting by eliminating the infrastructure, scaling, and maintenance overhead associated with running multiple model variants.

compare

model	params	downloads/mo	price	status
Qwen/Qwen3-Embedding-4B	4021.8M	2.6M	$0.008 / 1M tokens	live
NovaSearch/stella_en_1.5B_v5	1543.3M	30.1K	$0.008 / 1M tokens	live
Qwen/Qwen3-Embedding-0.6B	-	-	$0.008 / 1M tokens	live
BAAI/bge-small-en-v1.5	-	-	$0.008 / 1M tokens	live
nomic-ai/nomic-embed-text-v1.5	136.7M	16.9M	~$0.008 / 1M tokens	coming soon
nomic-ai/nomic-embed-text-v1	136.7M	4.2M	~$0.008 / 1M tokens	coming soon
facebook/w2v-bert-2.0	580.5M	3.7M	~$0.008 / 1M tokens	coming soon
Xenova/all-MiniLM-L6-v2	-	2.8M	at launch	coming soon
jinaai/jina-embeddings-v3	572.3M	2.7M	~$0.008 / 1M tokens	coming soon
ibm-granite/granite-embedding-small-english-r2	47.7M	2.2M	~$0.008 / 1M tokens	coming soon
Xenova/bge-base-en-v1.5	-	1.8M	at launch	coming soon
microsoft/wavlm-large	-	1.4M	at launch	coming soon
Qdrant/all-MiniLM-L6-v2-onnx	-	1.3M	at launch	coming soon
jinaai/jina-embeddings-v2-small-en	32.7M	1.3M	~$0.008 / 1M tokens	coming soon
Alibaba-NLP/gte-multilingual-base	305.4M	1.2M	~$0.008 / 1M tokens	coming soon
Alibaba-NLP/gte-large-en-v1.5	434.1M	1.1M	~$0.008 / 1M tokens	coming soon
Qwen/Qwen3-VL-Embedding-8B	8144.8M	1.1M	~$0.008 / 1M tokens	coming soon
jinaai/jina-embeddings-v5-text-nano	211.8M	1.1M	~$0.008 / 1M tokens	coming soon
Salesforce/SFR-Embedding-2_R	7110.7M	1M	~$0.008 / 1M tokens	coming soon
nomic-ai/nomic-embed-text-v2-moe	475.3M	854.7K	~$0.008 / 1M tokens	coming soon
indobenchmark/indobert-base-p1	-	826.3K	at launch	coming soon
Alibaba-NLP/gte-Qwen2-1.5B-instruct	1776.2M	772.7K	~$0.008 / 1M tokens	coming soon
microsoft/wavlm-base-plus	-	771.5K	at launch	coming soon
Qdrant/bm25	-	769.3K	at launch	coming soon
nvidia/llama-nemotron-embed-1b-v2	1235.8M	658.5K	~$0.008 / 1M tokens	coming soon
boboliu/Qwen3-Embedding-4B-W4A16-G128	4050.2M	549.1K	~$0.008 / 1M tokens	coming soon
Alibaba-NLP/gte-base-en-v1.5	136.8M	459.5K	~$0.008 / 1M tokens	coming soon
intfloat/e5-mistral-7b-instruct	7110.7M	414.7K	~$0.008 / 1M tokens	coming soon
jinaai/jina-embeddings-v2-base-en	137.4M	172K	~$0.008 / 1M tokens	coming soon
Snowflake/snowflake-arctic-embed-m-v2.0	305.4M	162.9K	~$0.008 / 1M tokens	coming soon
McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-supervised	-	112.3K	at launch	coming soon
Alibaba-NLP/gte-Qwen2-7B-instruct	7612.6M	79.3K	~$0.008 / 1M tokens	coming soon
jinaai/jina-embeddings-v5-omni-small	1626.3M	76.6K	~$0.008 / 1M tokens	coming soon
NovaSearch/stella_en_400M_v5	435.2M	69.4K	$0.008 / 1M tokens	coming soon
jinaai/jina-clip-v1	222.7M	61K	~$0.008 / 1M tokens	coming soon
royokong/e5-v	8355.3M	58.2K	~$0.008 / 1M tokens	coming soon
Snowflake/snowflake-arctic-embed-m-long	136.7M	53.5K	~$0.008 / 1M tokens	coming soon
ibm-granite/granite-embedding-english-r2	149M	45K	~$0.008 / 1M tokens	coming soon
codefuse-ai/F2LLM-v2-4B	4022.5M	41.1K	~$0.008 / 1M tokens	coming soon
jxm/cde-small-v2	305.7M	25.9K	~$0.008 / 1M tokens	coming soon
jinaai/jina-embeddings-v5-omni-nano	986M	25.2K	~$0.008 / 1M tokens	coming soon
McGill-NLP/LLM2Vec-Mistral-7B-Instruct-v2-mntp-unsup-simcse	-	24.7K	at launch	coming soon
nvidia/NV-Embed-v2	7851M	24.5K	~$0.008 / 1M tokens	coming soon
Salesforce/SFR-Embedding-Mistral	7110.7M	18.2K	~$0.008 / 1M tokens	coming soon
Linq-AI-Research/Linq-Embed-Mistral	7110.7M	14.7K	~$0.008 / 1M tokens	coming soon
Alibaba-NLP/gme-Qwen2-VL-2B-Instruct	2209M	9.1K	~$0.008 / 1M tokens	coming soon
sdadas/mmlw-e5-large	559.9M	5.2K	~$0.008 / 1M tokens	coming soon
infly/inf-retriever-v1-1.5b	1543.3M	4.3K	~$0.008 / 1M tokens	coming soon
codefuse-ai/F2LLM-v2-1.7B	1720.6M	3.8K	~$0.008 / 1M tokens	coming soon
jinaai/jina-embedding-b-en-v1	-	3.5K	at launch	coming soon
openbmb/MiniCPM-Embedding	2724.9M	2.5K	~$0.008 / 1M tokens	coming soon
opensearch-project/opensearch-neural-sparse-encoding-doc-v3-gte	137.4M	2.1K	~$0.008 / 1M tokens	coming soon
LCO-Embedding/LCO-Embedding-Omni-3B	4703.5M	2.1K	~$0.008 / 1M tokens	coming soon
LCO-Embedding/LCO-Embedding-Omni-7B	8931.8M	1.2K	~$0.008 / 1M tokens	coming soon
Lajavaness/bilingual-embedding-base	278M	1.1K	~$0.008 / 1M tokens	coming soon
Alibaba-NLP/gme-Qwen2-VL-7B-Instruct	8291.4M	1K	~$0.008 / 1M tokens	coming soon
BAAI/bge-en-icl	7110.7M	1K	~$0.008 / 1M tokens	coming soon
codefuse-ai/F2LLM-v2-8B	7568.4M	923	~$0.008 / 1M tokens	coming soon
HIT-TMG/KaLM-embedding-multilingual-mini-instruct-v2	494M	919	~$0.008 / 1M tokens	coming soon
HIT-TMG/KaLM-embedding-multilingual-mini-instruct-v1	494M	732	~$0.008 / 1M tokens	coming soon
jinaai/jina-embedding-s-en-v1	-	691	at launch	coming soon
BidirLM/BidirLM-Omni-2.5B-Embedding	2445M	619	~$0.008 / 1M tokens	coming soon
nomic-ai/nomic-embed-text-v1-unsupervised	-	609	at launch	coming soon
McGill-NLP/LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-unsup-simcse	-	446	at launch	coming soon
McGill-NLP/LLM2Vec-Sheared-LLaMA-mntp-supervised	-	440	at launch	coming soon
sdadas/mmlw-e5-base	278M	369	~$0.008 / 1M tokens	coming soon
infly/inf-retriever-v1	7069.1M	359	~$0.008 / 1M tokens	coming soon
izhx/udever-bloom-560m	-	334	at launch	coming soon
izhx/udever-bloom-1b1	-	321	at launch	coming soon
McGill-NLP/LLM2Vec-Mistral-7B-Instruct-v2-mntp-supervised	-	291	at launch	coming soon
nomic-ai/nomic-embed-text-v1-ablated	-	248	at launch	coming soon
Hum-Works/lodestone-base-4096-v1	-	235	at launch	coming soon
Mihaiii/Ivysaur	22.7M	232	~$0.008 / 1M tokens	coming soon
deepfile/embedder-100p	278M	223	~$0.008 / 1M tokens	coming soon
brahmairesearch/slx-v0.1	22.7M	215	~$0.008 / 1M tokens	coming soon
w601sxs/b1ade-embed	-	209	at launch	coming soon
izhx/udever-bloom-3b	-	206	at launch	coming soon
Mihaiii/Bulbasaur	17.4M	200	~$0.008 / 1M tokens	coming soon
jxm/cde-small-v1	281.1M	190	~$0.008 / 1M tokens	coming soon
Mihaiii/gte-micro-v4	19.2M	162	~$0.008 / 1M tokens	coming soon
zeta-alpha-ai/Zeta-Alpha-E5-Mistral	7110.7M	153	~$0.008 / 1M tokens	coming soon
lightonai/DenseOn-unsupervised	149M	140	~$0.008 / 1M tokens	coming soon
yibinlei/LENS-d8000	7110.7M	108	~$0.008 / 1M tokens	coming soon
yibinlei/LENS-d4000	7110.7M	101	~$0.008 / 1M tokens	coming soon
lightonai/ColBERT-Zero-supervised	149M	84	~$0.008 / 1M tokens	coming soon
Alibaba-NLP/gte-Qwen1.5-7B-instruct	7721.3M	81	~$0.008 / 1M tokens	coming soon
lightonai/ColBERT-Zero-unsupervised	149M	81	~$0.008 / 1M tokens	coming soon
McGill-NLP/LLM2Vec-Llama-2-7b-chat-hf-mntp-unsup-simcse	-	13	at launch	coming soon
manveertamber/cadet-embed-base-v1	109.5M	13	~$0.008 / 1M tokens	coming soon
McGill-NLP/LLM2Vec-Llama-2-7b-chat-hf-mntp-supervised	-	12	at launch	coming soon
sentence-transformers/static-retrieval-mrl-en-v1	-	-	at launch	coming soon

get a key + $25 free →docs