rate card

Models & pricing

The specialist models we've benchmarked, hosted and priced — with the long tail we're onboarding next below. Prices are in each model's native unit; realtime is the on-demand rate, batch is a discounted flexible tier (send X-Tier: batch).

all embeddings speech-to-text vision-language zero-shot image reranker image-to-text text-to-speech object detection depth estimation text generation

91 matches in embeddings · clear

model	task	tier	realtime	batch
Qwen/Qwen3-Embedding-0.6B	embeddings	A	$0.008/1M tok	$0.0025/1M tok
BAAI/bge-small-en-v1.5	embeddings	A	$0.008/1M tok	$0.0025/1M tok
Qwen/Qwen3-Embedding-4B	embeddings	A	$0.008/1M tok	$0.0025/1M tok
NovaSearch/stella_en_1.5B_v5	embeddings	A	$0.008/1M tok	$0.0025/1M tok

On the roadmap

87 models

High-demand specialist models with no hosted API. We benchmark and onboard them by task - each has a page; sign in and tell us which you need to jump the queue.

embeddings · 87

nomic-embed-text-v1.5 nomic-embed-text-v1 w2v-bert-2.0 all-MiniLM-L6-v2 jina-embeddings-v3 granite-embedding-small-english-r2 bge-base-en-v1.5 wavlm-large all-MiniLM-L6-v2-onnx jina-embeddings-v2-small-en gte-multilingual-base gte-large-en-v1.5 Qwen3-VL-Embedding-8B jina-embeddings-v5-text-nano SFR-Embedding-2_R nomic-embed-text-v2-moe indobert-base-p1 gte-Qwen2-1.5B-instruct wavlm-base-plus bm25 llama-nemotron-embed-1b-v2 Qwen3-Embedding-4B-W4A16-G128 gte-base-en-v1.5 e5-mistral-7b-instruct jina-embeddings-v2-base-en snowflake-arctic-embed-m-v2.0 LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-supervised gte-Qwen2-7B-instruct jina-embeddings-v5-omni-small stella_en_400M_v5 jina-clip-v1 e5-v snowflake-arctic-embed-m-long granite-embedding-english-r2 F2LLM-v2-4B cde-small-v2 jina-embeddings-v5-omni-nano LLM2Vec-Mistral-7B-Instruct-v2-mntp-unsup-simcse NV-Embed-v2 SFR-Embedding-Mistral Linq-Embed-Mistral gme-Qwen2-VL-2B-Instruct mmlw-e5-large inf-retriever-v1-1.5b F2LLM-v2-1.7B jina-embedding-b-en-v1 MiniCPM-Embedding opensearch-neural-sparse-encoding-doc-v3-gte LCO-Embedding-Omni-3B LCO-Embedding-Omni-7B bilingual-embedding-base gme-Qwen2-VL-7B-Instruct bge-en-icl F2LLM-v2-8B KaLM-embedding-multilingual-mini-instruct-v2 KaLM-embedding-multilingual-mini-instruct-v1 jina-embedding-s-en-v1 BidirLM-Omni-2.5B-Embedding nomic-embed-text-v1-unsupervised LLM2Vec-Meta-Llama-3-8B-Instruct-mntp-unsup-simcse LLM2Vec-Sheared-LLaMA-mntp-supervised mmlw-e5-base inf-retriever-v1 udever-bloom-560m udever-bloom-1b1 LLM2Vec-Mistral-7B-Instruct-v2-mntp-supervised nomic-embed-text-v1-ablated lodestone-base-4096-v1 Ivysaur embedder-100p slx-v0.1 b1ade-embed udever-bloom-3b Bulbasaur cde-small-v1 gte-micro-v4 Zeta-Alpha-E5-Mistral DenseOn-unsupervised LENS-d8000 LENS-d4000 ColBERT-Zero-supervised gte-Qwen1.5-7B-instruct ColBERT-Zero-unsupervised LLM2Vec-Llama-2-7b-chat-hf-mntp-unsup-simcse cadet-embed-base-v1 LLM2Vec-Llama-2-7b-chat-hf-mntp-supervised static-retrieval-mrl-en-v1