Qwen: Qwen3 Embedding 8B

qwen/qwen3-embedding-8b

32KContext Window

32KMax Output

Supported Protocols:max_tokenstemperaturetop_pstopfrequency_penaltypresence_penaltyseedtop_klogit_biaslogprobstop_logprobs

Online

The Qwen3 Embedding model series is the latest proprietary model of the Qwen family, specifically designed for text embedding and ranking tasks. This series inherits the exceptional multilingual capabilities, long-text understanding, and reasoning skills of its foundational model. The Qwen3 Embedding series represents significant advancements in multiple text embedding and ranking tasks, including text retrieval, code retrieval, text classification, text clustering, and bitext mining.

Capabilities

Text GenerationCode GenerationAnalysis & Reasoningmodels.reasoning

Technical Specs

Input Modality

Text

Output Modality

Text

Arch

—

Pricing

Pay per use, no monthly fees

Input Token< ¥0.001/1K Token

Output Token< ¥0.001/1K Token

Quick Start

from openai import OpenAI

client = OpenAI(
    base_url="https://api.uniontoken.ai/v1",
    api_key="YOUR_UNIONTOKEN_API_KEY",
)

response = client.chat.completions.create(
    model="qwen/qwen3-embedding-8b",
    messages=[
        {"role": "user", "content": "Hello!"}
    ],
)

print(response.choices[0].message.content)