OpenReplay Logo
12k
12k

Vérificateur de fenêtre de contexte

Vérifiez si votre prompt tient dans la fenêtre de contexte d'un modèle. Collez votre texte, choisissez un modèle, et voyez les tokens utilisés, les tokens restants et votre proximité avec la limite.

Estimation
Traité localement
0 / 1,000,000 tokens
0% de la fenêtre utilisée
0
Tokens utilisés
0
Réservés pour la réponse
1,000,000
Tokens restants
Référence des fenêtres de contexte Mis à jour le June 2026
Modèle Fournisseur Fenêtre de contexte
GPT-5.5 OpenAI ~1.1M tokens
GPT-5.4 OpenAI ~1.1M tokens
Gemini 3.5 Flash Google ~1M tokens
Gemini 3.1 Pro (Preview) Google ~1M tokens
Gemini 3.1 Flash-Lite Google ~1M tokens
Gemini 3 Flash (Preview) Google ~1M tokens
Gemini 2.5 Pro Google ~1M tokens
Gemini 2.5 Flash Google ~1M tokens
Gemini 2.5 Flash-Lite Google ~1M tokens
GPT-4.1 OpenAI ~1M tokens
GPT-4.1 mini OpenAI ~1M tokens
GPT-4.1 nano OpenAI ~1M tokens
Claude Opus 4.8 Anthropic ~1M tokens
Claude Sonnet 4.6 Anthropic ~1M tokens
Claude Fable 5 Anthropic ~1M tokens
DeepSeek-V4-Flash DeepSeek ~1M tokens
DeepSeek-V4-Pro DeepSeek ~1M tokens
Qwen3.5-Plus Alibaba ~1M tokens
Qwen-Plus Alibaba ~1M tokens
Qwen3.5-Flash Alibaba ~1M tokens
Qwen-Flash Alibaba ~1M tokens
GLM-5.2 Zhipu AI ~1M tokens
GPT-5.4 mini OpenAI 400,000 tokens
GPT-5.4 nano OpenAI 400,000 tokens
GPT-5 OpenAI 400,000 tokens
GPT-5 mini OpenAI 400,000 tokens
GPT-5 nano OpenAI 400,000 tokens
Kimi K2.7 Code Moonshot AI 262,144 tokens
Kimi K2.6 Moonshot AI 262,144 tokens
Kimi K2.5 Moonshot AI 262,144 tokens
Qwen3-Max Alibaba 262,144 tokens
o3 OpenAI 200,000 tokens
o4-mini OpenAI 200,000 tokens
Claude Opus 4.5 Anthropic 200,000 tokens
Claude Sonnet 4.5 Anthropic 200,000 tokens
Claude Haiku 4.5 Anthropic 200,000 tokens
GLM-5.1 Zhipu AI 200,000 tokens
GLM-5 Zhipu AI 200,000 tokens
GLM-4.7 Zhipu AI 200,000 tokens
GLM-4.7-FlashX Zhipu AI 200,000 tokens
GLM-4.7-Flash Zhipu AI 200,000 tokens
GLM-4.6 Zhipu AI 200,000 tokens
Moonshot V1 128k Moonshot AI 131,072 tokens
QwQ-Plus Alibaba 131,072 tokens
GLM-4.5 Zhipu AI 131,072 tokens
GLM-4.5-Air Zhipu AI 131,072 tokens
Llama 3.3 70B Meta 131,072 tokens
Llama 3.1 405B Meta 131,072 tokens
Llama 3.1 8B Meta 131,072 tokens
GPT-4o OpenAI 128,000 tokens
GPT-4o mini OpenAI 128,000 tokens
Moonshot V1 32k Moonshot AI 32,768 tokens
GPT-3.5 Turbo OpenAI 16,385 tokens
Moonshot V1 8k Moonshot AI 8,192 tokens

À propos de cet outil

La fenêtre de contexte d'un modèle correspond au nombre maximal de tokens qu'il peut prendre en compte à la fois — le prompt et la complétion réunis. Si vous la dépassez, la requête est rejetée ou silencieusement tronquée, supprimant le début de votre prompt. Cet outil compte votre texte par rapport à la limite du modèle sélectionné et affiche le résultat sous forme de barre de progression indiquant les tokens utilisés, le pourcentage de la fenêtre consommé et les tokens restants pour la réponse.

Les fenêtres de contexte vont de quelques milliers de tokens sur les modèles plus anciens à plus d'un million sur les plus récents. N'oubliez pas que la fenêtre est partagée : chaque token consacré au prompt est un token de moins disponible pour la réponse, alors gardez de la marge pour la sortie attendue. Les comptes d'OpenAI sont exacts grâce à tiktoken ; ceux des autres fournisseurs sont des estimations basées sur le nombre de caractères.

La fenêtre est partagée entre l'entrée et la sortie — prévoyez de la place pour la réponse, pas seulement pour le prompt.

Questions fréquentes

Qu'est-ce qu'une fenêtre de contexte ?

C'est le nombre total de tokens qu'un modèle peut conserver en mémoire de travail pour une seule requête, couvrant à la fois votre prompt et la réponse générée. Considérez-la comme la capacité d'attention à court terme du modèle, mesurée en tokens.

Que se passe-t-il si je la dépasse ?

Selon l'API, la requête échoue avec une erreur ou est tronquée — généralement les tokens les plus anciens sont supprimés — ce qui peut discrètement retirer des instructions placées au début de votre prompt. Mieux vaut rester confortablement en dessous de la limite.

Le prompt et la réponse partagent-ils la fenêtre ?

Oui. Si un modèle dispose d'une fenêtre de 128K et que votre prompt fait 120K tokens, il ne reste qu'environ 8K pour la réponse. Réservez toujours de l'espace pour la sortie attendue.

Quels modèles ont les plus grandes fenêtres de contexte ?

Plusieurs modèles récents d'OpenAI et de Google offrent environ un million de tokens, tandis que de nombreux modèles en production se situent entre 128K et 200K. Le tableau de référence de cet outil indique la limite de chaque modèle.