Vérificateur de fenêtre de contexte

Modèle

Réserver pour la réponse (tokens de sortie attendus)

Votre prompt Estimation

Traité localement

0 / 1,000,000 tokens

0% de la fenêtre utilisée

Tokens utilisés

Réservés pour la réponse

1,000,000

Tokens restants

Référence des fenêtres de contexte Mis à jour le June 2026

Modèle	Fournisseur	Fenêtre de contexte
GPT-5.5	OpenAI	~1.1M tokens
GPT-5.4	OpenAI	~1.1M tokens
Gemini 3.5 Flash	Google	~1M tokens
Gemini 3.1 Pro (Preview)	Google	~1M tokens
Gemini 3.1 Flash-Lite	Google	~1M tokens
Gemini 3 Flash (Preview)	Google	~1M tokens
Gemini 2.5 Pro	Google	~1M tokens
Gemini 2.5 Flash	Google	~1M tokens
Gemini 2.5 Flash-Lite	Google	~1M tokens
GPT-4.1	OpenAI	~1M tokens
GPT-4.1 mini	OpenAI	~1M tokens
GPT-4.1 nano	OpenAI	~1M tokens
Claude Opus 4.8	Anthropic	~1M tokens
Claude Sonnet 4.6	Anthropic	~1M tokens
Claude Fable 5	Anthropic	~1M tokens
DeepSeek-V4-Flash	DeepSeek	~1M tokens
DeepSeek-V4-Pro	DeepSeek	~1M tokens
Qwen3.5-Plus	Alibaba	~1M tokens
Qwen-Plus	Alibaba	~1M tokens
Qwen3.5-Flash	Alibaba	~1M tokens
Qwen-Flash	Alibaba	~1M tokens
GLM-5.2	Zhipu AI	~1M tokens
GPT-5.4 mini	OpenAI	400,000 tokens
GPT-5.4 nano	OpenAI	400,000 tokens
GPT-5	OpenAI	400,000 tokens
GPT-5 mini	OpenAI	400,000 tokens
GPT-5 nano	OpenAI	400,000 tokens
Kimi K2.7 Code	Moonshot AI	262,144 tokens
Kimi K2.6	Moonshot AI	262,144 tokens
Kimi K2.5	Moonshot AI	262,144 tokens
Qwen3-Max	Alibaba	262,144 tokens
o3	OpenAI	200,000 tokens
o4-mini	OpenAI	200,000 tokens
Claude Opus 4.5	Anthropic	200,000 tokens
Claude Sonnet 4.5	Anthropic	200,000 tokens
Claude Haiku 4.5	Anthropic	200,000 tokens
GLM-5.1	Zhipu AI	200,000 tokens
GLM-5	Zhipu AI	200,000 tokens
GLM-4.7	Zhipu AI	200,000 tokens
GLM-4.7-FlashX	Zhipu AI	200,000 tokens
GLM-4.7-Flash	Zhipu AI	200,000 tokens
GLM-4.6	Zhipu AI	200,000 tokens
Moonshot V1 128k	Moonshot AI	131,072 tokens
QwQ-Plus	Alibaba	131,072 tokens
GLM-4.5	Zhipu AI	131,072 tokens
GLM-4.5-Air	Zhipu AI	131,072 tokens
Llama 3.3 70B	Meta	131,072 tokens
Llama 3.1 405B	Meta	131,072 tokens
Llama 3.1 8B	Meta	131,072 tokens
GPT-4o	OpenAI	128,000 tokens
GPT-4o mini	OpenAI	128,000 tokens
Moonshot V1 32k	Moonshot AI	32,768 tokens
GPT-3.5 Turbo	OpenAI	16,385 tokens
Moonshot V1 8k	Moonshot AI	8,192 tokens

À propos de cet outil

La fenêtre de contexte d'un modèle correspond au nombre maximal de tokens qu'il peut prendre en compte à la fois — le prompt et la complétion réunis. Si vous la dépassez, la requête est rejetée ou silencieusement tronquée, supprimant le début de votre prompt. Cet outil compte votre texte par rapport à la limite du modèle sélectionné et affiche le résultat sous forme de barre de progression indiquant les tokens utilisés, le pourcentage de la fenêtre consommé et les tokens restants pour la réponse.

Les fenêtres de contexte vont de quelques milliers de tokens sur les modèles plus anciens à plus d'un million sur les plus récents. N'oubliez pas que la fenêtre est partagée : chaque token consacré au prompt est un token de moins disponible pour la réponse, alors gardez de la marge pour la sortie attendue. Les comptes d'OpenAI sont exacts grâce à tiktoken ; ceux des autres fournisseurs sont des estimations basées sur le nombre de caractères.

La fenêtre est partagée entre l'entrée et la sortie — prévoyez de la place pour la réponse, pas seulement pour le prompt.

Questions fréquentes

Qu'est-ce qu'une fenêtre de contexte ?

C'est le nombre total de tokens qu'un modèle peut conserver en mémoire de travail pour une seule requête, couvrant à la fois votre prompt et la réponse générée. Considérez-la comme la capacité d'attention à court terme du modèle, mesurée en tokens.

Que se passe-t-il si je la dépasse ?

Selon l'API, la requête échoue avec une erreur ou est tronquée — généralement les tokens les plus anciens sont supprimés — ce qui peut discrètement retirer des instructions placées au début de votre prompt. Mieux vaut rester confortablement en dessous de la limite.

Le prompt et la réponse partagent-ils la fenêtre ?

Oui. Si un modèle dispose d'une fenêtre de 128K et que votre prompt fait 120K tokens, il ne reste qu'environ 8K pour la réponse. Réservez toujours de l'espace pour la sortie attendue.

Quels modèles ont les plus grandes fenêtres de contexte ?

Plusieurs modèles récents d'OpenAI et de Google offrent environ un million de tokens, tandis que de nombreux modèles en production se situent entre 128K et 200K. Le tableau de référence de cet outil indique la limite de chaque modèle.

À propos de cet outil

Questions fréquentes

Outils associés