| Modèle | Fournisseur | Fenêtre de contexte |
|---|---|---|
| GPT-5.5 | OpenAI | ~1.1M tokens |
| GPT-5.4 | OpenAI | ~1.1M tokens |
| Gemini 3.5 Flash | ~1M tokens | |
| Gemini 3.1 Pro (Preview) | ~1M tokens | |
| Gemini 3.1 Flash-Lite | ~1M tokens | |
| Gemini 3 Flash (Preview) | ~1M tokens | |
| Gemini 2.5 Pro | ~1M tokens | |
| Gemini 2.5 Flash | ~1M tokens | |
| Gemini 2.5 Flash-Lite | ~1M tokens | |
| GPT-4.1 | OpenAI | ~1M tokens |
| GPT-4.1 mini | OpenAI | ~1M tokens |
| GPT-4.1 nano | OpenAI | ~1M tokens |
| Claude Opus 4.8 | Anthropic | ~1M tokens |
| Claude Sonnet 4.6 | Anthropic | ~1M tokens |
| Claude Fable 5 | Anthropic | ~1M tokens |
| DeepSeek-V4-Flash | DeepSeek | ~1M tokens |
| DeepSeek-V4-Pro | DeepSeek | ~1M tokens |
| Qwen3.5-Plus | Alibaba | ~1M tokens |
| Qwen-Plus | Alibaba | ~1M tokens |
| Qwen3.5-Flash | Alibaba | ~1M tokens |
| Qwen-Flash | Alibaba | ~1M tokens |
| GLM-5.2 | Zhipu AI | ~1M tokens |
| GPT-5.4 mini | OpenAI | 400,000 tokens |
| GPT-5.4 nano | OpenAI | 400,000 tokens |
| GPT-5 | OpenAI | 400,000 tokens |
| GPT-5 mini | OpenAI | 400,000 tokens |
| GPT-5 nano | OpenAI | 400,000 tokens |
| Kimi K2.7 Code | Moonshot AI | 262,144 tokens |
| Kimi K2.6 | Moonshot AI | 262,144 tokens |
| Kimi K2.5 | Moonshot AI | 262,144 tokens |
| Qwen3-Max | Alibaba | 262,144 tokens |
| o3 | OpenAI | 200,000 tokens |
| o4-mini | OpenAI | 200,000 tokens |
| Claude Opus 4.5 | Anthropic | 200,000 tokens |
| Claude Sonnet 4.5 | Anthropic | 200,000 tokens |
| Claude Haiku 4.5 | Anthropic | 200,000 tokens |
| GLM-5.1 | Zhipu AI | 200,000 tokens |
| GLM-5 | Zhipu AI | 200,000 tokens |
| GLM-4.7 | Zhipu AI | 200,000 tokens |
| GLM-4.7-FlashX | Zhipu AI | 200,000 tokens |
| GLM-4.7-Flash | Zhipu AI | 200,000 tokens |
| GLM-4.6 | Zhipu AI | 200,000 tokens |
| Moonshot V1 128k | Moonshot AI | 131,072 tokens |
| QwQ-Plus | Alibaba | 131,072 tokens |
| GLM-4.5 | Zhipu AI | 131,072 tokens |
| GLM-4.5-Air | Zhipu AI | 131,072 tokens |
| Llama 3.3 70B | Meta | 131,072 tokens |
| Llama 3.1 405B | Meta | 131,072 tokens |
| Llama 3.1 8B | Meta | 131,072 tokens |
| GPT-4o | OpenAI | 128,000 tokens |
| GPT-4o mini | OpenAI | 128,000 tokens |
| Moonshot V1 32k | Moonshot AI | 32,768 tokens |
| GPT-3.5 Turbo | OpenAI | 16,385 tokens |
| Moonshot V1 8k | Moonshot AI | 8,192 tokens |
À propos de cet outil
La fenêtre de contexte d'un modèle correspond au nombre maximal de tokens qu'il peut prendre en compte à la fois — le prompt et la complétion réunis. Si vous la dépassez, la requête est rejetée ou silencieusement tronquée, supprimant le début de votre prompt. Cet outil compte votre texte par rapport à la limite du modèle sélectionné et affiche le résultat sous forme de barre de progression indiquant les tokens utilisés, le pourcentage de la fenêtre consommé et les tokens restants pour la réponse.
Les fenêtres de contexte vont de quelques milliers de tokens sur les modèles plus anciens à plus d'un million sur les plus récents. N'oubliez pas que la fenêtre est partagée : chaque token consacré au prompt est un token de moins disponible pour la réponse, alors gardez de la marge pour la sortie attendue. Les comptes d'OpenAI sont exacts grâce à tiktoken ; ceux des autres fournisseurs sont des estimations basées sur le nombre de caractères.
La fenêtre est partagée entre l'entrée et la sortie — prévoyez de la place pour la réponse, pas seulement pour le prompt.
Questions fréquentes
Qu'est-ce qu'une fenêtre de contexte ?
C'est le nombre total de tokens qu'un modèle peut conserver en mémoire de travail pour une seule requête, couvrant à la fois votre prompt et la réponse générée. Considérez-la comme la capacité d'attention à court terme du modèle, mesurée en tokens.
Que se passe-t-il si je la dépasse ?
Selon l'API, la requête échoue avec une erreur ou est tronquée — généralement les tokens les plus anciens sont supprimés — ce qui peut discrètement retirer des instructions placées au début de votre prompt. Mieux vaut rester confortablement en dessous de la limite.
Le prompt et la réponse partagent-ils la fenêtre ?
Oui. Si un modèle dispose d'une fenêtre de 128K et que votre prompt fait 120K tokens, il ne reste qu'environ 8K pour la réponse. Réservez toujours de l'espace pour la sortie attendue.
Quels modèles ont les plus grandes fenêtres de contexte ?
Plusieurs modèles récents d'OpenAI et de Google offrent environ un million de tokens, tandis que de nombreux modèles en production se situent entre 128K et 200K. Le tableau de référence de cet outil indique la limite de chaque modèle.