Contador de tokens LLM

Modelo

Exato · tiktoken o200k_base

Seu prompt

Processado localmente

Tokens

Caracteres

Palavras

Tokens / palavra

Divisão em tokens

As fichas de tokens aparecem aqui conforme você digita.

Sobre esta ferramenta

Os grandes modelos de linguagem não leem caracteres nem palavras — eles leem tokens, os fragmentos de subpalavras em que um tokenizador divide o texto. A contagem de tokens determina tanto os limites de contexto quanto a cobrança da API, então saber quantos tokens um prompt usa faz a diferença entre uma requisição que cabe e uma que é truncada ou inesperadamente cara. Este contador mostra uma contagem de tokens ao vivo ao lado das contagens de caracteres e de palavras, além de uma visão colorida da segmentação para que você veja exatamente onde caem os limites.

Escolha um modelo para trocar de tokenizador. Os modelos da OpenAI usam tiktoken — o200k_base para GPT-5.x, GPT-4o e GPT-4.1, cl100k_base para GPT-3.5 — e produzem contagens exatas, idênticas às da API. Todos os outros provedores (Anthropic, Google, DeepSeek, Alibaba Qwen, Moonshot Kimi, Zhipu GLM, Meta Llama) não têm um tokenizador oficial do lado do navegador, então essas contagens são estimativas baseadas em caracteres: úteis para planejamento, mas verifique-as em relação ao próprio relatório de uso do provedor antes de confiar nelas para cobrança.

Seu texto é tokenizado inteiramente no seu navegador — nada é enviado, e as tabelas tiktoken carregam sob demanda na primeira vez que você conta.

Perguntas frequentes

O que é um token?

Um token é a unidade que um modelo de linguagem processa: uma palavra comum costuma ser um único token, enquanto palavras mais longas ou mais raras se dividem em vários. Como regra aproximada, um token equivale a cerca de quatro caracteres em inglês, ou aproximadamente três quartos de uma palavra — mas o único número exato é o que o próprio tokenizador do modelo produz.

As contagens são exatas?

Para os modelos da OpenAI, sim — esta ferramenta executa as mesmas codificações tiktoken (o200k_base e cl100k_base) que a API usa. Para todos os outros provedores — Anthropic, Google, DeepSeek, Qwen, Kimi, GLM, Llama — não existe um tokenizador público oficial do lado do cliente, então essas contagens são estimativas baseadas em caracteres e estão claramente rotuladas como estimativas (uma nota chega a sinalizar que a divisão colorida é uma aproximação da OpenAI).

Por que o mesmo texto usa um número diferente de tokens por modelo?

Cada família de modelos é treinada com seu próprio tokenizador e vocabulário, então um texto idêntico se divide de forma diferente. Vocabulários mais novos como o o200k_base geralmente condensam o inglês comum em menos tokens do que os mais antigos, e código ou escritas não latinas podem variar substancialmente entre as famílias.

Ele lida com emoji e outros idiomas?

Sim. As contagens cobrem toda a entrada, incluindo emoji, caracteres CJK e letras acentuadas. Na visão colorida, um caractere que um modelo codifica em vários tokens é mesclado em um único chip legível, enquanto a contagem ainda reflete cada token subjacente.

Sobre esta ferramenta

Perguntas frequentes

Ferramentas relacionadas