As categorias de remoção retiram o caractere; Espaços e NBSP e Homóglifos são normalizados (substituídos) e ficam desativados por padrão para proteger o texto legítimo.
| Caractere | Ponto de código | Nome Unicode | Categoria | Posição |
|---|
Sobre esta ferramenta
O texto pode carregar caracteres que você não vê: espaços e juntores de largura zero, marcas de ordem de bytes, sobreposições da direita para a esquerda e bidirecionais, caracteres de tag Unicode, espaços inquebráveis e homóglifos parecidos vindos de outras escritas. Eles entram pelo copiar e colar, por editores ricos e PDFs — e são cada vez mais usados para contrabandear instruções ocultas em texto enviado a um LLM, ou para disfarçar uma string como outra. Esta ferramenta analisa o seu texto e lista cada caractere suspeito com sua posição, ponto de código e nome Unicode.
Cada classe de caractere é um botão separado, então você decide o que remover — limpar controles de largura zero e bidi mantendo emojis e letras acentuadas legítimas, ou normalizar homóglifos de volta para ASCII. Uma visão antes/depois mostra exatamente o que mudou e você copia o resultado limpo com um clique. Nada que prejudicaria um texto multilíngue normal é removido por padrão.
A detecção e a limpeza são executadas inteiramente no seu navegador — o texto que você cola, que pode ser ele mesmo um payload suspeito, nunca sai do seu dispositivo.
Perguntas frequentes
O que são caracteres invisíveis ou de largura zero?
Pontos de código Unicode que se exibem como nenhum glifo visível ou como espaço comum — o espaço de largura zero (U+200B), o juntor de largura zero (U+200D), a marca de ordem de bytes (U+FEFF) e outros. Eles aparecem legitimamente em algumas escritas e sequências de emoji, mas fora de contexto costumam ser ruído ou um esconderijo para dados.
Como isso se relaciona com a injeção de prompt?
Os atacantes podem embutir instruções usando caracteres que um revisor humano não verá — escondidos em uma sequência de largura zero ou disfarçados com sobreposições bidi — de modo que o texto exibido pareça inofensivo enquanto o modelo lê outra coisa. Remover esses caracteres antes de enviar o texto a um modelo elimina esse esconderijo.
O que são homóglifos?
Caracteres de escritas diferentes que parecem idênticos, como o 'a' latino e o 'а' cirílico. Eles são usados para falsificar domínios, nomes de usuário e palavras-chave; o limpador pode sinalizar e normalizar os sósias comuns de volta aos seus equivalentes ASCII.
Ele vai remover emojis ou letras acentuadas?
Não, a menos que você peça. Cada categoria é um botão independente e os padrões preservam o texto multilíngue normal, incluindo emojis e sinais diacríticos — apenas os caracteres genuinamente ocultos ou enganosos são alvo.