Las categorías de eliminación quitan el carácter; Espacios y NBSP y Homóglifos se normalizan (se reemplazan) y están desactivados de forma predeterminada para proteger el texto legítimo.
| Carácter | Punto de código | Nombre Unicode | Categoría | Posición |
|---|
Acerca de esta herramienta
El texto puede contener caracteres que no ves: espacios y uniones de ancho cero, marcas de orden de bytes, anulaciones de derecha a izquierda y bidireccionales, caracteres de etiqueta Unicode, espacios irrompibles y homóglifos parecidos de otras escrituras. Se cuelan a través del copiar y pegar, los editores enriquecidos y los PDF — y se usan cada vez más para introducir instrucciones ocultas en el texto que se envía a un LLM, o para disfrazar una cadena como otra. Esta herramienta analiza tu texto y enumera cada carácter sospechoso con su posición, su punto de código y su nombre Unicode.
Cada clase de carácter es un interruptor independiente, así que tú decides qué eliminar — limpiar los controles de ancho cero y bidi conservando los emojis y las letras acentuadas legítimas, o normalizar los homóglifos de vuelta a ASCII. Una vista de antes/después muestra exactamente qué cambió y copias el resultado limpio con un solo clic. Nada que dañaría un texto multilingüe normal se elimina de forma predeterminada.
La detección y la limpieza se ejecutan enteramente en tu navegador — el texto que pegas, que puede ser él mismo una carga sospechosa, nunca sale de tu dispositivo.
Preguntas frecuentes
¿Qué son los caracteres invisibles o de ancho cero?
Puntos de código Unicode que se representan sin ningún glifo visible o como espacio en blanco ordinario — el espacio de ancho cero (U+200B), la unión de ancho cero (U+200D), la marca de orden de bytes (U+FEFF) y otros. Aparecen legítimamente en algunas escrituras y secuencias de emojis, pero fuera de contexto suelen ser ruido o un escondite para datos.
¿Cómo se relaciona esto con la inyección de prompt?
Los atacantes pueden incrustar instrucciones usando caracteres que un revisor humano no verá — ocultos en una secuencia de ancho cero o disfrazados con anulaciones bidi — de modo que el texto representado parece inofensivo mientras el modelo lee otra cosa. Eliminar estos caracteres antes de enviar el texto a un modelo suprime ese escondite.
¿Qué son los homóglifos?
Caracteres de escrituras diferentes que parecen idénticos, como la «a» latina y la «а» cirílica. Se usan para suplantar dominios, nombres de usuario y palabras clave; el limpiador puede señalar y normalizar los parecidos comunes de vuelta a sus equivalentes ASCII.
¿Eliminará los emojis o las letras acentuadas?
No, a menos que se lo pidas. Cada categoría es un interruptor independiente y los valores predeterminados preservan el texto multilingüe normal, incluidos los emojis y los signos diacríticos — solo se apunta a los caracteres genuinamente ocultos o engañosos.