OpenReplay Logo
12k
12k

Limpiador de caracteres invisibles

Detecta y elimina el Unicode oculto — caracteres de ancho cero, controles bidi, caracteres de etiqueta y homóglifos — que ocultan cargas de inyección de prompt o corrompen el texto. Analizado y limpiado en tu navegador.

Categorías a limpiar Analizado y limpiado localmente

Las categorías de eliminación quitan el carácter; Espacios y NBSP y Homóglifos se normalizan (se reemplazan) y están desactivados de forma predeterminada para proteger el texto legítimo.

Aún no hay texto para analizar.
Texto limpio
0 eliminados, 0 caracteres normalizados

Acerca de esta herramienta

El texto puede contener caracteres que no ves: espacios y uniones de ancho cero, marcas de orden de bytes, anulaciones de derecha a izquierda y bidireccionales, caracteres de etiqueta Unicode, espacios irrompibles y homóglifos parecidos de otras escrituras. Se cuelan a través del copiar y pegar, los editores enriquecidos y los PDF — y se usan cada vez más para introducir instrucciones ocultas en el texto que se envía a un LLM, o para disfrazar una cadena como otra. Esta herramienta analiza tu texto y enumera cada carácter sospechoso con su posición, su punto de código y su nombre Unicode.

Cada clase de carácter es un interruptor independiente, así que tú decides qué eliminar — limpiar los controles de ancho cero y bidi conservando los emojis y las letras acentuadas legítimas, o normalizar los homóglifos de vuelta a ASCII. Una vista de antes/después muestra exactamente qué cambió y copias el resultado limpio con un solo clic. Nada que dañaría un texto multilingüe normal se elimina de forma predeterminada.

La detección y la limpieza se ejecutan enteramente en tu navegador — el texto que pegas, que puede ser él mismo una carga sospechosa, nunca sale de tu dispositivo.

Preguntas frecuentes

¿Qué son los caracteres invisibles o de ancho cero?

Puntos de código Unicode que se representan sin ningún glifo visible o como espacio en blanco ordinario — el espacio de ancho cero (U+200B), la unión de ancho cero (U+200D), la marca de orden de bytes (U+FEFF) y otros. Aparecen legítimamente en algunas escrituras y secuencias de emojis, pero fuera de contexto suelen ser ruido o un escondite para datos.

¿Cómo se relaciona esto con la inyección de prompt?

Los atacantes pueden incrustar instrucciones usando caracteres que un revisor humano no verá — ocultos en una secuencia de ancho cero o disfrazados con anulaciones bidi — de modo que el texto representado parece inofensivo mientras el modelo lee otra cosa. Eliminar estos caracteres antes de enviar el texto a un modelo suprime ese escondite.

¿Qué son los homóglifos?

Caracteres de escrituras diferentes que parecen idénticos, como la «a» latina y la «а» cirílica. Se usan para suplantar dominios, nombres de usuario y palabras clave; el limpiador puede señalar y normalizar los parecidos comunes de vuelta a sus equivalentes ASCII.

¿Eliminará los emojis o las letras acentuadas?

No, a menos que se lo pidas. Cada categoría es un interruptor independiente y los valores predeterminados preservan el texto multilingüe normal, incluidos los emojis y los signos diacríticos — solo se apunta a los caracteres genuinamente ocultos o engañosos.