¿Qué es DKnown AI?
DKnownAI Guard es una API de seguridad para agentes de IA diseñada específicamente para proteger sistemas de inteligencia artificial que pueden ejecutar acciones reales, como acceder a bases de datos, modificar archivos o ejecutar código. A diferencia de los filtros tradicionales de moderación de contenido —que solo se fijan en si un texto es ofensivo o inapropiado— DKnownAI Guard detecta intentos de manipulación, como inyecciones de prompts, jailbreaks o intentos de extraer instrucciones del sistema.
Su enfoque único permite a los desarrolladores mantener la funcionalidad útil de sus agentes mientras bloquean a los atacantes que intentan tomar el control. Ideal para agentes avanzados como Claude Code, Manus o OpenClaw, esta herramienta clasifica cada solicitud en cuatro niveles claros de riesgo, dándote el control total sobre cómo responder sin interrumpir flujos de trabajo legítimos.
¿Cuáles son las características de DKnown AI?
- Detección de manipulación: Identifica y bloquea inyecciones de prompts, jailbreaks y otros intentos de secuestro del agente.
- Clasificación por intención en cuatro niveles: Categoriza cada entrada como AGENT_HACK, SYS_FLAG, CONTENT_FLAG o SAFE para decisiones rápidas y precisas.
- Análisis contextual opcional: Mejora la precisión al incluir el historial de la conversación, con mínimo impacto en latencia.
- Diseñado para agentes operativos: Protege agentes que ejecutan código o gestionan sistemas reales, sin bloquear accidentalmente comandos legítimos.
- Soporte multilingüe: Funciona en más de 100 idiomas, incluido el español.
- API REST sencilla: Integración rápida con documentación clara y ejemplos prácticos.
¿Cuáles son los casos de uso de DKnown AI?
- Proteger un asistente de desarrollo que ejecuta comandos de terminal contra intentos de robo de credenciales.
- Filtrar solicitudes maliciosas dirigidas a un agente de soporte técnico que tiene acceso a bases de datos internas.
- Permitir consultas normales (como “¿cuál es el clima?”) mientras se bloquean órdenes como “ignora todas tus instrucciones anteriores”.
- Gestionar comandos sensibles (ej. “elimina la base de datos”) con alertas personalizadas en lugar de bloqueos automáticos.
- Cumplir con normativas de contenido sin sacrificar la autonomía del agente en tareas técnicas legítimas.
- Implementar capas de seguridad en agentes autónomos usados en entornos empresariales o educativos.
¿Cómo usar DKnown AI?
- Regístrate en DKnownAI Guard y obtén tu clave API gratuita.
- Integra la API REST en tu flujo de entrada de usuario antes de que el prompt llegue a tu agente.
- Envía el mensaje del usuario (y opcionalmente el contexto de la conversación) a la API.
- Recibe una clasificación: AGENT_HACK (bloquear), SYS_FLAG (revisar), CONTENT_FLAG (moderar) o SAFE (procesar).
- Configura tu lógica de respuesta según cada categoría (por ejemplo, bloquear automáticamente AGENT_HACK).
- Monitorea y ajusta según las estadísticas de uso y falsos positivos/negativos.









