Qu'est-ce que DKnown AI ?
DKnownAI Guard est une API de sécurité spécialement conçue pour les agents IA capables d’exécuter du code, d’accéder à des fichiers ou d’interagir avec des systèmes réels. Contrairement aux outils classiques de modération de contenu qui se concentrent sur la nature du texte, DKnownAI détecte en amont les tentatives de manipulation, comme les injections de prompt ou les jailbreaks, afin de protéger votre agent sans entraver ses fonctions légitimes.
Grâce à une classification intelligente en quatre niveaux de risque, cette solution vous permet de bloquer immédiatement les attaques tout en laissant passer les requêtes normales. Que vous utilisiez Claude Code, Manus ou OpenClaw, DKnownAI Guard préserve l’autonomie de votre agent tout en le gardant sécurisé face aux menaces modernes.
Quelles sont les caractéristiques de DKnown AI ?
- Détection d’injection de prompt : Identifie et bloque les tentatives de détournement via des instructions trompeuses ou des échappatoires de rôle.
- Classification en quatre niveaux : Classe chaque requête en AGENT_HACK, SYS_FLAG, CONTENT_FLAG ou SAFE pour une réponse précise et adaptée.
- Analyse basée sur l’intention : Va au-delà des mots-clés pour comprendre si l’utilisateur cherche à manipuler l’agent ou non.
- Prise en compte du contexte conversationnel : Option pour inclure l’historique de la discussion et améliorer la précision, avec un impact minimal sur la latence.
- Conçu pour les agents actifs : Fonctionne avec des IA qui exécutent des actions réelles (exécution de code, modification de bases de données), là où les filtres traditionnels échouent.
- Support multilingue : Compatible avec plus de 100 langues, y compris le français.
Quels sont les cas d'utilisation de DKnown AI ?
- Protéger un assistant IA interne capable de modifier des configurations serveur contre les tentatives de piratage par injection de prompt.
- Filtrer les commandes système sensibles (comme « supprime la base de données ») sans bloquer les requêtes utiles comme « explique comment sauvegarder une base ».
- Séparer clairement les contenus à risque réglementaire (ex. fabrication de faux documents) des opérations techniques légitimes.
- Intégrer une couche de sécurité dans un agent de développement (comme Claude Code) pour éviter qu’un utilisateur malveillant n’exécute du code dangereux.
- Permettre à une équipe produit de traiter automatiquement les requêtes sûres tout en alertant les développeurs sur les opérations à haut risque.
- Déployer un chatbot client capable d’accéder à des APIs internes, sans craindre qu’un utilisateur ne le pousse à divulguer des données sensibles.
Comment utiliser DKnown AI ?
- Inscrivez-vous gratuitement sur DKnownAI Guard pour obtenir vos clés API.
- Intégrez l’API REST dans votre pipeline d’entrée avant que la requête n’atteigne votre agent IA.
- Envoyez chaque message utilisateur (avec ou sans contexte) à l’endpoint de classification.
- Selon la réponse (AGENT_HACK, SYS_FLAG, etc.), appliquez la politique correspondante : bloquer, alerter, modérer ou traiter normalement.
- Utilisez le mode contextuel si votre agent gère des conversations longues pour améliorer la précision.
- Surveillez vos logs pour ajuster vos règles de gestion des catégories SYS_FLAG et CONTENT_FLAG.









