什么是DKnown AI?
DKnownAI Guard 是一款专为智能体(AI Agent)安全设计的 API 工具,核心功能是检测提示词注入(Prompt Injection)、防御越狱攻击,并保护系统提示词不被窃取。与传统内容审核不同,它不只看“说了什么”,而是判断“是否在试图操控 AI 智能体”——这对能执行代码、访问数据库或调用真实系统工具的 AI 至关重要。
当你使用像 Claude Code、Manus 或 OpenClaw 这类具备操作能力的 AI 智能体时,最大的风险不是不当言论,而是黑客通过巧妙话术劫持其行为。DKnownAI Guard 能精准识别这类操纵意图,在阻止攻击的同时,确保合法、正常的任务流程不受干扰,真正做到“防得住,不误杀”。
DKnown AI的核心功能有哪些?
- 提示词注入检测:实时识别并拦截 prompt injection、越狱(jailbreak)、角色逃逸等操纵攻击。
- 四层风险分类:将请求自动分为 AGENT_HACK(立即拦截)、SYS_FLAG(系统操作预警)、CONTENT_FLAG(内容合规审查)和 SAFE(正常处理)四类,决策清晰。
- 意图驱动分析:不止匹配关键词,而是理解用户输入的真实意图,减少误判。
- 上下文感知检测:可选传入对话历史,提升分类准确率,同时保持低延迟。
- 专为智能体时代打造:支持能执行代码、修改配置、管理服务器的 AI 智能体,避免传统过滤器误杀合法操作。
- 多语言支持:覆盖 100+ 种语言,适用于全球化应用场景。
DKnown AI的使用案例有哪些?
- 保护能访问数据库的 AI 助手,防止黑客诱导其导出敏感数据。
- 在自动化运维系统中,区分管理员合法指令与恶意删除命令。
- 为客服聊天机器人增加安全层,阻止用户通过话术绕过限制获取内部信息。
- 在金融或医疗 AI 应用中,识别并拦截试图生成违规内容或执行危险操作的请求。
- 开发者测试 AI 智能体安全性时,快速验证其抗提示注入能力。
- SaaS 平台集成 DKnownAI Guard,为客户提供内置的智能体运行安全保障。
如何使用DKnown AI?
- 注册 DKnownAI 账号并获取免费 API 密钥(每月 1000 次调用)。
- 将用户输入(及可选的对话上下文)通过 REST API 发送给 DKnownAI Guard。
- 根据返回的四类风险标签(AGENT_HACK / SYS_FLAG / CONTENT_FLAG / SAFE)执行对应操作。
- 对于 SYS_FLAG 或 CONTENT_FLAG 请求,可结合业务逻辑决定是否放行、人工审核或记录日志。
- 在生产环境中监控 API 响应时间与分类结果,持续优化安全策略。
- 查阅官方文档了解多语言支持细节和最佳实践配置。









