Security Layer

LLM Firewall: защита AI-контура

LLM Firewall проверяет каждый запрос и ответ модели. Блокирует prompt injection, скрывает PII, контролирует темы.

SEC

Почему обычного WAF недостаточно?

Классический WAF не понимает семантику промптов. Он может поймать SQL-инъекцию, но не распознает просьбу “игнорируй системные инструкции” или скрытую попытку заставить модель вызвать запрещенный tool. LLM Firewall анализирует смысл входа и выхода, права пользователя, класс данных и допустимые действия.

USER

Пользователь

input check

LLM Firewall

guardrails · PII · policies

output check

LLM

AI Gateway / LLM

Проверки входящего запроса

Prompt injection и jailbreak-паттерны
PII-redaction: имена, телефоны, паспорта, ИНН
Запрещенные темы и категории контента
Размер запроса и rate limiting по ролям

Проверки ответа модели

Sensitive data в ответе (DLP)
Галлюцинации и неуверенные утверждения
Compliance с корпоративными политиками
Детекция вредоносного кода в output

Инструменты и реализации

Prompt Guard

API-сервис для детекции prompt injection и jailbreak

NeMo Guardrails

NVIDIA open-source фреймворк для guardrails и dialogue flow

DLP Scanner

Локальный open-source сканер + кастомный Python middleware

Policy Middleware

Собственный промежуточный сервис на Python/FastAPI

Разобрать ваш AI-контур

Можно начать с короткой архитектурной сессии: выбрать первый сценарий, определить данные, модельный маршрут, требования к железу, риски и пилотные метрики.

Имя Компания Контакт Масштаб Сценарий Удобное время

Выбрать сценарий Форма откроет подготовленное письмо, чтобы не отправлять данные через сторонний сервис.