Внедряем то, что проверено на собственных проектах. Локальные модели, on-premise, без утечки данных. Все проекты под NDA.
RAG-пайплайны
Корпоративная база знаний с AI-поиском. Гибридный поиск: dense + BM25 + RRF — точнее, чем чистый семантический. Автоиндексация каждые 10 минут, источники из Confluence, GitLab, SharePoint. Сотрудник задаёт вопрос — получает ответ с ссылкой на документ. Без галлюцинаций: retrieval проверяем, а не доверяем.
Стек: Qdrant + Ollama (bge-m3) + LLM. Автоиндексация каждые 10 минут, p95 ответа < 200ms.
Чат-боты и AI-ассистенты
AI-ассистенты через REST API, встроенные в микросервисную архитектуру. MCP-сервер с набором инструментов: поиск по базе знаний, профили пользователей, аналитика. Guardrails: санитизация PII перед каждым вызовом LLM, защита от prompt injection, полный audit log. Телеграм, корпоративный мессенджер, голосовой интерфейс.
Голосовой пайплайн (Whisper → LLM → TTS), RAG-ассистенты, guardrails (PII-фильтр, prompt injection protection). Полный audit log.
Проактивный мониторинг
Дрифт-детектор проверяет расхождения конфигураций по расписанию, агенты отслеживают аномалии и инициируют алерты без участия оператора. Evidently для дрейфа данных, кастомные детекторы для инфраструктуры. Обнаружение до эскалации.
Стек: Prometheus + Evidently + Pusk (наш). 340 метрик, скользящее окно 5 мин, p99 детекции 14ms, автоматический drift detection.
AI-аудит кода
8 статических анализаторов (trivy, semgrep, shellcheck, hadolint) + 3 AI-модели в цепочке: черновик → глубокий разбор → верификация. Каждое утверждение AI маркируется: факт, мнение или ложноположительное.
Code Roast — публичный сервис. 8 SAST-анализаторов + 3 AI-модели, отчёт за 15 минут.
AI-платформа для IT-команды (IT4IT)
Полный цикл: от эксперимента до продакшена. Единая точка входа через API-шлюз — маршрутизация между провайдерами, fallback-цепочки, квоты и логирование токенов по проектам. Мультитенантная изоляция на всех уровнях: namespace, сеть, API-ключи. Контроль расходов: локальные модели для типовых задач, внешние провайдеры, где требуется качество. 5 слоёв архитектуры, каждый — проверенный open-source.
Инфраструктура
K8s, GPU (MIG), S3-хранилище, Vault PKI
ML-ядро
MLflow, Feature Store, DVC, Model Registry
Инференс
vLLM, Triton, API Gateway, автоскейлинг
Безопасность
PII-фильтр, RBAC/OPA, Sigstore, audit log, guardrails
Приложения
RAG, AI-агенты, Copilots, кастомные приложения
Стоимость
Консультация
Аудит стека, рекомендации по архитектуре, подбор промышленных open-source аналогов, письменный отчёт
от 15 000 ₽
MVP / пилот
RAG или чат-бот под ключ, интеграция с вашими данными, деплой на вашей инфраструктуре, 2 недели поддержки
от 150 000 ₽
AI-платформа
Полный цикл IT4IT, мультитенантная архитектура, MLOps + мониторинг дрейфа, обучение вашей команды