TM taskmind.ru / engineering profile
AI systems architect

Hybrid AI Runtime / Agent Workflows / Automation

Архитектура AI-систем для private, enterprise, cloud-assisted и self-hosted сред.

Инженерный профиль в области AI systems architecture, hybrid AI runtime и enterprise integration. Основной фокус — локальные и облачные LLM, агентные рабочие процессы, RAG, MCP/tools, self-hosted инфраструктура и эксплуатационная надежность.

Инженерный фокус

Зрелый инженерный профиль на стыке backend, инфраструктуры, AI-практик и способности доводить систему до устойчивого рабочего состояния.

AI Systems Architecture

Не чат-бот поверх данных, а инженерная AI-среда: модель, контекст, инструменты, память, проверка, ограничения доступа и эксплуатационный контроль.

Hybrid AI Runtime

Локальные и облачные LLM, Open WebUI, llama.cpp, private/cloud RAG, fine-tuning readiness и model-serving контуры с осознанным управлением данными.

Agent Workflows & Tools

Controlled agent workflows, MCP servers, custom tools, n8n/Flowise и сценарии, где агент работает внутри проверяемого инженерного контура.

RAG / Vector Memory

pgvector-backed memory, retrieval pipelines, document ingestion, локальная база знаний и подача релевантного контекста в AI-инструменты.

Enterprise Integration

API-интеграции, ECM/документооборот, ESB-контуры, PLM/ERP, SSO/AD и работа с legacy-системами без потери эксплуатационной устойчивости.

Production Operations

Self-hosted инфраструктура, Dockerized AI services, observability, диагностика, деплой и сопровождение сервисов в рабочей среде.

Harness engineering

AI здесь не как декоративный термин, а как LLM execution harness: входные данные, инструменты, память, MCP-интеграции, проверки, обратная связь и возврат результата в рабочий процесс.

Harness

Среда, в которой агент получает контекст, вызывает MCP tools, проверяет результат, сохраняет память и выполняет задачу повторяемо, а не случайным промптом.

tool calling MCP servers evals RAG local memory

Ralph Loop

Практический цикл AI-assisted engineering: observe, decompose, execute, verify, persist и continue без потери управляемости.

observe decompose execute verify persist continue

Dark Factory Discipline

Подход к lights-out software delivery: человек задает архитектуру, ограничения, acceptance criteria и safety rails; агенты выполняют работу внутри наблюдаемого контура.

issue specs review chain observability guardrails

Task Intelligence

Пакетный анализ инженерных задач и заявок: MCP/OpenAPI-инструменты, контекст в режиме только чтения, промежуточные сводки и генерация рабочих документов по итогам.

issue trackers OpenAPI tools batch analysis documentation

Опыт

Основной акцент: промышленная разработка, архитектурные изменения и эксплуатация систем, которые живут не только на демо-стенде.

Lead Software Engineer / System Architect
2020 — настоящее время

Архитектурная трансформация enterprise-приложений, перевод legacy-платформ на Spring Boot, внедрение observability, автоматизация процессов разработки и практическая интеграция AI-инструментов в инженерный цикл.

Senior Java Developer
2015 — 2020

Развитие и поддержка тяжелых производственных систем, API-интеграции, ECM/документооборот, ESB-контуры, PLM/ERP и сопровождение сложных legacy-доменов.

Independent Infrastructure Practice
self-hosted / active

Taskmind.ru и смежные сервисы как рабочая инфраструктурная лаборатория: VPS, Nginx, Docker, n8n, Flowise, Open WebUI, защищенный доступ, RAG-пайплайны, MCP-интеграции и локальные AI-компоненты.

Стек и среда

Сильная сторона профиля — широкий инженерный слой: AI runtime, интеграции, backend на разных стеках, инфраструктура, контейнеры и локальная память.

Engineering Stack

Python, JavaScript/TypeScript, C#, Java/Spring Boot, REST/SOAP APIs, Kafka, RabbitMQ, ESB, ECM/document management, PLM/ERP integrations.

DevOps

Linux, Docker, Proxmox, k3s, Nginx, CI/CD, quality gates, observability, monitoring and production operations.

AI Stack

Claude Code, Codex, Cursor, Gemini Code Assist, Google Antigravity 2.0, Ollama, LM Studio, llama.cpp, pgvector, Qdrant, Flowise, n8n.

AI Runtime & RAG

Open WebUI configuration, H2O RAG / h2oGPT experiments, local retrieval pipelines, pgvector memory, model routing, MCP servers and custom tools for practical agent workflows.

Document AI

Docling/docling-serve, Tika, Marker, chunking strategy, embeddings and offline model cache workflows for private knowledge bases.

Hybrid AI Runtime

llama.cpp deployments, OpenAI-compatible local endpoints, cloud model APIs, long-context inference, GPU/RAM-aware model serving and controlled data paths.

Model Adaptation

Fine-tuning strategy, LoRA/adapters, domain datasets, eval sets and model behavior tuning when prompt engineering and RAG are not enough.