Что такое RAG?
Вместо дообучения модели на миллионах документов RAG динамически находит нужные фрагменты в момент запроса. Документы парсятся, разбиваются на смысловые блоки, превращаются в embeddings и сохраняются в vector store. При вопросе пользователя система подбирает релевантный контекст и передает его в LLM вместе с источниками.