Chat-With-CUHKSZ предоставляет упрощённую платформу для создания специализированного чатбота на основе базы знаний CUHKSZ. После клонирования репозитория пользователи настраивают свои учетные данные API OpenAI и указывают источники документов, такие как PDFs кампуса, веб-страницы и научные статьи. Инструмент использует LlamaIndex для предварительной обработки и индексации документов, создавая эффективное векторное хранилище. LangChain управляет извлечением информации и подсказками, доставляя релевантные ответы в диалоговом интерфейсе. Архитектура поддерживает добавление пользовательских документов, настройку стратегий подсказок и развертывание через Streamlit или Python-сервер. Также доступны опциональные улучшения семантического поиска, ведение журналов запросов для аудита и возможность расширения на другие университеты с минимальной настройкой.
Основные функции Chat-With-CUHKSZ
Загрузка и разбор документов (PDF, текст)
Векторное индексирование через LlamaIndex
Генерация с помощью поиска и дополнения через LangChain
Agentic-RAG-DeepSeek объединяет агентное управление с техниками RAG для обеспечения передовых диалоговых и исследовательских приложений. Сначала он обрабатывает корпус документов, создавая векторные представления с помощью LLM и сохраняя их в векторной базе данных DeepSeek. Во время работы AI-агент извлекает релевантные участки, создает контекстно-зависимые подсказки и использует LLM для синтеза точных, кратких ответов. Эта структура поддерживает итеративные мнослойные рабочие процессы, операциями на основе инструментов и настраиваемыми политиками для гибкого поведения агента. Разработчики могут расширять компоненты, интегрировать дополнительные API или инструменты и отслеживать работу агента. Будь то создание динамических систем вопросов и ответов, автоматизированных исследовательских помощников или тематических чатботов, Agentic-RAG-DeepSeek обеспечивает масштабируемую, модульную платформу для решений на базе поиска и AI.