MARFT — это открытый исходный код многопользовательский набор инструментов для тонкой настройки обучения с подкреплением нескольких агентов для совместных работ ИИ и оптимизации языковых моделей.
MARFT — это основанный на Python инструмент для больших языковых моделей (LLM), позволяющий воспроизводить эксперименты и быстро прототипировать системы совместного ИИ.
DataEnvGym предлагает коллекцию модульных и настраиваемых сред, построенных на API Gym, что облегчает исследования в области обучения с подкреплением в сферах, основанных на данных. Исследователи и инженеры могут выбрать встроенные задачи, такие как очистка данных, создание признаков, планирование пакетных задач и потоковая аналитика. Фреймворк поддерживает бесшовную интеграцию с популярными библиотеками RL, стандартизированные метрики оценки и инструменты логирования для отслеживания эффективности агентов. Пользователи могут расширять или объединять среды для моделирования сложных конвейеров данных и оценки алгоритмов в реалистичных условиях.