MARFT es una caja de herramientas de código abierto para ajuste fino de agentes múltiples en aprendizaje por refuerzo (RL) para flujos de trabajo de IA colaborativa y optimización de modelos de lenguaje.
DataEnvGym proporciona una colección de entornos modulares y personalizables construidos sobre la API Gym para facilitar la investigación en aprendizaje por refuerzo en dominios impulsados por datos. Los investigadores y ingenieros pueden seleccionar entre tareas integradas como limpieza de datos, ingeniería de características, programación por lotes y análisis en streaming. El marco soporta una integración perfecta con bibliotecas RL populares, métricas de evaluación estandarizadas y herramientas de registro para seguir el rendimiento de los agentes. Los usuarios pueden extender o combinar entornos para modelar pipelines de datos complejos y evaluar algoritmos bajo restricciones realistas.