Agent Lightning

正常

GitHub Python MIT

简介

Agent Lightning 是微软开源的 AI Agent 训练框架，通过强化学习提升 Agent 能力。

ART（Agent Reinforcement Trainer）是一个使用 GRPO 算法训练多步 Agent 的强化学习框架，支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。

阿里巴巴通义实验室开源的深度研究 Agent，采用多阶段迭代式信息检索和推理架构，能够对复杂问题进行深度分析、综合和总结，支持网页搜索和文档分析。

Stream 开源的视觉与语音智能体框架，支持任意模型和视频提供商，利用边缘网络实现超低延迟的实时多模态 AI 交互。

专为复杂研究和预测任务优化的深度研究 Agent 框架，其 MiroThinker-1.7 和 MiroThinker-H1 模型在 BrowseComp 基准上分别达到 74.0 和 88.2 分，支持多步骤推理和信息检索。