Agent Lightning
正常简介
Agent Lightning 是微软开源的 AI Agent 训练框架,通过强化学习提升 Agent 能力。
Agent Lightning 是微软开源的 AI Agent 训练框架,通过强化学习提升 Agent 能力。
ART(Agent Reinforcement Trainer)是一个使用 GRPO 算法训练多步 Agent 的强化学习框架,支持为 Qwen、Llama 等模型进行在职训练以完成真实世界任务。
阿里巴巴通义实验室开源的深度研究 Agent,采用多阶段迭代式信息检索和推理架构,能够对复杂问题进行深度分析、综合和总结,支持网页搜索和文档分析。
Stream 开源的视觉与语音智能体框架,支持任意模型和视频提供商,利用边缘网络实现超低延迟的实时多模态 AI 交互。
专为复杂研究和预测任务优化的深度研究 Agent 框架,其 MiroThinker-1.7 和 MiroThinker-H1 模型在 BrowseComp 基准上分别达到 74.0 和 88.2 分,支持多步骤推理和信息检索。