Meta Agents Research Environments
活跃简介
Meta 开源的动态 Agent 评测平台,在演化环境中测试多模态 Agent 的策略适应能力。
Meta 开源的动态 Agent 评测平台,在演化环境中测试多模态 Agent 的策略适应能力。
IBM 开源的工业 4.0 AI Agent 基准与框架,提供 460+ 场景、4 个专业 Agent 和多智能体编排蓝图,用于工业资产运维领域。
面向 CLI 编码 Agent 的审计级多智能体编排平台,提供 HMAC 链式审计日志、签名 Agent 卡和制品溯源,支持气隙部署。
深度研究 Agent 综合基准测试,提供系统化的深度研究能力评估框架,用于评测各类深度研究 Agent 的表现。
AWS Agent Evaluation 是亚马逊提供的 AI Agent 评估工具,支持对 Bedrock Agent 和其他 LLM Agent 进行自动化质量评估。提供多维度的评估指标和基准测试框架,帮助开发者持续改进 Agent 性能。