Meta Agents Research Environments

相关项目

AssetOpsBench

1.7k · Python

活跃

IBM 开源的工业 4.0 AI Agent 基准与框架，提供 460+ 场景、4 个专业 Agent 和多智能体编排蓝图，用于工业资产运维领域。

industry-4.0benchmarkmulti-agent +2

Bernstein

539 · Python

活跃

面向 CLI 编码 Agent 的审计级多智能体编排平台，提供 HMAC 链式审计日志、签名 Agent 卡和制品溯源，支持气隙部署。

multi-agentauditcompliance +2

Deep Research Bench

738 · Python

活跃

深度研究 Agent 综合基准测试，提供系统化的深度研究能力评估框架，用于评测各类深度研究 Agent 的表现。

benchmarkevaluationdeep-research +2

AWS Agent Evaluation

364 · Python

不活跃

AWS Agent Evaluation 是亚马逊提供的 AI Agent 评估工具，支持对 Bedrock Agent 和其他 LLM Agent 进行自动化质量评估。提供多维度的评估指标和基准测试框架，帮助开发者持续改进 Agent 性能。