相关项目
Ragas
13.6k · Python
Ragas 是一个用于评估 RAG(检索增强生成)系统的框架。提供多种评估指标,包括忠实度、答案相关性、上下文精确度等,帮助开发者优化 RAG 应用性能。
ragevaluationllm +1
TruLens
3.3k · Python
TruLens 是一个用于评估和跟踪 LLM 应用的开源工具。提供针对 RAG 应用的专门评估功能,包括上下文相关性、接地性和答案相关性等评估维度。
llmevaluationobservability +1
Awesome AI Apps
10.2k · Python
展示 RAG、智能体、工作流和其他 AI 用例的项目合集,提供丰富的实践示例和教程资源。
agentragworkflow +1
MemAgent
1.0k · Python
可扩展至 350 万上下文 token 的记忆智能体框架,附带用于任意智能体工作流 RL 训练的训练框架,解决长上下文记忆难题。
memoryagentrag +2