相关项目
TruLens
3.2k · Python
TruLens 是一个用于评估和跟踪 LLM 应用的开源工具。提供针对 RAG 应用的专门评估功能,包括上下文相关性、接地性和答案相关性等评估维度。
llmevaluationobservability +1
DeepEval
14.1k · Python
DeepEval 是一个用于 LLM 应用的开源评估框架。提供丰富的评估指标和工具,支持单元测试、集成测试,帮助开发者构建可靠的 LLM 应用。
llmevaluationtesting +1
Haystack
24.5k · MDX
Haystack 是企业级 RAG 与搜索应用框架,支持文档处理、检索、生成与评估全链路。
ragretrievalllm +1
LlamaIndex
47.7k · Python
LlamaIndex 是一个数据框架,用于构建 LLM 应用程序的数据连接层。它提供了强大的 RAG 能力,支持多种数据源和向量数据库。
ragllmindexing +1