DeepEval
ActiveDescripcion
DeepEval es un framework de evaluacion de codigo abierto para aplicaciones LLM.
DeepEval es un framework de evaluacion de codigo abierto para aplicaciones LLM.
Ragas es un framework para evaluar sistemas RAG con varias metricas incluyendo fidelidad, relevancia de respuestas y precision del contexto.
TruLens es una herramienta de codigo abierto para evaluar y rastrear aplicaciones LLM.
Helicone es una plataforma de observabilidad para LLMs que proporciona registro, monitoreo y analisis de costos.
GPT Engineer es una herramienta de IA que genera bases de código completas basadas en descripciones en lenguaje natural.