DeepEval
Hoạt độngMô tả
DeepEval là framework đánh giá mã nguồn mở cho ứng dụng LLM.
DeepEval là framework đánh giá mã nguồn mở cho ứng dụng LLM.
Ragas là framework để đánh giá hệ thống RAG (Retrieval Augmented Generation).
TruLens là công cụ mã nguồn mở để đánh giá và theo dõi các ứng dụng LLM.
Helicone là nền tảng proxy và quan sát mã nguồn mở cho ứng dụng LLM, cung cấp tracing request, caching và phân tích chi phí.
GPT Engineer là công cụ AI tạo toàn bộ codebase dựa trên mô tả ngôn ngữ tự nhiên.