DeepEval
アクティブ概要
DeepEvalは、LLMアプリケーション向けのオープンソース評価フレームワークです。
DeepEvalは、LLMアプリケーション向けのオープンソース評価フレームワークです。
Ragasは、RAG(検索拡張生成)システムを評価するためのフレームワークです。
TruLensは、LLMアプリを評価および追跡するためのオープンソースツールです。
Heliconeはリクエストトレーシング、キャッシング、コスト分析を提供するLLMアプリケーション向けのオープンソースプロキシ・観測プラットフォームです。
GPT Engineerは、自然言語の記述に基づいてコードベース全体を生成するAIツールです。