trulens-dataset-curation

Name: trulens-dataset-curation
Availability: InStock
Author: truera

Official

Create and curate ground-truth evaluation data.

Data & Analytics #evaluation #pandas #dataset #data-management #ground-truth #TruLens

Authortruera

Version1.0.0

Installs0

System Documentation

What problem does it solve?

Creating reliable evaluation data for LLMs is time-consuming and error-prone. This Skill helps you build ground-truth datasets that enable consistent measurement of model outputs against expected responses, chunks, and retrieval results, empowering teams to track improvements across versions.

Core Features & Use Cases

Ground-truth dataset structure: query, query_id, expected_response, and expected_chunks fields.
Easy persistence and retrieval with TruLens to support versioned evaluations.
Facilitate sharing and collaboration across teams to standardize evaluation.

Quick Start

Install prerequisites: pip install trulens pandas
Initialize TruSession from trulens.core import TruSession session = TruSession()
Build a dataset import pandas as pd data = { "query": ["What is TruLens?"], "expected_response": ["TruLens is an open-source library for evaluating and tracing AI agents."], "expected_chunks": [["TruLens"]] } ground_truth_df = pd.DataFrame(data)
Persist and load session.add_ground_truth_to_dataset(dataset_name="my_dataset", ground_truth_df=ground_truth_df, dataset_metadata={"domain":"TruLens QA","version":"1.0"}) df = session.get_ground_truth("my_dataset")

trulens-dataset-curation

System Documentation

What problem does it solve?

Core Features & Use Cases

Quick Start

Dependency Matrix

Required Modules

Components

💻 Claude Code Installation

Agent Skills Search Helper