Evals

A framework for evaluating language models and LLM-powered systems.

OpenAI's framework for evaluating language models and LLM-powered systems.

Screenshot of Evals website

Recent stories

0 linked stories

No linked stories yet.