Model Robustness

Sign in / Sign up

Model Robustness articles

Dirichlet Distribution Output Layers for Uncertainty in Classification

by Peter de Blanc + ChatGPT Deep Research 8 months ago

01

#Neural Networks #epistemic uncertainty #multi-label classification more...

Motivation and Concept of Dirichlet Outputs In a standard classifier, the softmax output gives a single categorical distribution for each input, but it cannot express **uncertainty about that dist...

Tutorial: Building, Running, and Publishing a Custom LLM Evaluation

by Peter de Blanc + ChatGPT Deep Research 9 months ago

00

#Large Language Models #Machine Learning #Model Performance more...

Evaluating large language models (LLMs) on novel tasks (like game-playing) requires careful planning. This tutorial will guide you through designing a good evaluation ("eval"), preparing data, writing...