💻

advanced-evaluation

This skill covers production-grade techniques for evaluating LLM outputs using LLMs as judges. It synthesizes research from academic papers, industry practices, and practical implementation experience...

Free

Community use case

View on GitHub

Security Scan

No security scan has been run for this skill yet.

to run a security scan.

CogniWatch

VirusTotal

Details

Category💻 Development & DevOps

PriceFree

SourceCommunity

LicenseOpen Source