초집중.
  • Home
  • About
Sign in Subscribe

RAG 평가

[AI Agent] LLM Evaluation Review (5주차)
RAG 평가

[AI Agent] LLM Evaluation Review (5주차)

생성형 AI 시대, 데모 제작은 빨라졌지만 검증 체계 구축이 더 중요해졌습니다. Golden Dataset, LLM-as-a-Judge, RAGAS를 활용한 체계적 평가 방법으로 RAG 시스템의 검색과 생성을 분리 평가하고, 평균이 아닌 실패 패턴 분석으로 운영 가능한 구조를 설계하세요.
Read More
초집중. © 2026
  • Sign up
Powered by Ghost