개발자를 위한 Microsoft AI 에이전트 제어 툴: 텍스트로 AI 행동 테스트하기
식 페이지](https://commandline.microsoft.com/assert-written-intent-executable-evals/)에서 확인할 수 있다. ASSERT의 단점과 한계 단점 1 — 명세 문서화가 선행되어야 한다. ASSERT는 행동 명세(spec)가 사전에 문서화되어 있어야 제 기능을 발휘한다. (Microsoft Foundry 블로그) 정책이나 의도를 명문화하는 문화가 없는 팀이라면 툴 도입 전에 명세 작성 프로세스부터 구축해야 하며, 이는 적지 않은 선행 비용이다. 단점 2 — 정확성·성능 이외의 AI 안전 문제는 감지하지 못한다. 에이전트 평가는 정확성과 성능만 측정하며 AI 윤리나 안전 문제(편향, 유해 콘텐츠 생성 등)는 감지하지 못한다. (Microsoft Learn) 모든 테스트를 통과한 에이전트도 부적절한 응답을 낼 수 있으므로, 별도의 콘텐츠 안전 필터와 병행 운영이 필수다. ...