LLM-as-a-Judge

LLM出力をどう評価するか?LLM-as-a-Judgeを使った実運用の話 #PERSOL CAREER Advent Calendar2025

HR forecasterで新機能「求人票AIアドバイザー」を紹介し、LLM-as-a-Judgeによる評価の取り組みを解説する。

生成AIアプリケーション開発における最適な開発スタイルの考察

はじめに 生成AI技術の進化に伴い、企業が生成AIアプリケーションの開発に挑戦する機会が増えています。しかし、従来のソフトウェア開発手法では、生成AI特有の課題に十分に対応しきれない場面も多く見られます。モデルの予測不能な挙動やUX設計上の不確実性…

社内向け生成AIチャットサービス:社内文書検索機能の正式版リリースとLLM-as-a-Judge導入に向けた改善の取り組み

はじめに 現代企業の中で、業務効率向上のためには、膨大な社内情報を効率的に管理し、迅速にアクセスする能力が必要です。特に、ExcelやPowerPointのような非構造化データを含む社内文書の検索は、知識管理の重要な課題となっています。弊社では、この課題…