論文紹介：TISE: Bag of Metrics for Text-to-Image Synthesis Evaluation (ECCV2022)

こんにちは、品川です。この記事は画像生成AI Advent Calendar 2022 14日目の記事です。

ECCV2022の論文をサーベイしていてテキストからの画像生成の評価指標の研究を見つけて面白そうだと思いまして、この機会にまとめてみたので紹介したいと思います。

論文：https://www.ecva.net//papers/eccv_2022/papers_ECCV/html/5685_ECCV_2022_paper.php
著者実装：https://github.com/VinAIResearch/tise-toolbox

まとめ自体はspeakerdeckにあげたので、こちらを見ていただければと思います。

最初はてっきりDiffusion系で比較しているのかと思ったらまさかのGANこれくしょんでした。ECCV投稿締め切り当時はまだGANも幅を利かせてたんでしたっけ？隔世の感・・・

読んでみたらちょっともやっとするところもありましたが、テキストからの画像生成の評価はまだまだ手薄で、せいぜいFIDやR-precisionにばかり頼っているところがあるので、希少性が評価されたのかなと思います。

Twitterでも最近話題になっているのを目にしますが、画像生成の評価は今後もますます重要ですね。どんどん盛り上がっていったらいいなと個人的には思います。私の学生さんもテキストからの画像生成の評価関連でぼちぼち学会投稿を狙っているので、楽しみにしていただけたらと思います（適度なプレッシャーをかけていくスタイル）