大喜利データセット。
画像からテキストのやつって、どう見てもアレのデータだよね・・・
自分は日本は生成AIにおいて負け組の側だとずっと思っていたんだけど、データセットの中身については、日本初のデータというのがかなりあったりする。(画像生成だったらAnime-styleとか)
日本人のインターネットの使い方が特殊だって言うのがあるんだろうけど、こうしたデータの側で存在感を出していければ、ワンチャン逆転の目もあったりするのか・・・?
(でも収集してまとめてくれるのも、モデルを作って商用展開するのも、ほとんど海外だけど)