
Googleから実用上役に立ちそうなライブラリ。RAG案件って結局ナレッジのMarkdown化が重いので。後は神エクセルをなんとかする方法論を確立してくれれば・・・。
ファインチューニングのデータ数を減らす方法は、たぶん実務的には経験則として知られていた方法なんだけど、きちんとまとめてメソッド化したというところか。
データだけ渡されて性能が出なかったときに、ベースモデルをあっちにしてこっちにしてとか言われたらこの論文を見せよう。
結局データをきちんと作り込むのが重要という、機械学習の基本に立ち返るのだ。