Skip to main content
 

TECH BLOGTECH BLOG を配信します。

今週の気になったAIニュース vol. 104

GPTの学種にはデータの質が重要とはずいぶん言われていたが、データの質を上げるより数を増やす方がコストがかからないのでデータ量とパラメーター数でなんとかするモデルが多い中、ソースコード限定で質に注目したモデルが登場。

データの質と上げるといったときに難しいのが、どのような文章が高品質か自動でチェックする事が難しかったから。

OpenAIはGPT4の論文で、まず文章の質をスコアリングするモデルを作ったと書いてあるのも併せて考えると興味深い。