Skip to main content
 

TECH BLOGTECH BLOG を配信します

今週の気になったAIニュース vol. 183

Qwen3で中華モデルが猛威を振るう週かと思いきや米国製モデルもなかなか頑張っている。

MicrosoftのPhi-4、
>OpenAI o3-miniによる生成データなどを用いた教師ありファインチューニング

って、OpenAIからの知識蒸留は公然の秘密だと思っていたけど、堂々と書いているの初めて見た。

IBMは何か違うことトライしているらしい。過去の生成文の隠れ状態を保持する、っていうのは、TransformerよりRNN(LSTM)に近い動作に見える。

(そういえばTransformers are RNNsって論文があったなとおもって改めて調べてみたらもう5年間の話なのか・・・)