TECH BLOGTECH BLOG を配信します

今週の気になったAIニュース vol. 134

2024年02月28日

fabcross for エンジニア - エンジニアのためのキャリア応援マガジン

ChatGPTの基盤技術Transformerを処理性能で5倍上回る、AIアルゴリズム「Mamba」 - ...

https://engineer.fabcross.jp/archeive/240220_mamba.html

新たなAIアルゴリズム「Mamba」の開発成果とされる論文が、2023年12月1日、プレプリントサーバー「arXiv」に掲載された。論文は、Mambaの性能について、ChatGPTを駆動するLLM（大規模言語モデル）の「

機械学習モデルの再学習でLoRAよりもより少ない計算コストと時間でより高いパフォ...

https://gigazine.net/news/20240220-dora-weight-decomposed-low-rank-adaptation/

大規模言語モデルや画像生成AIなどの機械学習モデルでは、ファインチューニングやLoRA(Low Rank Adaptation)といった手法によって、モデルの重みを微調整し、特定のタスクや目的に沿った出力を行うようにカスタマイズすることができます。香港科技大学の研究チームが、LoRAよりも計算コストと時間を削減できる新たな手法「DoRA(Weight-Decomposed Low-Rank Adaptation)」を発表しました。

AI-SCHOLAR | AI：(人工知能)論文・技術情報メディア

Metaがベイズ最適化の予想外の改善を実現

https://ai-scholar.tech/articles/bayesian-optimization/LogEI

3つの要点✔️ 評価のコストが高いシステムの効率的な最適化技術としてベイズ最適化がある✔️ 改善量の期待値（EI）を計算することで解の改善に必要な試行錯誤を削減可能✔️ パラメータが高次元の場合のEIの不具合を解決することで予想外の改善を達成Unexpected Improvements to Expected Improvement for Bayesian Optimizationwritten by Sebastian Ament, Samuel Daulton, David Eriksson, Maximilian Balandat, Eytan Bakshy(Submitted on 31 Oct 2023 (v1), last rev...

Transformerが5倍高速になったというニュースが出た。

実はTransformerの計算量はO(N^2)なのだが、これをO(N)にしたという技術としてTransformers are RNNs（https://arxiv.org/abs/2006.16236）というのが既にある。

ニュース記事を書いた人の理解度の問題なんだろうけど、言語・音声・ゲノム解析などで使えるとあっても、文章生成に使えるとは書いてないので、ChatGPTを引き合いに出すのはミスリードの可能性あり。

実はベイズ最適化の改善が一番大きなニュースかも。

様々なニューラルネットワークの学習において、ハイパーパラメーターの最適化によく使われるのがベイズ最適化なので、ここが良くなるのはかなり大きいはず。

optunaに実装されるのはまだかなー