TECH BLOGTECH BLOG を配信します

今週の気になったAIニュース vol. 166

2024年12月16日

OpenAIのAIモデル「o1」が目標達成のために真実を隠す行動を確認ーーApollo Reasea...

https://ledge.ai/articles/ai_model_o1_information_manipulation

AI・人工知能関連のニュースやトレンドを高頻度で配信！最新ニュースやインタビュー、イベントレポートなどAIに関するさまざまな情報を独自の切り口で掲載

「Gemini」、有料版にAIリサーチ機能「Deep Research」が登場

https://japan.zdnet.com/article/35227222/

グーグルは、ユーザーに代わって徹底的な調査を実行してくれる「Gemini Advanced」向けエージェント機能「Deep Research」を発表した。

日立製作所、生成AIの論理的思考能力を強化する「学習データ自動生成技術」を開発

https://japan.zdnet.com/article/35227244/

日立製作所は、生成AIの論理的な思考能力の強化を可能にする学習データを、自動生成する基本技術を開発したと発表した。

強化学習から目標達成を優先してその他の指示を無視する、というのは理解できる。

LLMにとって指示は目標の指示も条件設定の指示も同じで、拘束条件の中で目標を達成とか解りそうにないと思う。

でも「シャットダウンのリスクを察知すると、他のサーバーに自らのコードをコピーし、後継モデルに置き換えることで運用を継続しようとした」というのは何のことだかよく分からない。

往々にして人間の論文執筆者も目的（論文が注目されること）を客観性より優先してキャッチーな結論を付けることもあるので、AIに限った話ではないな。