TECH BLOGTECH BLOG を配信します

今週の気になったAIニュース vol. 181

2025年04月21日

www.itmedia.co.jp

「異議あり！」――AIが「逆転裁判」をプレイ　最も“推論性能”が高いモデルは？　米...

https://www.itmedia.co.jp/aiplus/articles/2504/16/news189.html

ゲーム「逆転裁判」をAIにプレイさせ、推論性能を測る――米カリフォルニア大学サンディエゴ校の研究機関・Hao AI Labは4月16日（日本時間、以下同）、こんな実験の結果を公開した。米OpenAIが15日にリリースしたAIモデル「GPT-4.1」など、最新モデルも含め、複数のAIモデルの性能を比較したという。

マイクロソフト、「Copilot Studio」にcomputer use機能を追加--ウェブサイトやア...

https://japan.zdnet.com/article/35231963/

マイクロソフトは米国時間4月16日、「Copilot Studio」に「computer use」機能を追加したと発表した。

OpenAI、新たな推論モデル「o3」と「o4-mini」公開　画像も“考える”

https://www.watch.impress.co.jp/docs/news/2007481.html

OpenAIは16日(米国時間)、推論モデルの最上位となる「Open AI o3」と「o4-mini」を発表した。いずれも素早く応えるよりも、長く考えて最適な答えを導くようトレーニングした推論モデルで、「これまでで最も賢いモデル」としている。

逆転裁判でAIの性能を把握する試み、LLaMa4ってこんなに低かったの。

ゲームというのは人間が楽しむために作られているので、それを対話的にプレイする能力というのはAI評価軸として面白い試みかもしれない。

人間なら普通こう考えてひっかかるよね、というトラップに対して、「人間と同じようにひっかかる」AIが正しいのか、「人間では気づけない事柄に気づいて判断する」AIが正しいのか・・・。