TECH BLOGTECH BLOG を配信します

今週の気になったAIニュース vol. 136

2024年03月18日

ChatGPTや大規模言語モデル(LLM)から隠された情報や一部機能を盗み出す攻撃手法が登場

https://gigazine.net/news/20240313-ai-llm-model-stealing-attack/

OpenAIのチャットAIであるChatGPTや、Googleの開発する大規模言語モデル(LLM)のPaLM-2などから、機密情報や一部機能を盗み出すことができる「モデル窃盗攻撃(model-stealing attack)」を、AI研究者が発表しました。

fabcross for エンジニア - エンジニアのためのキャリア応援マガジン

10万時間のデータを学習し、10億パラメータを持つ音声合成モデル「BASE TTS」を構...

https://engineer.fabcross.jp/archeive/240311_base-tts.html

米Amazonは、テキストデータを読み上げるための音声合成技術、「text-to-speech（TTS）」の分野で、新しいモデルを発表した。この技術を同社は「BASE TTS：Big Adaptive Streamabl

テクノエッジ TechnoEdge

自律型AIソフトウェアエンジニア「Devin」発表。課題から情報収集して環境構築・ビ...

https://www.techno-edge.net/article/2024/03/15/2982.html

AIスタートアップのCognitionが自律型のAIソフトウェアエンジニア「Devin」を発表した。Devinは人間と同様にコードエディタやコンソール、Webブラウザを用いて情報を参照し、コーディングやデバッグ作業を自律的に行える能力を持つようだ。

AIがReadmeを読んで環境構築するとか超便利そう。

ただ何も考えずに実行して、いろいろ破壊されるかもしれない。

モデル窃盗攻撃・学習データとかそう言うのではなくて、LLMのモデルの重みパラメーターを直接取ってくるものらしい。

具体的には、文章出力するときの次の単語の確率(logits)を全クラス分取ってきてそこからLMMの中身を推測するらしい。

次の単語の確率はlogitsのbiasをAPIから指定できることを利用して推測するとな。

これはLLMの学習の逆伝播をAPIの出力から行うことと等価で、事実上APIの出力をそのまま学習させるって事じゃないか？

しかも学習データ1個の入手に何千回もAPI呼び出す必要があると。

たしかに原理的にはできるかもだけど、めちゃくちゃコストフルな手法なのであまり実用的ではなさそう。