hidekatsu-izuno 日々の記録

プログラミング、経済政策など伊津野英克が興味あることについて適当に語ります(旧サイト:A.R.N [日記])

「AI技術の最前線」から何が見えるか

Preferred Networks の創業者 岡野原さんの「AI技術の最前線」をひと通り読んだ。

岡野原さんは、以前から簡潔データ構造などアルゴリズム系で有名な方だったが、起業した PFI もいまや日本を代表する企業に育っており、すごいとしか言いようがない。

そういう経歴であるから、この「AI技術の最前線」も帯に書かれた手加減なしの言葉通り大変マニアックな仕上がりとなっている。読んだ感覚としては経済セミナーみたいな専門誌の記事に近い。日経ロボティクスの連載記事だったみたいなのだけれど i.i.d (独立同分布)など専門用語が特に説明なしに出てくる。この雑誌の読者層ってどこら辺の人なんだろ。背伸びして知識を得たい私には大変楽しいけれども。

AI技術の「最前線」を読んだ以上、やはりその先を予想したくなってしまうし、応用にも夢が膨らむ。

特にこの本を読んで得た気づきは「現実世界のデータ分布は多くが低次元多様体であり、機械学習はその特徴を利用している」という点だ。ここ最近、統計学に関してはある程度土地勘が付いてきたように感じているが、これは統計学サイドには見られない視点のように思う。

機械学習は汎用的であることに注目されるが、むしろ重要なのは特化した事前分布を汎用的に生成できる点にあるのではないだろうか。機械学習はデータが多いだけで理論的には統計学のサブセットに過ぎないと捉えると大きな間違いかもしれない。

日本のSIerの片隅にいる当方でも日々様々なシステムに関わっていると時代の変化は感じるわけだけど、最近の特にボトルネックとなるのがデータ量の多さだ。このご時世なのでシステムは1日でも止めたくないけれども、移行対象のデータが莫大すぎてデータをコピーするだけでも何日もかかってしまう。圧縮したくとも、特に画像データのようなものはすでに圧縮されているため、それ以上容量を縮めるのは難しく回避も困難な場合がある。しかし、この問題も先ほどの特徴を利用すれば解決できるかもしれない。

例えば、モデルだけを2台のマシンに事前に用意しておき、元の画像に近しい画像を双方で生成しその差分だけをネットワークで送る、というようなことができれば、極めて高速なデータ転送ができるのではなかろうか。zstd の辞書ベース圧縮の画像版と考えるとわかりやすいだろうか。

機械学習で利便性を得られる一方、(この本で扱われる範囲の広さがまさにそれを表しているが)機械学習の応用分野は多岐にわたる。DALL-E2 や Stable Diffusion が絵画にもたらしたような局所的なシンギュラリティはこれから多くの分野で起こることが予想される。

私も以前は絵を描いていたから、この度の騒動は他人事ではない。今はまだ一貫性の高い絵作りは難しいが、それも時間の問題だろう。正直、これから先、絵で食べていくのは大変になると思う。手描きの価値はこれからも残るだろうが、常に自動生成の絵と比較され単価も見合ったものになるとすれば困ったものだ。

現状でも、Youtube で似たような動画ばかりが推薦され、本当は見たいはずの動画にたどり着けないという問題があるが、今後、あなたの好みに合った作品(小説や映画)がコンピューターによって生成される未来が本当に実現したとき、どう受け止めればよいのか私にはわからない。今までは夢物語だったが、現在の状況を見ると10年先には現実的にあり得る世界だ。心を揺り動かす素晴らしい作品が次々と自動的に生成されてくる世界は必ずしも幸福な未来とは思えない。

もちろん、この本で語られるように人間ならば簡単に行えることが必ずしもコンピューターにも簡単にできるわけではない(例えば、多様な料理)、そもそも人間が行わなければ意味がない(例えば、承認行為)こともある。ただ、これまで以上に個々の作業は自動化され、人間に残された仕事は自動化されたタスクの間や人間とタスクの間をつなぐだけになっていくのだろう。そういえば、プログラマの仕事も最近はライブラリのつなぎこみと言えなくもない。

まぁ、私の仕事はSI(システムインテグレーター)なので、その分野は相変わらず残る可能性は高いのか。これだけは安心材料と言えるかもしれない。