松田語録:Google Genie〜「アクション」が可能な動画生成AI
さあ次はいよいよAIじゃないかという気 がするんですけども何の話でしょうかや 辞任の話ですあああのコメントでもあり ましたねあのはいいや私も中身全然分かっ てないんですけどコメントで出てたなとな んだろうなと思ってたんですけども何の話 何ですか一体いやこれはGoogleがね 出したま新しいAIなんだけどああこれが 動画制作愛ってまずあれがあの 空が出たじゃないですかはいはいオープA からはいうんで僕はね実は今日の勉強会で あのそのジニのあのブログとそれから ペーパーのま前半読みはいそれの解説動画 を3本見たいんですわえうんではジニーと いうのはGoogleの出した動画え動画 生成AIなんですがこれがねまずねその 1番ま 詳しいあのYouTubeはいでこれ物理 学者の人が作ってるやつなんやけどおで それがねまず最初こういうことまず空と いうのがあるとで空っていうのはま動画 生生ですよねでそれに対抗してあのヤン官 がvjpというのを出したとはいはいはい これね調べるとねVちゅうのはねなんてゅ かブログあるけど実物実際にあの 動画作ったちゅうの僕は見てないんですが ああはあはで空はすごいがあるわけですね はいでそれに対しねヤル感が文句言ってる わけあんなもんダメだってうんねで大きな 誤解があるとねで実際ね重要なの アクションをはいやることだとで彼のVJ パの中にねはいすに次のアクションを アクションすることによってまま場面が 決まるというようなことがあってだから アクションという概念がないとダメなん だっていうことをま彼が言うてるわけよ そのやる感がねはいはいうんところが まさにジニていうのはねそのアクションを 取り入れてるわけよはい ああでさらにすごいのはですただまま どんなものかいうとあの動画生成なんだ けどでそのYouTuberこういうあの 空で有名なあのシーンあの新宿をですね あの女の人が歩いてくるシーンがある でしょあのあのサングラスかけたねはいで あの空ちゅうのはこうテキストプロンプト を書いてそれをそのままねそれがすごい リアルだっていうことはいいんだけどはい 単にそれがそのままずっと流れるだけだと はいはいでそこにアクションという概念は ないとはいはいはいでもしねここでそこで まその女の人にねそこで立ち止まって 振り返って逆向きに歩きなさいとかうん あるいはそっからタクシーに乗りなさいと かそういう風なねま何かね途中であせこせ
みたいなねコマンドを入れられないわけ ですよねああ入れられないんですかま入れ てるやつなさそうな感じがしましたけど いやそれ最初に入れとくのはいいよ ああどういうことですかいやいや最初に プロンプトでまねね女性が歩いてきてある ところで立ち止まって振り返って逆向きに 歩くという風に言うとけばそれそうなるよ はいはいはいでも今度はそれはそれそう なるだけであってはいはいはいとはゲー ムっちゅうのはねね見ててあそのボタンと かなんか操作することによってですねこう どとでも変えられるじゃないですか そこ言うわそれがアクションだおうんで その地味ちゅうのはですねそのアクション あヤル感が言うのアクションが入らないと ダメだと言ってんのねだから空みたいな ものはダメだと言ってあおでだけどジニー はアクションが入ってるわけですよあおだ からYouTuberね最初ねその空とん からあのvjpとのがあってま空が オープンエででメタだからGoogleが 今あのジニちゅうの出してきたからこんな とこにこうねまこここかなとか言ってでも よく見るとそんなもんじゃないんだとジニ ちゅうのはね空とかあのジパーとよりも 上位のもっと高度なもんなんだってだから その上に来るんだっていううん ふーつまりでしかもすごいのはねその アクションま実際にやってんのはゲームと いう非常に簡単なシーンしかま今実はでき てないのよおおでだけどこれはねゲームを アクションをやんのんですねどういう アクションをするというのがねゲームの 動画をずっとたくさん見てあな何時間ち 言ったかな10万時間かななんか ものすごい量の動画ゲーム動画を見てはい そこでアクションを学ぶんだおおで例えば まキャラクターがこうあって次にここ飛ん でたらねここへ飛ぶというアクションがあ るってことを学ぶんだ うんこれはねヤルカが盛に前言ってたよう に赤ちゃん子供ちゅうのはねま世の中 いっぱい見ることによってねでを学習する て世界モデル作るて言ってるわけよでその 点に今のllmはそれがかけとるっていう 批判してるわけだけど今いたジニーはです ねまさにものすごい量のYouTubeを 見ることによって世界がどうなってるか 行動まで含めて学習してるっていうわけよ ああはあはあうんだからまだ今は非常に 単純なもんなんだけどうんこの将来性って のがすごいよとただ計算時間すごいよ でまあまあそういう話ですようんうんで そういう話をま勉強会でまあまあ勉強し
たらある人が面し例え言ってたけどあ なるほどなって例えばね春急戦ってあのえ 2001年宇宙の旅ねはいあん中でこう いうシーンがあったわけあのボマ船長と その仲間が春に聞かれないよう にこの部屋のな別の部屋に入って喋ってる とはいそこを春がねあの目ね真っ赤な目が あるじゃないですかじっとと見てるとはい うんであれ聞こえてないわけはいね音は 遮断されてるからところがね春急戦は何 やってるかと唇の動きを見てたけねはい うんそれで何を喋ってるかちゅうのま いわゆる何あの唇を読むっちうのできます よね独独身術実結局それをマスターしたっ ちゅうわけやねはいうんハ急戦はで結局ね 春急戦は人々がね喋るのを見ててまそれ までの学習でねええで結局独身術を自分で マスターしたわけだから自任は基本的に 同じことをやってるとおおうんまで膨大な YouTubeを見ることによってこの 世の中の動きという教えられてないんだ けど自分で学んでいって おおいやだからまさにね人間と同じになり つつあるわけですよええまだまだ プリミティブだけどねうんだから1段階 進んだんですよジニー自体は今は論文が 公開されたという状態ですあ論文は公開さ れた論文とブログが公開されシステムは まだ公開されてない感じなんです Googleだからね本物公開かどうか わからんよね動画が出てるわけでもないん ですねいいや動画出ていや動画出てないか ああいうものサンプルは出てましたけどね プル出てたねあブログで何秒かはいうん ああうんペーパーはもちろん動かないけど ブログでは出て動いてたよねうんうんうん だこれはね単にね動画をつくだけじゃなく てロボットにも使えるってね書いてあった よねそうそれはそうでなんかゲームにも 使えそうですよねあもちろんゲームね 使えるにゲゲームになりそうですねそう いう体がねゲ映みたいな感じですよねええ なんかただねロボットが重要ならねね ロボットが動く手をねね恋愛が見てねええ で動かし方を学ぶわけですやほうほうほう ほうほうほういやつまりねいや感じたこと はもうこの頃の進歩が激しすぎてええええ ええだから空が出てであれねジェミニーの プロの1.5が出てねまだねそんなに半年 半月も経ってないのにまた次の方が出てっ てその他にもねいっぱい出ててもう 取り上げきれないのよはいやいやだから そういう視点が残ってたのかっていうのを 改めて感じましたけどねうんうんうんあの マルチモーダルって言って今のあのマルチ
モーダルのAIであこれ結構あの う重要な部分尽くしてるなと思ったんです けども今言ったアクションみたいな観点 って確かにちょっと今までの中には ちゃんと明治的には入ってなかった感じは しますねうんでアクションが重要なのはね 当然ロボットですねうんええだからねこれ ままだ勉強戦といかないけど今年はね ロボットのええのの年だってああロボット 賢いロボットがいっぱい出てくるとうん うんうんうんいうことですよね [音楽] へえそうですか特にねヒューマノイド型の ロボットが人間と同じ速度で歩きええ人間 と同じ速度で手とかなんとか動かせるよう になったらえこれはもうね新しい時代だっ てうんで今までね色々ロボットのがある けどあれ早送りして動画をねええうんうん あのまそれらしく見せてるけど動き自身 遅いのね ああはいはいはいはい [音楽] ううんだから今年はね特に今年の末までに 何が起こるか4の中にはなんか中身は書か れてるんですか今までの トランスフォーマーとは違うなんああ書い てます書いてますそれは書いてますああ えっとあのGに行ってあの名前はあれです ねあのアラジンのランプこすると出てくる あれですよね精霊うん妖精ですねでそれは ジェネラティブインタラクティブ エンバイロンメントの略だって言っね なんかあれですねAIを示唆してますねえ ジェネラティブのジェント インタラクティブでアトエンバイロメント いいということでだからなんだ動画を生成 するんだけどこのAボタン押したとかB ボタン押したとかそういうあの見た見てる 側からの操作によってリアルタイムで コントロールできると右とか左見とかでき るっていうそういうインタラクトいうのは あそそうか今回の名前って動画考はいはい はいそうですねていうことですねそれで えっとあとここで歌ってるのは えっと何だっけえっとファウンデーション ワールドモデルだよって歌ってるんですね で今まであのllmってのは ファウンデーションモデルだって言ってる んですけどそれがもっとちゃんと世界を 理解してるよと動画をいっぱい見ただけで そのちゃんと3Dが理解できるからあの 静止が1個与えればそれでもう キャラクターが動かせるようなあの動画が 出て生成できちゃうよっっていうところを えもそれはガラっと新しいよってことを
主張してますねうんうんうんうんうんうん うんま短い期間になんかそういう新しい 全然違うものがパッと出てくるから ちょっとびっくりってのはあり ますいやだからね前から言うようにまさに ねシに突入しつつあるような感じがして ならうんつまり先生と発展曲線の膝ちうの やったらもうもうそのさ中にあるような気 がするわけうんうんすごいですね確かにね すごいいや特にねトランスフォーマーは もうこれで終わりだみたいなねええ意見も ままあやるかなんか特にそういうんだけど でもねこんな方にどんどんどんどん発展し ていってんだからねうん前のあの リングトランスフォーマーはいはいによる 100万トークとかねうんあれなんかねま トランスフォーマーそのまのじゃないです かで今度のもVQVAかとか山とかST トランスフォーマーとかなんとか言って マストランスフォーマーですようんだから まだまだ行くよねすごいそういえば1年 ちょい前ぐらいだからあの第3次AI ブームそろそろ終わるとか言ってた社会 評論家みたいな人いましたけど息してるか なとか思っ てそうなんやでね えあのAIなんて意識だって今のAIは AIじゃないんだとAiのなんだっけ古代 宣伝に騙されるなってうんいやいやいや 古代3どころか心の底から驚いてます けどって感 ですそう かまこの分野研究するの大変ですねだけど ああそれも言ってますねあはい代の研究松 県の人なんかはあのクリエイターもなんか 絶望に 打ちひしがれてるかもしんないけどあの AI研究者だって結構なんか打ちのめされ てるぞって言ってて俺たち次何やったら いいんだよってなってますよって言って ますからねに立って走るというのは難しい ですねなかなかねあとどうしてももう 後追いになってしまいそうそうそうそう そうで今これができてないから俺これに 取り組めばいいのかなと思ってるとすぐ できちゃって経みたいな そうそうねこれがすごいのはねまだねAI が作ってるわけじゃあの研究してるわけ じゃなくて人間がやってんのねはいはい やっぱり ね流れとか流行とかの恐ろしいもんよね うんまさできると思えばできんのねうん ああうんうんないはできないんですよねで 今ねこういう大流行してしかもね人間が やってんだからなんでこんなことができる
んだって言ったらできると思ってるから できるわけですあうんうんうん飛行機は 飛んだみたいな感じですよねうんうんうん うんいやまさにそうだから飛んだのが まあまあGPT2か3ぐらいやけど今ねだ あ飛行機の歴史で言えばね1903年にま 初めて飛んでですねねで第1位世界大戦で ま結構ね大活躍してあれ19年ねだから 16年間ですやああだから飛んなのが まあまあまあ17年2017年の トランスフォーマーとしたらえね17年後 ちったら34年とか35年とかそなん でしょうんうんうんいやだから今飛行機が ね爆発的に発展してる時期に相当するわけ よ うんであん時はねいろんな工夫がなされて ねで飛行機の理論も分からんのに工夫がね 用力理論も分からんのに工夫がなされたそ まそんな時期ですかねうんでだんだんまま 理屈は上がってきたけどねうんいやそうま あのエアの場合特に関わってる人の広さっ ていうのもすごいですよねこれその技術ま 例えば相対性理論になるとかあんなんは すごいけどやっぱり一部の人しか理解でき なかったんですけどAIの場合は社会への 影響も含めるともううん かなりの人が関わっていてあこれはね人類 最後の技術かなっていう大な言い方じゃ ない気がしてきますよねうんうんあでなん でかつうとやっぱりね主婦が関わってる からでしょうんお金がねああお金作にうん それね飛行機の場合はやっぱりねあれは 軍事利用ちゅうことがあったと思うのよ うんうんで政府とかが相当金出したんじゃ ないかって気がするねで今政府じゃなくて ま企業ですよねはいうんそうですね企業も 入ってますからね研究者もいるしユーザー もいる しいやあいやあ日本頑張らな頑張ら開け ませんねそううんそうやっぱできると思わ ないといけないってことですねうん本も まだできるんだといやあなんか企業がね ちょっとあかんし大学もあんまりあかん ような気をするし大学頑張らないとダメ じゃないですか うん企業も経済も良くないし経済どすゃ いいんかなというとこですねこれね僕前の 本に書いたんやけど日本のね景やよくな ダメになったやっぱりね人口構成に問題が あるわけようんそれはあの生産年齢人口 っていうのがあってうんこれはね何歳かな 16歳から60歳ぐらいまでかなうんま 要するにまあの生産労働に従できる人間ね でこれがあのたくさんいるとま有利なわけ ですやんで日本がこれで世界のトップを
占めてた60年代ぐらいから90年までな んやうんこの間があの日本生産年齢人口が 多かったんですねうんうんだからね ちょうどその時に日本がま非常に栄えた わけじゃないですかで90年を盛にして ですね中国とか韓国に抜かれたわけ うんでで日本の長楽始まったのはまそう いうことがあるわけですよでまほんで まあまあそのでで言うと今韓国はね急速に 下がっていってるからね特殊出世率 っちゅうので言うてま女性1人が何人子供 産むかっていうのは日本が1.2ぐらいや けど韓国が0.8かなんかぐらいなんです よねはいうんものすごい低いのようんだ からまあねいう見方で見れば韓国に将来 ないんですよはいでま中国もあのそうなん ですね1人政策のためにところがねところ がね僕の前の方に書いてこういうこと書い てあんだけどそれは人間が労働するからだ とおおで機械が労働するAIが労働すれば ですね人口が多いということはね特有利に はならないだから日本はそこを目指すべき だって前の本に書いてあんやけどまだそこ まで至ってないわけですよねうんつまり 機械AIが生産を代替するっていうのは 多分ね多分ね2030年頃からでしょうん うんと日本はその前に90年代にからね 30年まで40年間失れた40 年間40年に増えたんですねうん今まで 30年とか言っ30年聞いましたけどうん まあちょっとそれなんとか頑張って考えて いきましょうみんなではいはい
収録日:2024年2月29日
シンギュラリティサロン主宰の松田卓也神戸大学名誉教授の健康や学習に関連する日ごろのお考えを皆さんにお伝えします。今回はGoogleのGenieについて。
出演:松田卓也 シンギュラリティサロン主宰・神戸大学名誉教授
塚本昌彦 神戸大学教授
小林秀章 セーラー服おじさん
保田充彦 XOOMS代表
企画・運営:シンギュラリティサロン(https://singularity.jp/)
