Sora対抗、テキスト・画像→高品質動画生成AI「Dream Machine」/鼻歌からボーカル曲を作れる楽曲生成AI「Suno」【今週公開の最新AIツール&ニュース】
皆さんこんにちは今回の動画では3D生成 AIのUnumaAIが突如公開した テキストや画像から超高品質の動画を 作れる動画生成AIツールドリーム マシーン机を叩いた音や鼻歌から曲を 作れる楽曲生成AIツール素の新機能有名 画像生成AIの最新版stable diff3ミディアムなど ここ1週間の間にリリースされた最新の AIツールの概要と使い方を紹介しAI 効果でAppleの株価が過去最高値を 更新小池ゆり子東京都知事のAIゆり子 登場などai関連の最新ニュースをお届け しますそれではよろしくお願いし [音楽] ますまずはドリームマシーンの紹介です テキストから3Dモデルを生成できるAI ツールGなど3D系のツールを開発する lumaAIは突如新たな動画生成AI ツールドリームマシンを公開しました ドリームマシーンはテキストや画像から 高品質でリアルな一貫性のある動画を生成 できるAIツールで動画を直接 トレーニングデータとして使用することで 2分で品質の5秒の動画を成できるとして いますドリームマシンはツールページの ライナウボタンを押してGoogle アカウントでログインすれば月に30回 無料で動画を作れますログイン後のページ の上部にあるフォームに作りたい動画の イメージをテキスト入力して送信ボタンを 押せば動画が生成されますまたフームの 左側にある写真アイコンから画像を アップロードし画像を動かしたいかの イメージをテキスト入力して送信ボタンを 押せば画像が動画化されますオーAIが 公開予定の動画生成AI空のプロジェクト ページで提供されているテキストを入力し てドリームマシーンで動画を作ってみまし たが画質が若干荒いものがあるものの似た ものが再現できました画像を動画にする 機能については既存の動画生成AIツール で作れる動画と比べて動きはありますが 破綻が若干多い気がしましたちなみに サブスク登録するとより多くの動画を 作れるようになります3Dモデル生成の 分野で評価の高いルマAIが開発する ツールなだけに今後の進化に期待です続い てはスノの新機能の紹介ですテキストから ボーカル入りの楽曲を生成できるAI ツールスノは以前からから告知していた アップロードしたオーディオファイルや 録音したオーディオデータを参考に楽曲を 生成できる機能を実装しました素の公式X では机を叩いた音や鼻歌から楽曲を生成 する動画が公開されていますジョロを叩い た音からロックサウンドが生成されるデモ 動画がこれです [音楽] いかがでしょうかリズムオからッが生成さ れていますちなみにこの機能は有料のプロ プランとプレミアプランのユーザーに提供 されスの楽曲を生成するページに新たに アップロードオーディオというボタンが できているのでここから利用できるよう ですなおスノは全ユーザーに向けてソング ラジオ機能を実装しましたこの機能は自分 や他人の楽曲の詳細画面のジャケット写真 のカにある3点ボタンを押して出てくる ポップアップ画面でgotoソングラジオ を選択すると似たような楽曲がリスト アップされリストアップされた楽曲を連続 で再生できる機能ですスノに関してはこの チャンネルの別動画でボーカル入りの楽曲 を作る方法を解説しているので興味のある 方はそちらの動画をご覧 ください続いてはSTdiff3 ミディアムの紹介ですスタビリティAIは テキストから画像を生成できるAIモデル の最新版ステイブルディフュージョン3 ミディアムを公開しましたステイブル ディフュージョン3ミディアムは20億 パラメーターを搭載した小さなモデル ながら高品質な画像生成を実現し空間的 水論構成要素アクションスタイルを含む 複雑なプロンプトしディフュージョン トランスフォーマーアーキテクチャという 画像生成における最新技術を活用すること でスペルや文字組のミスを提言し画像の中 にテキストを表示する能力が向上したよう ですまたNVIDIAやAMDと コラボレーションすることでステイブル ディフュージョン3ミディアムに最適化さ れたGPUシステムを搭載している場合に はパフォーマンスが向上するとのことです ステイブルディフュージョン3ミディアム のモデルデータはハギングフェスで提供さ れていて非商用であれば無料で利用でき 商用利用する場合はライセンス登録が必要 ですまたハギングフェイスに無料の公式 デモも用意されていてフォームに作りたい 画像のイメージをテキスト入力し欄ボタン を押せば画像が出力され作った画像を ダウンロードできます 続いてはNのPC用ブラウザアプリ版の 紹介ですシンガポールのAI スタートアップCRPTLTDはモバイル アプリで公開していたアニメ動画生成AI ツールNのPC用のツールを公開しました PC用のツールにはブラウザ版 Windowsアプリ版Macアプリ版の 3つが用意されていますNは画面上で キャラクターが動くアニメ動画を作れる AIツールでPC版ではモバイルアプリ版 よりもパワーアップし最大8つのアバター を自由に配置してサイズの調整も可能に なり顔認識でキャラクターを動かせ プレゼン用ゲーム配信用など多様な テンプレート機能が追加されました ブラウザ版ではナイトの公式ページに行っ て無料でスタートボタンを押し GoogleやAppleアカウントで ログインすればお試しで無料で利用でき ますログイン後の画面の空白から作成の 部分で生成する動画の重要費を選択して から出てくる画面の左側でアバターや背景 音楽などを設定して動画を作っていきます キャラクターやボイスはたくさん用意され ておりツールに実装されているサンプル テンプレートを見るとアプリの説明動画や 会社の業紹介動画雑学ショート動画など 色々な動画が作れるようですなお無料版で は5分の音声生成最大1分の動画生成と いう制限がついていますが有料サブスク 登録すると無料版で使えない機能が解放さ れより長い音声や動画が作れるようになる ようです続いてはvlmの紹介です株式 会社サイバーエージェントは75億 パラメータの日本語大規模資格言語モデル vlmを公開しましたvlmはサイバー エージェント独自の日本語大規模言語 モデルサイバーエージェントLM2に資格 を付与したモデルでモデルデータは ハギングフェスで公開されており商用利用 可能なアチ2.0ライセンスで提供され ますまたハギングフェスに無料のデモも 用意されておりデモページのフォームの 左側にあるクリップアイコンから画像を アップロードしフームに画像についての 質問をテキスト入力して送信すれば画像に ついての質問に答えてくれ ます続いては科の新機能の紹介です人気の 動画生成AIツール科は画像から動画を 生成できるイージtoビデオ機能を アップデートしたと発表しましたピカは ツールトップページからGoogle アカウントなどを使ってログインすれば 動画を作れるクレジットが毎日追加される のである程度無料で動画を作れますログ イン後のエクスプローページで強化された イージtoビデオ機能で作られた動画を 確認でき色々なバリエーションの動画を 作れるようになったことが分かりますなお ログイン後のページのカにある はビデオの部分から画像をアップロードし フームに画像をどのように動かしたいかの イメージをテキスト入力して星ボタンを 押せば画像から動画が作れます続いては genenタイプの紹介ですGoogle は新しい技術を試せる実験 プラットフォームGooglelaosに おいて同社の画像性AIイマジン2を搭載 したテキストからオリジナルの アルファベットフォントを生成できるAI ツールgenenタイプを公開しました genenタイプはツールページに行って Googleアカウントでログインすると 無料で利用できログイン後のツールの トップページの左側のフォームにどのよう なパターンのアルファベットフォントを 作りたいかのイメージをテキスト入力して ジェネレートボタンを押すとイメージに 沿ったアルファベットフォントが生成さ れるので右側のフォームにアルファベット でA単語を入力しフームCのSas PINGボタンを押せば生成したフォント が反映されたA単語の画像をダウンロード できます続いてはLEONのGPT4機能 の紹介です株式会社LEON technologiesJAPANは 無料のAIチャットサービスLEONにオ AIの最新大規模言語モデルGPT4を 実装したと発表しましたLEONに Googleアカウントなどを使ってログ インしログイン後のページにあるフォーム の株でGPT4を選択すればGPT4を 使ってチャットできますまた先日iOS アプリ版が公開されたLEONのアプリ版 LEON使い放題AIのAndroid アプリ版がリリースされましたアプリは GooglePlaySTから無料で ダウンロードし利用できます続いては インスタントライトの紹介です フォトグラファーAI株式会社は生成AI を使った証明コントロールツール インスタントライトを発表しました インスタントライトは画像内の証明を瞬時 に編集できるAIツールで実際に触れる 無料のデモが用意されていてデモ画面の 画像アイコンの部分に画像をアップロード すると編集画面が立ち上がるので アップロードした画像内でライトの位置を 指定し照明の色光の強さライトの奥行きを 設定し画像を生成するボタンを押すと設定 した証明を反映した画像が生成されます なおインスタントライトは今後web サービスとして提供される予定だという ことで広告クリエイティブやインテリア デザインイラスト制作映像制作などでの 活用が期待されます続いてはスーパー ガウシアンの紹介ですadobリサーチの 研究者らは荒い3Dモデルを高画質化する AI技術スーパーガウシアンを発表しまし たスーパーガウシアンを使うと複数の視点 の画像から3Dモデルを生成できる既存の ナーフやガウシアン 解像度の3Dモデルの出力を実現できるの で幅広い3Dアプリケーションでの利用が 期待されるとしていますこの動画を作って いるタイミングでは公開されているのは プロジェクトページと論文だけですが プロジェクトページで公開されている サンプル動画を見るだけでもかなり期待 できる技術と言え [音楽] ますここからは今週発表されたAIの ニュースを簡単にまとめて紹介しますまず はAI効果でAppleの株価が過去最 高値を更新の話題です6月11日の米国の 株式市場でAppleの株価が7%以上 上昇して過去最高値を更新しましたこれに よりAppleの時価総額は3兆18億 ドルに達しMicrosoftの3兆 2200億ドルについで2位に 6月13日にはMicrosoftを抜い て時価総額1位になりましたこの上昇の 背景には6月10日から始まった Appleの年時開発者会議 WWDC2024でiPhoneやMac に実装される予定の生成AI技術 AppleインテリジェンスとOpen AIと提携してチットGPTをApple 製品に統合することが発表されたことに ありますApple製品へのAI機能実装 とオAIとの連携発表についてはネットで も賛否が分かれていましたが株式市場には 行為的に捉えられたよう です続いては小池ゆり子東京都知事のAI ゆり子登場の話題です6月13日東京都 知事の小池ゆり子氏は自身のXを更新し 生成AIで作ったニュースのAIゆり子が 子育て教育施策の所得制限撤廃について 分かりやすく解説した動画を公開しました 使用されているAIツールについて明記は されていませんがおそらくヘジやdid などの動画生成AIツールを使って小池氏 の音声をクローンし写真をアバター化して 作っていると思われますSNS上の反応は 賛否分れていましたが7月にれる東京知事 戦を前に大きな話題となっていました続い てはAppleがApple製品に Googlejemに統合の移行の話題 です6月11日に開催されたAppleの 年時開発者会議 WWDC2024の基調公演でApple 機器に実装されるAI機能Apple インテリジェンスとOpenAIと提携し チッGPTとApple製品が統合される ことが発表されましたがApple系の ニュースサイト925Macによると貴重 講演後のイベントでAppleの幹部が 将来的にはユーザーがクリエイティブな 文章やコーディングに最適なAIモデルを 選択してApple製品で使えることを 目指すとしGoogleの生成AI技術 ジェミニなど様々なAIモデルとの統合を 進める計画であるととのことです Apple製品にジェミニが組み込まれる という報道はこれまで何度もありましたが 近いうちに正式発表されるかもしれません 続いてはAppleとOpenOpen AIの定型をマスク氏が批判の話題です6 月11日AppleはiPhoneや MacなどのAI新機能としてOpen OpenAIのチットGPTを活用した 複数の機能を発表しましたこのの報道を 受け実業家のイロンマスク氏が自身のXを 更新しAppleがOSレベルでOpen AIのサービスを組み込むなら自分の会社 ではAppleデバイスを禁止すると投稿 しましたマスク氏は元オープAIの共同 設立者ですが現在は競合するAIサービス を運営していてオーAIと対立関係にあり ますさらにマスク氏はAppleと OpenAIが提携したタイミングで OpenAIと同社のサムアルトマン CEOに対して訴訟を起こしていた県の 訴訟を取り下げたと報道されていますが 理由は明らかにされていません続いては オラクルがMicrosoftとOpen AIとの定型を発表の話題です ソフトウェア会社のオラクルは MicrosoftとOpenAIとの 定型を発表しましたこのによりOpen AIが利用するプラットフォームが Microsoftadleに加えて オラクルのクラウドサービスオラクル クラウドインフラストラクチャにも拡大さ れますOpenOpenAIと Microsoftはすでに長期的な パートナーシップを結んでいて MicrosoftadleがOpen AIの独占的なクラウドプロバイダーとし て機能していましたが今回の定型により OpenAIのクラプイダーとして オラクルクラウドインフラストラクチャが 新たに加わることとなりますこの定型は オープAIの研究や製品APIサービスの 負荷を支えるための重要なステップとなり そう です続いてはMicrosoftがGPT ビルダーの一般提供終了の話題です Microsoftは2024年3月から 同社の個人向け有料AIチャットサービス コパイロットプロにて自分専用のAI チャットコパイロットGPTを作成できる サービスGPTビルダーを提供していまし たが6月上旬に提供を終了すると発表し ました7月10日以降コパイロットプロ ユーザーはコパイロットGPTを作れなく なり7月10日から7月14日までの間に ユーザーが作成したコパイロットGPキー とれに関連するデータが削除されます ちなみにエンタープライズユーザーへは 引き続きGPTビルダーが提供されるとの ことです続いてはMicrosoftが windows11の新機能リコールの 初期実装見送りの話題です Microsoftは6月13日同社の ブログを更新し6月18日に発売予定の AIに特化した PCロップPCに搭載する予定だった windows11の新機能リコール機能 の展開についてコパイロットプスPCを 購入してもすぐにリコール機能を体験でき ずにまずは一部のテスターにプレビュー版 が提供されそのフィードバックを得て改善 が完了した後に全てのコパイロット PlusPCでリコール機能のプレビュー 版を利用できるようにする予定だと発表し ましたマイクロソフトはリコール機能を 発表後にセキュリティ専門家などから サイバーセキュリティとプライバシーに 関する懸念が多く寄せられたこともあり リコール機能の正式リリースには慎重に なっているよう ですなおこの動画で紹介した記事やツール などのリンクは動画の概要欄に貼ってい ますAIツールに興味のある方は是非自分 の手で試してみてくださいそれではは次回 の動画でお会いしましょう
◆動画の説明
今週リリースされたAIツールやAIニュースをまとめています
ツールはなるべく無料で使えるモノを中心に紹介します!
◆動画のもくじ
0:00 動画のもくじ
0:55 テキスト・画像→高品質動画生成AI「Dream Machine」
2:50 楽曲生成AI「Suno」の新機能 ~鼻歌から楽曲生成~
4:57 最新画像生成AIモデル「Stable Diffusion 3 Medium」
6:30 アニメ動画生成AI「Kn1ght」のPC用ブラウザ・アプリ
8:25 サイバーエージェントの視覚付与LLM「VLM」
9:15 動画生成AI「Pika」の画像→動画生成機能強化
10:12 オリジナルのアルファベット生成AI「GenType」
11:11 wrtnにOpenAIの最新LLM「GPT-4o」実装
12:01 画像内の照明編集AI「InstantLight」
13:04 3Dモデルを高画質化するAI「SuperGaussian」
13:55 AI効果でAppleの株価が過去最高値を更新
15:13 小池百合子東京都知事のAIゆりこ登場
16:03 AppleがApple製品にGoogle Gemini統合の意向
17:10 AppleとOpenAIの提携をマスク氏が批判
18:14 OracleがMicrosoftとOpenAIとの提携発表
19:14 MicrosoftがGPT Builderの一般提供終了
20:09 MicrosoftがRecall機能の初期実装見送り
21:14 エンディングムービー
◆動画の中で紹介している内容
Luma AI、NVIDIA、AMD、CyberAgentLM2、WWDC2024、Gemini
Google Labs、NeRF、Gaussian Splatting、Apple Intelligence
Microsoft Azure、Copilot+ PC
◆参考サイト(※一部URLの先頭には「h」をつけてください)
・Dream Machine
https://lumalabs.ai/dream-machine
・Suno
https://x.com/suno_ai_
https://suno.com/
・Stable Diffusion 3 Medium
ttps://ja.stability.ai/blog/stable-diffusion-3-medium
https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium
・Kn1ght
https://www.kn1ght.app/ja
・VLM
https://www.cyberagent.co.jp/news/detail/id=30344
https://huggingface.co/spaces/cyberagent/llava-calm2-preview
・Pika
ttps://pika.art/my-library
https://x.com/pika_labs
・GenType
https://labs.google/gentype
・リートン
https://play.google.com/store/apps/details?id=jp.wrtn.app
https://wrtn.jp/
・InstantLight
ttps://fotographer.ai/instantlight
・SuperGaussian
https://supergaussian.github.io/
・ニュース
https://developer.apple.com/jp/wwdc24/
ttps://www.nikkei.com/article/DGXZQOGN13FBM0T10C24A6000000/
ttps://x.com/ecoyuri
ttps://9to5mac.com/2024/06/10/craig-federighi-says-apple-hopes-to-add-google-gemini-and-other-ai-models-to-ios-18/
ttps://jp.reuters.com/economy/industry/PLTW4X5O6BL65KXTJSCUDCUM6M-2024-06-11/
ttps://www.oracle.com/news/announcement/openai-selects-oracle-cloud-infrastructure-to-extend-microsoft-azure-ai-platform-2024-06-11/
ttps://support.microsoft.com/en-gb/topic/gpt-builder-is-being-retired-d1de6c3a-4c7a-4bcd-98ff-2f65f3d23cd1
ttps://blogs.windows.com/windowsexperience/2024/06/07/update-on-the-recall-preview-feature-for-copilot-pcs/
◆参考動画
Introducing Copilot+ PCs
▼オススメ動画
「堀江貴文のChatGPT大全」を世界一わかりやすく解説!【AIベストセラー本要約】
ChatGPTの革新的活用事例20選!~OpenAI DevDayで発表のGPT-4 Turbo with vision、GPTsなど~
ChatGPTをめっちゃ便利にする海外製GPTsベスト20!~GPT-5シミュレート、仮想Grok、動画生成、論文検索~
自作ChatGPT「GPTs」人気ベスト30! 8000個の中から厳選! ~GPTsの作り方や制作時の注意点まとめも~
▼SNS
作成中・・・
▼どんなチャンネル?
当面の間は週に2,3本更新予定
案内人のアンドロイドが
毎日煩雑な情報が飛び交うAI(ChatGTP)の話題を中心に
関連情報をまとめて公開します!
管理人:ミライ
※すべてソースを基に制作しています
みなさんぜひコメントをどしどしお願いします!
#chatgpt #チャットgpt #gpt4o #apple #iPhone #AI #gemini #生成AI #openai
