# 動画生成AIの最前線:Runwayが初の「ワールドモデル」と動画へのネイティブオーディオ追加を発表
## 導入文
AI画像・動画生成のリーディングカンパニーであるRunwayが、初の「ワールドモデル」となる「GWM-1」を発表し、AI業界に新たな波を起こしている。同時に、主力動画モデル「Gen 4.5」をアップデートし、待望のネイティブオーディオ機能と長尺・マルチショット生成能力を追加。これにより、AI動画生成はプロトタイプ段階から、より実用的な制作ツールへと進化を遂げようとしている。
## Runwayが提唱する「ワールドモデル」とは
ワールドモデルとは、AIシステムが現実世界の仕組み(物理法則、時間の流れなど)を内部でシミュレーションし、学習するモデルのことである。これにより、AIはあらゆるシナリオで訓練されることなく、推論、計画、行動が可能となる。RunwayのGWM-1は、フレームごとの予測を通じてシミュレーションを作成し、世界が時間とともにどのように振る舞うかを理解することを目指している。
### 競合を凌駕する「汎用性」への挑戦
Runwayは、GWM-1がGoogleの「Genie-3」などの競合モデルよりも「汎用的」であると位置づけている。同社のCTOであるアナスタシス・ゲルマニディス氏は、「ワールドモデルを構築するには、まず優れた動画モデルを構築する必要があった。ピクセルを直接予測するようにモデルを教えることが、汎用的なシミュレーションを実現するための最良の方法だと信じている」と述べている。
GWM-1には、特定の用途に特化したバージョンも用意されている。
* **GWM-Worlds:** ユーザーがプロンプトや画像参照を通じてシーンを設定し、物理法則やライティングを理解した上で世界を生成するインタラクティブなプロジェクトアプリ。ゲーム開発やエージェントのナビゲーション訓練に有用。
* **GWM-Robotics:** 気象条件や障害物などの新しいパラメータで強化された合成データを使用し、ロボットの訓練に役立てることを目的としている。
* **GWM-Avatars:** 人間の行動をシミュレートするためのリアルなアバター構築を目指す。
## Gen 4.5モデルの進化:ネイティブオーディオと長尺生成
ワールドモデルの発表と並行して、Runwayは基盤となる動画モデル「Gen 4.5」のアップデートも行った。このアップデートの最大の目玉は、**ネイティブオーディオ**機能の追加である。これにより、生成された動画に、キャラクターのセリフや背景音を自然に含めることが可能となった。
さらに、**長尺・マルチショット生成**機能も強化され、キャラクターの一貫性を保ちながら、最大1分間の動画を、様々なアングルからの複雑なショットで生成できるようになった。この進化は、ネイティブオーディオとマルチショットストーリーテリングの分野で先行するKlingなどの競合に追いつき、AI動画生成がプロの制作現場で活用できるレベルに達しつつあることを示している。
## 元記事リンク
[動画生成AIの最前線:Runwayが初の「ワールドモデル」と動画へのネイティブオーディオ追加を発表](https://techcrunch.com/2025/12/11/runway-releases-its-first-world-model-adds-native-audio-to-latest-video-model/)






