動画生成AIの競争が激化する中、米スタートアップRunwayが最新モデル「Gen-4.5」を発表しました。業界標準ベンチマークで首位を獲得したこの新モデルは、従来の課題を克服し、映像制作の現場に革新をもたらす可能性を秘めています。
## 性能競争をリードするGen-4.5の革新性
RunwayのGen-4.5は、Googleの「Veo 3」やOpenAIの「Sora 2」といった競合の最新モデルを抑え、業界標準のベンチマーク「Artificial Analysis Text to Video」で首位に立ちました[1]。前モデルGen-4と同等の速度と価格を維持しつつ、**複雑なマルチ要素シーンの生成**、**精密な配置と流動的な動き**、そして**現実的な物理演算**といった点で大幅な性能向上を実現しています[1]。
特に注目すべきは、その**物理的正確性**と**視覚的精度**です。物体の重みや勢い、液体の流れといった物理的な挙動がより自然に表現されるようになり、髪の毛一本一本や素材の織り目といった微細なディテールも、動きや時間の経過を通じて一貫性を保つことが可能になりました[1]。開発にはNVIDIAのGPUが全面的に採用され、動画拡散モデルの最適化が推進されています。
## 残された課題とプロの現場での活用
一方で、Gen-4.5にも「ドアの取っ手を押す前にドアが開いてしまう」といった**因果関係の推論**や、オブジェクトの永続性といった課題が残されています[1]。Runwayはこれらの課題解決に向けた研究を継続しています。
現在、Gen-4.5は英公共メディアBBC、仏ゲーム大手Ubisoft、米小売大手Targetといった著名なメディア・エンターテインメント企業を早期アクセスパートナーとして迎え、段階的に提供が始まっています[1]。プロの制作現場では、背景生成による**制作コストの削減**や、アイデア段階のビジュアル化といった活用が期待されています。
しかし、この技術の進化は、実在の俳優をAIに置き換える可能性から、ハリウッドの俳優組合などから強い反発も招いています[1]。Gen-4.5の登場は、AI技術をどこまで活用し、人間のクリエイターの役割をどう再定義するのかという、映像制作業界全体での議論を加速させるでしょう。






