Seedance 2.5 公式リリース:テクニカルプレビューとコア機能

2026年6月23日、Volcano Engine FORCEカンファレンスにおいて、Volcano Engine社長のTan Dai氏がSeedance 2.5のリリースを正式に発表しました。ByteDanceのDoubaoチームが開発したこの最新のSeedance動画生成ラインは、動画時間、マルチモーダル参照能力、意味的編集において大幅なアップグレードを実現しています。現在、グローバルなエンタープライズベータテスト中であり、2026年7月上旬に正式ローンチ予定です。

映画制作、デジタル広告、クリエイティブデザインが求める高い一貫性と構造的要件を満たすように設計されたSeedance 2.5は、堅牢なエンタープライズワークフローへの戦略的なシフトを象徴しています。

ByteDanceのSeedance 2.5動画生成モデルの3つの更新されたコア機能を紹介する概要インフォグラフィック

進化の軌跡:Seedance 1.0からSeedance 2.5へ

Seedanceモデルファミリーの開発は、AI動画生成の古典的な限界(特に連続時間と時間的一貫性)を克服することに焦点を当てた急速なタイムラインを示しています。

  • 2025年5月(Seedance 1.0 Lite):軽量基盤モデルとしてローンチ。テキストから動画、画像から動画の機能をサポートし、最大10秒の動画を生成。
  • 2026年2月(Seedance 2.0:出力能力を30秒動画に拡大(ただしシーケンシャルな継ぎ接ぎ技術に依存)。初のマルチモーダル入力を導入し、その精度で世界的な注目を集めました。バージョン2.5発表と同時に、Volcano Engineは前世代Seedance 2.0をアップグレードし、ネイティブ4K動画生成をサポート。
  • 2026年6月(Seedance 2.5):新たに発表されたバージョンはセグメント継ぎ接ぎを不要とし、最大30秒のネイティブ単一セグメント動画生成をサポート。さらに参照能力を大幅に拡張し、深い空間制御ワークフローを導入。

Seedance 2.5 動画サンプル

Seedance 2.5 の主要な技術アップグレード

Seedance 2.5のコア機能強化は、クリエイターが時間長、スタイルマッチング、局所的編集を細かく制御できるようにすることに重点を置いています。

1. ネイティブ30秒単一セグメント生成

従来の長編生成モデルは、短いセグメントを継ぎ接ぎする手法に依存することが多く(これにより視覚的なドリフトや構造的不整合が生じる可能性があります)、Seedance 2.5は1回のネイティブパスで完全な30秒クリップを出力します。シーケンス全体を連続的に生成することで、時間的・カメラ運動の高い一貫性を確保。このアーキテクチャのアップグレードは、滑らかなカメラトラッキング、複雑なパン、連続的なナラティブフローをサポートし、これらは映画的なストーリーボードやハイエンド広告にとって不可欠な要素です。

連続フローと継ぎ接ぎシーケンスを比較した、ネイティブ30秒単一セグメント動画生成の視覚的表現

2. 拡張されたマルチモーダル参照能力

異なるシーン間でキャラクターやスタイルの一貫性を維持することは、生成動画における長年の課題でした。Seedance 2.5は、同時に入力可能な参照数を拡張することでこれに対応しています。本モデルは、最大50個の全モーダル参照アセット(画像、オーディオトラック、参照動画を含む)を同時にインポート可能。これはSeedance 2.0の12入力制限から4倍の増加です。この能力により、制作チームはモデルに包括的なキャラクターシート、環境ターンアラウンド、小道具参照、オーディオキューを同時に入力でき、生成出力全体で高い視覚的・様式的忠実度を確保できます。

Seedance 2.5の拡張されたマルチモーダル参照能力を示す図。最大50個の同時参照アセットをサポート

3. 制御可能な細粒度編集

プロの編集者にとって、小さなミスを修正するためにまったく新しい動画を生成するのは非常に非効率です。Seedance 2.5は、正確な意味的動画編集を提供することでこれに対応。クリエイターは、元の俳優の動き、カメラアングル、照明条件、全体の構図を完全に維持したまま、シーン内の特定の要素(キャラクターの服装、環境の詳細、小道具、被写体のIDなど)を置き換えたり修正したりできます。

Seedance 2.5における制御可能な細粒度動画編集のデモ。キャラクターの衣装や小道具を選択的に更新

4. 業界初の3Dプリビジュアライゼーション(3Dレイアウトレンダリング)

大きなワークフロー革新として、Seedance 2.5は3Dホワイトモデルプリビジュアライゼーション機能を導入。クリエイターはローフィデリティな3Dブロックアウト(業界で「ブロッキング」や「アニマティック」と呼ばれることが多い)とスタイル参照を入力できます。モデルはこれらの幾何学的ブロックを詳細で視覚的に安定した動画シーケンスにレンダリングします。これにより、初期段階の空間ブロッキングと最終シーン視覚化の間の効率的な橋渡しが実現し、アニメーションやVFXのプリプロダクションへの技術的ハードルを大幅に低減します。

ローフィデリティなブロックアウトを使用した、業界初の3Dプリビジュアライゼーションと3Dレイアウトレンダリングワークフローのイラスト

内部アーキテクチャ:スパースDiTと統合生成

Seedance 2.5の能力は、モデルが空間データと時間データを処理する方法における大きな構造的変化によって実現されています。

  • スパース拡散トランスフォーマー(DiT)アーキテクチャ:Doubaoチーム独自の拡散トランスフォーマーフレームワークを基盤に、Seedance 2.5は最適化されたスパースアテンション機構を採用。このアーキテクチャは計算上の冗長性を削減し、モデルが長時間シーケンスの動画データを効率的に学習・推論できるようにします。
  • 統合された共同オーディオ・動画生成:従来のワークフローではオーディオをポストプロセスとして別途生成するのに対し、Seedance 2.5は統合的な共同生成機構を採用。視覚信号と聴覚信号を同じ潜在空間内で共同処理することで、画面上のアクション(対話、足音、環境インパクトなど)とそれに対応する効果音の間でネイティブな同期を実現。
  • ネイティブ高忠実度出力:最適化された空間時間アテンション機構により、複雑なマルチオブジェクトインタラクションや高速カメラ移動でも構造的詳細を維持しながら、ネイティブ4K解像度での安定したレンダリングが可能。

Seedance 2.5の技術アーキテクチャのブロック図概要。スパース拡散トランスフォーマー(DiT)と共同オーディオ・動画生成を示す

エコシステム統合と商用化戦略

ByteDanceはSeedance 2.5を、より広範なデジタルエコシステム(「CapCut」「Dreamina AI」「Doubao」「Volcano Engine Model Ark」プラットフォーム)とシームレスに統合できるように設計しています。

ビジネス面では、本モデルは持続可能なエンタープライズ(B端)収益化への意図的なシフトを反映しています。カンファレンスで開示されたデータによると、エンタープライズ向けのSeedanceプラットフォームは実行可能な商業パスを確立しており、年間経常収益(ARR)200億ドルに達しています。この収益源は、Doubaoエコシステム全体における大規模モデル推論に関連する多大な計算コストを相殺する上で重要な役割を果たしています。

さらに、ByteDanceはカンファレンスで、新しいAI著作権商用化プラットフォームをプレビューしました。周星馳(Stephen Chow)のような著名なクリエイターが初期パートナーとして参加し、クリエイターは承認された知的財産テンプレートを使用して合法的に派生作品を制作できるようになります。これにより、生成メディアにおけるIP利用のための構造化されたコンプライアンス経路が確立されます。