AI生成サービス・API調査2025

2025年11月時点での画像・動画・ワールド生成AIサービスとAPIの最新調査。アート作品・インスタレーション展示への活用を視野に、料金体系、API仕様、商用利用条件を整理する。

サービス比較一覧

画像生成AI

サービス モデル 料金 API 商用利用
OpenAI GPT Image 1 $0.011-0.25/枚 REST API 可(全生成物の権利譲渡)
OpenAI DALL-E 3 $0.04-0.12/枚 REST API
Google Nano Banana (Gemini 2.5 Flash Image) $0.04/枚 Gemini API 商用利用可
Stability AI SDXL $0.011/枚 REST API 売上$1M以下は無料ライセンス
Stability AI SD3.5 $0.037/枚 REST API 要商用ライセンス
Midjourney v6 $10-60/月 Discord(API未公開) 有料プラン限定
Google Imagen 4 Vertex AI課金 Gemini/Vertex API 商用利用可
Adobe Firefly Image 5 Firefly Services課金 REST API 商用利用可(安全ライセンス)

動画生成AI

サービス モデル 料金 最大尺 API 商用利用
Google Veo 3 $0.40/秒(音声付き) 8秒 Gemini API / Vertex AI
Runway Gen-4 $0.01/credit 10秒 REST API 有料プラン
Luma AI Ray3 $0.20-0.32/生成 10秒 REST API Plus以上
Kling AI v1.6 $12~/月 3分 REST API 有料プラン
Pika v2.5 要サブスク - 限定 有料プラン
OpenAI Sora 2 ChatGPT Pro限定 60秒 API未公開 検討中

ワールド/環境生成AI

サービス 出力形式 料金 API
Blockade Labs 360° Skybox (8K) $20/月(Unity) REST API

3D モデル生成AI

サービス 料金 出力形式 PBRテクスチャ API
Meta SAM 3D $0.02/モデル メッシュ(Quest/AR連携) 対応 Meta API(2026 Q1 SDK)
Tencent Hunyuan3D 2.5 20回/日無料、API 200無料クレジット GLB, FBX, OBJ PBR対応 REST API(Tencent Cloud)
Microsoft TRELLIS NVIDIA NIM課金 GLB 対応 NVIDIA NIM / PiAPI
Meshy AI $16/月〜 FBX, GLB, OBJ, STL, USDZ, BLEND Diffuse/Roughness/Metallic/Normal REST API
Tripo AI (Tripo3D) 従量課金 GLB, FBX, OBJ, USD, STL PBR対応 REST API
Rodin AI (Hyper3D) $24/月〜 OBJ, GLB, FBX 基本対応 REST API
Luma AI Genie Luma課金 GLTF, USDZ 対応 REST API
Adobe Substance 3D Firefly Services課金 3Dコンポジット 対応 REST API(Beta)

詳細ページ

3D生成

素材性能(リアルタイムレンダリング向け)

TouchDesigner、Unreal Engine、Unity等のリアルタイムレンダリングソフトウェアで使用する際の素材としての性能評価。

出力解像度・フォーマット

種別 サービス 最大解像度 フォーマット アルファ対応
画像 OpenAI GPT Image 1 1536×1024 PNG, URL 背景除去API別途
画像 DALL-E 3 1792×1024 PNG, URL 背景除去API別途
画像 Stability SDXL 1024×1024 PNG, JPEG 可(設定次第)
動画 Google Veo 3 4K MP4 非対応
動画 Runway Gen-4 1080p MP4, MOV 非対応
動画 Luma Ray3 1080p MP4 非対応
3D Meshy AI - GLB, FBX, OBJ N/A(3Dメッシュ)
3D Tripo AI - GLB, FBX, USD N/A
360° Blockade Labs 8K JPG, PNG, EXR, HDR 深度マップ別途

リアルタイムレンダリング連携の評価

画像素材

観点 評価 備考
解像度 最大1792px、4K以上はアップスケール必要
アルファ/透過 直接出力不可、後処理で背景除去
HDR/EXR × 非対応(SDR PNG/JPGのみ)
連番出力 バッチ生成で対応可
品質一貫性 Seed固定でも完全一致は困難

推奨ワークフロー:

  1. AI生成(1024-1792px)
  2. Topaz/VideoProc等でアップスケール(4K-8K)
  3. 必要に応じてPhotoshop/DaVinci等で背景除去
  4. TouchDesigner/UEにテクスチャとして読み込み

動画素材

観点 評価 備考
解像度 1080p〜4K
アルファ/透過 × 非対応(グリーンバック合成で代替)
フレームレート 24fps固定が多い(60fps非対応)
× 最大8-10秒(Sora除く)
ProRes/EXR × MP4/MOV圧縮形式のみ

推奨ワークフロー:

  1. AI動画生成(1080p/4K)
  2. After Effects/DaVinci Resolveでキーイング(必要時)
  3. ProRes/EXRシーケンスに変換
  4. TouchDesigner/UEにインポート

代替案: グリーンバックプロンプトで生成 → キーイング処理

3Dモデル素材

観点 評価 備考
メッシュ品質 Meshy/Tripoは実用レベル
PBRテクスチャ Diffuse/Roughness/Metallic/Normal対応
リグ/アニメ 一部サービスのみ対応
ポリゴン数制御 3K〜100K指定可(Meshy)
UE/Unity互換 FBX/GLB直接インポート可

推奨ワークフロー:

  1. AI 3D生成(Image-to-3D推奨)
  2. Blender等でリトポ/最適化(必要時)
  3. PBRマテリアル調整
  4. FBX/GLBでUE/Unityにインポート

360°環境素材

観点 評価 備考
解像度 最大8K
HDR/EXR 対応(Blockade Labs)
深度マップ 別途出力可
3Dメッシュ GLB出力可(NeRF変換)

推奨ワークフロー:

  1. Skybox AI生成(8K)
  2. HDR/EXRでエクスポート
  3. UE/TD/Blenderでスカイボックス/HDRI照明に使用

リアルタイム連携ツール

TouchDesigner連携

  • Spout/NDI: リアルタイムテクスチャストリーミング
  • TOPチェーン: PNG連番再生、動画テクスチャ
  • 3Dファイル読み込み: FBX/GLTFインポート

Unreal Engine連携

  • Media Texture: 動画テクスチャとして使用
  • EXRシーケンス: 連番インポート
  • Datasmith: 3Dモデルインポート
  • TDinstanceUE: TD→UE Spoutストリーミング

表現性の評価

サービス アート向け表現力 TD/UE連携しやすさ 総合評価
Midjourney ◎(芸術性高) △(Discord経由) 画像素材として優秀
OpenAI GPT Image ○(バランス良) ○(API直結) 汎用性高
Stability SDXL ○(カスタマイズ性) ◎(ローカル実行可) 制御性重視
Runway Gen-4 ◎(シネマティック) 映像素材として優秀
Google Veo 3 ◎(4K+音声) 高品質映像素材
Meshy/Tripo ◎(PBR+FBX) 3D素材として実用的
Blockade Labs ○(環境特化) ◎(HDR/EXR) 環境素材として最適

アート・インスタレーション利用の観点

利用規約の要点

著作権の帰属

  • OpenAI: 生成物の権利はユーザーに帰属
  • Midjourney: 有料プランで権利取得(年商$1M超はPro必須)
  • Stability AI: Community Licenseは年商$1M以下限定

法的リスク

  1. 著作権保護の不確実性: AIによる純粋な生成物は著作権保護を受けられない可能性(米国著作権局2025年見解)
  2. 学習データ問題: Midjourney等に対する訴訟進行中(2025年6月 Disney/Universal訴訟)
  3. 公開展示: 一部サービスは「公開展示」を別途許諾が必要とする場合あり

推奨事項

  • 商用ライセンスを明示的に取得
  • 人間による「十分な創作的関与」を加える
  • 生成元情報(SynthID等)の透かしに注意
  • 契約書に利用範囲を明記

インスタレーション向け推奨サービス

用途 推奨サービス 理由
事前生成(画像) OpenAI GPT Image 1 / Stability AI 明確な商用ライセンス
事前生成(動画) Google Veo 3 / Runway Gen-4 API安定性・品質
リアルタイム生成 ComfyUI + Replicate/Fal.ai 柔軟なワークフロー
360°環境 Blockade Labs Skybox 唯一の専門サービス

ワークフロー統合オプション

クラウドAPI

  • Replicate: Pay-per-second、ComfyUIワークフロー対応
  • Fal.ai: 高速推論、Flux/Kling/WAN対応
  • ViewComfy: ComfyUIワークフローをAPI化

自動化連携

  • n8n: Replicate/Fal.ai統合ノード
  • BuildShip: ノーコードAPI連携
  • Webhook: 長時間処理の非同期通知

コスト試算例

展示用動画コンテンツ制作(100本×10秒)

サービス 単価 合計
Google Veo 3 $0.40/秒 × 10秒 $400
Runway Gen-4 ~$0.50/本 $50
Luma Ray3 $0.32/本 $32

画像バッチ生成(1000枚)

サービス 単価 合計
OpenAI GPT Image 1 Mini $0.01/枚 $10
OpenAI DALL-E 3 $0.04/枚 $40
Stability SDXL $0.011/枚 $11

生成例イメージ(参考リンク)

画像生成

動画生成

ワールド生成

3D生成

参考リンク

画像生成

動画生成

3D生成

環境/ワークフロー