AI生成サービス・API調査2025
2025年11月時点での画像・動画・ワールド生成AIサービスとAPIの最新調査。アート作品・インスタレーション展示への活用を視野に、料金体系、API仕様、商用利用条件を整理する。
サービス比較一覧
画像生成AI
| サービス |
モデル |
料金 |
API |
商用利用 |
| OpenAI |
GPT Image 1 |
$0.011-0.25/枚 |
REST API |
可(全生成物の権利譲渡) |
| OpenAI |
DALL-E 3 |
$0.04-0.12/枚 |
REST API |
可 |
| Google |
Nano Banana (Gemini 2.5 Flash Image) |
$0.04/枚 |
Gemini API |
商用利用可 |
| Stability AI |
SDXL |
$0.011/枚 |
REST API |
売上$1M以下は無料ライセンス |
| Stability AI |
SD3.5 |
$0.037/枚 |
REST API |
要商用ライセンス |
| Midjourney |
v6 |
$10-60/月 |
Discord(API未公開) |
有料プラン限定 |
| Google |
Imagen 4 |
Vertex AI課金 |
Gemini/Vertex API |
商用利用可 |
| Adobe |
Firefly Image 5 |
Firefly Services課金 |
REST API |
商用利用可(安全ライセンス) |
動画生成AI
| サービス |
モデル |
料金 |
最大尺 |
API |
商用利用 |
| Google |
Veo 3 |
$0.40/秒(音声付き) |
8秒 |
Gemini API / Vertex AI |
可 |
| Runway |
Gen-4 |
$0.01/credit |
10秒 |
REST API |
有料プラン |
| Luma AI |
Ray3 |
$0.20-0.32/生成 |
10秒 |
REST API |
Plus以上 |
| Kling AI |
v1.6 |
$12~/月 |
3分 |
REST API |
有料プラン |
| Pika |
v2.5 |
要サブスク |
- |
限定 |
有料プラン |
| OpenAI |
Sora 2 |
ChatGPT Pro限定 |
60秒 |
API未公開 |
検討中 |
ワールド/環境生成AI
| サービス |
出力形式 |
料金 |
API |
| Blockade Labs |
360° Skybox (8K) |
$20/月(Unity) |
REST API |
3D モデル生成AI
| サービス |
料金 |
出力形式 |
PBRテクスチャ |
API |
| Meta SAM 3D |
$0.02/モデル |
メッシュ(Quest/AR連携) |
対応 |
Meta API(2026 Q1 SDK) |
| Tencent Hunyuan3D 2.5 |
20回/日無料、API 200無料クレジット |
GLB, FBX, OBJ |
PBR対応 |
REST API(Tencent Cloud) |
| Microsoft TRELLIS |
NVIDIA NIM課金 |
GLB |
対応 |
NVIDIA NIM / PiAPI |
| Meshy AI |
$16/月〜 |
FBX, GLB, OBJ, STL, USDZ, BLEND |
Diffuse/Roughness/Metallic/Normal |
REST API |
| Tripo AI (Tripo3D) |
従量課金 |
GLB, FBX, OBJ, USD, STL |
PBR対応 |
REST API |
| Rodin AI (Hyper3D) |
$24/月〜 |
OBJ, GLB, FBX |
基本対応 |
REST API |
| Luma AI Genie |
Luma課金 |
GLTF, USDZ |
対応 |
REST API |
| Adobe Substance 3D |
Firefly Services課金 |
3Dコンポジット |
対応 |
REST API(Beta) |
詳細ページ
3D生成
素材性能(リアルタイムレンダリング向け)
TouchDesigner、Unreal Engine、Unity等のリアルタイムレンダリングソフトウェアで使用する際の素材としての性能評価。
出力解像度・フォーマット
| 種別 |
サービス |
最大解像度 |
フォーマット |
アルファ対応 |
| 画像 |
OpenAI GPT Image 1 |
1536×1024 |
PNG, URL |
背景除去API別途 |
| 画像 |
DALL-E 3 |
1792×1024 |
PNG, URL |
背景除去API別途 |
| 画像 |
Stability SDXL |
1024×1024 |
PNG, JPEG |
可(設定次第) |
| 動画 |
Google Veo 3 |
4K |
MP4 |
非対応 |
| 動画 |
Runway Gen-4 |
1080p |
MP4, MOV |
非対応 |
| 動画 |
Luma Ray3 |
1080p |
MP4 |
非対応 |
| 3D |
Meshy AI |
- |
GLB, FBX, OBJ |
N/A(3Dメッシュ) |
| 3D |
Tripo AI |
- |
GLB, FBX, USD |
N/A |
| 360° |
Blockade Labs |
8K |
JPG, PNG, EXR, HDR |
深度マップ別途 |
リアルタイムレンダリング連携の評価
画像素材
| 観点 |
評価 |
備考 |
| 解像度 |
△ |
最大1792px、4K以上はアップスケール必要 |
| アルファ/透過 |
△ |
直接出力不可、後処理で背景除去 |
| HDR/EXR |
× |
非対応(SDR PNG/JPGのみ) |
| 連番出力 |
○ |
バッチ生成で対応可 |
| 品質一貫性 |
△ |
Seed固定でも完全一致は困難 |
推奨ワークフロー:
- AI生成(1024-1792px)
- Topaz/VideoProc等でアップスケール(4K-8K)
- 必要に応じてPhotoshop/DaVinci等で背景除去
- TouchDesigner/UEにテクスチャとして読み込み
動画素材
| 観点 |
評価 |
備考 |
| 解像度 |
○ |
1080p〜4K |
| アルファ/透過 |
× |
非対応(グリーンバック合成で代替) |
| フレームレート |
△ |
24fps固定が多い(60fps非対応) |
| 尺 |
× |
最大8-10秒(Sora除く) |
| ProRes/EXR |
× |
MP4/MOV圧縮形式のみ |
推奨ワークフロー:
- AI動画生成(1080p/4K)
- After Effects/DaVinci Resolveでキーイング(必要時)
- ProRes/EXRシーケンスに変換
- TouchDesigner/UEにインポート
代替案: グリーンバックプロンプトで生成 → キーイング処理
3Dモデル素材
| 観点 |
評価 |
備考 |
| メッシュ品質 |
○ |
Meshy/Tripoは実用レベル |
| PBRテクスチャ |
○ |
Diffuse/Roughness/Metallic/Normal対応 |
| リグ/アニメ |
△ |
一部サービスのみ対応 |
| ポリゴン数制御 |
○ |
3K〜100K指定可(Meshy) |
| UE/Unity互換 |
◎ |
FBX/GLB直接インポート可 |
推奨ワークフロー:
- AI 3D生成(Image-to-3D推奨)
- Blender等でリトポ/最適化(必要時)
- PBRマテリアル調整
- FBX/GLBでUE/Unityにインポート
360°環境素材
| 観点 |
評価 |
備考 |
| 解像度 |
◎ |
最大8K |
| HDR/EXR |
◎ |
対応(Blockade Labs) |
| 深度マップ |
○ |
別途出力可 |
| 3Dメッシュ |
○ |
GLB出力可(NeRF変換) |
推奨ワークフロー:
- Skybox AI生成(8K)
- HDR/EXRでエクスポート
- UE/TD/Blenderでスカイボックス/HDRI照明に使用
リアルタイム連携ツール
TouchDesigner連携
- Spout/NDI: リアルタイムテクスチャストリーミング
- TOPチェーン: PNG連番再生、動画テクスチャ
- 3Dファイル読み込み: FBX/GLTFインポート
Unreal Engine連携
- Media Texture: 動画テクスチャとして使用
- EXRシーケンス: 連番インポート
- Datasmith: 3Dモデルインポート
- TDinstanceUE: TD→UE Spoutストリーミング
表現性の評価
| サービス |
アート向け表現力 |
TD/UE連携しやすさ |
総合評価 |
| Midjourney |
◎(芸術性高) |
△(Discord経由) |
画像素材として優秀 |
| OpenAI GPT Image |
○(バランス良) |
○(API直結) |
汎用性高 |
| Stability SDXL |
○(カスタマイズ性) |
◎(ローカル実行可) |
制御性重視 |
| Runway Gen-4 |
◎(シネマティック) |
○ |
映像素材として優秀 |
| Google Veo 3 |
◎(4K+音声) |
○ |
高品質映像素材 |
| Meshy/Tripo |
○ |
◎(PBR+FBX) |
3D素材として実用的 |
| Blockade Labs |
○(環境特化) |
◎(HDR/EXR) |
環境素材として最適 |
アート・インスタレーション利用の観点
利用規約の要点
著作権の帰属
- OpenAI: 生成物の権利はユーザーに帰属
- Midjourney: 有料プランで権利取得(年商$1M超はPro必須)
- Stability AI: Community Licenseは年商$1M以下限定
法的リスク
- 著作権保護の不確実性: AIによる純粋な生成物は著作権保護を受けられない可能性(米国著作権局2025年見解)
- 学習データ問題: Midjourney等に対する訴訟進行中(2025年6月 Disney/Universal訴訟)
- 公開展示: 一部サービスは「公開展示」を別途許諾が必要とする場合あり
推奨事項
- 商用ライセンスを明示的に取得
- 人間による「十分な創作的関与」を加える
- 生成元情報(SynthID等)の透かしに注意
- 契約書に利用範囲を明記
インスタレーション向け推奨サービス
| 用途 |
推奨サービス |
理由 |
| 事前生成(画像) |
OpenAI GPT Image 1 / Stability AI |
明確な商用ライセンス |
| 事前生成(動画) |
Google Veo 3 / Runway Gen-4 |
API安定性・品質 |
| リアルタイム生成 |
ComfyUI + Replicate/Fal.ai |
柔軟なワークフロー |
| 360°環境 |
Blockade Labs Skybox |
唯一の専門サービス |
ワークフロー統合オプション
クラウドAPI
- Replicate: Pay-per-second、ComfyUIワークフロー対応
- Fal.ai: 高速推論、Flux/Kling/WAN対応
- ViewComfy: ComfyUIワークフローをAPI化
自動化連携
- n8n: Replicate/Fal.ai統合ノード
- BuildShip: ノーコードAPI連携
- Webhook: 長時間処理の非同期通知
コスト試算例
展示用動画コンテンツ制作(100本×10秒)
| サービス |
単価 |
合計 |
| Google Veo 3 |
$0.40/秒 × 10秒 |
$400 |
| Runway Gen-4 |
~$0.50/本 |
$50 |
| Luma Ray3 |
$0.32/本 |
$32 |
画像バッチ生成(1000枚)
| サービス |
単価 |
合計 |
| OpenAI GPT Image 1 Mini |
$0.01/枚 |
$10 |
| OpenAI DALL-E 3 |
$0.04/枚 |
$40 |
| Stability SDXL |
$0.011/枚 |
$11 |
生成例イメージ(参考リンク)
画像生成
動画生成
ワールド生成
3D生成
参考リンク
画像生成
動画生成
3D生成
環境/ワークフロー