プラットフォーム別テクニック
DALL-E、Midjourney、Stable Diffusionの固有パラメータ、プロンプティングスタイル、ベストプラクティスを比較・習得する。
プレミアムコースコンテンツ
このレッスンはプレミアムコースの一部です。Proにアップグレードすると、すべてのプレミアムコースとコンテンツを利用できます。
- すべてのプレミアムコースを利用
- 1,000以上のAIスキルテンプレート付き
- 毎週新しいコンテンツを追加
🔄 前回のおさらい: レッスン5では、イテレーションワークフロー、ネガティブプロンプト、img2img、シードコントロールを学びました。今回は3大プラットフォームそれぞれの固有テクニックを深掘りします。
DALL-E
強み
- テキスト描画: 画像内のテキストをほぼ正確に生成(看板、ロゴ、パッケージ)
- リテラルな解釈: プロンプトを忠実に再現(芸術的解釈を加えない)
- インペインティング: 画像の特定部分だけを再生成
- ChatGPT統合: 会話型でプロンプトを洗練できる
プロンプティングスタイル
DALL-Eは会話的で自然な言語に反応:
古い木製のデスクの上に置かれた革装丁の古書、
横に温かいコーヒーカップ、
窓からの午後の柔らかい光が差し込む、
コージーな書斎の雰囲気、
写真スタイル、浅い被写界深度
ベストプラクティス
- 完全な文章で詳細に説明
- テキスト描画が必要な場合はDALL-Eを第一選択
- プロダクトモックアップや具体的な仕様に基づく画像に最適
Midjourney
主要パラメータ
| パラメータ | 効果 | 使用例 |
|---|---|---|
--ar | アスペクト比 | --ar 16:9(シネマティック) |
--s / --stylize | 芸術的解釈の強度 | --s 250(バランス) |
--c / --chaos | バリエーションの幅 | --c 50(多様な結果) |
--q / --quality | 生成品質 | --q 2(高品質) |
--no | ネガティブプロンプト | --no text, watermark |
--seed | シード値 | --seed 12345 |
プロンプティングスタイル
Midjourneyは簡潔でエヴォカティブなプロンプトに反応:
ancient library, golden light streaming through
stained glass, dust particles, cinematic --ar 16:9 --s 500
✅ 確認クイズ: Midjourneyの–stylize値を高く(500以上)に設定するとどうなる?(Midjourneyの美的センスが強く反映され、より芸術的で「Midjourneyらしい」仕上がりに。プロンプトの忠実度は下がるがビジュアル品質は上がることが多い。逆に低い値ではプロンプトに忠実な、よりリテラルな結果に。)
Stable Diffusion
主要パラメータ
| パラメータ | 効果 | 推奨値 |
|---|---|---|
| Steps | 生成ステップ数 | 20-30(品質とバランス) |
| CFG Scale | プロンプト忠実度 | 7-9(バランス) |
| Sampler | サンプリングアルゴリズム | Euler a、DPM++ 2M |
| Denoising | img2imgの変更度 | 0.3-0.7(用途次第) |
| Model | チェックポイント | 目的に応じて選択 |
ControlNet
Stable Diffusion最大の差別化機能。入力画像から構図を制御:
- Canny: エッジ検出 → 構造を維持しながらスタイル変更
- Depth: 深度マップ → 3D的な構図を正確に制御
- Pose: 人体ポーズ → 特定のポーズを正確に再現
- Segmentation: 領域分割 → 各領域に異なる指示
プロンプティングスタイル
Stable Diffusionはキーワード重視の構造に反応:
masterpiece, best quality, ancient library,
golden volumetric light, stained glass windows,
floating dust particles, photorealistic,
8k uhd, sharp focus
プラットフォーム比較
| 用途 | 最適プラットフォーム | 理由 |
|---|---|---|
| テキスト入り画像 | DALL-E | テキスト描画が最も正確 |
| アート/イラスト | Midjourney | 美的品質が最高 |
| カスタム制御 | Stable Diffusion | ControlNet+カスタムモデル |
| 初心者 | DALL-E | ChatGPT統合で最も直感的 |
| バッチ処理 | Stable Diffusion | ローカル実行で大量生成 |
| プロダクト写真 | DALL-E | リテラルな解釈に優れる |
| コンセプトアート | Midjourney | 芸術的解釈が強み |
| プライバシー重視 | Stable Diffusion | データがローカルに留まる |
まとめ
- DALL-Eはテキスト描画とリテラルな解釈が強み——ビジネスとプロダクト用途に最適
- Midjourneyは–stylizeで芸術的解釈を制御——美的品質が最高
- Stable Diffusionはオープンソースで完全なコントロール——ControlNetが構図制御の革命
- 各プラットフォームのプロンプティングスタイルが異なる——DALL-Eは会話的、Midjourneyは簡潔、Stable Diffusionはキーワード重視
- プロジェクトの目的に応じてプラットフォームを使い分ける
次のレッスン
次は「商用利用とライセンス」——AI生成画像の著作権、プラットフォーム別ライセンス、ビジネスでの安全な活用方法を学びます。
理解度チェック
まず上のクイズを完了してください
レッスン完了!