2026年、AI漫画劇は「技術の試し」から「工業量産」の段階に突入した。しかしツールがどう進化しても、変わらない核心ロジックが1つある。それは、良いプロンプト(Prompt)がAI出力の上限を決定するということだ。前期の企画と絵コンテデザインの品質が最終的な完成作品の天井を直接左右するが、プロンプトこそがクリエイティブと実行を結ぶ架け橋である。
本記事では、AI漫画劇制作の4つのコアステップを分解し、そのまま使えるプロンプトテンプレートと失敗回避ガイドを提供する。小説ストーリー→脚本→絵コンテ→テキストから画像→画像から動画。各段階では「なぜそのように書くのか」を重視し、単なる数式の提示にとどまらない体系的なプロンプト思考の構築を支援する。
一、小説・ストーリーから脚本への変換:テキストから視聴覚言語への翻訳
これはAI漫画劇制作の最初のステップであり、最も見落とされやすい工程でもある。良い脚本とは、小説の内容をそのまま写し取ることではなく、「読書体験」を「撮影可能な映像言語」に変換することである。
コアプロンプトテンプレート
以下のテキストストーリーを、AI漫画劇制作に適した単話脚本(2〜5分尺)に改編してください。要件:
シーン表記の規範:各カット冒頭に場所・時間を明記(例:「屋内−カフェ−昼間」)
キャラクターの台詞は口語化:セリフは人物の性格に合致させ、長いモノローグは避ける。単話の台詞は総尺の40%以内に抑える
動作指示は簡潔な動詞で描写:心理描写ではなく実行可能な動詞を使う(「彼は窓の外を見て眉をひそめる」而非「彼は心の中でとても不安だった」)
テンポの制御:冒頭30秒以内に感情の爆発点(サスペンス/逆転)を設け、全編の起承転結とクライマックスの位置を明示する
出力フォーマット要件:
シーン番号+場所・時間
キャラクター名+台詞内容(引用符で囲む)
動作指示(括弧内に簡潔な描写)
トランジション説明(ハードカット/ディゾルブ/パン・ティルト・トラック)
テクニックの要点
核心的な葛藤を残す:主人公が何を解決すべきかを一文で語れることが、脚本の魂となる
感情フックを前面に:冒頭には視聴者を引き付ける爆発点が必須で、アルゴリズム推薦の重み付けを高める
心理描写を避ける:脚本は絵コンテマンや声優が読むもので、各セリフはすべて映像に変換可能でなければならない

二、脚本から絵コンテへの変換:テキストを映像言語に翻訳する
絵コンテはAI漫画劇制作の中で最も見落とされやすい工程だが、完成作品のプロフェッショナル度を直接左右する。腾讯クラウドの報告では「創作の重心を前倒しにする」ことが強調されており、絵コンテ段階での問題発見時の修正コストは完成映像段階のわずか1/5である。
コアプロンプトテンプレート
以下の脚本を詳細な絵コンテに改編してください。各カットに以下を含めること:
カット番号とショットサイズ:ロングショット(環境の提示)/ミディアムショット(会話・インタラクションに最もよく使用)/クローズショット(顔の表情の強調)/アップショット(重要な情報の強調)
画面の描写:構図、キャラクターの配置、主要な動作(例:「主人公が窓際に背中を向けて立ち、窓の外は豪雨」)
尺とトランジション:各カットの持続時間を明記(通常3〜8秒)、およびカット間の接続方法
カメラワーク説明:イン(内面/ディテールにフォーカス)/アウト(サスペンス/壮大さの演出)/パン(シーンの描写)/トラック(キャラクターの移動に追随)
テクニックの要点
ショットサイズの切り替えロジック:感情のクライマックスにはアップショット、シーン転換にはロングショットを使う。同じショットサイズの連続使用による視覚的疲れを避ける
動作の連続性:隣接するカット間でキャラクターの位置と動きの方向を合理的に接続する(例:「画面左から右へ歩いた」後に突然左側に現れることのないように)
尺の制御:速いテンポのシーンは短いカットでハードカット(2〜3秒)、ゆったりしたテンポのシーンは5〜8秒に伸ばしディゾルブトランジションを合わせる
三、絵コンテからのテキストから画像生成:テキストから静止画への飛躍
これはAI漫画劇のコア制作工程の1つであり、技術的ハードルが最も高いステップでもある。現在の主流手法は、絵コンテを1カットずつ静止画に変換し(各カット3〜8秒分)、その後ビデオ生成段階に移行する方法である。
コアプロンプトテンプレート(キャラクターデザイン)
「キャラクターカード」の作成:外見、服装、髪型、身分、性格を明確にする。例:「少年、黒い短髪、鋭い眼差し、白い制服、無口で冷淡、隠れた異能者」
参照画像の固定:事前にAIでキャラクターの多角度立ち絵(正面/横/背面)を生成し、以降のすべてのカットをこの画像を参照基準とする
一貫性制約語句(プロンプト末尾に必ず追加):「顔は安定かつ明瞭、人体構造は正常、服装・髪型・五官は前後で一貫、モデル貫通なし、変形なし」
コアプロンプトテンプレート(シーン描写)
場所+時間・天候+照明・色調+重要なディテール+スタイル美学。例:
「現代都市、雨の夜の屋上、夜、ネオンサインが明滅、遠くに高層ビルが林立、ブルーアワー、冷たいブルートーン、雨が地面を濡らし光の斑点を反射、空気中に雨霧が漂う、サイバーパンクスタイル」
テクニックの要点
キーワード数を制御:各モジュールで核心語を2〜3個選ぶだけで十分。過度に積み重ねるとAIのロジックが混乱する
重み付け構文の活用:ほとんどのAIツールは(キーワード:重み値)や[キーワード]をサポートしている。例えば「(鋭い眼差し:1.2)」で特徴を強制的に際立たせられる
照明と色調が雰囲気を決定:シルエットライト(人物の威厳感)、劇的な明暗コントラスト(緊張感)、ゴールデンアワー(日没1時間前の温かみ)
スタイルキーワード早見表:サイバーパンク(ネオン/雨夜/霧/アジア要素)、水墨中国画風(余白/写意/淡彩/墨のぼかし)、アメリカンレトロ(フィルム質感/粒子感/ティール&オレンジ)

四、絵コンテからの画像から動画生成:静止から動態への質的変化
これはAI漫画劇制作の最後のステップであり、作品を「生き生きとさせる」ための鍵となる。現在の主流手法は、静止画を短いビデオクリップ(各カット3〜8秒)に変換し、それらを完全なエピソードに連結する方法である。
コアプロンプトテンプレート(動作描写)
静的・矛盾する指示を避ける:「立ったまま手を上げる」「ゆっくり且つ素早く」のような記述は使わない
動作の過程と力加減を描写:例:「腕を下方から力強く頭上まで振り上げる」「身体を前に傾け重心を低くする」「連続的な回転からの着地動作」
表情の細分化語彙:曖昧な感情語を避け、微表情の描写を使う。例:「眼差しに鋭さが一瞬闪过」「口元に冷笑が浮かぶ」「瞳孔がわずかに収縮する」「眉間に不安を帯びた皺が寄る」
コアプロンプトテンプレート(カメラワーク制御)
主体+動作+表情+シーン+カメラワーク・ショットサイズ+スタイル+画質。例:
「少年、黒い短髪、鋭い眼差し、白い制服、無口で冷淡、隠れた異能者、現代都市の雨上がりの屋上に立つ、夜、ネオンサインが明滅、遠くに高層ビルが林立、ブルーアワー、冷たいブルートーン、雨が地面を濡らし光の斑点を反射、片手をポケットに突っ込み、遠くを見つめる、眼差しに一抹の迷いと決意を宿し、戦いに備える、日漫風、厚風、厚塗り、繊細な光と影、強いコントラスト、高精細、ローアングルショット、バストショット、三分割法構図、インショット、孤独でありながら熱い雰囲気、史诗感、嵐の前触れ、8k、映画画質、モデル貫通なし、キャラクター前後一貫」
テクニックの要点
動作リファレンスを事前に:動画生成前に、各カットの動きの軌跡を明確にする(例:「キャラクターが画面左から右へ歩く」または「カメラがゆっくり主人公の顔のクローズアップに近づく」)
物理法則の合理性:流体、光と影、人物の動きは基本的な物理ロジックに合致させる必要がある。視聴者は専門用語で問題を説明できないかもしれないが、「誤魔化し」フレームを見た瞬間に没入感から引き剥がされる
画質仕上げキーワード(プロンプト末尾に直接追加):「8k、4k、超高精細、映画画質、フォトリアル、繊細な光と影、高精細、ジャギーなし、フィルム質感、HDR」
五、初心者向け失敗回避ガイド:4つのよくある落とし穴
落とし穴その一:プロンプトの積み重ねでAIのロジックが混乱する
各モジュールで核心語を2〜3個選ぶだけで十分だ。キーワードが10個を超えると、AIはランダムに取捨選択を始め、出力品質がかえって低下する。
落とし穴その二:キャラクターの一貫性が保てない
統一されたキャラクターセッティングカードがないと、AIが生成した画面はカット間で顔の特徴が漂流する。解決策は、事前に多角度の立ち絵を生成して参照基準とすることだ。
落とし穴その三:動作の描写が抽象的すぎる
「彼はとても幸せだった」のような描写は具体的な映像に変換できない。実行可能な動作と表情に細分化する必要がある。「口角が上がり、目が三日月のように細まり、身体がわずかに前に傾く」のように。
落とし穴その四:トランジションのロジックを無視する
隣接するカット間の接続方法は視聴体験に直接影响する。ハードカットは速いテンポのシーンに、ディゾルブは感情の移行に適し、パン・ティルト・トラックには明確な方向が必要(例:「左から右へトラバース」)。

まとめ:プロンプトの本質は「演出家思考」である
AI漫画劇のプロンプト作成は単なるキーワードの詰め合わせではなく、クリエイティブを実行可能な映像言語に変換することである。小説から脚本への翻訳、脚本から絵コンテへの分解、テキストから画像への生成、静止から動態への飛躍。各ステップでクリエイターは演出家の視点を持つことが求められる。
肝心なのは、良いプロンプトテンプレートは流用できるが、作品の品質を真に決定するのは「物語のテンポと感情の共鳴」だということである。個人のプロンプトライブラリを構築する最善の方法は、まず1本の完全な漫画劇SOP(テキスト原稿から完成映像まで)を完成させ、その後実際の効果に基づいて各ステップのプロンプトをイテレーション最適化することこそが、工業量産の前提条件となる。