2026年,AI漫劇已從「技術嘗鮮」進入「工業化量產」階段。但無論工具如何進化,一個核心邏輯始終不變:好的提示詞(Prompt)決定了AI輸出的上限。前期策劃與分鏡設計的品質直接決定了最終成片的天花板——而提示詞正是連結創意與執行的橋樑。
本文將拆解AI漫劇製作的四個核心環節,提供可直接套用的Prompt模板和避坑指南:小說故事→劇本→分鏡腳本→文生圖→圖生視訊。每個階段都強調「為什麼這樣寫」而非僅僅給出公式,幫助創作者建立系統化的提示詞思維。
一、小說/故事轉劇本:從文字到視聽語言的翻譯
這是AI漫劇製作的第一步,也是最容易被低估的環節。好的劇本不是把小說內容照搬一遍,而是將「閱讀體驗」轉化為「可拍攝的鏡頭語言」。
核心提示詞模板
請將以下故事文本改編為適合AI漫劇製作的單集劇本(2-5分鐘時長)。要求:
場景標註規範:每個鏡頭開頭註明地點、時間(如「內景-咖啡廳-白天」)
角色對白口語化:台詞要符合人物性格,避免長段落獨白。單集對白不超過總時長的40%
動作提示簡短動詞描述:用可執行的動詞代替心理描寫(如「他皺眉看向窗外」而非「他心裡很不安」
節奏控制:開篇30秒內設置情緒爆點(懸念/反轉),標註全劇的起承轉合和高潮位置
輸出格式要求:
場景編號+地點時間
角色名稱+對白內容(用引號標註)
動作提示(括號內簡短描述)
轉場說明(硬切/疊化/推拉搖移)
技巧要點
保留核心衝突:一句話能說清主角要解決什麼問題,這是劇本的靈魂
情緒鉤子前置:開篇必須有一個能留住觀眾的爆點,提升演算法推薦權重
避免心理描寫:劇本是給分鏡師和配音演員看的,每一句台詞都要能轉化為畫面

二、劇本轉分鏡腳本:將文字翻譯為鏡頭語言
分鏡腳本是AI漫劇製作中最容易被低估的環節,卻直接決定了成片的專業度。騰訊雲報告強調「創作重心前置」——分鏡階段發現問題修改成本僅為成片階段的1/5。
核心提示詞模板
請將以下劇本改編為詳細的分鏡腳本,每個鏡頭包含:
鏡頭編號與景別:全景(展現環境)/中景(對話互動最常用)/近景(突出面部情緒)/特寫(關鍵資訊強調)
畫面描述:構圖、角色位置和關鍵動作(如「主角站在窗邊背對觀眾,窗外是暴雨」
時長與轉場:標註每個鏡頭持續時間(通常3-8秒),以及鏡頭間的銜接方式
運鏡說明:推鏡頭(聚焦內心/細節)/拉鏡頭(營造懸念/宏大感)/搖鏡頭(揭示場景)/跟鏡頭(跟隨角色移動)
技巧要點
景別切換邏輯:情緒高潮用特寫,場景轉換用全景。避免連續使用相同景別導致視覺疲勞
動作連貫性:相鄰鏡頭的角色位置和運動方向要合理銜接(如「從畫面左側走向右側」後不能突然出現在左側)
時長控制:快節奏場景用短鏡頭硬切(2-3秒),慢節奏場景可拉長至5-8秒並配合疊化轉場
三、分鏡腳本文生圖:從文字到靜態畫面的跨越
這是AI漫劇的核心生產環節之一,也是技術門檻最高的步驟。當前主流做法是將分鏡腳本逐條轉化為靜態圖像(每個鏡頭3-8秒),再進入視訊生成階段。
核心提示詞模板(角色設計)
建立「人設卡」:明確外貌、服裝、髮型、身份、性格。示例:「少年,黑色短髮,凌厲眼神,白色校服,冷漠寡言,隱藏異能者」
固定參考圖:提前用AI生成角色多視角立繪(正面/側面/背面),後續所有鏡頭以此圖為參考基準
一致性約束詞(必加在提示詞末尾):「面部穩定清晰,人體結構正常,服裝、髮型、五官前後一致,無穿模、無變形」
核心提示詞模板(場景描述)
地點+時間/天氣+光線/色調+關鍵細節+風格美學。示例:
「現代都市,雨夜天台,夜晚,霓虹燈光閃爍,遠處高樓林立,藍調時刻,冷藍色調,雨水打濕地面反射光斑,空氣中漂浮著雨霧,賽博龐克風格」
技巧要點
控制關鍵詞數量:每個模組挑2-3個核心詞即可,堆砌過多會導致AI邏輯混亂
善用權重語法:多數AI工具支援(關鍵詞:權重值)或[關鍵詞],如「(眼神凌厲:1.2)」可強制突出特徵
光線與色調決定氛圍:輪廓光(人物高大威嚴)、戲劇性明暗對比(緊張感)、黃金時刻(日落前1小時溫暖感)
風格關鍵詞速查:賽博龐克(霓虹/雨夜/霧氣/亞洲元素)、水墨國風(留白/寫意/淡彩/墨色暈染)、美式復古(膠片質感/顆粒感/青橙色調)

四、分鏡圖生視訊:從靜態到動態的質變
這是AI漫劇製作的最後一步,也是決定作品「活起來」的關鍵。當前主流做法是將靜態圖像轉化為短視訊片段(每個鏡頭3-8秒),再拼接為完整劇集。
核心提示詞模板(動作描述)
避免靜態/矛盾指令:不要寫「站著舉手」或「既緩慢又快速」
描寫運動過程+力度:如「手臂從下方有力地揮至頭頂」、「身體前傾重心壓低」、「連貫的旋轉落地動作」
表情細化詞彙:替換籠統情緒詞,使用微表情描述。示例:「眼神閃過狠厲」、「嘴角勾起冷笑」、「瞳孔微微收縮」、「眉頭緊鎖帶著一絲不安」
核心提示詞模板(運鏡控制)
主體+動作+表情+場景+運鏡/景別+風格+畫質。示例:
「少年,黑色短髮,凌厲眼神,白色校服,冷漠寡言,隱藏異能者,站在現代都市的雨後天台,夜晚,霓虹燈閃爍,遠處高樓林立,藍調時刻,冷藍色調,雨水打濕地面反射光斑,單手插兜,眺望遠方,眼神帶著一絲迷茫和堅定,準備迎接戰鬥,日漫風,厚塗,細膩光影,強烈對比,高細節,仰視鏡頭,半身構圖,三分法構圖,推鏡頭,孤獨又熱血的氛圍,史詩感,風雨欲來,8k,電影質感,無穿模,人物前後一致」
技巧要點
動作參考前置:在生成視訊前,先明確每個鏡頭的運動軌跡(如「角色從畫面左側走向右側」或「鏡頭緩慢推進到主角面部特寫」
物理規律合理性:流體、光影、人物運動需符合基本物理邏輯。觀眾可能不會用專業術語描述問題,但一旦看到「穿幫」幀會立刻出戲
畫質收尾詞(直接堆在提示詞末尾):「8k,4k,超高畫質,電影質感,照片級真實,細膩光影,高細節,無鋸齒,膠片質感,HDR」
五、新手避坑指南:四大常見陷阱
陷阱一:提示詞堆砌導致AI邏輯混亂
每個模組挑2-3個核心詞即可。當關鍵詞超過10個時,AI會開始隨機取捨,輸出品質反而下降。
陷阱二:角色一致性失控
沒有統一的角色設定卡,AI生成的畫面會在不同鏡頭間出現面部特徵漂移。解決方案是提前生成多視角立繪並作為參考基準。
陷阱三:動作描述過於抽象
「他很高興」這樣的描述無法轉化為具體畫面。必須細化為可執行的動作和表情:「嘴角上揚,眼睛彎成月牙狀,身體微微前傾」
陷阱四:忽略轉場邏輯
相鄰鏡頭的銜接方式直接影響觀感。硬切適合快節奏場景,疊化適合情緒過渡,推拉搖移需要明確方向(如「從左向右橫移」)。

總結:提示詞的本質是「導演思維」
AI漫劇提示詞的寫作不是簡單的關鍵詞堆砌,而是將創意轉化為可執行的鏡頭語言。從小說到劇本的翻譯、從劇本到分鏡的分解、從文字到圖像的生成、從靜態到動態的跨越——每個環節都要求創作者具備導演的視角。
記住:好的提示詞模板可以套用,但真正決定作品品質的是「敘事節奏與情緒共鳴」。建立個人提示詞庫的最佳方式是:先完成一條完整的漫劇SOP(從故事文本到成片),再根據實際效果迭代優化每個環節的Prompt才是工業化量產的前提。