不同於純擴散模型,這款模型會先「思考」再下筆。即使提示詞中包含 100+ 個獨立元素,畫面仍能保持視覺連貫並符合需求。
上傳參考圖片
拖入任意照片或插畫作為參考。模型會保留構圖、角色與產品細節,同時依您的提示詞變換風格或場景。輸入愈清晰、解析度愈高,輸出也會愈銳利。
支援 PNG、JPG、WebP,最大 24MB
描述您想生成的畫面
盡量具體。模型能回應細節豐富的提示詞——光線、鏡頭角度、氛圍、文字疊層,甚至字體需求。您可以描述「東京賽博龐克街角店舖」「水彩肖像」「像素風地下城」或「中英雙語海報」,模型都會忠實還原。
0/1000
選擇畫面比例
正方形、直式、橫式或寬螢幕電影畫幅——均可輸出至 2K 解析度。

GPT Image 2 的照片級真實場景
Prompt: "A photorealistic candid photograph of an elderly sailor on a small fishing boat, shot like 35mm film." GPT Image 2 能渲染出真實的光線、精準的反射以及忠於原物的材質質感——皮膚、玻璃、織物、水面——完全沒有早期生成器那種塑膠感的 AI 質感。
照片級真實輸出直播間美女帶貨美妝示例
Prompt: "Create a vertical social livestream beauty room with a friendly creator presenting skincare products, soft pink-and-cyan studio lighting, live comments, hearts, and shopping UI overlays." GPT Image 2 可以一次生成完整直播間場景:自然出鏡的美女主播、可讀的互動 UI、美妝產品細節與商業燈光都保持協調。
美妝直播間示例為漫畫條幅而生的敘事推理
Prompt: "A vertical comic reel with 4 equal-sized panels of a pet sneaking out to explore the garden at night." 原生推理層能跨畫格保持角色一致性、構圖與故事節奏——這是純擴散模型難以達成的。
一條 prompt 生成 4 格漫畫草圖輸入,照片輸出
用 GPT Image 2 做參考圖編輯。上傳一張手繪,然後輸入 Prompt: "Turn this drawing into a photorealistic image. Preserve the exact layout, proportions, and perspective." 構圖保持不變,材質變成真實的。
輸入草圖
照片級真實輸出無需棚拍的乾淨產品去背
丟進任意產品圖,然後輸入 Prompt: "Extract the product and place it on a plain white opaque background. Preserve product geometry and label legibility." GPT Image 2 會回傳一張即用型電商圖——不用 Photoshop,也不用棚拍。
原始照片
乾淨去背把任意風格遷移到任意主體
Prompt: "Use the style from the input image and generate a man riding a motorcycle on a white background." GPT Image 2 會讀取風格參考圖,把它套用到一個全新的主體上,同時保留原圖的視覺語法。
新主體,同風格為什麼創作者選擇 GPT Image 2
GPT Image 2 是 OpenAI 首款具備原生推理能力的圖像模型,正因如此,創作者、行銷人員與開發者都在以「天」為單位遷移過來。以下是它有別於此前所有生成器的核心優勢。
GPT Image 2 定價方案
靈活的方案滿足所有使用 GPT Image 2 的族群——從探索 AI 藝術的愛好者,到每天產出數百張素材的專業團隊。
Starter
$9.9/ 月
開始探索這款模型。
包含:
- 每月 2,950 點數
- 約 118 張圖像/月
Creator
$19.9/ 月
長期創作者的最佳性價比。
包含:
- 每月 6,500 點數
- 約 260 張圖像/月
Studio
$49.9/ 月
適合團隊與重度使用者。
包含:
- 每月 18,000 點數
- 約 720 張圖像/月
GPT Image 2 常見問題
關於 GPT Image 2(OpenAI 新一代圖像模型)的常見問答。
01GPT Image 2 是什麼?
GPT Image 2 是 OpenAI 於 2026 年 4 月 21 日發布的新一代圖像生成模型,也是 OpenAI 首款在架構層原生具備推理能力的圖像模型。正因如此,它在處理複雜提示詞、多語言文字與精細構圖方面都遠勝前代模型。輸出最高可達 2K 解析度,風格涵蓋照片級寫實到像素風。
02GPT Image 2 與 DALL-E 或 GPT-4o 圖像生成有何不同?
此前 OpenAI 的圖像工具採用擴散式生成,沒有專門的推理層。這款新模型在作畫前會先思考整體構圖,因此在文字算繪、多主體複雜場景與風格還原度上皆有顯著提升。在 Image Arena 排行榜上,它在發布後 12 小時內就以 +242 分的領先優勢登頂,是該榜單史上最大的領先差。
03它能算繪中文、日文或阿拉伯文嗎?
可以。精準的多語言文字算繪正是它的王牌功能之一。模型支援拉丁、中文、日文、韓文、阿拉伯文等文字系統,以及雙語菜單、海報、產品包裝與 UI 原型等混合排版情境——這是老一代模型始終做不好的地方。
04使用本工具需要額外訂閱 OpenAI 嗎?
不需要。您可以直接透過我們的平台使用點數呼叫該模型,不必另外開通 OpenAI 帳戶。後台由我們處理模型存取與擴容,您只需專注於提示詞與生成結果即可。
05我上傳的參考圖會被保密嗎?
會。您上傳的參考圖僅用於為您生成結果,不會被用於訓練或公開分享。生成的圖像歸您所有,使用範圍須遵循 OpenAI 關於生成內容的相關條款。




