OpenAI 发布 DALL-E 4:4K分辨率+视频生成,AI图像创作进入新阶段

张开发
2026/5/23 7:50:43 15 分钟阅读
OpenAI 发布 DALL-E 4:4K分辨率+视频生成,AI图像创作进入新阶段
前言DALL-E 4刚发布我第一时间扒了一遍官方信息和早期测试反馈整理成这篇文章。对AI图像生成感兴趣的开发者和创作者应该都关注到了——这次升级不是小修小补而是几乎重构了上限分辨率从2K拉到4096×4096支持数百种艺术风格还塞进了视频生成能力。本文适合正在做AI图像/视频相关项目的开发者想了解DALL-E 4技术变化的AI从业者准备把DALL-E API集成进产品的工程师一、核心升级一览1.1 分辨率2K → 4KDALL-E 3的输出上限是1792×1024这次直接干到4096×4096。这意味着什么实际用途上印刷物料直接可用海报、书籍封面大屏展示不虚展览、会议背景墙后期裁剪空间大了不少对开发者来说API调用时新增了quality: hd-4k参数python复制import openai client openai.OpenAI() response client.images.generate( modeldall-e-4, prompta photorealistic portrait of a cyberpunk city at night, detailed, size4096x4096, qualityhd-4k, n1, ) image_url response.data[0].url print(image_url)注意4K分辨率消耗token更多按API价格预估约是标准画质的3-4倍商业项目记得算好成本。1.2 艺术风格从几十种到数百种DALL-E 3支持的风格有限很多时候靠Prompt硬堆关键词。DALL-E 4内置了数百种风格标签可以在系统参数里直接指定python复制response client.images.generate( modeldall-e-4, prompta landscape, styleukiyo-e, # 浮世绘 # 其他可选watercolor, oil-painting, pixel-art, anime, 3d-render... size1024x1024, qualitystandard, n1, )实测结果内置风格标签比在Prompt里写ukiyo-e style准确很多尤其是小众风格的还原度提升明显。1.3 视频生成图像转视频初登场这是这次最大的新方向——DALL-E 4支持从文本或图像生成短视频目前最长5秒。python复制# 文本生成视频preview功能需申请白名单 response client.videos.generate( modeldall-e-4-video, prompta slow-motion wave crashing on a beach at sunset, duration5, fps24, resolution1920x1080, ) video_url response.data[0].url目前视频生成是preview状态需要单独申请API权限不是默认开放。生成质量在5秒短片范围内表现不错运动连贯性比早期版本改善很多。二、图像编辑能力增强这次编辑功能也升级了Inpainting局部重绘精度提高了一大截。以前用DALL-E做局部修改边缘融合经常很奇怪现在好多了python复制import base64 from pathlib import Path # 读取原图和遮罩 original_image base64.b64encode(Path(original.png).read_bytes()).decode() mask_image base64.b64encode(Path(mask.png).read_bytes()).decode() response client.images.edit( modeldall-e-4, imageoriginal_image, maskmask_image, promptreplace the background with a sunlit forest, size1024x1024, )遮罩文件格式要求PNG透明区域为需要重绘的部分白色区域保留原图。这个坑我踩过白色和透明搞反了会导致整图被替换。三、安全机制改进DALL-E 4在内容安全上做了一些改变主要体现在减少过度拒绝以前一些正常的艺术创作请求会莫名被拒这次改善了更精准的违规检测针对真实人物、版权内容的识别更准确错误信息更清晰被拒绝时会返回具体原因而不是笼统的内容违规这对做内容审核相关产品的开发者是个好消息误伤率下降会减少很多用户投诉。四、API变更小结主要变化点升级前确认一下参数DALL-E 3DALL-E 4modeldall-e-3dall-e-4最大尺寸1792x10244096x4096qualitystandard,hdstandard,hd,hd-4kstylevivid,natural扩展为数百种标签视频生成不支持preview阶段Prompt工程上没有太大变化之前的Prompt大部分可以直接复用风格相关的Prompt可以迁移到style参数里通常效果更好。五、总结DALL-E 4这次升级的核心变化分辨率到4K——印刷级输出覆盖更多商业场景风格系统重构——内置数百种风格减少Prompt工程量视频生成上线——还在preview阶段但方向已经明确编辑精度提升——Inpainting边缘融合改善明显安全误伤减少——减少正常创作被误拒的情况如果你现在在用DALL-E 3的API可以直接把model改成dall-e-4测试一下大部分场景应该是即插即用的。4K分辨率的成本稍高按需选用就好。视频生成那部分值得关注申请了preview白名单的可以先跑起来测试。你目前在项目里用到AI图像生成了吗DALL-E 4有没有解决你之前的痛点

更多文章