【CVPR26-杜克大学】超越真值约束：利用图像质量先验实现真实场景图像修复

张开发

• 2026/6/6 7:48:44 • 15 分钟阅读

分享文章

Beyond Ground-Truth: Leveraging Image Quality Priors for Real-World Image Restoration代码https://github.com/fengyang1399-pixel/IQPIR单位杜克大学、清华大学、洛桑联邦理工学院一、问题背景现在的真实场景图像修复模糊人脸、暗光、水下、背光图修复几乎都依赖标准答案图Ground-Truth监督训练。但这个模式有两个致命问题标准答案图本身质量参差不齐AI只能学到平均画质修不出顶级高清效果只挑高质量图训练会丢失数据多样性容易修出伪影、失真直接用画质分数优化容易出现“分数高、看着假”的过度优化问题传统码本模型虽然稳定但完全依赖不完美的标准答案没法主动追求人眼最舒服的高清质感。二、方法创新作者提出了一套叫IQPIR的全新框架核心是用“画质先验”代替死磕标准答案三大创新点画质条件Transformer把无参考画质评价NR-IQA的分数当作条件输入让AI直接朝着“满分画质”去修即插即用不改动原有模型结构。双码本结构普通码本学图像通用轮廓、结构高清码本专学发丝、纹理等顶级细节两者融合兼顾结构准确与质感高清。离散空间画质优化用码本的离散表示限制输出空间解决连续空间里“分数高、图像假”的过度优化让分数高真的好看。三、实验结果IQPIR在四大真实场景任务中全面登顶SOTA盲人脸修复在LFW、WebPhoto、WIDER数据集上各项画质指标全部第一用户打分最高暗光图像增强PSNR、SSIM领先FID、BIQE更低视觉更干净自然水下图像增强清晰度、色彩还原优于现有模型UIQE、UIQM指标最优背光图像修复细节保留完整颜色失真最小同时把IQPIR集成到其他主流修复模型WaveFace、Interlcm、Reti-Diff等都能带来2%~7%的稳定提升。四、优势与局限核心优势不依赖完美标准答案主动追求最高感知画质即插即用可无缝增强现有图像修复模型双码本离散优化兼顾结构准确与真实质感泛用性强人脸、暗光、水下、背光全场景适用局限画质先验来自现有NR-IQA模型会继承其评价偏差对超极端退化、极低质图像的修复稳定性仍有提升空间五、一句话总结IQPIR抛弃对不完美标准答案的依赖用画质先验双码本让AI直接学会“审美修图”在真实场景图像修复中实现更清晰、更自然、更贴合人眼观感的效果还能轻松赋能现有模型。

【CVPR26-杜克大学】超越真值约束：利用图像质量先验实现真实场景图像修复

最新文章

2025最权威的六大降重复率助手实测分析

零成本构建移动服务器：基于Termux的安卓Web服务实战

别再只用默认指标了！用通达信APP自定义一个‘分时T+0’盯盘助手，保姆级配置指南

告别“一锤子买卖”：给你的Xilinx FPGA设计加上Multiboot双镜像冗余备份

苹果15年来首次换帅，新CEO能否带领苹果打赢AI硬件之战？

从‘联网盒子’到‘数据枢纽’：T-BOX的十年演进与未来猜想（附：独立硬件 vs 融入域控的深度分析）

推荐文章

相关文章

分享文章

更多文章

Auto.js 快手极速版自动化脚本优化实战：从基础刷视频到智能点赞

ESP32 + MicroPython 实现音频录制与播放的完整方案

yuzu模拟器全平台配置指南：从卡顿到流畅的优化之道

生猪的一些思考：资本做空的实质是去散户，大企业掌握生猪价格话语权，这样就可以无限收割，利润不是一时的，看在长久摊薄做空成本

FramePack：让视频生成触手可及的部署指南

数据库表结构导出工具：跨数据库类型的文档生成解决方案

复古风音频工具箱体验：音频像素工坊的TTS与UVR功能实测

VideoDownloadHelper终极指南：三步搞定在线视频下载，免费高效解决资源保存难题

MSPM0G3507外部时钟配置实战：从8MHz晶振到80MHz主频的精准跃迁

3步攻克APA 7th格式配置：学术写作者的Word样式解决方案

突破网盘下载限速：从技术原理到实战落地的全攻略

计算机基础