论文拆解|TextOVSR:文本引导戏曲专属视频超分,细分场景 VSR 新方案
这篇文章详细介绍了CVPR2026的 TextOVSR,这是一种专为老旧戏曲视频修复设计的文本引导视频超分辨率新方案。该技术通过视觉与文本双模态融合,利用描述画面缺陷和戏曲内容的文字信息,精准还原脸谱、刺绣等传统艺术细节。相比泛化能力较弱的通用算法,它在处理非物质文化遗产影像的复杂退化问题上表现出卓越的针对性。该方案采用正负双分支架构来平衡去噪与细节强化,有效解决了传统修复中纹理模糊或失真的痛点。虽然在通用视频和极速运动场景下存在局限性,但它为垂类文化影像的数字化高清重塑提供了低成本且高效的工业级参考。TextOVSR: Text-Guided Real-World Opera Video Super-Resolution