祝贺实验室团队硕士生季晨皓一篇论文CamPVG: Camera-Controlled Panoramic Video Generation with Epipolar-Aware Diffusion被SIGGRAPH ASIA2025录用。
近年来,支持相机控制的视频生成技术发展迅猛,为视频生成赋予了更精准的视角调控能力。然而,现有方法多聚焦于透视投影场景下的视频生成相机控制,在全景视频生成领域仍面临显著挑战,其核心难点在于全景位姿表示与球面投影本身固有的复杂性。为解决这一难题,我们提出 CamPVG, 首个由精确相机位姿引导的全景视频生成框架。该框架通过球形投影机制,实现了全景图像的相机位置编码与跨视角特征聚合。具体而言,我们设计了普朗克全景嵌入(Panoramic Plücker Embedding),通过球坐标转换与普朗克坐标的融合,对相机外参进行高效编码;该位姿编码器可有效捕捉全景几何结构,克服了传统方法在等矩形全景投影场景下的应用局限。此外,我们引入球面对极模块(Spherical Epipolar Module),通过沿极线的自适应注意力掩码机制施加几何约束,实现了细粒度跨视角特征聚合,显著提升了生成全景视频的质量与视角一致性。大量实验结果验证,所提方法能够生成与相机轨迹高度一致的高质量全景视频,其性能显著优于现有方法在该任务上的表现。
