[Award] Big Congrats! We won 3rd place from NTIRE 2025 Shadow Removal Challenge in CVPR 2025!

3 月 9, 2025
大恭喜 ACVLab 林宇凡李家銘 (交大AI學院兼任研究助理/成大數據所碩士班) 在 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2025 的最重要的 Low-Level Vision 國際競賽中,且極具盛名的 NTIRE 競賽,於 Shadow Removal Challenge 中,並從全球共超過三百對參加的隊伍中,獲得世界第三佳績!更重要的是,這是宇凡 (碩一) 第一次主導,而這也代表我們 ACVLab 的一年級,已經能獨當一面的最佳證明。
本次 NTIRE 2025 Shadow Removal Challenge 即聚焦於極具應用價值且充滿挑戰的「陰影移除(Shadow Removal)」任務,旨在從室內自然場景中準確地消除陰影,同時完整地保留物體原始的結構與真實質感,這其實對很多應用都很有幫助;舉凡自駕車、運動視訊辨識分析、甚至於3D建模等,消除陰影的影像,可以協助AI更好的理解這個影像內的世界。
陰影移除任務經常面臨多種挑戰,包括陰影與背景之間邊界模糊、光照條件變化劇烈,以及不同場景間陰影形態的差異。室內場景的陰影特徵尤其複雜,不僅包含由直接光照產生、邊緣較銳利的「硬陰影(Hard Shadow)」,也包含由環境或其他物體反射光線所造成、邊緣較柔和的「軟陰影(Soft Shadow)」。本次競賽進一步提供了高解析度的室內單一影像,無法直接以完整影像作為模型的輸入,因此必須將影像分割為小區塊處理,造成 Transformer 架構原本的全局感受野優勢無法充分發揮,重建難度大幅上升。
為了克服上述挑戰,近期已有一些 paper 觀察到,陰影雖然會影響表面的色彩與亮度分布,但並不會反映在深度資訊(Depth)與物體表面的法向資訊(Surface Normal)之中。因此,將原始 RGB 影像轉換為深度影像與法向影像作為額外的輔助輸入,已經被證明能夠做到較單一模態更好的效果,這也是一種輔助多模態的做法。然而,宇凡觀察到,陰影覆蓋區域通常伴隨紋理細節的損失,導致在進行陰影移除時,容易使得重建結果顯得模糊,而這些資訊在頻域中是以高頻的方式呈現。因此,我們特別引入了頻域增強模組,針對影像的高頻資訊進行強化,以恢復因陰影遮蔽而遺失的紋理細節,並輔以深度圖及法向圖作為額外引導資訊,讓模型更準確地復原被陰影遮蔽的區域,提升整體感知品質與結構一致性,最終成功重建高品質、高解析度且無陰影的結果,除了 Pecepetual Quality 略輸,在客觀品質評估上,都是全球第一,且超越第二名一個顯著GAP,也代表了宇凡在觀察此競賽的能力不凡,再次恭喜宇凡、家銘!

By Jess