[News!] 2 papers accepted to CVPR 2026 main track and 1 to the Findings Workshop!

2 月 26, 2026
[🌫️ #PhaSR:讓陰影無所遁形]
傳統陰影去除假設光源單純,但現實世界多光源、環境光、室內燈的顏色偏移全部混在一起,直接把幾何跟語意融合只會出一堆奇怪的偽影。PhaSR 分兩個階段解這個問題。第一階段是 PAN(Physically Aligned Normalization),完全無模型、不需要訓練,基於 Retinex 理論把輸入的色偏先修掉,讓網路專心處理紋理跟陰影結構,實驗上能把 shadowed 與 non-shadowed 區域的殘差誤差降低高達 26.4%。前人運用 Retinex 理論的來做影像處理的不少,但是用在純AI推論並結合在 Restoration領域,也算是少有的創新。第二階段是 GSRA(Geometric-Semantic Rectification Attention),核心想法是直接用幾何注意力減掉語意注意力裡的噪音,在均勻光照區域抑制幾何噪音,在真正的邊緣保留精準度。結果在 Ambient6K 上直接超越所有擴散模型(PSNR 28.44 / SSIM 0.942),推論速度 87.9ms、 55.6G FLOPs,跟 StableShadowDiffusion 的 3000ms / 500G+ 更輕巧,更有效。如果簡單講一句話就是又快又好。
恭喜交大的研究助理 家銘、碩一生錦慧;成大敏求的 宇凡、數據所的 語柔。
[🪟 #ReflexSplit:同時還原透射層跟反射層]
大多數方法把反射當雜訊直接去掉,但 SIRS(Single Image Reflection Separation)要求兩層都要還原,難度完全不一樣。現實的混合模型是 I = T + R + Φ(T,R),非線性交互讓兩層糾纏在一起,網路越深越會把透射跟反射搞混,出現 ghosting。
ReflexSplit 用雙流架構(Transmission + Reflection 各自獨立跑),中間透過 LFSB 交互:先讓兩個 stream 互看對方理解共同的退化特徵,再強迫彼此分離。核心創新是 Differential Dual-Dimensional Attention,直接把反射流的注意力圖從透射流中減去,在架構層面強制執行分離而不是靠網路自己去學。搭配 CrGF 解決 upsampling 的梯度不穩定,以及特製的學習策略,整個訓練穩很多。最後在 Real20 拿到 SSIM 0.846、Nature 0.854,參數量 174M,比 SOTA對手 RDNet 的 266.4M 少了 35%。 這個除了視覺效果很好,數據上也明顯比目前SOTA好上一個等級。
恭喜交大的研究助理 家銘、碩一生錦慧;成大敏求的 宇凡、數據所的 語柔。
[⚡ #ELSA:FP32 長序列注意力,終於不用二選一|CVPR 2026 Findings Workshop]
ELSA 要解決的問題很明確:醫學影像、高光譜遙測、以及最近跟藥物開發合作以及化工合作都需要高精度的計算,這類科學計算講究精準度,如果用FP16/BF16,雖然快,但越大型模型累積誤差越大。現有 FP32 的標準注意力 O(N²) 記憶體長序列直接 OOM,還有現在的 memory-efficient 解法(ME-SDPA)雖然省記憶體,但計算是 sequential 的,慢到讓人崩潰。而且影片、高解析度相片或資料,往往需要超長Token, 除了 Token compression (資訊還會不見呢), 還有沒有其他解法? 於是我們從根本下手,重新思考,ELSA 把 softmax 注意力的累加過程重新 formulate 成 prefix-scan 問題,用兩層掃描架構(intra-block + inter-block)把平行深度從 O(N) 壓到 O(log N),完整保留 exact softmax semantics,不換 operator、不需要 retraining、不依賴 Tensor Core,從 Jetson TX2、 A100、CPU、AMD RX 9060XT 都能跑。值得一提 ELSA 也已在專利審查中。目前結果在16K tokens底下, FP32 throughput 3.4x 快於 ME-SDPA、VRAM 少 37%、65K token 仍有 12% 優勢,drop-in 換上去 ImageNet Top-1 誤差 ±0.1%,等於沒有損失。FP16是打不贏 Flash Attention系列的,但是實測結果速度也在 5%以內差距,Token越長,差距越小。
恭喜交大的研究助理 廖涴婷、博一生 馬欣蒂、研究助理 李家銘
———————-
科普:Findings Workshop 是什麼:這是 CVPR 2026 的新機制,由 Area Chair 從沒進主會但有實質貢獻的論文中額外推薦,今年有 1,717 篇(約全部投稿的 10%)入選,也還不錯啦,畢竟ELSA真的是工程之作。
感謝每一位共同作者,以及每一個深夜還在跑實驗的同學們 🙏

By Jess