第31届国际多媒体会议(ACM International Conference on Multimedia, ACM MM)将于2023年10月29日-11月3日在加拿大渥太华召开。我院唐赫副教授指导的两篇长文被录用。ACM MM是CCF推荐的A类国际学术会议,在多媒体计算和计算机图形学领域广受关注。本次会议共收到来自全世界的3071篇有效投稿,最终录用902篇,录用率约29.3%。
论文标题:Partitioned Saliency Ranking with Dense Pyramid Transformers
通讯作者:唐赫
共同第一作者:孙承笑(软件工程21级研究生),许岩(软件工程21级研究生)
项目链接:https://github.com/ssecv/PSR
内容简介:本文提出了一种非序列化的显著目标排序方法(PSR),多次对最显著的几个目标进行无序分割,然后根据这些无序分割结果对各个显著目标进行排序。PSR可以缓解显著目标排序中的内生二义性,从而在排序精度上比传统方法具有明显提升。此外还提出了密集金字塔转换器来实现特征的全局跨尺度交互,这种交互方式用较少的计算量实现了跨尺度密集特征交互。定性和定量实验表明,PSR优于当前最先进的方法。PSR相关代码已开源,欢迎同行交流与使用。
图1 (a)序列化显著排序方法与(b)非序列化显著排序方法
论文标题:Unite-Divide-Unite: Joint Boosting Trunk and Structure for High-accuracy Dichotomous Image Segmentation
通讯作者:唐赫
共同第一作者:裴佳伦(香港中文大学博士后),周张俊(软件工程21级研究生)
项目链接:https://github.com/ssecv/UDUN
内容简介:本文提出了一种新颖的网络结构,Unite-Divide-Unite Network (UDUN)。该网络通过分治并重构互补特征,达到同时增强主体区域和结构细节的效果,从而实现了目标的高精度分割。UDUN能够提取更丰富的图像特征,同时保持模型轻量化,在高分辨率(1024×1024)输入下仍能实现65.3FPS。在多个评估指标上,UDUN的表现优于当前最先进的方法。UDUN相关代码已开源,欢迎同行交流与使用。
图2 UDUN网络结构图