PG电子APP PGdianziAPP 分类>>
新突破! 零样PG电子- PG电子官方网站- APP下载试玩本伪装分割框架CAMF无需标注 实现精准分割
PG电子,PG电子官方网站,PG电子试玩,PG电子APP下载研究者对比了显著物体与伪装物体的注意力模式,使用归一化的平均注意力距离(Normalized Mean Attention Distance, MAD)。较低的MAD值表示模型更关注局部区域,即注意力集中在邻近位置;而较高的MAD值则反映模型倾向于全局注意力,能够捕捉图像中远距离的依赖关系。从图中可以看出,基于显著物体数据集训练的模型更偏好全局特征,而针对伪装物体数据集微调的模型则同时融合了全局和局部的注意力模式。
此外,尽管SOS数据有助于全局模式的学习,但其表征往往在语义上较为粗糙。为缓解该问题,作者引入了多尺度细粒度对齐模块(Multi-scale Fine-grained Alignment, MFA),该模块融合了由多模态大语言模型(Multimodal Large Language Model, M-LLM)生成的图像描述嵌入(caption embeddings),通过跨模态多尺度对齐机制优化分层语义表示,从而增强模型对复杂场景中细粒度语义信息的捕捉能力。