建设网站涉及的技术彩票网站开发多少钱-内蒙古自治区网站建设公司-Seo优化

建设网站涉及的技术,彩票网站开发多少钱,个人博客首页,北京做彩右影影视公司网站0 论文信息论文标题: HS-FPN: High Frequency and Spatial Perception FPN for Tiny Object Detection中文标题#xff1a;高频与空间感知特征金字塔网络#xff08;HS-FPN#xff09;用于小目标检测论文链接论文代码论文出处#xff1a;AAAI2025 1 论文概述针对 FPN 在…0 论文信息论文标题: HS-FPN: High Frequency and Spatial Perception FPN for Tiny Object Detection中文标题高频与空间感知特征金字塔网络HS-FPN用于小目标检测论文链接论文代码论文出处AAAI20251 论文概述针对 FPN 在小目标检测中存在的 “特征有限、缺乏关注、空间感知不足” 三大问题提出 HS-FPN 网络通过高频感知模块HFP和空间依赖感知模块SDP增强小目标特征表达与空间关联性在 AI-TOD、DOTA_minil0 等数据集上验证相比基线模型 AP 提升 1.2-3.4 个百分点且易嵌入现有检测框架。2 实验动机现有基于 FPN 的小目标检测模型存在三大核心痛点且传统方法与前沿技术提供了优化启发共同构成实验动机FPN 的固有缺陷小目标可用特征有限骨干网络下采样压缩小目标特征最终特征图中仅残留少量像素难以支撑精准检测缺乏网络关注FPN 对所有尺度特征采用统一处理流程1×1 卷积降维、像素级相加融合未针对小目标弱特征进行特殊增强空间感知不足上下层特征通过像素级相加融合上采样导致的像素偏移引发特征错位无法捕捉小目标周围空间关联。传统频域方法的启发小目标在图像中表现为细节和边缘对应频域中的高频成分而低频成分主要是背景轮廓。传统方法如小波变换、DCT通过过滤低频可增强小目标显著性用信号杂波比 SCR 量化启发设计 HFP 模块。注意力机制的借鉴Vision TransformerViT的注意力机制擅长捕捉长距离依赖但直接应用于小目标检测易受噪声干扰因此设计 SDP 模块通过特征块划分与交叉注意力精准捕捉上下层特征的像素级空间依赖。3 创新之处提出 HS-FPN 网络架构首次将 “频域特征增强” 与 “空间依赖捕捉” 结合到 FPN 中针对性解决小目标检测的三大痛点结构简洁且兼容现有检测模型。高频感知模块HFP采用可调节参数 α 的高通滤波器动态过滤低频背景成分提取小目标高频响应双分支注意力机制通道路径CP通过 GAPGMP 聚合高频特征为含小目标信息的通道分配高权重空间路径SP生成空间掩码聚焦小目标所在区域双分支特征融合后通过 3×3 卷积优化增强特征表达的同时抑制噪声。空间依赖感知模块SDP不同于 FPN 的像素级相加SDP 对上下层特征C i C_iCi与上采样后的P i 1 P_{i1}Pi1构建 Query-Keys-Value 矩阵通过特征块划分避免维度不匹配计算特征块内像素级交叉注意力捕捉空间关联解决上采样导致的特征错位与 ViT 的块间注意力不同SDP 聚焦块内像素交互更适配小目标的局部特征增强。低侵入性与实用性HS-FPN 与 FPN 结构高度相似无需重构检测框架可直接替换现有模型中的 FPN 模块适配 ResNet、MobileNet 等多种骨干网络。4 模块介绍高频感知模块HFPHigh Frequency Perception高频特征增强HFP 模块High Frequency Perception通过 DCT 高通滤波器提取高频响应专门增强微小目标的“边缘/细节”特征。高频响应分别作为 channel 权重CP spatial 权重SP突出包含 tiny objects 的通道与空间区域。importtorchimporttorch.nnasnnimporttorch.nn.functionalasFimporttorch_dctasDCT# 定义DCT空间交互模块classDctSpatialInteraction(nn.Module):def__init__(self,in_channels,# 输入特征图的通道数ratio,# 用于计算高频保留比例的参数isdctTrue):# 标记是否使用DCT变换True时在p1p2中使用False时在p3p4中使用# 调用父类nn.Module的初始化方法super(DctSpatialInteraction,self).__init__()self.ratioratio self.isdctisdct# 如果不使用DCT创建1x1卷积用于空间注意力ifnotself.isdct:self.spatial1x1nn.Sequential(# 1x1卷积将输入通道数转为1用于生成空间注意力图*[nn.Conv2d(in_channels,1,kernel_size1,biasFalse)])# 计算权重矩阵的方法def_compute_weight(self,h,w,ratio):# 根据比例计算低频区域的高度和宽度h0int(h*ratio[0])# 高度方向的低频区域比例w0int(w*ratio[1])# 宽度方向的低频区域比例# 创建全为1的权重矩阵大小与输入特征图的空间维度相同weighttorch.ones((h,w),requires_gradFalse)# 不需要计算梯度# 将低频区域左上角的权重设为0实现过滤低频特征的效果weight[:h0,:w0]0returnweightdefforward(self,x):# x是输入特征图# 获取输入特征图的形状batch_size, channels, height, width_,_,h0,w0x.size()# 如果不使用DCT直接通过1x1卷积生成空间注意力并与输入相乘ifnotself.isdct:# 用sigmoid将卷积结果归一化到0-1作为注意力权重returnx*torch.sigmoid(self.spatial1x1(x))# 对输入特征图进行二维DCT变换idctDCT.dct_2d(x,normortho)# 使用正交归一化二维离散余弦变换# 计算权重矩阵并移动到与输入相同的设备CPU/GPUweightself._compute_weight(h0,w0,self.ratio).to(x.device)# 调整权重形状并扩展到与DCT结果相同的形状weightweight.view(1,h0,w0).expand_as(idct)# 用权重过滤低频特征保留高频特征dctidct*weight# 过滤掉低频特征# 对处理后的DCT结果进行逆DCT变换生成空间掩码dct_DCT.idct_2d(dct,normortho)# 将输入特征图与生成的空间掩码相乘returnx*dct_# 定义DCT通道交互模块classDctChannelInteraction(nn.Module):def__init__(self,in_channels,# 输入特征图的通道数patch,# 用于池化的补丁大小ratio,# 用于计算高频保留比例的参数isdctTrue# 标记是否使用DCT变换):super(DctChannelInteraction,self).__init__()self.in_channelsin_channels self.hpatch[0]# 补丁的高度self.wpatch[1]# 补丁的宽度self.ratioratio self.isdctisdct# 1x1卷积用于通道注意力计算使用分组卷积32组self.channel1x1nn.Sequential(*[nn.Conv2d(in_channels,in_channels,1,groups32)],)self.channel2x1nn.Sequential(*[nn.Conv2d(in_channels,in_channels,1,groups32)],)self.relunn.ReLU()# ReLU激活函数# 计算权重矩阵的方法与空间交互模块中的实现相同def_compute_weight(self,h,w,ratio):h0int(h*ratio[0])w0int(w*ratio[1])weighttorch.ones((h,w),requires_gradFalse)weight[:h0,:w0]0# 将低频区域权重设为0returnweight# 前向传播方法defforward(self,x):# x是输入特征图# 获取输入特征图的形状batch_size, channels, height, widthn,c,h,wx.size()# 如果不使用DCT使用普通的通道注意力机制ifnotself.isdct:# true时在p1p2中使用false时在p3p4中使用# 对输入进行自适应最大池化得到1x1的特征图amaxpF.adaptive_max_pool2d(x,output_size(1,1))# 对输入进行自适应平均池化得到1x1的特征图aavgpF.adaptive_avg_pool2d(x,output_size(1,1))# 将最大池化和平均池化的结果通过ReLU激活后再通过1x1卷积最后相加channelself.channel1x1(self.relu(amaxp))self.channel1x1(self.relu(aavgp))# 生成通道注意力权重并与输入相乘returnx*torch.sigmoid(self.channel2x1(channel))# 如果使用DCT先对输入进行二维DCT变换idctDCT.dct_2d(x,normortho)# 计算权重矩阵并移动到与输入相同的设备weightself._compute_weight(h,w,self.ratio).to(x.device)# 调整权重形状并扩展到与DCT结果相同的形状weightweight.view(1,h,w).expand_as(idct)# 过滤低频特征保留高频特征dctidct*weight# 过滤掉低频特征# 对处理后的DCT结果进行逆DCT变换dct_DCT.idct_2d(dct,normortho)# 对逆DCT结果进行自适应最大池化和平均池化输出大小为patch大小amaxpF.adaptive_max_pool2d(dct_,output_size(self.h,self.w))aavgpF.adaptive_avg_pool2d(dct_,output_size(self.h,self.w))# 对池化结果应用ReLU激活然后在空间维度上求和调整形状为(batch_size, channels, 1, 1)amaxptorch.sum(self.relu(amaxp),dim[2,3]).view(n,c,1,1)aavgptorch.sum(self.relu(aavgp),dim[2,3]).view(n,c,1,1)# 计算通道注意力channelself.channel1x1(amaxp)self.channel1x1(aavgp)# 生成通道注意力权重并与输入相乘returnx*torch.sigmoid(self.channel2x1(channel))# 定义高频感知模块classHigh_Frequency_Perception_Module(nn.Module):def__init__(self,in_channels,# 输入特征图的通道数ratio(0.25,0.25),# 高频保留比例默认保留75%的高频区域patch(8,8),# 池化补丁大小isdctTrue):# 是否使用DCT变换super(High_Frequency_Perception_Module,self).__init__()# 创建空间交互子模块self.spatialDctSpatialInteraction(in_channels,ratioratio,isdctisdct)# 创建通道交互子模块self.channelDctChannelInteraction(in_channels,patchpatch,ratioratio,isdctisdct)# 输出处理模块3x3卷积保持空间大小分组归一化self.outnn.Sequential(*[nn.Conv2d(in_channels,in_channels,kernel_size3,padding1,biasFalse),nn.GroupNorm(32,in_channels)]# 使用32组的分组归一化)defforward(self,x):# x是输入特征图# 通过空间交互模块得到空间注意力加权后的特征spatialself.spatial(x)# 通过通道交互模块得到通道注意力加权后的特征channelself.channel(x)# 将空间和通道注意力的结果相加再通过输出处理模块returnself.out(spatialchannel)if__name____main__:inputtorch.randn(1,32,50,50)# 实例化高频感知模块输入通道数为32modelHigh_Frequency_Perception_Module(in_channels32)outputmodel(input)print(f输入张量形状:{input.shape})print(f输出张量形状:{output.shape})空间依赖感知模块Spatial Dependency Perception Module SDFM实际意义①空间融合缺陷FPN递归上采样导致上下层特征图中小目标位置错位仅通过像素级加法融合特征未建模像素间的空间依赖关系。②小目标空间信息缺失小目标特征易被背景噪声掩盖传统方法无法聚焦局部区域上层高语义特征与下层细节特征缺乏有效关联特征表达不完整。实现方式①输入上层特征图A与下层特征图B。②特征映射生成通过1×1卷积分别从特征图A生成查询Q从特征图B生成键K和值V。③特征块划分将 Q、K、V划分为多个特征块对每个特征块计算Q与K的像素级相似度矩阵。④加权融合用相似度矩阵对 V 进行加权聚合生成空间依赖信息特征。⑥输出整合将特征块按空间位置拼接与原始输入相加得到增强后的特征图。待补充5 写作思路空间依赖感知模块Spatial Dependency Perception ModuleSDFM思想延伸跨领域写作、包括不仅限于请务必举一反三1、语义分割任务/小目标边界分割①实际问题传统分割网络如U-Net融合高低层特征时小目标如行人、交通标志边界易因空间错位导致分割不连续。解决方案①SDP迁移方案在解码器与编码器之间插入SDFM细节特征为Q语义特征为K/V通过像素级相似度建立边界与语义的空间关联。思想延伸跨领域写作、包括不仅限于请务必举一反三2、图像超分辨率任务/纹理细节增强①实际问题在放大低分辨率图像时高频纹理如布料纹理、文字边缘与低频语义如物体形状的空间对应关系丢失导致“伪纹理”模糊出现。解决方案①将低分辨率特征作为Q高分辨率语义特征作为K/V学习纹理细节在于语义空间分布规律。【研究对象可任意替换】

建设网站涉及的技术彩票网站开发多少钱

牡丹江做网站公司建设银行网站上预览电子回单

宁波电商网站建设开发小制作小发明手工五年级

网站续费简单logo设计

网站建设的目标定位网站加速器下载

免费免费网站模板下载改革网首页

外贸上哪个网站开发客户做外贸用什么网站比较好

建设网站涉及的技术彩票网站开发多少钱

牡丹江做网站公司建设银行网站上预览电子回单

宁波电商网站建设开发小制作小发明手工五年级

网站 续费简单logo设计

网站建设的目标定位网站加速器下载

免费免费网站模板下载改革网首页

外贸上哪个网站开发客户做外贸用什么网站比较好

网站续费简单logo设计