浙江大学学报(工学版)

Select

1. 基于区块链的用户自定义位置共享方案

申自浩,刘梦珂,王辉,刘沛骞,刘琨

浙江大学学报(工学版) 2024, 58 (4): 655-663. DOI: 10.3785/j.issn.1008-973X.2024.04.001

摘要

HTML

PDF（pc）（1140KB）（129）

针对移动社交网络位置共享服务存在的隐私泄漏问题，提出基于区块链的用户自定义位置共享（BUDLS）方案. 基于区块链实现位置信息分布式管理，防止中央服务器收集大量用户隐私，增强用户位置信息的可控性. 设计基于公钥数字签名和同态加密相结合的加密机制，防止位置信息被攻击者非法获取. 定义灵活的访问控制策略，根据用户需要提供可靠的服务. 安全分析验证结果显示，BUDLS方案满足隐私安全目标. 仿真实验结果表明，相比传统方案，BUDLS方案降低了时间成本，提高了位置查询的准确性，有效保护了移动社交网络平台用户的位置隐私.

Select

2. 面向实时决策的物联网时效与失真性能研究

王艳芳,王伟,董云泉

浙江大学学报(工学版) 2024, 58 (4): 664-673. DOI: 10.3785/j.issn.1008-973X.2024.04.002

摘要

HTML

PDF（pc）（1538KB）（57）

在物联网中，传感器及时、准确地数据传输是决策单元获得有效数据决策（如估计、推断或控制）的保障. 为了减小估计失真，决策单元同时使用多个数据包并利用最佳线性无偏估计量（BLUE）进行联合估计. 以决策信息年龄（AuD）和均方误差（MSE）分别度量系统决策时刻信息的时效性和失真，提出2种决策方案，研究所提方案的信息时效性与失真性能. 在固定数量数据包的决策方案中，监测中心每收到固定数量数据包后进行一次估计；在固定时间间隔的决策方案中，监测中心每隔固定时间间隔进行一次估计. 通过调度系统的决策过程来最小化平均AuD和平均失真的加权和，实现系统的时效性和失真的关系平衡. 仿真结果表明，通过优化系统决策过程，所提方案可以实现在提升系统时效性的同时减小估计失真.

Select

3. 基于生成对抗网络的文本两阶段生成高质量图像方法

曹寅,秦俊平,高彤,马千里,任家琪

浙江大学学报(工学版) 2024, 58 (4): 674-683. DOI: 10.3785/j.issn.1008-973X.2024.04.003

摘要

HTML

PDF（pc）（7066KB）（61）

为了解决传统文本生成图像方法生成图像质量差和文本描述与生成图像不一致问题，以多种损失函数为约束，提出深度融合注意力的生成对抗网络方法（DFA-GAN）. 采用两阶段图像生成，以单级生成对抗网络（GAN）为主干，将第一阶段生成的初始模糊图像输入第二阶段，对初始图像进行高质量再生成，以提升图像的生成质量. 在图像生成的第一阶段，设计视觉文本融合模块，深度融合文本特征与图像特征，将文本信息充分融合在不同尺度的图像采样过程中. 在图像生成的第二阶段，为了充分融合图像特征与文本描述词特征，提出以改进后的Vision Transformer为编码器的图像生成器.定量与定性实验结果表明，对比其他主流模型，所提方法提高了生成图像的质量，与文本描述更加符合.

Select

4. 联合语义分割和深度估计的交通场景感知算法

范康,钟铭恩,谭佳威,詹泽辉,冯妍

浙江大学学报(工学版) 2024, 58 (4): 684-695. DOI: 10.3785/j.issn.1008-973X.2024.04.004

摘要

HTML

PDF（pc）（2815KB）（54）

受不同像素级视觉任务间的特征信息能够相互指导和优化的思路启发，基于多任务学习理论提出联合语义分割和深度估计的交通场景感知算法. 提出双向跨任务注意力机制，实现任务间的全局相关性显式建模，引导网络充分挖掘和利用任务间互补模式信息. 构建多任务Transformer，增强特定任务特征的空间全局表示，实现跨任务全局上下文关系的隐式建模，促进任务间互补模式信息的融合. 设计编-解码融合上采样模块来有效融合编码器蕴含的空间细节信息，生成精细的高分辨率特定任务特征. 在Cityscapes数据集上的实验结果表明，所提算法的语义分割平均交并比达到79.2%，深度估计均方根误差为4.485，针对5类典型交通参与者的距离估计平均相对误差为6.1%，能够以比现有主流算法更低的计算复杂度获得更优的综合性能.

Select

5. 基于遥感图像道路提取的全局指导多特征融合网络

宦海,盛宇,顾晨曦

浙江大学学报(工学版) 2024, 58 (4): 696-707. DOI: 10.3785/j.issn.1008-973X.2024.04.005

摘要

HTML

PDF（pc）（2780KB）（62）

在遥感图像中，建筑与道路的类间相似度高，且存在阴影和遮挡，使得现有深度学习语义分割网络在分割道路时误分割率高，为此提出全局指导多特征融合网络(GGMNet)用于提取遥感图像中的道路. 将特征图分为若干个局部特征，再将全局上下文信息与局部特征相乘，强化各类别特征的提取，以降低网络对道路周边相似地物的误判率. 采用融合多阶段特征的方法准确定位道路空间，降低将其余地物识别为道路的概率. 设计自适应全局通道注意力模块，利用全局信息指导局部信息，丰富每个像素的上下文信息. 在解码阶段，设计多特征融合模块，充分利用并融合骨干网络4个阶段的特征图中的位置信息与语义信息，发掘层与层之间的关联性以提升分割精度. 使用CITY-OSM数据集、DeepGlobe道路提取数据集和CHN6-CUG数据集对网络进行训练和测试. 测试结果表明，GGMNet具有优秀的道路分割性能，降低道路误分割率的能力比对比网络强.

Select

6. 基于个体记忆效应和距离效应的出行目的地识别

郑思静,陈勇,朱奕璋,陈喜群

浙江大学学报(工学版) 2024, 58 (4): 708-717. DOI: 10.3785/j.issn.1008-973X.2024.04.006

摘要

HTML

PDF（pc）（2793KB）（42）

通过分析个体出行轨迹数据，挖掘个体出行历史记忆特征以及个体所处位置与潜在目的地的距离特征，建立新的出行目的地识别模型. 利用杭州市200个匿名个体62880次出行数据测试所建模型的效果. 对基于位置的服务（LBS）数据进行预处理，提取以活动为目的的分段出行数据片段，采用GeoHash网格编码方法得到网格化后的个体历史目的地集合. 利用随机缺失的个体出行历史轨迹数据构建训练集和测试集，采用非线性最小二乘法对模型进行参数标定. 结果表明，所建模型提升了出行目的地识别精度；对比不同模型的召回率、折扣累计收益和F1分数，所建模型优于马尔可夫模型、决策树模型以及随机森林模型；数据缺失率敏感性分析结果验证了所建模型的鲁棒性.

Select

7. 修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测

唐善成,逯建辉,张莹,金子成,赵安新

浙江大学学报(工学版) 2024, 58 (4): 718-728. DOI: 10.3785/j.issn.1008-973X.2024.04.007

摘要

HTML

PDF（pc）（2238KB）（14）

磁瓦表面缺陷样本数量少，异常视觉特征分布发散，现有依赖目标特征的有监督检测方法不能有效检测未定义缺陷；磁瓦表面正常纹理呈非均匀且非周期性分布，使得经典重构网络难以准确地重构磁瓦表面正常特征，导致相关无监督检测方法性能低下. 为此，采用多头注意力增强的掩码图像修复网络(MIINet)，长距离提取图像特征，捕捉全局信息，增强图像修复的能力；引入视觉显著性算法抑制磁瓦表面纹理信息和突显缺陷区域，以便二值化算法精准分割缺陷嫌疑区域；利用MIINet修复待检测图像缺陷嫌疑区域，选用修复前后图像的残差图像和结构相似性实现缺陷检测与缺陷判定. 与经典无监督方法相比，修复缺陷嫌疑区域的表面缺陷检测方法的准确率提升了2.36%，F1值提升了1.62%.

Select

8. 基于双向门控式宽度学习系统的监测数据结构变形预测

罗向龙,王亚飞,王彦博,王立新

浙江大学学报(工学版) 2024, 58 (4): 729-736. DOI: 10.3785/j.issn.1008-973X.2024.04.008

摘要

HTML

PDF（pc）（1430KB）（41）

监测数据深度学习预测模型运算量大、实时性差，为此结合宽度学习系统（BLS）和双向长短时记忆（Bi-LSTM）模型的优势，提出基于双向门控式宽度学习系统(Bi-G-BLS)的结构变形预测模型. 对BLS的特征节点增加循环反馈和遗忘门结构，提高当前节点对前一节点的依赖关系，分别从正向和反向提取时间序列的内部特征，充分挖掘数据的双向特征，在提高模型预测精确度的同时减少模型预测时间. 基于实测的地铁基坑沉降监测数据的测试结果显示，所提预测模型与门控循环单元（GRU）、BLS、Bi-LSTM、G-BLS模型相比，均方根误差（RMSE）、平均绝对误差（MAE）、平均绝对百分比误差（MAPE）平均分别降低了21.04%、12.81%、24.41%；在预测精度相近的情况下，所提模型的预测时间比Bi-LSTM模型降低了99.59%. 结果表明，所提模型在预测速度和精确度上较对比模型有明显提升.

Select

9. 基于多依赖图和知识融合的方面级情感分析模型

何勇禧,韩虎,孔博

浙江大学学报(工学版) 2024, 58 (4): 737-747. DOI: 10.3785/j.issn.1008-973X.2024.04.009

摘要

HTML

PDF（pc）（1258KB）（63）

方面级情感分析存在以下问题：句法依赖解析方式单一，语法信息的提取和利用不完善；外部知识库使用有限，无法提供足以判断情感的背景知识与信息；引入的知识过多，导致结论出现偏差. 为此提出新的方面级情感分析模型，使用2种不同的句法解析方式对句子构建2种句法依赖图. 依据外部情感知识构建情感关系图，引入概念知识图谱增强句子中的方面词本体，构建与经过概念知识图谱增强的句子对应的可见矩阵. 使用双通道图卷积神经网络处理依赖图、情感关系图与可视矩阵，融合依赖图与情感关系图，对特定方面的特征表示进行语义、句法双交互. 实验结果表明，所提模型在多个数据集上的准确率和宏F1值均显著优于主流模型.

Select

10. 基于YOLOv5s的无人机密集小目标检测算法

韩俊,袁小平,王准,陈烨

浙江大学学报(工学版) 2023, 57 (6): 1224-1233. DOI: 10.3785/j.issn.1008-973X.2023.06.018

摘要

HTML

PDF（pc）（2789KB）（224）

针对无人机图像中背景复杂、小目标数量多且分布密集的特点，提出基于YOLOv5s的无人机密集小目标检测算法LSA_YOLO. 构造多尺度特征提取模块LM-fem，增强网络的特征提取能力. 为了抑制复杂背景的干扰，使算法关注目标信息，提出依靠多尺度上下文信息的、新的混合域注意力模块S-ECA. 设计自适应权重动态融合结构AFF，为浅层特征和深层特征合理分配融合权重. 将S-ECA、AFF应用于PANet结构，提高算法在复杂背景下的密集小目标检测能力. 使用损失函数Focal-EIOU代替损失函数CIOU，增强模型检测性能. 在公开数据集VisDrone2021上的实验结果表明，当设置输入分辨率为1 504 $ \times $1 504时，对所有目标类别的平均检测精度从YOLOv5s的51.5%提高到LSA_YOLO的57.6%.

Select

11. 基于深度神经网络的雷达距离超分辨方法

覃承进,蒋俊正

浙江大学学报(工学版) 2023, 57 (6): 1215-1223. DOI: 10.3785/j.issn.1008-973X.2023.06.017

摘要

HTML

PDF（pc）（1871KB）（208）

现有的雷达超分辨算法难以有效地应用于现实场景, 为此提出基于深度神经网络(DNN)的调频连续波(FMCW)雷达距离超分辨方法. 所提方法通过DNN外推雷达信号的观测时间以提高频域分辨率, 进而提高雷达的距离分辨率. 为了降低后续DNN的处理复杂度，利用快速傅里叶变换结合离散时间傅里叶变换(FFT+DTFT)算法预处理雷达的中频信号. 采用具有非线性拟合能力的DNN对输入信号进行特征提取, 预测信号的发展趋势. 将预测信号递归输入DNN以不断外推时域信号的长度, 对时域外推后的信号进行快速傅里叶变换得到具有高分辨率的距离像. 为了排除杂波干扰, 对距离像进行恒虚警率(CFAR)检测以有效地提取目标的距离信息. 仿真实验结果表明, 所提方法可以超越雷达带宽的限制实现距离超分辨. 与现有的超分辨方法相比, 所提方法具有更小的误差且更适用于处理现实场景中的雷达信号.

Select

12. 基于Transformer的高效自适应语义分割网络

张海波,蔡磊,任俊平,王汝言,刘富

浙江大学学报(工学版) 2023, 57 (6): 1205-1214. DOI: 10.3785/j.issn.1008-973X.2023.06.016

摘要

HTML

PDF（pc）（1465KB）（263）

基于Transformer的语义分割网络存在2个问题：分辨率变化引起的分割精度显著下降，自注意力机制计算复杂度过高。为此，利用零值填充的卷积可保留位置信息的特性，提出自适应卷积位置编码模块；利用自注意力计算中特定矩阵的维度可相互抵消的特性，提出降低自注意力计算量的联合重采样自注意力模块；设计用于融合不同阶段特征图的解码器，构造能够自适应不同分辨率输入的高效分割网络EA-Former. EA-Former在数据集ADE20K、Cityscapes上的最优平均交并比分别为51.0%、83.9%. 与主流分割算法相比，EA-Former能够以更低的计算复杂度得到具有竞争力的分割精度，由输入分辨率变化引起的分割性能下降问题得以缓解.

Select

13. 基于分割注意力与线性变换的轻量化目标检测

张艳,孙晶雪,孙叶美,刘树东,王传启

浙江大学学报(工学版) 2023, 57 (6): 1195-1204. DOI: 10.3785/j.issn.1008-973X.2023.06.015

摘要

HTML

PDF（pc）（1383KB）（212）

为了满足目标检测的实时性和模型轻量化需求，提高目标检测精度，对YOLOv5中的特征融合模块进行优化，提出基于金字塔分割注意力与线性变换的轻量化目标检测算法PG-YOLOv5. 利用金字塔分割注意力模块，捕获不同尺度特征图的空间信息以丰富特征空间，提升网络的多尺度特征表示能力，提高目标检测的精度. 利用基于线性变换的GhostBottleNeck模块，以少量原始特征图与线性变换得到的特征图相结合的方式，有效减少模型参数量. 算法的平均精度均值从YOLOv5L的81.2%提高到PG-YOLOv5的85.7%，PG-YOLOv5的参数量比YOLOv5L的下降了36%. 将PG-YOLOv5部署到Jetson TX2，并编写目标检测软件. 实验结果表明，基于Jetson TX2的目标检测系统的图像处理速度为262.1 ms/帧，PG-YOLOv5的平均精度均值为85.2%；与YOLOv5原始模型相比，PG-YOLOv5更适合边缘端部署.

Select

14. 基于关系门控图卷积网络的方面级情感分析

程艳芬,吴家俊,何凡

浙江大学学报(工学版) 2023, 57 (3): 437-445. DOI: 10.3785/j.issn.1008-973X.2023.03.001

摘要

HTML

PDF（pc）（1096KB）（146）

在方面级情感分析任务中，现有方法难以有效利用句法关系类型且性能依赖依存解析的准确性，为此提出注意力增强的关系门控图卷积神经网络（ARGCN）模型. 该模型将双向长短时记忆（BiLSTM）网络学习得到的句子顺序特征与依存概率矩阵相结合构建单词图；利用关系门控图卷积神经网络（RG-GCN）和注意力增强网络（AAN）分别从单词图和句子的顺序特征中获取方面词的情感特征；拼接RG-GCN和AAN的输出作为方面词最终的情感特征. 在数据集 SemEval 2014 、 Twitter 上进行对比实验和消融实验，结果表明ARGCN模型可以有效地利用关系类型，减小依存解析准确性对模型性能的影响，更好地建立方面词和意见词的联系，模型准确率优于所有基线模型.

Select

15. 基于视觉Transformer时空自注意力的工人行为识别

陆昱翔,徐冠华,唐波

浙江大学学报(工学版) 2023, 57 (3): 446-454. DOI: 10.3785/j.issn.1008-973X.2023.03.002

摘要

HTML

PDF（pc）（2240KB）（263）

针对人机协作特殊场景中工人行为识别的问题，提出基于Transformer网络的视频人体行为识别模型，利用Transformer网络核心的自注意力机制，减少网络的结构复杂度，提升网络的性能. 模型在提取图像空间特征的基础上，增加时间特征的分析，从空间和时间2个维度实现对视频数据的处理. 在处理后的数据中提取分类向量传入分类模块，得到最终的识别结果. 为了验证模型的有效性，分别在公开数据集UCF101和实验室采集的工人常规行为（自建）数据集上进行人体行为识别实验. 实验结果显示，在UCF101上模型平均识别准确率为93.44%，在自建数据集上模型平均识别准确率为98.54%.

Select

16. 基于改进YOLOv5的电子元件表面缺陷检测算法

曾耀,高法钦

浙江大学学报(工学版) 2023, 57 (3): 455-465. DOI: 10.3785/j.issn.1008-973X.2023.03.003

摘要

HTML

PDF（pc）（1697KB）（507）

目标检测模型在电子元件生产环境中的实时检测能力不佳，为此采用GhostNet替换YOLOv5的主干网络. 针对电子元件表面缺陷存在小目标及尺度变化较大的目标的情况，在YOLOv5主干网络中加入坐标注意力机制，在避免大量计算资源消耗的前提下增强感受野，将坐标信息嵌入通道注意力中以提升模型对目标的定位. 使用加权双向特征金字塔网络结构替换YOLOv5特征融合模块中的特征金字塔网络(FPN)结构，提升多尺度加权特征的融合能力. 在自制缺陷电子元件数据集上的实验结果表明，改进的GCB-YOLOv5模型平均精度达到93%，平均检测时间为33.2 ms，相比于原始YOLOv5模型，平均精度提高了15.0%，平均时间提升了7 ms，可以同时满足电子元件表面缺陷检测精度与速度的需求.

Select

17. 基于深度学习三维成型的钢板表面缺陷检测

兰欢,余建波

浙江大学学报(工学版) 2023, 57 (3): 466-476. DOI: 10.3785/j.issn.1008-973X.2023.03.004

摘要

HTML

PDF（pc）（5141KB）（302）

为了解决二维检测方法难以检测带有深度信息的缺陷问题，提出全新的三维重建网络. 提出基于多尺度特征增强的级联式三维重建网络(MFE-CasMVSNet)，并与点云数据处理技术结合，用于钢板表面缺陷检测. 为了提高三维重建的精度，提出位置导向的特征增强模块(PFEM)和多尺度特征自适应融合模块(MFAFM)，对特征进行有效提取并减少信息丢失. 提出基于曲率稀疏化的密度聚类方法(CS-DBSCAN)，用于精确识别不同部位的缺陷. 引入三维检测框，实现对缺陷的定位与检测可视化. 实验结果表明，相较于图像几何的重建方法，MFE-CasMVSNet能够更加精确、快速地实现钢板表面的三维重建. 相较于二维检测，三维缺陷检测能够精确获取缺陷的三维形状信息，实现对钢板表面缺陷的多维度检测.

Select

18. 基于无监督域适应的跨场景带钢表面缺陷识别

刘坤,杨晓松

浙江大学学报(工学版) 2023, 57 (3): 477-485. DOI: 10.3785/j.issn.1008-973X.2023.03.005

摘要

HTML

PDF（pc）（1277KB）（152）

深度学习模型面对跨场景的带钢表面缺陷识别时存在泛化性能差的问题，为此提出端到端的多级对齐域适应神经网络模型(MADA)，实现源域与目标域数据的像素级光照分布对齐与特征级纹理分布对齐. MADA通过无参考像素级光照分布对齐模块和光照校正损失函数，将源域与目标域数据投影到光照子空间，实现源域与目标域的像素级光照分布对齐. 利用纹理特征提取器和特征级域鉴别器的对抗学习，实现源域和目标域数据的纹理分布对齐. 实验在邯郸钢铁集团带钢表面缺陷数据集的F1指数达到98%，在谢维尔钢铁集团带钢表面缺陷数据集上的F1指数达到86.6%. 实验结果表明，与其他域适应方法相比，所提方法具有更好的泛化性能.

Select

19. 基于强化学习和3σ准则的组合剪枝方法

徐少铭,李钰,袁晴龙

浙江大学学报(工学版) 2023, 57 (3): 486-494. DOI: 10.3785/j.issn.1008-973X.2023.03.006

摘要

HTML

PDF（pc）（920KB）（138）

针对结构复杂、参数冗余的深度神经网络无法部署到资源受限的嵌入式系统的问题，受稀疏率对性能影响的启示，提出基于强化学习和3σ准则的组合剪枝方法. 根据稀疏率对准确率的影响，确定最佳全局稀疏率，使稀疏率和精度达到较好平衡. 在最佳全局稀疏率的指导下，利用强化学习方法自动搜索每层卷积层的最佳剪枝率，根据剪枝率剪去不重要的权重. 通过3σ准则确定全连接层每层的权重剪枝阈值，对全连接层进行权重剪枝. 通过再训练来恢复模型识别的精度. 实验结果表明，所提剪枝方法可以将网络VGG16、ResNet56和ResNet50的参数，分别压缩83.33%、70.1%和80.9%，模型的识别准确率分别降低1.55%、1.98%和1.86%.

Select

20. 结合社交影响和长短期偏好的个性化推荐算法

周青松,蔡晓东,刘家良

浙江大学学报(工学版) 2023, 57 (3): 495-502. DOI: 10.3785/j.issn.1008-973X.2023.03.007

摘要

HTML

PDF（pc）（793KB）（140）

针对基于会话的推荐算法只捕获用户的短期动态兴趣，忽略长期兴趣和社交好友对用户行为的影响，提出结合社交影响和长短期偏好的推荐算法. 设计新颖的异构关系图来组织用户的社交关系和历史会话，提出基于注意力机制的异构图神经网络对图进行学习，得到融合用户社交影响的长期偏好. 针对社交影响力不一致容易引入噪声的问题，提出加权剪枝策略，减少了噪声干扰且丰富了图结构信息. 利用无损的会话建模方法捕获用户的短期偏好，将短期偏好与长期偏好进行自适应融合，得到反映用户全局偏好的特征表示. Gowalla和Delicious数据集上的实验结果表明，所提方法的各项指标相比现有先进方法均有显著提升，证明了所提算法的有效性.

Select

21. 基于高采样率惯性测量单元的手部状态与手势识别

李卓峰,孙铭会

浙江大学学报(工学版) 2023, 57 (3): 503-511. DOI: 10.3785/j.issn.1008-973X.2023.03.008

摘要

HTML

PDF（pc）（3956KB）（128）

为了同时实现手势识别与手部状态识别，针对高采样率惯性测量单元具有同时采集动作信号与振动信号的特点，搭建基于单惯性测量单元的手势识别与触摸识别原型设备. 可视化分析手部状态数据与手势数据在时域与频域上的差异，建立手部状态、划动手势与画圈手势数据集. 针对数据特征的差异，提出差异化特征提取方法，分别构建手部状态分类与手势分类的神经网络结构. 使用数据集训练神经网络模型，在手部综合状态识别任务中正确率达到99%，在划动手势识别任务和画圈手势识别任务中的正确率均达到98%. 提出实时数据流处理、状态转移、未知类别判断的原型程序框架，基于手部状态识别模型实体与手势识别模型实体搭建实时程序，测量实际运行整体计算延时与单模型计算延时，验证模型实时运算能力. 模型评估实验与实时运算能力验证实验结果表明，使用高采样率惯性测量单元准确且实时地识别手部状态与手势具备可行性.

Select

22. 基于知识图谱的商用飞机维修方案推荐系统集成建模

邢雪琪,丁雨童,夏唐斌,潘尔顺,奚立峰

浙江大学学报(工学版) 2023, 57 (3): 512-521. DOI: 10.3785/j.issn.1008-973X.2023.03.009

摘要

HTML

PDF（pc）（2093KB）（191）

针对我国商用飞机智能维修和数字化诊断的需求,面向非结构化故障隔离手册，提出新型BM长短期记忆网络（BM LSTM）算法. 运用多数投票法融合条件随机场（CRF）、双向长短期记忆网络（BiLSTM）、BiLSTM CRF 3种实体识别算法，有效提高实体识别精度. 基于商用飞机维修故障诊断手册构建维修方案知识图谱，结合词频-逆向文件频率（TF-IDF）相似度算法与BM LSTM算法，设计商用飞机维修方案推荐系统，实现通过检索非结构化故障描述文本准确匹配到维修方案的功能. 实验结果表明，利用商用飞机故障隔离手册构建知识图谱、基于所提创新方法开发的维修方案推荐系统，能够有效保证维修信息精确匹配，显著提高维修方案形成效率.

Select

23. 多尺度残差网络模型的开放式电阻抗成像算法

刘近贞,陈飞,熊慧

浙江大学学报(工学版) 2022, 56 (9): 1789-1795. DOI: 10.3785/j.issn.1008-973X.2022.09.012

摘要

HTML

PDF（pc）（1889KB）（182）

针对开放式电阻抗成像（OEIT）的图像重建算法存在的成像精度低、对噪声敏感、重建图像伪影面积较大等问题，提出基于多尺度残差网络模型的OEIT算法. 该算法利用不同尺寸卷积核的残差块提取边界电压的多尺度特征；在完成特征拼接后，利用卷积实现深层信息融合，得到预测的电导率分布结果. 使用有限元法搭建OEIT正问题模型，构造“边界电压?电导率分布”数据集，将所提算法与其他算法在该数据集和实际模型实验中进行比较. 结果表明，所提算法使OEIT的重建精度、抗噪能力和定位目标准确性显著提高，并使检测目标的伪影面积缩小.

Select

24. 融合多尺度和多头注意力的医疗图像分割方法

王万良,王铁军,陈嘉诚,尤文波

浙江大学学报(工学版) 2022, 56 (9): 1796-1805. DOI: 10.3785/j.issn.1008-973X.2022.09.013

摘要

HTML

PDF（pc）（1159KB）（306）

为了从医疗图像中自动且准确地提取兴趣区域, 提出基于神经网络的分割模型MS²Net. 针对传统卷积操作缺乏获取长距离依赖关系能力的问题, 为了更好提取上下文信息, 提出融合卷积和Transformer的架构. 基于Transformer的上下文抽取模块通过多头自注意力得到像素间相似度关系, 基于相似度关系融合各像素特征使网络拥有全局视野, 使用相对位置编码使Transformer保留输入特征图的结构信息. 为了使网络适应兴趣区域形态的差异, 在MS²Net中应用解码端多尺度特征并提出多尺度注意力机制. 对多尺度特征图依次应用分组通道和分组空间注意力, 使网络自适应地选取合理的多尺度语义信息. MS²Net在数据集ISBI 2017和CVC-ColonDB上均取得较U-Net、CE-Net、DeepLab v3+、UTNet等先进方法更优的交并比指标, 有着较好的泛化能力.

Select

25. 日常养老情境的异构多机器人动态多任务分配

李勇,柳富强,孙柏青,张秋豪,杨俊友

浙江大学学报(工学版) 2022, 56 (9): 1806-1814. DOI: 10.3785/j.issn.1008-973X.2022.09.014

摘要

HTML

PDF（pc）（1082KB）（120）

针对异构多机器人系统动态任务分配问题，基于多智能体技术，利用符合养老情境特点的多智能体组织结构，提出处理养老情境下任务类型相对固定的异构多机器人多任务动态分配机制. 建立基于被服务对象满意度函数的投标值计算模型，兼顾多任务的动态分配与被服务对象的满意度. 根据拓扑排序算法，提出多智能体系统死锁的检测及处理方法，解决执行智能体自锁、各执行智能体间互锁的问题. 对不同任务情况在不同分配机制下的被服务对象满意度进行仿真. 仿真结果表明，在避免死锁的情况下，所提机制能够兼顾养老情景下的动态任务分配和被服务对象的满意度.

Select

26. 基于自适应采样的复杂模型全局近似

殷小亮,钱承

浙江大学学报(工学版) 2022, 56 (9): 1815-1823. DOI: 10.3785/j.issn.1008-973X.2022.09.015

摘要

HTML

PDF（pc）（1562KB）（127）

针对复杂模型近似处理的问题，提出自适应采样结合曲面曲率的全局近似方法. 采用自适应设计域分割采样方法获取新增采样点，逐步提高源模型的响应面近似模型精度. 引入判定响应面近似模型精度，提出利用几何方法计算曲面曲率，并结合启发式直接搜索算法（DIRECT）搜索响应面模型上的最大曲率点及设计域最佳分割位置. 所提方法可以运用于其他响应面模型，并适合用于大设计域、大数据源模型的近似处理. 函数源模型及复杂电动车模型的近似处理测试结果表明，所提方法具有实用性和有效性.

Select

27. 响应和滤波器偏差感知约束的无人机目标跟踪算法

王海军,张圣燕,杜玉杰

浙江大学学报(工学版) 2022, 56 (9): 1824-1832. DOI: 10.3785/j.issn.1008-973X.2022.09.016

摘要

HTML

PDF（pc）（805KB）（156）

针对无人机视觉跟踪任务中目标外观变化大、视野角度多变问题，提出基于响应和滤波器偏差感知约束的无人机实时目标跟踪算法. 该算法根据视频帧间响应差和滤波器变化的一致性，通过建模前后帧响应差和滤波器的变化，建立基于响应偏差感知和帧间滤波器偏差约束机制的目标函数，学习目标的外观变化和滤波器的帧间变化. 引入辅助变量构建优化函数，采用交替方向乘子法（ADMM）将计算目标问题转化为求相关滤波器和辅助变量的最优解. 采用跟踪准确度和成功率指标，将所提算法与其他9种算法在DTB70、UAV123@10 fps和UAVDT等3个无人机视频数据库上进行对比实验. 实验结果表明，所提算法对遮挡、形变、角度变化等干扰属性均具有良好的鲁棒性，跟踪平均速度达到39.0帧/s，能够有效跟踪无人机目标.

Select

28. 基于改进Mobilenet-YOLOv3的轻量级水下生物检测算法

郝琨,王阔,王贝贝

浙江大学学报(工学版) 2022, 56 (8): 1622-1632. DOI: 10.3785/j.issn.1008-973X.2022.08.016

摘要

HTML

PDF（pc）（3887KB）（224）

在水下生物检测中，经典目标检测模型由于体积大、参数量多，不适用于微小型水下硬件设备，而现有轻量化模型又难以平衡检测精度和实时性. 针对这一问题，本研究提出了基于改进Mobilenet-YOLOv3的轻量级检测算法CPM-YOLOv3，该算法利用规整通道剪枝算法对Mobilenet-YOLOv3进行剪枝，并将特征提取网络中的SE (squeeze-and-excitation)模块替换成CBAM (convolutional block attention module)，实现对网络模型的压缩. 同时，在不同尺寸的检测层中分别加入2个CBAM，在几乎不增加模型大小的情况下提升模型关注目标特征信息的能力. 实验结果表明，CPM-YOLOv3模型大小仅有4.86 MB，与原模型相比大小降低了94.7%，平均检测精度为87.0%，速度为5.1 ms/帧. 相较于其他网络模型，CPM-YOLOv3更适合在微小型水下设备中应用.

Select

29. 基于灰度相似性的激光点云与全景影像配准

范光宇,宫宇宸,饶蕾,陈年生

浙江大学学报(工学版) 2022, 56 (8): 1633-1639. DOI: 10.3785/j.issn.1008-973X.2022.08.017

摘要

HTML

PDF（pc）（2194KB）（163）

针对传感器参数未知、环境结构特征不明显、影像数据较少等情况，提出基于灰度相似性的车载3D激光点云与全景影像自动化配准方法. 基于全景拼接算法和柱面投影原理，分别将多张单幅图片拼接为全景影像，并将3D激光点云转换为2D深度图. 基于灰度相似性原理，将全景影像和2D深度图在水平方向和垂直方向等间隔细分成区域对，沿水平方向和垂直方向移动全景影像，计算每次移动后各细分区域对之间像素灰度值之和的比值，并求解其均方差，将均方差最小时的区域移动值作为最终匹配偏移量. 根据偏移量计算得到全景影像相对3D激光点云的水平旋转角度和垂直平移距离. 实测结果表明，本研究所提算法对场景的适应性较好，平均配准误差为2个像素，而对比方法无法实现有效配准.

Select

30. 光伏航拍红外图像的热斑自动检测方法

夏杰锋,唐武勤,杨强

浙江大学学报(工学版) 2022, 56 (8): 1640-1647. DOI: 10.3785/j.issn.1008-973X.2022.08.018

摘要

HTML

PDF（pc）（2340KB）（170）

针对光伏电站传统巡检技术的高成本、低效率以及准确率不高等问题，提出二阶段式的航拍红外图像热斑检测方法，实现对红外图像中热斑缺陷的组件级定位及精细化分类诊断. 该方法将传统图像处理技术与深度学习方法融合，进一步提升缺陷诊断的准确率与效率. 基于航拍红外图像前、后景灰度值的差异，提出基于边缘检测的组件分割方法来提取光伏组件轮廓以实现组件级定位，该方法以相对较小的硬件需求实现光伏组件有效检出率可达99.3%. 考虑到热斑成因、危害及对应处理方式的差异性，提出基于EfficientNet的红外缺陷分类模型对热斑进行精细的四分类，为电站运维人员提供更为精准的决策支撑，该模型在空间占用20.17 MB的情况下获得97.0%的热斑分类准确率. 经过实验对比分析，论证了本研究所提出的方法在缺陷诊断的效率以及准确率上都较高.

按栏目浏览