浙江大学学报(工学版)

Select

1. 基于改进强化学习的多智能体追逃对抗

薛雅丽,叶金泽,李寒雁

浙江大学学报(工学版) 2023, 57 (8): 1479-1486. DOI: 10.3785/j.issn.1008-973X.2023.08.001

摘要

HTML

PDF（pc）（1158KB）（441）

针对多智能体追逃问题，提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法. 将多智能体深度确定性策略梯度算法（MADDPG）和双延迟-确定策略梯度算法（TD3）相结合，提出多智能体双延迟-确定策略梯度算法（MATD3）. 针对多智能体追逃问题中奖励函数存在大量稀疏奖励的问题，提出利用优先经验回放方法确定经验优先度以及采样高价值经验. 设计解耦奖励函数，将奖励函数分为个体奖励和联合奖励以最大化全局奖励和局部奖励，提出DEPER-MATD3算法. 基于此算法设计仿真实验，并与其他算法对比，实验结果表明，该算法有效解决了过估计问题，且耗时相比MATD3算法有所减少. 在解耦奖励函数环境下该算法训练的追击者的全局平均奖励升高，追击者有更大的概率追击到逃逸者.

Select

2. 基于小世界理论的区块链Kademlia网络改进方法

赵越,赵赫,谭海波,余斌,俞望年,马志宇

浙江大学学报(工学版) 2024, 58 (1): 1-9. DOI: 10.3785/j.issn.1008-973X.2024.01.001

摘要

HTML

PDF（pc）（1194KB）（386）

针对当前区块链Kademlia网络研究中通常以牺牲安全性为代价提升可扩展性的问题，提出基于小世界理论的区块链Kademlia网络改进方法. 该方法遵循小世界理论的思想，提出置换扩容节点的概率公式，概率与节点间距离呈反比，节点置换次数和额外增加的节点数量可以根据实际情况灵活调整. 通过理论分析和实验验证，证明了采用该方法改造的网络能够达到最终的稳定状态. 实验结果显示，利用该方法将全网广播交易消息时须经历的传输层级减少了15.0%~30.8%，加快了定位节点的速率. 与其他改变网络结构的优化算法相比，该方法降低了网络的结构化程度，增强了网络的安全性.

Select

3. 多特征融合的驾驶员疲劳状态检测方法

方浩杰,董红召,林少轩,罗建宇,方勇

浙江大学学报(工学版) 2023, 57 (7): 1287-1296. DOI: 10.3785/j.issn.1008-973X.2023.07.003

摘要

HTML

PDF（pc）（1481KB）（358）

针对现有疲劳状态检测方法无法适用于疫情防控下的驾驶员，利用改进后的YOLOv5目标检测算法，对驾驶员的面部区域进行检测，建立多特征融合的疲劳状态检测方法. 针对公交驾驶特性，建立包含佩戴口罩和未佩戴口罩情况的图像标签数据. 通过增加YOLOv5模型的特征采样次数，提高眼、嘴、面部区域的检测精度. 利用BiFPN网络结构保留多尺度的特征信息，使得预测网络对不同大小的目标更敏感，提升整体模型的检测能力. 结合人脸关键点算法提出参数补偿机制，提高眨眼、打哈欠帧数的准确率. 将多种疲劳参数融合归一化处理，开展疲劳等级划分. 公开数据集NTHU和自制数据集的验证结果表明，该方法对佩戴口罩和未佩戴口罩情况均可以进行眨眼、打哈欠识别，可以准确地判断驾驶员的疲劳状态.

Select

4. 自适应樽海鞘群算法求解考虑运输时间的柔性作业车间调度

牛昊一,吴维敏,章庭棋,沈微,张涛

浙江大学学报(工学版) 2023, 57 (7): 1267-1277. DOI: 10.3785/j.issn.1008-973X.2023.07.001

摘要

HTML

PDF（pc）（1024KB）（350）

针对考虑运输时间的柔性作业车间调度问题，以最小化最大完工时间为优化目标，提出自适应樽海鞘群算法. 设计基于随机密钥方法的3层编码方案，将编码的离散解空间连续化. 引入惯性权重评价跟随者之间的相互影响程度，增强算法的全局探索与局部搜索能力. 提出自适应更新领导者-跟随者种群数量策略，根据种群迭代状态对领导者和跟随者的数量进行自适应调整. 在邻域搜索中引入禁忌搜索策略，防止算法陷入局部最优. 通过基准算例测试，验证了算法的有效性和优越性，发现AGV数量对完工时间的影响符合边际效应递减的规律.

Select

5. 混合采样下多级特征聚合的视频目标检测算法

秦思怡,盖绍彦,达飞鹏

浙江大学学报(工学版) 2024, 58 (1): 10-19. DOI: 10.3785/j.issn.1008-973X.2024.01.002

摘要

HTML

PDF（pc）（2492KB）（282）

针对现有基于深度学习的视频目标检测算法无法同时满足精度和效率要求的问题，在单阶段检测器YOLOX-S的基础上，提出基于混合加权采样和多级特征聚合注意力的视频目标检测算法. 混合加权参考帧采样(MWRS)策略采用加权随机采样操作和局部连续采样操作，充分利用有效的全局信息与帧间局部信息. 多级特征聚合注意力模块(MFAA)基于自注意力机制，对YOLOX-S提取的分类特征进行细化，使得网络从不同层次的特征中学到更加丰富的特征信息. 实验结果表明，所提算法在ImageNet VID数据集上的检测精度均值AP50达到77.8%，平均检测速度为11.5 ms/帧，在检测图片上的目标分类和定位效果明显优于YOLOX-S，表明所提算法达到了较高的精度，具有较快的检测速度.

Select

6. 基于动态注意力网络的图像超分辨率重建

赵小强,王泽,宋昭漾,蒋红梅

浙江大学学报(工学版) 2023, 57 (8): 1487-1494. DOI: 10.3785/j.issn.1008-973X.2023.08.002

摘要

HTML

PDF（pc）（1196KB）（275）

针对图像超分辨率算法在具有不同重要性的通道和空间域上采取相同的处理方式，导致计算资源无法集中利用到重要特征上的问题，提出基于动态注意力网络的图像超分辨率算法. 该算法改变了现有均等处理注意力机制的方式，通过构建的动态注意力模块对不同的注意力机制赋予动态学习的权重，以获取网络更需要的高频信息，重建高质量图片；通过特征重用的方式构建双蝶式结构，充分融合2个注意力分支的信息，弥补不同注意力机制间所缺失的特征信息. 在Set5、Set14、BSD100、Urban100和Manga109数据集上的模型评估结果表明，相较于其他主流超分辨率算法，本研究所提算法整体性能表现更好. 当放大因子为4时，相较于次优算法，所提算法在5个公开测试集上的峰值信噪比分别提升了0.06、0.07、0.04、0.15、0.15 dB.

Select

7. 基于循环神经网络的双目视觉物体6D位姿估计

杨恒,李卓,康忠元,田兵,董青

浙江大学学报(工学版) 2023, 57 (11): 2179-2187. DOI: 10.3785/j.issn.1008-973X.2023.11.005

摘要

HTML

PDF（pc）（1068KB）（268）

针对当前物体6D位姿估计任务准确率较低的问题，提出双目数据集制作方法及物体6D位姿估计网络Binocular-RNN. 将YCB-Video Dataset中已有图像作为双目相机左摄像头捕获内容，利用Open GL将YCB-Video Dataset中相应三维物体模型进行导入，输入各物体相关参数，由虚拟双目相机右摄像头捕获合成图片. 利用单目预测网络分别对双目数据集中左、右图像的几何特征进行提取. 经过循环神经网络对几何特征进行融合，并预测物体6D位姿. 以模型点平均距离(ADD)、平均最近点距离(ADDS)、平移误差和角度误差作为评价指标,对Binocular-RNN与其他位姿估计方法进行对比. 结果表明，在利用单一物体对网络进行训练时，Binocular-RNN 的ADD或ADDS指标得分分别为PoseCNN、GDR-Net的2.66、1.15倍. 利用基于物理的实时渲染（Real+PBR）方式训练的Binocular-RNN的性能超过基于深度神经网络的迭代6D姿态匹配的方法(DeepIM).

Select

8. 航空装配领域中命名实体识别的持续学习框架

刘沛丰,钱璐,赵兴炜,陶波

浙江大学学报(工学版) 2023, 57 (6): 1186-1194. DOI: 10.3785/j.issn.1008-973X.2023.06.014

摘要

HTML

PDF（pc）（1091KB）（265）

为了构建航空装配领域中装配流程信息、装配技术知识、行业标准和三者内在联系组成的航空装配知识图谱，提出基于持续学习的命名实体识别技术框架. 所提框架的特点是从零语料到大规模语料的渐进式学习过程中，在不依赖人工设定特征的情况下，始终保持较高的识别效果. 从飞机总装配和部件对接的实际工业场景展开所提框架的性能对比实验，并以操纵拉杆和钢索的安装为实验案例. 实验结果表明，在处理不同规模的语料环境的情况下，所提框架在正确率、召回率、F1值上均显著优于以往算法，所提框架可以为航空装配领域命名实体识别任务持续提供可信的结果.

Select

9. 基于Transformer的高效自适应语义分割网络

张海波,蔡磊,任俊平,王汝言,刘富

浙江大学学报(工学版) 2023, 57 (6): 1205-1214. DOI: 10.3785/j.issn.1008-973X.2023.06.016

摘要

HTML

PDF（pc）（1465KB）（263）

基于Transformer的语义分割网络存在2个问题：分辨率变化引起的分割精度显著下降，自注意力机制计算复杂度过高。为此，利用零值填充的卷积可保留位置信息的特性，提出自适应卷积位置编码模块；利用自注意力计算中特定矩阵的维度可相互抵消的特性，提出降低自注意力计算量的联合重采样自注意力模块；设计用于融合不同阶段特征图的解码器，构造能够自适应不同分辨率输入的高效分割网络EA-Former. EA-Former在数据集ADE20K、Cityscapes上的最优平均交并比分别为51.0%、83.9%. 与主流分割算法相比，EA-Former能够以更低的计算复杂度得到具有竞争力的分割精度，由输入分辨率变化引起的分割性能下降问题得以缓解.

Select

10. 基于个体预测的动态多目标优化算法

王万良,陈忠馗,吴菲,王铮,俞梦娇

浙江大学学报(工学版) 2023, 57 (11): 2133-2146. DOI: 10.3785/j.issn.1008-973X.2023.11.001

摘要

HTML

PDF（pc）（1723KB）（257）

为了快速追踪随环境变化的动态多目标优化问题的Pareto前沿，提出基于个体预测的动态多目标优化算法(IPS). 利用参考点联系算法筛选出特殊点，该特殊点具有良好的收敛性和多样性，通过对特殊点集的预测快速响应环境变化. 提出针对种群中心点预测的反馈校正机制，在预测非支配解集的过程中，对预测步长进行反馈校正，从而使预测更加准确；为了避免算法陷入局部最优，提出混合多样性维持机制，引入由拉丁超立方抽样和精度可控的突变策略分别产生的随机个体，以提高种群的多样性. 将所提算法与其他4种动态多目标优化算法进行对比分析，实验结果表明，IPS能够平衡种群的多样性和收敛性，在FDA、DMOP、F5~F10系列问题上，实验结果优于其他4种算法.

Select

11. 基于XGBoost-SHAP的钢管混凝土柱轴向承载力预测模型

陈曦泽,贾俊峰,白玉磊,郭彤,杜修力

浙江大学学报(工学版) 2023, 57 (6): 1061-1070. DOI: 10.3785/j.issn.1008-973X.2023.06.001

摘要

HTML

PDF（pc）（2896KB）（246）

为了可靠、准确地预测钢管混凝土（CFST）柱的轴向承载力，建立和解释集成机器学习的CFST柱轴向承载力预测模型. 使用马氏距离评估CFST柱数据库质量，通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型，使用K折交叉验证(K-Fold CV)和树结构概率密度估计(TPE)算法寻找模型的最优超参数组合. 采用不同评价指标将优化后XGBoost模型的预测值与已有方法和未优化XGBoost模型的计算值比较. 使用SHAP方法给出XGBoost模型预测结果的整体和局部的解释. 结果表明，经过超参数调整优化的XGBoost模型的性能超越了相关规范和经验公式的性能，且SHAP方法能够有效地解释XGBoost模型的输出.

Select

12. 结合静态事实和重复历史事实的动态知识图谱推理方法

林栋,李永强,仇翔,冯远静,谢碧峰

浙江大学学报(工学版) 2023, 57 (10): 1915-1922. DOI: 10.3785/j.issn.1008-973X.2023.10.001

摘要

HTML

PDF（pc）（856KB）（243）

针对现有的动态知识图谱推理方法容易忽略动态知识图谱中存在着大量静态信息和重复历史事实的问题，提出结合静态事实和重复历史事实的动态知识图谱网络方法. 该方法利用动态知识图谱中实体间隐藏的静态联系来构成静态事实，并协助动态知识图谱推理；利用历史事实构建历史词表，在预测未来时对历史词表进行查询；对历史中未发生的事实进行惩罚，提高重复历史事实的预测概率. 在2个公开的数据集上进行动态知识图谱推理实验，对比实验时选用目前主流的5个模型作为基线. 在实体预测实验中，平均倒数排名(MRR)达到0.489 1和0.530 3，Hits@10达到0.588 7和0.616 5，证明了所提方法的有效性.

Select

13. 基于集成学习与深度学习的日供水量预测方法

周欣磊,顾海挺,刘晶,许月萍,耿芳,王冲

浙江大学学报(工学版) 2023, 57 (6): 1120-1127. DOI: 10.3785/j.issn.1008-973X.2023.06.007

摘要

HTML

PDF（pc）（1780KB）（240）

为了有效改善日供水量预测精度低、泛化能力不足的问题，以义乌市4个水厂的历史日供水数据为基础，提出基于集成学习算法改进的长短时记忆(LSTM)神经网络的供水预测方法. 该方法以拉依达准则预处理后的历史日供水量作为数据输入，将具备长期时序信息记忆能力的LSTM神经网络作为集成学习的弱预测器，使用网格搜索法进行网络超参数调优，使用AdaBoost集成学习算法对弱预测器进行加权组合得到强预测器. 结果表明：与随机森林、AdaBoost与LSTM神经网络相比，基于集成学习算法改进的LSTM神经网络有最高的纳什效率系数(NSE)、最低的均方根误差(RMSE)与平均绝对误差(MAE)，对日供水数据的变化趋势与峰值的拟合效果最好；改进LSTM供水预测方法的时序预测精度得到极大提升，有较好的泛化能力、稳定的预测性能，能够为城市水资源合理配置、一体化智能供水调度提供重要参考.

Select

14. 面向水下场景的轻量级图像语义分割网络

郭浩然,郭继昌,汪昱东

浙江大学学报(工学版) 2023, 57 (7): 1278-1286. DOI: 10.3785/j.issn.1008-973X.2023.07.002

摘要

HTML

PDF（pc）（2385KB）（240）

提出面向水下场景的图像语义分割网络，考虑到速度和准确度之间的权衡问题，网络采用轻量且高效的编解码器结构. 在编码器部分，设计倒置瓶颈层和金字塔池化模块，高效地提取特征. 在解码器部分，构建特征融合模块融合多水平特征，提升了分割的准确度. 针对水下图像边缘模糊的问题，使用辅助的边缘损失函数来更好地训练网络，通过语义边界的监督细化分割的边缘. 在水下语义分割数据集SUIM上的实验数据表明，对于320像素×256像素的输入图像，该网络在NVIDIA GeForce GTX 1080Ti显卡上的推理速度达到258.94帧/s，mIoU达到53.55%，能够在保证高准确度的同时，达到实时的处理速度.

Select

15. 分体式飞行汽车全自主对接导引系统设计与验证

王琛,林威,胡良鹏,张骏铭

浙江大学学报(工学版) 2023, 57 (12): 2345-2355. DOI: 10.3785/j.issn.1008-973X.2023.12.001

摘要

HTML

PDF（pc）（3722KB）（238）

研究针对分体式飞行汽车全自主对接导引系统的流程架构、软硬件系统、核心算法以及验证. 根据导引方式的过渡，采用远程、中程、近程多段融合导引. 针对YOLOv4-tiny实际使用中的误检、漏检情况，使用点密度聚类和核相关滤波算法提供光顺的融合信息. 提出修正因子方法以实现近程导引阶段AprilTag测量数据的融合修正，通过姿态补偿算法解决相机与无人机固连的相机姿态问题. 引入暗光图像增强算法，将引入算法与视觉导引算法结合，以满足低照度环境下的对接导引需求. 搭建仿真平台和工程应用平台，逐步对发展的流程、系统架构以及算法进行验证. 试验结果表明，工程应用飞行平台可以导引安全、平稳且精准的降落任务，在圆锥形对接机构中的容许误差为6 cm、角度误差为5°. 该结果证明提出的全自主对接导引技术精度良好且具有可靠性.

Select

16. 文本生成图像研究综述

曹寅,秦俊平,马千里,孙昊,闫凯,王磊,任家琪

浙江大学学报(工学版) 2024, 58 (2): 219-238. DOI: 10.3785/j.issn.1008-973X.2024.02.001

摘要

HTML

PDF（pc）（2809KB）（236）

对文本生成图像任务进行综合评估和整理，根据生成图像的理念，将文本生成图像任务分为3大类：基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像. 针对基于生成对抗网络架构的文本生成图像方法，按照改进的不同技术点归纳为6小类：采用多层次体系嵌套架构、注意力机制的应用、应用孪生网络、采用循环一致方法、深度融合文本特征和改进无条件模型. 通过对不同方法的分析，总结并讨论了现有的文本生成图像方法通用评估指标和数据集.

Select

17. 大点数FFT在“申威26010”上的并行优化

郭俊,刘鹏,杨昕遥,张鲁飞,吴东

浙江大学学报(工学版) 2024, 58 (1): 78-86. DOI: 10.3785/j.issn.1008-973X.2024.01.009

摘要

HTML

PDF（pc）（1231KB）（227）

根据“神威·太湖之光”超级计算机所用国产“申威26010”处理器的架构特点和编程规范，提出针对大点数FFT的众核并行优化方案. 该方案源自经典的Cooley-Tukey FFT算法，通过将一维大点数数据迭代分解为二维小规模矩阵进行并行加速. 为了解决矩阵“列FFT”的读写、转置和计算问题，提出“列均分-行连续”的读写策略，通过对数据进行合理的分配、重排、交换，结合SIMD向量化、旋转因子优化、双缓冲、寄存器通信、跨步传输等优化手段，充分利用了众核处理器的计算资源和传输带宽. 实验结果显示，单核组64从核并行程序较主核运行FFTW库，可以达到最高65x、平均48x以上的加速比.

Select

18. 基于YOLOv5s的无人机密集小目标检测算法

韩俊,袁小平,王准,陈烨

浙江大学学报(工学版) 2023, 57 (6): 1224-1233. DOI: 10.3785/j.issn.1008-973X.2023.06.018

摘要

HTML

PDF（pc）（2789KB）（224）

针对无人机图像中背景复杂、小目标数量多且分布密集的特点，提出基于YOLOv5s的无人机密集小目标检测算法LSA_YOLO. 构造多尺度特征提取模块LM-fem，增强网络的特征提取能力. 为了抑制复杂背景的干扰，使算法关注目标信息，提出依靠多尺度上下文信息的、新的混合域注意力模块S-ECA. 设计自适应权重动态融合结构AFF，为浅层特征和深层特征合理分配融合权重. 将S-ECA、AFF应用于PANet结构，提高算法在复杂背景下的密集小目标检测能力. 使用损失函数Focal-EIOU代替损失函数CIOU，增强模型检测性能. 在公开数据集VisDrone2021上的实验结果表明，当设置输入分辨率为1 504 $ \times $1 504时，对所有目标类别的平均检测精度从YOLOv5s的51.5%提高到LSA_YOLO的57.6%.

Select

19. 基于双注意力机制的多分支孪生网络目标跟踪

李晓艳,王鹏,郭嘉,李雪,孙梦宇

浙江大学学报(工学版) 2023, 57 (7): 1307-1316. DOI: 10.3785/j.issn.1008-973X.2023.07.005

摘要

HTML

PDF（pc）（2692KB）（224）

为了解决SiamRPN++单目标跟踪算法在目标被短时遮挡及外观剧烈变化时定位不准确的问题，提出基于双注意力机制的多分支孪生网络目标跟踪算法. 采用具有轻量化主干网络的SiamRPN++为基础算法，结合轻量化的通道和空间注意力机制，提升跟踪过程中应对遮挡挑战时的抗干扰能力. 新增上一帧模板分支，动态更新目标外观变化，利用三元组损失增强跟踪过程中前景与背景的判别能力. 根据目标的移动速度进行局部扩大搜索，使目标被短时遮挡后仍可以及时、准确地跟踪到目标. 实验结果表明，改进后的算法在OTB100数据集的成功率和精确度较原算法分别提高了2.4%和1.6%，平均中心位置误差降低了28.97个像素，平均重叠率提高了14.5%.

Select

20. 脉冲型地震动作用下钢框架结构地震需求概率模型

赵国臣,徐龙军,杜佳俊,朱敬洲,朱兴吉,谢礼立

浙江大学学报(工学版) 2023, 57 (6): 1080-1089. DOI: 10.3785/j.issn.1008-973X.2023.06.003

摘要

HTML

PDF（pc）（1127KB）（222）

基于实际脉冲型地震动数据建立钢框架结构的Abaqus有限元模型，建立钢框架结构4种形式（最大底部剪力、最大底部弯矩、最大层间位移角和顶层位移）的地震需求概率模型. 为了方便模型应用和明确模型参数的物理意义，构建模型时在规范方法和力学原理计算结果的基础上增加修正项，基于贝叶斯方法进行模型优化和参数估计. 结果表明，所建立的4种地震需求概率模型能够获取有限元数值解的无偏估计. 以最大层间位移角概率模型为例，可以得到20层钢框架结构的地震易损性曲线. 相对于普通类型地震动作用，钢框架结构在脉冲型地震动作用下的失效概率显著偏大.

全文下载排行