浙江大学学报(工学版)

Select

1. 基于YOLOv5s的无人机密集小目标检测算法

韩俊,袁小平,王准,陈烨

浙江大学学报(工学版) 2023, 57 (6): 1224-1233. DOI: 10.3785/j.issn.1008-973X.2023.06.018

摘要

HTML

PDF（pc）（2789KB）（222）

针对无人机图像中背景复杂、小目标数量多且分布密集的特点，提出基于YOLOv5s的无人机密集小目标检测算法LSA_YOLO. 构造多尺度特征提取模块LM-fem，增强网络的特征提取能力. 为了抑制复杂背景的干扰，使算法关注目标信息，提出依靠多尺度上下文信息的、新的混合域注意力模块S-ECA. 设计自适应权重动态融合结构AFF，为浅层特征和深层特征合理分配融合权重. 将S-ECA、AFF应用于PANet结构，提高算法在复杂背景下的密集小目标检测能力. 使用损失函数Focal-EIOU代替损失函数CIOU，增强模型检测性能. 在公开数据集VisDrone2021上的实验结果表明，当设置输入分辨率为1 504 $ \times $1 504时，对所有目标类别的平均检测精度从YOLOv5s的51.5%提高到LSA_YOLO的57.6%.

Select

2. 基于改进强化学习的多智能体追逃对抗

薛雅丽,叶金泽,李寒雁

浙江大学学报(工学版) 2023, 57 (8): 1479-1486. DOI: 10.3785/j.issn.1008-973X.2023.08.001

摘要

HTML

PDF（pc）（1158KB）（429）

针对多智能体追逃问题，提出基于优先经验回放和解耦奖励函数的多智能体强化学习算法. 将多智能体深度确定性策略梯度算法（MADDPG）和双延迟-确定策略梯度算法（TD3）相结合，提出多智能体双延迟-确定策略梯度算法（MATD3）. 针对多智能体追逃问题中奖励函数存在大量稀疏奖励的问题，提出利用优先经验回放方法确定经验优先度以及采样高价值经验. 设计解耦奖励函数，将奖励函数分为个体奖励和联合奖励以最大化全局奖励和局部奖励，提出DEPER-MATD3算法. 基于此算法设计仿真实验，并与其他算法对比，实验结果表明，该算法有效解决了过估计问题，且耗时相比MATD3算法有所减少. 在解耦奖励函数环境下该算法训练的追击者的全局平均奖励升高，追击者有更大的概率追击到逃逸者.

Select

3. 多特征融合的驾驶员疲劳状态检测方法

方浩杰,董红召,林少轩,罗建宇,方勇

浙江大学学报(工学版) 2023, 57 (7): 1287-1296. DOI: 10.3785/j.issn.1008-973X.2023.07.003

摘要

HTML

PDF（pc）（1481KB）（353）

针对现有疲劳状态检测方法无法适用于疫情防控下的驾驶员，利用改进后的YOLOv5目标检测算法，对驾驶员的面部区域进行检测，建立多特征融合的疲劳状态检测方法. 针对公交驾驶特性，建立包含佩戴口罩和未佩戴口罩情况的图像标签数据. 通过增加YOLOv5模型的特征采样次数，提高眼、嘴、面部区域的检测精度. 利用BiFPN网络结构保留多尺度的特征信息，使得预测网络对不同大小的目标更敏感，提升整体模型的检测能力. 结合人脸关键点算法提出参数补偿机制，提高眨眼、打哈欠帧数的准确率. 将多种疲劳参数融合归一化处理，开展疲劳等级划分. 公开数据集NTHU和自制数据集的验证结果表明，该方法对佩戴口罩和未佩戴口罩情况均可以进行眨眼、打哈欠识别，可以准确地判断驾驶员的疲劳状态.

Select

4. 基于XGBoost-SHAP的钢管混凝土柱轴向承载力预测模型

陈曦泽,贾俊峰,白玉磊,郭彤,杜修力

浙江大学学报(工学版) 2023, 57 (6): 1061-1070. DOI: 10.3785/j.issn.1008-973X.2023.06.001

摘要

HTML

PDF（pc）（2896KB）（243）

为了可靠、准确地预测钢管混凝土（CFST）柱的轴向承载力，建立和解释集成机器学习的CFST柱轴向承载力预测模型. 使用马氏距离评估CFST柱数据库质量，通过极限梯度提升(XGBoost)算法建立CFST柱轴向承载力预测模型，使用K折交叉验证(K-Fold CV)和树结构概率密度估计(TPE)算法寻找模型的最优超参数组合. 采用不同评价指标将优化后XGBoost模型的预测值与已有方法和未优化XGBoost模型的计算值比较. 使用SHAP方法给出XGBoost模型预测结果的整体和局部的解释. 结果表明，经过超参数调整优化的XGBoost模型的性能超越了相关规范和经验公式的性能，且SHAP方法能够有效地解释XGBoost模型的输出.

Select

5. 文本生成图像研究综述

曹寅,秦俊平,马千里,孙昊,闫凯,王磊,任家琪

浙江大学学报(工学版) 2024, 58 (2): 219-238. DOI: 10.3785/j.issn.1008-973X.2024.02.001

摘要

HTML

PDF（pc）（2809KB）（214）

对文本生成图像任务进行综合评估和整理，根据生成图像的理念，将文本生成图像任务分为3大类：基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像. 针对基于生成对抗网络架构的文本生成图像方法，按照改进的不同技术点归纳为6小类：采用多层次体系嵌套架构、注意力机制的应用、应用孪生网络、采用循环一致方法、深度融合文本特征和改进无条件模型. 通过对不同方法的分析，总结并讨论了现有的文本生成图像方法通用评估指标和数据集.

Select

6. 面向水下场景的轻量级图像语义分割网络

郭浩然,郭继昌,汪昱东

浙江大学学报(工学版) 2023, 57 (7): 1278-1286. DOI: 10.3785/j.issn.1008-973X.2023.07.002

摘要

HTML

PDF（pc）（2385KB）（239）

提出面向水下场景的图像语义分割网络，考虑到速度和准确度之间的权衡问题，网络采用轻量且高效的编解码器结构. 在编码器部分，设计倒置瓶颈层和金字塔池化模块，高效地提取特征. 在解码器部分，构建特征融合模块融合多水平特征，提升了分割的准确度. 针对水下图像边缘模糊的问题，使用辅助的边缘损失函数来更好地训练网络，通过语义边界的监督细化分割的边缘. 在水下语义分割数据集SUIM上的实验数据表明，对于320像素×256像素的输入图像，该网络在NVIDIA GeForce GTX 1080Ti显卡上的推理速度达到258.94帧/s，mIoU达到53.55%，能够在保证高准确度的同时，达到实时的处理速度.

Select

7. 航空装配领域中命名实体识别的持续学习框架

刘沛丰,钱璐,赵兴炜,陶波

浙江大学学报(工学版) 2023, 57 (6): 1186-1194. DOI: 10.3785/j.issn.1008-973X.2023.06.014

摘要

HTML

PDF（pc）（1091KB）（263）

为了构建航空装配领域中装配流程信息、装配技术知识、行业标准和三者内在联系组成的航空装配知识图谱，提出基于持续学习的命名实体识别技术框架. 所提框架的特点是从零语料到大规模语料的渐进式学习过程中，在不依赖人工设定特征的情况下，始终保持较高的识别效果. 从飞机总装配和部件对接的实际工业场景展开所提框架的性能对比实验，并以操纵拉杆和钢索的安装为实验案例. 实验结果表明，在处理不同规模的语料环境的情况下，所提框架在正确率、召回率、F1值上均显著优于以往算法，所提框架可以为航空装配领域命名实体识别任务持续提供可信的结果.

Select

8. 球面手腕康复机构逆运动学解新方法及应用

焦文杰,姬帅旭,郝惠敏,黄家海,李利娜,李诗雨

浙江大学学报(工学版) 2023, 57 (7): 1365-1373. DOI: 10.3785/j.issn.1008-973X.2023.07.011

摘要

HTML

PDF（pc）（7412KB）（188）

针对球面手腕康复机器人的末端执行机构——共轴3RRR球面并联机构(CSPM)存在逆运动学解不完整性或无解析解的问题，提出基于欧拉角的逆运动学分步求解方法. 根据共轴球面并联机构的特性，可以将CSPM姿态欧拉角分解为绕Z轴和绕X、Y轴旋转的2个子姿态，求解绕X、Y轴旋转子姿态逆运动学解的集合. 选取每个关节逆运动学解集合中的较小值，与绕Z轴旋转的角度相加作为CSPM逆运动学解，利用CSPM正运动学验证了所提方法的正确性. 在真实手腕运动范围的基础上，以无连杆碰撞点和无奇异位形为约束条件，使用所提方法求解手腕康复装置的实际姿态空间. 在实际的姿态空间内，将提出的逆运动学求解方法与单位四元数相互转换，将单位四元数插补应用于CSPM运动规划中，理论计算结果与试验结果均为光滑的轨迹曲线，两者误差的最大值不超过2.5°.

Select

9. 基于模态注意力图卷积特征融合的EEG和fNIRS情感识别

赵卿,张雪英,陈桂军,张静

浙江大学学报(工学版) 2023, 57 (10): 1987-1997. DOI: 10.3785/j.issn.1008-973X.2023.10.008

摘要

HTML

PDF（pc）（1285KB）（212）

为了提升情感识别的准确率，从情绪视频引起的脑电（EEG）和功能近红外（fNIRS）数据中提取每个通道的信号之间的联系，并提出基于模态注意力多路图卷积神经网络(MA-MP-GF)的特征融合情感识别方法. 将EEG和fNIRS数据构建为图结构数据，通过多路图卷积分别对每种模态的信号进行特征提取；利用模态注意力图卷积层融合不同模态通道间的连接信息. 模态注意力机制可以赋予不同模态节点不同权重，使得图卷积层能够更加充分提取不同模态节点间连接关系. 对采集的30个被试的4类情感数据进行实验测试，与仅EEG和仅fNIRS单模态识别结果相比，所提出的图卷积融合方法能够获得更高的识别准确率，分别提升了8.06%、22.90%；与当前常用的EEG-fNIRS融合方法相比，所提出的图卷积融合方法的平均识别准确率提升了2.76%~7.36%；图卷积融合方法在加入模态注意力后识别率最高提升了1.68%.

Select

10. 自适应樽海鞘群算法求解考虑运输时间的柔性作业车间调度

牛昊一,吴维敏,章庭棋,沈微,张涛

浙江大学学报(工学版) 2023, 57 (7): 1267-1277. DOI: 10.3785/j.issn.1008-973X.2023.07.001

摘要

HTML

PDF（pc）（1024KB）（345）

针对考虑运输时间的柔性作业车间调度问题，以最小化最大完工时间为优化目标，提出自适应樽海鞘群算法. 设计基于随机密钥方法的3层编码方案，将编码的离散解空间连续化. 引入惯性权重评价跟随者之间的相互影响程度，增强算法的全局探索与局部搜索能力. 提出自适应更新领导者-跟随者种群数量策略，根据种群迭代状态对领导者和跟随者的数量进行自适应调整. 在邻域搜索中引入禁忌搜索策略，防止算法陷入局部最优. 通过基准算例测试，验证了算法的有效性和优越性，发现AGV数量对完工时间的影响符合边际效应递减的规律.

Select

11. 基于温度和SOC的锂离子电池特征提取及SOH估计

董浩,毛玲,屈克庆,赵晋斌,李芬

浙江大学学报(工学版) 2023, 57 (7): 1470-1478. DOI: 10.3785/j.issn.1008-973X.2023.07.022

摘要

HTML

PDF（pc）（1630KB）（173）

为了解决电池日常使用过程中数据量获取不足和健康因子提取难的问题，通过分析不同温度下锂离子电池的荷电状态(SOC)与充电电压的变化曲线，提出基于温度和SOC的锂离子电池健康因子提取及健康状态(SOH)在线估计的方法. 在电池的实际充电过程中，根据环境温度差异选取电压和电流作为健康因子. 利用遗传-爬山算法优化极限学习机的网络参数，建立健康因子和SOH的映射关系，实现SOH在线估计. 使用9组NASA电池老化数据进行验证，结果表明，本文方法具有估计精度高、环境温度适应性强的优点.

Select

12. 液滴撞击移动及旋转表面过程研究综述

周易,金哲岩,杨志刚

浙江大学学报(工学版) 2023, 57 (10): 2060-2076. DOI: 10.3785/j.issn.1008-973X.2023.10.015

摘要

HTML

PDF（pc）（3621KB）（131）

基于现有液滴撞击移动及旋转表面的研究，简要阐述液滴撞击移动表面及旋转表面的现象；将移动表面分为平移固体表面、旋转固体表面和移动液膜3种形式，从实验系统、模型建立和数值模拟3个方向对现有的液滴撞击移动表面研究进行总结. 液滴撞击移动及旋转表面的研究已有一定基础，而高撞击速度、微小液滴、旋转表面等情况的研究较为空白，旋转表面波推进等理论和实验结果也缺乏数值模拟的补充. 基于上述情况，提出液滴撞击移动表面及旋转表面的研究展望.

Select

13. 基于集成学习与深度学习的日供水量预测方法

周欣磊,顾海挺,刘晶,许月萍,耿芳,王冲

浙江大学学报(工学版) 2023, 57 (6): 1120-1127. DOI: 10.3785/j.issn.1008-973X.2023.06.007

摘要

HTML

PDF（pc）（1780KB）（233）

为了有效改善日供水量预测精度低、泛化能力不足的问题，以义乌市4个水厂的历史日供水数据为基础，提出基于集成学习算法改进的长短时记忆(LSTM)神经网络的供水预测方法. 该方法以拉依达准则预处理后的历史日供水量作为数据输入，将具备长期时序信息记忆能力的LSTM神经网络作为集成学习的弱预测器，使用网格搜索法进行网络超参数调优，使用AdaBoost集成学习算法对弱预测器进行加权组合得到强预测器. 结果表明：与随机森林、AdaBoost与LSTM神经网络相比，基于集成学习算法改进的LSTM神经网络有最高的纳什效率系数(NSE)、最低的均方根误差(RMSE)与平均绝对误差(MAE)，对日供水数据的变化趋势与峰值的拟合效果最好；改进LSTM供水预测方法的时序预测精度得到极大提升，有较好的泛化能力、稳定的预测性能，能够为城市水资源合理配置、一体化智能供水调度提供重要参考.

Select

14. 基于物理信息神经网络的Burgers-Fisher方程求解方法

徐健,朱海龙,朱江乐,李春忠

浙江大学学报(工学版) 2023, 57 (11): 2160-2169. DOI: 10.3785/j.issn.1008-973X.2023.11.003

摘要

HTML

PDF（pc）（1371KB）（203）

为了探索基于物理信息的神经网络（PINN）求解微分方程时，物理信息在训练神经网络中的作用，提出将物理信息分为规律信息和数值信息2类，以阐释PINN求解微分方程的逻辑，以及物理信息的数据驱动方式和神经网络可解释性.设计基于2类信息的神经网络综合损失函数，并从训练采样和训练强度2方面建立信息的训练平衡度，从而利用PINN求解Burgers-Fisher方程. 实验表明，PINN能够获得较好的方程求解精度和稳定性；在求解方程的神经网络训练中，Burgers-Fisher方程的数值信息比规律信息能更好地促进神经网络逼近方程解；随着训练采样和迭代次数的增加，以及2类信息的平衡，神经网络训练效果得到提高；增加神经网络规模可以提高方程求解精度，但也增加了网络训练迭代时间，在固定训练时间下并非神经网络规模越大效果越好.

Select

15. 融合知识图谱的推荐系统研究进展

王慧欣,童向荣

浙江大学学报(工学版) 2023, 57 (8): 1527-1540. DOI: 10.3785/j.issn.1008-973X.2023.08.006

摘要

HTML

PDF（pc）（1419KB）（93）

针对推荐系统存在的数据稀疏、冷启动、推荐可解释性低、个性化不足等问题，分析知识图谱在推荐系统中的融入情况.从推荐系统的需求、知识图谱的相关概念、推荐系统与知识图谱的融合方式3个方面，对当前推荐系统存在的问题及推荐系统融合知识图谱后的解决方案进行概括. 总结近年来通过结合注意力机制、神经网络、强化学习方法，采用取舍节点、整合节点、探索路径等原理充分利用知识图谱中复杂结构信息，从而提升推荐系统满意度. 提出融合知识图谱的推荐系统所面临的知识图谱完备性、动态性、高阶关系可利用度以及推荐性能方面的挑战及未来可能的发展方向.

Select

16. 高速公路行车风险路侧感知系统的设备优化布设

李立,平振东,徐志刚,汪贵平

浙江大学学报(工学版) 2023, 57 (6): 1137-1146. DOI: 10.3785/j.issn.1008-973X.2023.06.009

摘要

HTML

PDF（pc）（1542KB）（118）

采用最大信息系数相关性检验遴选行车风险度量指标，提出基于信息熵理论的行车风险多指标度量与融合方法；构建以获取行车风险熵最大为目标，考虑系统建设成本、设备检测范围的路侧感知设备布设优化模型. 基于多车道高速公路车辆行驶轨迹，通过算例获得在不同预算约束条件下的最优路侧设备布设方案，分析设备选型、传统的等间距设备布设方法、原始数据噪声等因素对路侧感知系统获取道路行车风险能力的影响. 结果表明，路侧感知系统建设经费增加与系统行车风险获取能力提升呈现边际效用递减规律，相较于设备数量过多或过少的情况，设置数量适中的路侧感知设备费效比更高，优化后的设备布设方案的费效比比等间距布设方案的费效比高，原始数据测量误差不超过10%不会影响设备优化布设方案的计算结果.

Select

17. In718合金激光粉末床熔融悬垂结构成形数值模拟与实验研究

王材桦,来旭辉,杨欢庆,魏正英

浙江大学学报(工学版) 2023, 57 (6): 1175-1185. DOI: 10.3785/j.issn.1008-973X.2023.06.013

摘要

HTML

PDF（pc）（2407KB）（125）

针对激光粉末床熔融 (LPBF)成形中点阵倾斜支杆的悬垂打印质量问题, 以In718悬垂熔道为研究单元，建立三维介观数值模型. 基于离散单元法在建模软件EDEM中建立粉末床模型, 基于有限体积法在Flow-3D中实现LPBF熔道成形过程, 通过数值模拟分析激光-粉末颗粒相互作用的流动、传热、熔化、凝固过程. 结果表明, 实体-粉末交界区域容易出现不连续的熔道, 改善工艺参数可以提高该区域熔道成形的连续性. 在低能量密度(44.19 J/mm³)下, 施加高激光功率(300 W)不会产生匙孔缺陷, 能够以比低激光功率(87.5 W)更强的马兰戈尼流动、更快的熔池流动速度填充不连续点, 提高实体-粉末交界区域的熔道连续性.

Select

18. 基于GRU的扑翼非定常气动特性快速预测

赵嘉墀,王天琪,曾丽芳,邵雪明

浙江大学学报(工学版) 2023, 57 (6): 1251-1256. DOI: 10.3785/j.issn.1008-973X.2023.06.021

摘要

HTML

PDF（pc）（2600KB）（73）

为了克服传统计算流体力学代理模型不能有效模拟流体力学高度非线性系统的困难，解决现有基于深度学习的代理模型难以有效处理时间顺序信息的问题，以扑翼飞行器的二维翼型为研究对象，基于门控循环单元（GRU）与多层感知机，建立扑翼非定常气动参数的快速预测模型，实现对扑翼扑动时高度非定常、非线性气动参数的实时预测. 使用计算流体力学方法获得扑翼二维翼型扑动时的气动参数，以该参数为样本训练预测模型. 将扑翼的扑动振幅、频率、摆动角度与运动时间输入预测模型，快速得到扑翼在对应扑动状态下的升力、阻力与力矩. 实验结果表明，所建立的预测模型精度高、计算速度快，能够实现对扑翼非定常气动参数变化的实时高精度预测.

Select

19. 基于分割注意力与线性变换的轻量化目标检测

张艳,孙晶雪,孙叶美,刘树东,王传启

浙江大学学报(工学版) 2023, 57 (6): 1195-1204. DOI: 10.3785/j.issn.1008-973X.2023.06.015

摘要

HTML

PDF（pc）（1383KB）（211）

为了满足目标检测的实时性和模型轻量化需求，提高目标检测精度，对YOLOv5中的特征融合模块进行优化，提出基于金字塔分割注意力与线性变换的轻量化目标检测算法PG-YOLOv5. 利用金字塔分割注意力模块，捕获不同尺度特征图的空间信息以丰富特征空间，提升网络的多尺度特征表示能力，提高目标检测的精度. 利用基于线性变换的GhostBottleNeck模块，以少量原始特征图与线性变换得到的特征图相结合的方式，有效减少模型参数量. 算法的平均精度均值从YOLOv5L的81.2%提高到PG-YOLOv5的85.7%，PG-YOLOv5的参数量比YOLOv5L的下降了36%. 将PG-YOLOv5部署到Jetson TX2，并编写目标检测软件. 实验结果表明，基于Jetson TX2的目标检测系统的图像处理速度为262.1 ms/帧，PG-YOLOv5的平均精度均值为85.2%；与YOLOv5原始模型相比，PG-YOLOv5更适合边缘端部署.

Select

20. 风电机组传动链动力响应特性与支撑系统影响

白聪儿,孙哲杰,秦美娟,王潇,刘勇

浙江大学学报(工学版) 2023, 57 (6): 1165-1174. DOI: 10.3785/j.issn.1008-973X.2023.06.012

摘要

HTML

PDF（pc）（2793KB）（81）

针对风力发电机组传动链动力学响应问题，以某兆瓦级风电机组为研究对象，建立传动链刚柔耦合的多体动力学仿真模型.分别分析机架柔性、齿轮箱弹性支撑刚度、发电机弹性支撑刚度对传动链动力响应特性（包括传动链模态、谐振与不同风况条件下的振动响应）的影响规律；通过实验室内振动测试，分别从时域和频域上验证模型的有效性. 结果表明：支撑系统对振动能量主要分布在发电机壳体、齿轮箱箱体的模态影响最大，合理进行支撑系统刚度设计能够有效降低传动链共振风险. 时域分析结果表明，谐振引起的零部件振动速度偏差最大达到120%；增大齿轮箱弹性支撑刚度并降低发电机弹性支撑刚度，有助于降低传动链振动水平.

摘要阅读排行