提出的预测模型采取分时序分段策略,使用卷积神经网络(CNN)提取景区多因素时序数据的特征,并对不同因素的时序数据赋予不同的权重,将结果送入门控循环单元(GRU)以挖掘其中的时序信息,结合预测时刻的情境信息(天气状况和节假日)预测短期景区内游客人数. 在某景区的闸机数据集和监控点车辆数据集上的实验结果表明:基于门控循环单元的多因素感知短期游客人数预测模型可以充分考虑多情境因素并对不同因素时序数据赋予不同的权重,均方根误差(RMSE)和平均绝对百分比误差(MAPE)均小于传统模型,能够有效降低短期游客人数预测误差。
为进一步提高人脸特征点定位精度,探究当前广泛用于人脸关键点定位的全卷积神经网络(FCN)架构的原理和缺陷,讨论FCN核函数在特征点定位中引入的副作用,即训练和测试时评判准则不一致的问题. 理论分析该问题存在的可能性和普遍性,设计实验验证在实际场景下此问题存在的广泛性. 提出结合残差特征的沙漏网络结构并将其应用于人脸特征点检测;提出多级沙漏网络的级联结构,并将其与经典的栈式沙漏网络进行对比分析. 实验结果表明:二级级联结构获得了与四级栈式结构相当的特征点定位精度,大幅降低了模型参数量和时间复杂度. 所提方法在300-W数据库的困难子集上的平均归一化误差为6.84%,优于已有最好方法.
综合考虑语音帧间关系及后处理网络的效果,提出一种改进的基于深度信念网络(DBN)的语音转换方法. 该方法利用线性预测分析-合成模型提取说话人线性预测谱的特征参数,构建基于区域融合谱特征参数的深度信念网络用以预训练模型,经过微调阶段后引入误差修正网络以实现细节谱特征的补偿. 对比实验结果表明,随着训练语音帧数的增加,转换语音的谱失真呈下降趋势. 同时,在训练语音帧数较少的情况下,改进方法在异性间转换的谱失真小于50%,在同性间转换的谱失真小于60%. 实验结果表明,改进方法的谱失真度较传统方法降低约6.5%,且同性别间转换效果比异性间转换效果更为明显,转换后语音的自然度和可理解度明显提高.
为了在术前更准确、非侵入地鉴别乏脂肪血管平滑肌脂肪瘤(fp-AML)和肾透明细胞癌(ccRCC),提出一种基于CT图像的影像组学模型. 从CT图像中提取774个三维的影像组学特征;分三步进行特征选择:计算皮尔森相关矩阵剔除冗余特征,使用Welch’s t检验确定具有显著差异的特征,利用序列浮动前向选择算法选择具有鉴别能力的特征;使用基于稀疏学习的径向基函数神经网络进行分类. 结果表明:该模型获得的正确率、敏感度、特异性和受试者工作特征曲线下面积分别为90.00%、66.67%、100.0%和0.9173. 利用分类器的输出概率进行模型的可靠性评估,当概率阈值为0.95时,该模型获得的自信正确率、未定率和错分率分别为71.67%、25.00%和3.33%,结果表明所提出的影像组学模型能可靠地对fp-AML和ccRCC进行分类.
采用结合转录组、代谢通路、蛋白结构的呼出气体检测生物信息学分析方法来确定肺癌气体标志物,用于肺癌的筛选诊断. 采用标准仪器(GCMS)检测肺癌病人和正常人的呼吸气体样本;经统计分析,筛选出10种特异性挥发性有机物(VOC). 采用转录组分析得到肺癌和健康人的差异表达基因,其富集的代谢通路与人体内产生VOC的代谢通路一致,证明所筛选的VOC标志物与肺癌病人代谢具有相关性. 基于此VOC建立的肺癌诊断模型的灵敏度、特异性和整体正确率分别为86.2%,91.2% 和89.6%,说明所提方法能简便、有效区分正常人和肺癌病人,为早期肺癌筛查提供方便、可靠的检测方法.
为了应对大数据应用中数据移动对系统性能和能耗造成的负面影响,基于3D存储器集成存储与逻辑电路的特点和MapReduce模型的并发特性,提出一种基于动态任务迁移的近数据处理(NDP)方法. 对MapReduce应用的工作流解耦以获取核心计算任务,提供迁移机制将计算任务动态迁移到NDP单元中;采用原子操作优化数据访问,从而大幅度减少数据移动. 实验结果表明,对于MapReduce应用,提出的近数据处理方法将75%的数据移动约束在存储单元内部,有效减少了主处理单元与存储单元之间的数据移动. 与目前最先进的工作相比,所提方法在系统性能和系统能效上分别有70%和44%的提升.
为了探究电子商务环境下,强势传统零售商应对电商冲击时的渠道结构选择问题,建立一个强势传统零售商与一个纯网络零售商的微分博弈模型. 考虑产品需求受零售商商誉和定价的共同影响,分别针对强势传统零售商增设与不增设线上渠道这2种渠道结构选择情形构建模型,求解得出2种情形下传统零售商的最优定价和服务策略,并结合数学证明和数值实验对2种情形下的销量和利润进行比较. 结果表明,强势传统零售商是否应当开设线上渠道与当前电子渠道市场的发展状况有关,当电子渠道市场份额扩大到一定程度时,与不增设线上渠道相比,增设线上渠道可以实现零售商本身总体销量和利润的提升,同时可以给顾客带来更好的服务体验,但零售价格更高.
将图像增强方法低光网络(LLNet)应用于实际场景下的彩色图像时会产生大量冗余参数,为此基于LLNet提出卷积自编码器网络(CAENet)的图像增强方法. 将LLNet方法中的低光处理模块与网络训练衔接在一起;采用卷积网络代替传统自编码器的编码和解码方式. 实验结果表明:CAENet能够有效节约时间成本,减少网络参数,使网络训练更加高效,得到更好的图像低维表示. 在Corel5k数据集上的实验效果表明,CAENet在减少网络参数的同时,能有效提高图像光感和色感;在高分辨率数据集上的实验结果表明,针对图像细节方面,CAENet能够保留细节不失真;针对含噪低光图像,CAENet能在增强图像的同时达到去噪的效果,证明CAENet具有较强的鲁棒性.
针对遥感图像中汽车的识别和提取问题,分析大规模数量汽车的分布和排列,提出基于长方形点过程的汽车分布概率模型. 采用先验模型刻画汽车在空间中的分布规律,采用数据项表达模型与图像的联系. 采用模拟退火策略结合可逆跳马尔科夫链蒙特卡洛采样方法,对模型进行优化求解,实现图像中汽车的自动识别和提取. 实验结果表明,所提方法能很好地用于道路和停车场等规则场景,提取精确度达到99%,回收率达到90%;由于先验模型的约束可以很好地解决汽车相互重叠和方向摇摆的问题,汽车提取的效果比传统算法更好.
TOF相机能够同时采集灰度图像和深度图像从而优化相机位姿的估计值. 应用图结构调整框架优化多帧数据采集时的相机位姿,采用帧间配准决定优化的精度和效率. 从2帧图像上提取并匹配尺度不变特征点对,二维特征点被扩展到三维空间后,利用与特征点的空间位置关系将2帧三维点云配准;逐步应用提出的算法配准参与位姿优化的多帧点云中的任意2帧点云;最后将有效配准的点云帧对作为输入数据,采用图结构算法优化位姿. 实验结果表明,提出的帧间配准算法使得位姿估计值精度显著提高,同时保证了估计效率.
针对跨国人口迁移预测所面临的数据代表性问题,利用多源数据分别构建3个预测模型:线性拟合模型、乘法分量模型和带有时间序列预测(WTSP)的线性拟合模型. 线性拟合模型用于刻画1年内的移民规律;乘法分量模型利用时间序列预测算法对未来迁移模式进行预测;WTSP线性拟合模型利用迁移模式的变化预测跨国人口迁移数量的未来趋势. 对比3个模型的预测结果可知,WTSP线性拟合模型可以有效预测未来的移民规律,相比经典线性拟合模型,WTSP线性拟合模型能体现迁移模式随时间变化的规律,预测准确率可至少提升3%;相比乘法分量模型,WTSP线性拟合模型能呈现更完整的迁移模式,有更强的可解释性.
建立兴趣点生命周期可预测性模型来刻画城市兴趣点演化规律的可预测性. 该模型针对城市兴趣点在连续时间窗口的变化情况,给出其生命周期长度和生命周期状态的定义,分析兴趣点在演化过程中的可预测性. 为量化城市兴趣点演化规律的可预测性,将城市兴趣点的生命周期长度和生命周期状态的信息熵同Fano不等式相结合,基于信息论中信息的不确定性度量方法给出城市兴趣点生命周期长度和生命周期状态的可预测性计算方法,并结合7个城市的城市兴趣点数据,计算出不同粒度、不同类别的兴趣点的可预测性. 结果表明:城市兴趣点的生命周期是可预测的且不同类别兴趣点的可预测性差异较大;相对于稳定状态和爆发状态的兴趣点,处于消亡状态的兴趣点的可预测性更高.
为了充分利用快递面单中所包含的时间、地址、物品等信息对城市进行数据分析,基于大量城市历史快递数据,提出一种城市画像系统框架. 通过数据补全、地址转换、物品类型提取以及数据格式转换等方法,对多家快递公司的数据进行汇聚和预处理. 提出寄递频次、寄递时间、寄递地址、寄递物品4个分析指标,基于西安市真实历史数据集,分别对城市中不同社会群体与城市区域的快递数据进行分析,并基于数据分析结果进行城市画像;结合社会实际情况对分析结果中存在的规律与异常情况作出合理解释,通过可视化平台对城市画像内容进行集成与演示. 结果表明,采用提出的城市画像系统能够发现不同社会群体和区域之间存在的寄递行为规律与异常.
为了挖掘商店类别与地址之间的关系,基于神经协同过滤(NCF)框架提出商业选址神经协同过滤方法——NeuMF-RS. 采用嵌入方式分别得到商店类别和地址的表示,利用矩阵分解的思想学习商店类别与地址之间的线性关系;利用深度学习多层感知机学习商店类别与地址之间非线性、深层次的关系;结合这2种方法学习到的关系得到最终结果. 利用北京市的餐馆数据与POI数据来评价NeuMF-RS方法的性能,结果表明,NeuMF-RS相对于其他先进的深度学习方法和协同过滤方法在商业选址方面具有更好的性能,更能兼顾线性与非线性关系.