从机械设备海量数据中提取有效表征事务和现象本质属性的低维特征,通常采用欧式距离的平方度量这些数据所呈现出来的不确定性和变异性。但是,在大数据背景下,数据量呈几何倍数增加,给数据传输、存储、搜索、分析及可视化等造成极大困难。如何寻求在不同范数下样本投影距离最大的目标优化,其原始数据与重构数据之间的重构误差也能得到优化,并且能保留原欧式距离中的旋转属性。针对这个难题,机械工程学院王肖锋、刘军研究团队创新提出了基于向量2范数度量的投影距离和重构误差双目标优化策略,以提高表征这些数据中不确定性和变异性的鲁棒性能。相关研究成果以“Cosine 2DPCA with Weighted Projection Maximization”为题发表在近期的IEEE Transactions on Neural Networks and Learning Systems(TNNLS)期刊上。
鲁棒低维表征是基于统计学思想,利用不同范数的数据度量方式进行广义数据表征和数据压缩,在表面故障诊断、模式识别、目标识别等领域具有比较广泛应用,尤其在当前疫情防控常态化条件下人脸识别则更具有针对性应用。在这项工作中,作者提出了余弦目标优化模型,采用具有可调幂的向量2范数作为距离度量,以最大化权重投影,更有助于抑制隐藏在数据之间的不确定性和变异性。作者进一步开发了求解Cosine 2DPCA的贪婪迭代算法,并从理论上证明解的收敛性和相关性。这一工作表明,提出的Cosine 2DPCA方法在重构性能、相关性能、复杂度性能及分类性能等方面均有显著改进,其性能优于现有大多数数据表征方法,为解决复杂环境下的鲁棒低维表征提供了新的途径。
该工作以天津理工大学作为第一完成单位和第一通讯单位发表,第一作者为王肖锋副教授,第二作者为硕士研究生石乐岩,第一通讯作者为刘军教授,充分体现学校近年来在研究生培养和学科建设方面取得的成绩。该成果得到国家重点研发计划和天津市科技计划智能制造重大专项支持。
TNNLS是计算机领域的著名期刊,旨在出版神经网络和学习系统方面的理论、设计和应用的技术文章,期刊影响因子为10.451。
全文链接:https://ieeexplore.ieee.org/document/9751148。
该团队已经将理论成果成功应用于国家重点研发计划中的焊缝表面缺陷识别研究,其相关应用成果已于2022年3月也以“Online detection of weld surface defects based on improved incremental learning approach”为题发表在EXPERT SYSTEMS WITH APPLICATIONS(ESWA)期刊上。该论文信息为:Wang X, Zhang Y, Jun L, Luo Z, Zielinska T, Ge W*. Online detection of weld surface defects based on improved incremental learning approach. Expert Systems with Applications. 2022, 195: 116407.(SCI1区Top, IF=6.9, WOS:000761953000010)。