LI Shuaijun,L? Jia.Self-Training Algorithm Based on Density Peak Clustering Combining Synthetic Examples Generation with AdaboostENN[J].期刊社,2022,39(04):105.[doi:10.11721/cqnuj20220416]
结合合成实例与adaboostENN密度峰值自训练算法
- Title:
- Self-Training Algorithm Based on Density Peak Clustering Combining Synthetic Examples Generation with AdaboostENN
- 分类号:
- TP301.6
- 摘要:
- 【目的】针对基于密度峰值聚类的自训练算法中错误标记样本会造成分类正确率降低,以及当已标记样本分散时密度峰值聚类算法结果易受到截断距离影响的问题,提出了结合合成实例与adaboostENN的密度峰值自训练算法。【方法】首先,用合成实例方法增加已标记样本的数量并提升空间分布的可靠性;其次,通过密度峰值聚类算法揭示数据空间结构,从而选择有代表性的无标记样本进行标记预测;最后,用集成噪声滤波器来更准确地检测出被错误标记的样本并将它删除。【结果】通过12个UCI数据集上的实验验证了所提出算法的有效性。【结论】提出的算法不仅能有效地解决无标记样本被错误标记的问题,而且使得密度峰值聚类算法不易受到截断距离的影响。
相似文献/References:
[1]刘建峰,吕佳. 非对称稀疏图的半监督学习研究 [J].重庆师范大学学报(自然科学版),2017,34(02):76.[doi:10.11721/cqnuj20170209]
LIU Jianfeng,Lü Jia. Research on Semi-supervised Learning via Non-symmetric Sparse Graph [J].期刊社,2017,34(04):76.[doi:10.11721/cqnuj20170209]
[2]罗云松,吕佳.结合密度峰值优化模糊聚类的自训练方法[J].重庆师范大学学报(自然科学版),2019,36(02):94.[doi:10.11721/cqnuj20190211]
LUO Yunsong,Lü Jia.Self-Training Algorithm Combined with Density Peak Optimization Fuzzy Clustering[J].期刊社,2019,36(04):94.[doi:10.11721/cqnuj20190211]
[3]吕佳,李婷婷.半监督自训练方法综述[J].重庆师范大学学报(自然科学版),2021,38(05):98.[doi:10.11721/cqnuj20210406]
Lü Jia,LI Tingting.A Summary of Semi-Supervised Self-Training Methods[J].期刊社,2021,38(04):98.[doi:10.11721/cqnuj20210406]
[4]徐善亮,吕佳.基尼指数结合K均值聚类的协同训练算法[J].重庆师范大学学报(自然科学版),2022,39(04):134.[doi:10.11721/cqnuj20220413]
XU Shanliang,L? Jia.A Co-Training Algorithm Based on a Combination of Gini Index and K-means Clustering[J].期刊社,2022,39(04):134.[doi:10.11721/cqnuj20220413]