为加强研究生学术交流活动,推进学术创新,特开通“研究生学术报告预告区”。我校研究生和教师可以在预告区及时发布和了解有关研究生学术报告的信息,届时参加。也可就某学术报告展开专题讨论与交流。
本发明提供了一种基于机器学习的矢量图文件位图文件分类方法,通过引入元素路径和文件大小标签从而训练聚类模型,能够有效提高文件分类的精确度以及速度,详见下文描述。
一种基于机器学习的矢量图文件位图文件方法,其特征在于,所述方法包括以下步骤:
将所分类文件读取,通过文件解析方法获取文件的元素路径数目,以及获取文件的大小。
将两个标签放入一个二位向量中,这样批量将n个分类文件转化为n*2的矩阵。
将测试文件按照7:2:1的比例划分为训练集,测试集和验证集。
利用特征向量不断重新确定分类中心点(簇中心),通过梯度下降算法得到最小化损失函数。
最后通过聚类的分类中心,我们通过图示可以清楚的得到两类文件,并分别标记,这样就得到了快速精确的分类结果。
本发明提供的技术方案的有益效果是:
1、通过对文件的并行分析,可以在短时间内对大量文件进行分类。
2、通过引入元素路径和文件大小标签进而进行聚类分析,能有效提高目标分类的精度。