[1]陈可华..基于多代表点的文本分类研究[J].郑州大学学报(工学版),2010,31(06):116-118,125.[doi:10.3969/j.issn.1671-6833.2010.06.028]
点击复制
基于多代表点的文本分类研究()
《郑州大学学报(工学版)》[ISSN:1671-6833/CN:41-1339/T]
- 卷:
-
31
- 期数:
-
2010年06期
- 页码:
-
116-118,125
- 栏目:
-
- 出版日期:
-
2010-11-30
文章信息/Info
- 作者:
-
陈可华.
-
宁德师范学院计算机系,福建,宁德,352100
- 关键词:
-
文本分类; 多代表点; Rocchio; KNN
- DOI:
-
10.3969/j.issn.1671-6833.2010.06.028
- 摘要:
-
文本自动分类是一种有效的组织信息和管理信息的工具,传统分类方法一般在分类效果和运行效率上两者不可兼得,通过综合Rocchio和KNN 2种分类方法的优点,设计出一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(真实或虚拟的),再使用基于这些代表点的Rocchio和KNN方法进行分类.实验表明,该方法以较少的训练时间达到令人满意的分类效果,并且能很好地解决不平衡类问题,实验结果显示,该方法能达到与SVM相当的分类效果.
更新日期/Last Update:
1900-01-01