[1]朱蔷蔷,张桂芸,刘文龙..基于MapReduce框架一种文本挖掘算法的设计与实现[J].郑州大学学报(工学版),2012,33(05):110-113.[doi:10.3969/j.issn.1671-6833.2012.05.024]
点击复制

基于MapReduce框架一种文本挖掘算法的设计与实现()
分享到:

《郑州大学学报(工学版)》[ISSN:1671-6833/CN:41-1339/T]

卷:
33卷
期数:
2012年05期
页码:
110-113
栏目:
出版日期:
2012-09-10

文章信息/Info

作者:
朱蔷蔷张桂芸刘文龙.
天津师范大学计算机与信息工程学院,天津,300387, 天津师范大学计算机与信息工程学院,天津,300387, 天津师范大学计算机与信息工程学院,天津,300387
关键词:
Hadoop MapReduce 相邻词组 降序输出
DOI:
10.3969/j.issn.1671-6833.2012.05.024
摘要:
随着文本挖掘在主动信息服务中应用的日益扩展,在文本数据的基础上分析数据的内在特征已经成为目前的研究趋势,本文在Hadoop平台上设计并实现了一种文本挖掘算法,该算法利用MapReduce框架按照自然语料中相邻词组出现的频数进行降序输出,从而有助于用户挖掘大量数据中各项集之间的联系,实验结果体现了该算法的有效性和良好的加速比.
更新日期/Last Update: 1900-01-01