版权说明 操作指南
首页 > 成果 > 详情

基于KNN和Bayes算法的组合分类器的垃圾评论识别研究

认领
导出
下载 Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
Research on Identifying Product Review Spam Based on Combination Classification of KNN and Bayesian Algorithms
作者:
梁曌;陈思宇;梁小林;康欣
作者机构:
长沙市雅礼中学,湖南 长沙,410071
长沙理工大学 数学与统计学院,湖南 长沙,410114
[梁小林; 康欣; 陈思宇] 长沙理工大学
[梁曌] 湖南省长沙市雅礼中学
语种:
中文
关键词:
KNN算法;Bayes算法;组合分类器;互信息;交叉验证
关键词(英文):
Bayes algorithm;combination classification;mutual information;cross validation
期刊:
经济数学
ISSN:
1007-1660
年:
2016
卷:
33
期:
1
页码:
36-41
基金类别:
长沙理工大学研究生创新性项目(CX2015SS20);
机构署名:
本校为第一机构
院系归属:
数学与统计学院
摘要:
产品垃圾评论在一定程度上影响了评论信息的参考价值,本文旨在建立识别模型将垃圾评论从评论文本中剔除,保留真实的产品评论。首先,分析了产品评论的特点,从数据搜集、文本预处理、互信息检验、文本表示4个模块提取了14个特征。然后,利用高互补性建立了基于 KNN 和 Bayes 算法的组合分类器模型。最后,利用交叉验证对 iPhone 6 Plus 的产品评论进行检验,得到评价指标分别为:正确识别率75.3%、召回率82.1%以及 F1值77.5%.
摘要(英文):
Product review spare affects the reference value of information to a certain extent. The purpose of this paper was to set up a model to remove the product review spam, and retained the real product reviews. Firstly, this paper analyzed the characterictics of the product reviews, and abstracted 14 features from Data collecting, text preprocessing, mutual informa- tion inspecting, and text representing. Secondly, we established a model of combination classifications based on KNN and Bayes algorithm by using the biggest complementarity. Finally, we made cross validating to the product review for ...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com