Game_Comment_Clean

用来辅助手动标记评论的web可视化应用

我们先从渠道应用宝里面获取了很多游戏的数据，其中包括评论、用户评分。这些评论有内容简短、重复出现等特点。因此我们先进行了预处理

接下来我们手动标记了1000条评论数据（这个样本有点少，至少要10000条的），0代表无用评论，1代表普通评论。分类模型选用了逻辑回归方法，但是如何表达样本数据使其适用分类模型是重要考虑得。我们尝试了四种表示方法

自己对过滤垃圾评论的尝试，比如tf-idf、余弦相似度，效果不是很好，可以忽略

gameComment_useless_clean_word2vec 用word2、CNN方法进行分类

practice_comment_word2vec是用来训练word2vec语料库

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
commentWeb		commentWeb
comment_clean_jupyter		comment_clean_jupyter
.gitignore		.gitignore
readme.md		readme.md

Provide feedback