摘要
abstract
第一章 绪论
第一节 研究背景和意义
第二节 研究主要内容与创新尝试
第三节 研究思路和方法
一、研究思路
二、研究方法
第四节 研究框架和篇章结构
一、论文研究框架
二、本文组织结构
第二章 研究现状与相关技术
第一节 相关概念介绍
一、网络论坛
二、网络水军
三、医药论坛
第二节 水军识别研究现状
第三节 图神经网络
第四节 其他主要技术
一、决策树
二、贝叶斯
三、支持向量机
四、神经网络
五、随机森林
第三章 数据采集和特征分析
第一节 数据采集
一、网络爬虫任务设计
二、数据存储
第二节 数据标注
第三节 数据分析
一、数据描述
二、用户行为特征
三、用户关系特征
第四节 特征值选取
一、基于传统机器学习的特征值选取
二、基于图神经网络的特征选取
第四章 基于传统方法的水军识别模型研究
第一节 模型评价指标选择
第二节 基于行为特征值的决策树分类模型
第三节 基于行为特征值的贝叶斯分类模型
第四节 基于行为特征值的支持向量机分类模型
第五节 基于行为特征值的神经网络模型
第六节 基于行为特征值的随机森林分类模型
第五章 基于图神经网络的水军识别模型研究
第一节 图神经网络模型构建工具
第二节 基于关系特征的图神经网络模型构建及结果
第三节 基于关系和行为特征的图神经网络模型构建及结果
第四节 模型训练结果及分析
第六章 总结及展望
第一节 研究总结
第二节 研究展望
参考文献
附录
致谢
个人简历及在学期间发表的研究成果
文章摘要:随着互联网的发展,医药论坛在社交网络平台和医疗健康知识服务中扮演着重要角色,它也成为了网络水军觊觎的热门目标之一。许多无良商家雇佣水军发布诱导信息,宣传无资质的产品和治疗方法,如任由他们肆意而为,将会给广大网民(包括病患)造成人身和财产损失。因此准确识别和清除这些水军变得尤为重要。医药论坛中的水军有着和其他网络平台所不同的特性。随着网络实名化的普及,医药论坛的水军也从旧有的无所顾忌,到现在从行为上越来越趋近于正常用户,这给识别带来了更大的难度和更高的要求,许多传统的检测方式已经无法匹配新的场景也无法满足新的需求。本文通过分析和提取医药论坛用户的行为和关系特征,创建了多个医药论坛水军检测模型,包括传统机器学习分类模型与图神经网络分类模型,并通过实验进行对比。本文具体的工作有:(1)设计并部署了医药论坛网络数据采集爬虫程序,在甜蜜家园平台采集真实海量的用户论坛数据;(2)将采集到的数据进行格式化、清洗和分析,从用户信息特征、用户行为特征、用户论坛社交网络特征、用户行为关系四个角度分析数据,并提取特征值。提出了单位在线时间回帖数、用户活跃时段、发言时间间隔等新的特征,并将它们用于医药论坛网络水军检测模型中;(3)引入了基于用户行为关系二部图的图神经网络模型,挖掘出用户回帖行为和主贴的关系,构建了以发帖用户和回帖用户为节点,用户行为特征为特征向量的全连通图并使用多层图神经网络构造基于用户行为特征和关系特征的分类模型。本文设计的网络水军分类模型,与传统的基于用户行为特征的网络水军分类模型进行对比试验。在真实的数据集上试验表明,使用加入了关系特征的图神经网络方法取得了较好的分类效果,达到了0.902的AUC值,高于传统的分类模型方案,为水军识别研究提供了新的借鉴。
文章关键词:
论文DOI:10.27296/d.cnki.gshcu.2021.000603
论文分类号:TP183;TP391.1;G252
文章来源:《医药论坛杂志》 网址: http://www.yyltzz.cn/qikandaodu/2022/0928/1686.html
医药论坛杂志投稿 | 医药论坛杂志编辑部| 医药论坛杂志版面费 | 医药论坛杂志论文发表 | 医药论坛杂志最新目录
Copyright © 2021 《医药论坛杂志》杂志社 版权所有 Power by DedeCms
投稿电话: 投稿邮箱: