在互联网飞速发展的今天,流言作为信息的一种,其危害在社交网络的作用下不断地被放大。随着社交网络的迅速发展,流言传播无论从影响规模上和还是传播速度上来说都每日剧增,这使得人们对判别流言和抑制流言方法的需求也随之增长。为了对社交网络中的流言进行判别与溯源,从真实社交网络数据爬取入手,基于数据的时间轨迹,挖掘出流言的传播路径,构建信息传播网络,并基于传播网络拓扑特征分析对流言进行判别和溯源。并且基于传播网络以及相关拓扑特征信息,提出了通过检测其连通分支节点数目和直径分布是否满足幂律分布来判别该网络中是否有流言存在,对不满足幂律分布的,通过检测"离群点"的方法来初步定位流言存在关注与被关注的关系,其中还存在很多单个节点,这些节点在我们所得的数据库信息中是单独的,不存在互相关注的关系。我们根据话题数据库构建的话题传播网络也验证了这一点,整个网络由一个个连通分支构成本文有公司网站全自动缩管机采集转载中国知网整理 http://www.suoguanji.cc ,从话题传播网络中可以直观地发现:网络中最多的是直径为1(两个节点的连通分支)的连通分支,而直径特别大的连通分支数很少,连通分支的数量随着直径(节点数目)的增长而急剧减少。之后我们定量分析拓扑网络特征,分别针对三个不同的话题网络统计了其联通分支的节点数目和直径分布(图1-图3)。图1BroadwayACeleb节点和直径分布图2FlyDubai节点和直径分布图3MakeTVShowsEvi节点和直径分布我们可以直观地看出,直径很大或者节点数目很多的连通分支数量很少,流言的判别与溯源-数控滚圆机缩管机张家港电动液压滚圆机缩管机滚弧机大多数都是直径为1或者说节点数目为2的连通分支,直径分布和节点数目分布图呈现幂律分布的特征。2.3验证幂律分布如果样本数据满足幂律分布,那么对其横纵坐标都取对数,即在双对数坐标下,幂律分布表现为一条斜率为幂指数的负数的直线,我们以直径分布为例,将传播路径网络的直径分布图转换为双对数坐标,之后对散点图进行线性拟合,得到每个话题传播网络连通分支直径分布的双对数曲线,分别如图4到图6所示。我们可以看到,在双对数坐标下,直径分布几乎可被完美拟合为一条负斜率直线,因而,我们可以得出结论,话题传播路径网络的连通分支直径分布满足幂律分布。图4话题流言判别2.4.1“离群点”检测在样本空间中,与其他的样本点的一般行为或者特征不一致的点,我们称为离群点。在这里,我们把双对数曲线中明显偏离拟合直线的点称之为“离群点”,例如图6中的第四个点,它明显偏离拟合曲线,我们称之为“离群点”。本文有公司网站全自动缩管机采集转载中国知网整理 http://www.suoguanji.cc 那么,如何确定这样的“离群点”呢?在聚类分析中,离群点检测常用的方法包括基于统计分布的离群点检测、基于距离的离群点检测、基于密度的局部离群点检测、基于偏差的离群点检测等。基于统计分布的离群点检测:这一类离群点检测方法首先假设样本空间中所有的数据符合某一个分布或者某一个数据模型,之后基于模型或者分布采用不和谐校验的方法来识别离群点。这种离群点检测方法需要我们预先知道样本空间中的数据结构的分布特征,这在检测之前我们往往无法获知。基于距离的离群点检测:这种检测方法定义如果在样本空间S中与对象O的距离大于d的至少有N个样本点,那么我们称这个对象O是以N(指至少N个样本点)和d为参数的基于距离的离群点。这种检测方法需要数据均匀分布,如果数据分布不均匀,那么可能检测就会遇到困难。基于密度的局部离群点检测:定义如果某个对象属于局部离群点,那么相对于它自己的局部领域,它是远离的。区别于前两种方法,基于密度的局部离群点检测不将离群点看成是二元性质的点,换句话说,不仅仅是判断一个点是否离群点,而是有一个权值来描述离群程度,它可以应用到样本分布不均匀的情况下。基于偏差的离群点检测:这种方法流言的判别与溯源-数控滚圆机缩管机张家港电动液压滚圆机缩管机滚弧机本文有公司网站全自动缩管机采集转载中国知网整理 http://www.suoguanji.cc
- [2019-08-02]故障诊断仿真分析-数控滚圆机滚
- [2019-08-02]试验方法的研究-液压缩管机数控
- [2019-07-26]开裂原因分析及防治-数控滚圆机
- [2019-07-26]及应对措施分析-数控滚圆机缩管
- [2019-07-21]无人机巡检控制系统-数控切割机
- [2019-07-21]人员疏散行为研究-数控滚圆机滚
- [2019-07-16]面天线仿真中的应用-数控切割机
- [2019-07-16]快速消隐算法研究-数控滚圆机滚
- [2019-07-11]功率放大器设计-液压缩管机数控
- [2019-07-11]直接调制器研究-数控滚圆机滚弧