近年来, 随着网络信息技术的快速发展, Facebook、Twitter、微博等社交网络已成为人们获取信息、发表观点、表达情绪的重要途径, 给舆论的传播、形成与演化带来极大便利。研究社交网络中舆论信息的传播过程和演化机制, 对科学进行舆论的监控和引导具有重要的意义。
目前对舆论传播与演化的研究主要集中在观点动力学建模方面, 国内外学者已经提出多种模型来解释舆论的形成和演进现象。这些模型大致可以分为离散观点模型和连续观点模型。离散观点模型采用有限离散数值模拟个体观点[1-2], 例如, +1代表赞同, -1代表反对。虽然离散模型能清晰地表达个体态度, 但却不能很好地反映个体观点的渐进变化过程。Deffuant等[3]考虑到人们的观点并非总是非左即右, 将观点分布在连续数值区间内, 认为只有观点相近的人员才会引发共鸣并进行交流, 首次建立了基于有界信任的连续观点模型。文献[4]借鉴Deffuant模型[3], 对信任阈值内的所有个体观点进行算术平均, 作为个体下一时刻的观点, 构建了HK (Hegselmann-Krause) 模型。HK模型正受到越来越多的关注, 后续学者分别从复杂网络拓扑结构、观点交互规则、有限信任机制和舆论环境因素等方面对有界信任HK模型进行了深入研究[5-10]。
上述模型均在不同程度上表达了观点演化和群体交流的主要特征, 但是综合、深入地考虑有限信任机制和个体社会影响力对舆论形成的作用的研究相对较少。在现实中, 观点相近的人的确能促进交流, 但同时人们也更愿意和关系较为亲近的个体进行交流, 而和关系较为疏远的个体进行交流的概率较小。鉴于此, 本文在设定交互信任边界的同时, 根据“亲密度原则”随机筛选若干个信任阈值外的个体进行观点交流, 以此扩充HK模型的交互集合。同时, 消除HK模型中的同质化影响力假设, 提出一种基于人际相似性和交互强度来量化个体社会影响力的方法。本文的目的是构建一个更贴近实际的舆论形成模型, 以此研究个体亲疏关系、社会影响力及网络结构特征在舆论传播与演化中的作用。
1 网络模型舆论动力学模型多以某种复杂网络结构作为舆论演化的载体。以往研究表明, 不同的网络结构对演化结果有着重要影响。因此, 一个更加接近现实的网络模型是模拟分析的基础。对国内外大型社交网络Facebook、LiveJournal、Twitter和新浪微博等的统计研究表明, 社交网络普遍具有两个重要特性:较高的聚类系数,度分布满足幂律分布[11-12]。为了刻画这两种特性, 本文在Holme等[13]提出的网络模型算法基础上, 将三角连接策略中节点的选择范围从最近邻 (person-person) 扩大到次近邻 (person-person-person), 从而构造可变聚类系数的无标度网络来模拟社交网络环境。该算法思路是在BA (由Barabasi和Albert提出) 无标度网络的增长过程中, 每新加入一个节点就添加m0条边, 加边时以概率 (1-pt) 执行无标度网络的优先连接策略, 以概率pt执行三角连接策略。三角连接策略用于调节网络聚类系数Cluster, 且pt越大, Cluster越大, 而加边数量m0则会影响到网络的平均度Degree[13]。
图 1为依据该算法生成具有5 000个节点的网络的度分布图, 经计算, 该网络的Degree=39.621 4, Cluster=0.165 9, 度分布近似服从幂律分布P(k)~k-b(b=1.832 8)。
考虑一个规模为N的社交网络G=(A, E), 其中A是社交网络中代表用户个体的节点集, |A|=N; E是用户间好友关系的边集, 代表观点信息可能的传播路径。设列向量O t=(o1t, o2t, …, oNt)T表示t时刻N个个体观点构成的观点向量; oit是个体i在时间步t的观点值, oit∈[0, 1], i∈A, t≥0, t=0时为其初始观点值。定义μijt=|oit-ojt|为个体i和j之间的观点差距; ε为有界信任阈值, ε∈[0, 1]。经典有界信任HK模型算法主要包含选择交互集合和更新观点两部分, 对此, 本文分别作如下合理扩展。
2.1 计算交互集合定义1 将网络中连接两个节点i和j的最短路径上的边数定义为节点间的距离dij, 将dij的指数形式定义为节点间亲密度cij, 如式 (1) 所示:
$ {c_{ij}} = {e^{1 - {d_{ij}}}} $ | (1) |
在现实生活中, 关系亲密的人之间比较容易进行沟通交流, 而相对疏远的人之间进行交流的概率较小。从式 (1) 可知, 如果两个体在网络中的距离较大则其亲密度越低, 并且距离越大, 亲密度衰减得越快。当j是i的邻居时, dij=1, cij达到最大值1;而当dij增大时, cij就会呈现指数衰减。
本文基于有限信任和亲密度计算交互集合, 因此个体i交互集合的选择过程可分为两步:
1) 按照有界信任算法选择与i的观点差距处于信任阈值ε内的个体集合, 即:
$ N{\rm{ei}}ghbor_{i,1}^t = \{ j \in A|\mu _{ij}^t \le \varepsilon ,j \ne i\} $ | (2) |
2) 根据“亲密度原则”选择m个信任阈值外的随机节点作为交互对象。如果个体j的观点在i的信任阈值外, 那么j被i选为阈值外交互对象的概率可表述为pijt, 如式 (3) 所示:
$ p_{i,j}^t = \frac{{{e^{\lambda {c_{ij}}}}}}{{\sum\limits_{k \notin Neighbor_{i,1}^t \cup \{ i\} } {{e^{\lambda {c_{ik}}}}} }} $ | (3) |
其中:λ作为可调参数, 用于调节阈值外节点选取过程的随机性。当λ < 0时, 概率pijt受个体间亲密度的影响较小, 选取过程的随机性较大; 当λ=0时, eλcij=1, 概率大小不再与亲密度值相关, 此时个体等概率地被选为交互对象。随着λ的增大 (λ > 0), 亲密度对选取概率的影响也增大, 且与个体i的距离越近、关系越亲密的个体被选中的概率越大。当λ足够大时, m个节点几乎是按照亲密度值由大到小依次进行选取的, 此时随机性消失。
按照上述“亲密度原则”选取的随机节点组成集合Neighbori, 2t,则个体i在t时刻的交互集合为:
$ Neighbor_i^t = N{\rm{ei}}ghbor_{i,1}^t \cup N{\rm{ei}}ghbor_{i,2}^t $ | (4) |
经典HK模型[4]按照式 (5) 进行观点更新:
$ o_i^{t + 1} = \frac{1}{{|Neighbor_{i,1}^t|}}\sum\limits_{j \in Neighbor_{i,1}^t} {o_j^t} $ | (5) |
从式 (5) 可以看出, 个体i在下一时刻的观点取决于信任阈值内交互集合观点的算数平均值。该算法将个体同质化, 假设每个节点对i的影响程度相同, 且均为集合势的倒数。事实上, 个体作为观点的主体, 具有千差万别的属性, 这导致个体的社会影响力并不相同。例如在社交网络中, 粉丝众多、活跃度较高、经过官方认证的用户自然比一般用户的影响力要强一些;而且往往是那些有朋友圈交集、互动频繁的个体更容易引发彼此思想、情感或行为上的变化。Li等[5]虽然考虑到了个体间影响力权重的差异性, 但其模型算法只是将权值赋予[0, 1]内的随机数, 其物理意义并不明显。本文综合考虑社交网络结构和用户间的交互行为, 提出一种基于人际相似性和交互强度来量化个体社会影响力的方法。
定义2 将社交网络中用户间的共同好友比例定义为人际相似性, 用Si, jt表示, 如式 (6) 所示:
$ S_{i,j}^t = \frac{{|\mathit{\pmb{\Gamma}} (i) \cap \mathit{\pmb{\Gamma}} (j)|}}{{\sqrt {k(i) \times k(j)} }} $ | (6) |
对于网络中的节点i, 定义它的邻居为Γ(i), k(i)= |Γ(i)|为节点i的度, |Γ(i)∩Γ(j)|为节点i和j的共同好友数量。
定义3 将舆论传播中个体间的观点交互频率定义为交互强度。更具体地, 用i和j之间的历史互动次数占i和j全部历史互动次数的比例Ei, jt来表示, 如式 (7) 所示:
$ E_{i,j}^t = \frac{{\mathit{\pmb{\Psi}} (i,j)}}{{\sqrt {\mathit{\pmb{\Psi}} (i) \times \mathit{\pmb{\Psi}} (j)} }} $ | (7) |
其中:Ψ(i, j) 表示个体i对j的历史观点交互次数; Ψ(i) 和Ψ(j) 分别表示个体i和j对所有个体的总历史交互次数。
本模型将人际相似性和交互强度作为个体影响力的构成因素, t时刻个体j对i的总影响力即为Si, jt和Ei, jt的线性组合, 用I i, jt表示, 如式 (8) 所示:
$ I_{i,j}^t = \alpha S_{i,j}^t + \left( {1 - \alpha } \right)E_{i,j}^t $ | (8) |
其中:α(0≤α≤1) 为Si, jt和Ei, jt在影响力构成中所占的比重。
定义N阶方阵W t为t时刻的影响力权重矩阵, 其第i行第j列元素wijt表示t时刻个体j对个体i归一化后的影响权重, 计算方法如式 (9) 所示:
$ w_{ij}^t{\rm{ = }}\left\{ {\begin{array}{*{20}{l}} {\frac{{I_{i,j}^t}}{{\sum\limits_{r \in Neighbor_i^t} {I_{i,r}^t} }}{\rm{, }}j \in Neighbor_i^t}\\ {{\rm{ }}0{\rm{ }},\;\;\;\;{\rm{ 其他}}} \end{array}} \right. $ | (9) |
很明显, 权重矩阵Wt为时变行随机矩阵, 也即
t+1时刻, 所有个体同步更新观点:将交互集合内个体观点的加权平均值作为该时刻个体的观点值, 如式 (10) 所示:
$ {{\boldsymbol{O}}^{t{\boldsymbol{ + }}1}}{\boldsymbol{ = }}{{\boldsymbol{W}}^{t{\boldsymbol{ + }}1}}{{\boldsymbol{O}}^t} $ | (10) |
当群体中最大观点值omaxt与最小观点值omint之差小于ξ时 (见式 (11)), 则认为所有个体观点收敛于一致, 群体形成舆论共识, 该时刻t称为收敛时间CT。
$ o_{{\rm{max}}}^t - o_{{\rm{min}}}^t \le \xi $ | (11) |
其中:ξ是一个非常小的正数, 这里取ξ=0.000 1。
3 实验与分析利用仿真工具Matlab对上述社交网络舆论形成模型进行仿真实验, 观察不同参数集下模型的性质, 分析影响舆论形成的关键因素。实验结果均取100次仿真的平均值。
模型的仿真算法如下:
输入: N, m0, pt, ε, λ, m, α。
输出: G, Degree, Cluster, Ot, CT。
步骤1 初始化输入参数;
步骤2 按照第1章中的算法构建具有N个节点的网络G作为舆论演化的网络载体;
步骤3 初始时刻为N个个体赋予[0, 1]内的随机数, 构造初始观点向量Ot=0;
步骤4 根据式 (1)~(4) 计算当前个体i的交互集合Neighborit;
步骤5 根据式 (6)~(9) 分别计算交互集合内个体对当前个体i的影响权重wijt;
步骤6 更新并记录个体间的交互次数;
步骤7 重复步骤4~6直至遍历完所有个体后, 根据式 (10) 计算本轮的观点向量Ot;
步骤8 重复步骤4~7直至系统达到收敛条件 (11);
步骤9 记录观点向量Ot和收敛时间CT;
步骤10 算法结束。
该模型算法分为两层嵌套循环, 对于规模为N的群体, 步骤1~3主要进行模型参数初始化和网络结构初始化。步骤4~6中的计算交互集合、计算影响权重、更新交互次数可作为算法的基本操作。步骤4~7为内层循环, 时间复杂度为O(N2)。步骤4~8为外层循环, 循环次数为CT。故本文算法的时间复杂度为O(N2), 这与HK模型的时间复杂度在量级上是持平的。但考虑到本模型引入了亲密度、人际相似性和交互强度等概念, 因而空间复杂度较原始HK模型会有所上升。
3.1 舆论共识的形成本节首先在相同条件下对新模型与经典HK模型作对比分析, 进而探究新模型在舆论演化中涌现出的一些特性。取N=1 000, m0=5, pt=0.5, 建立社交网络模型。设定ε∈{0.01, 0.05, 0.1, 0.2}, λ∈[-2, 2], m∈[1, 10], α=0.5, 之后从t=0时刻分别按经典HK模型算法[4]和新模型算法进行实验, 所得结果如图 2~4所示。
图 2为经典HK模型在不同信任阈值ε下群体观点的变化曲线。从图 2可看出, HK模型中观点集团的个数对ε的变化比较敏感, 其最终的观点簇数大致服从1/(2ε) 规则, 也即是ε越小, 形成的观点集团就越多, 这和文献[4]所得结论几乎一致。而在本模型中, 如图 3所示, 无论ε为多大, 群体观点最终都收敛于一致, 形成舆论共识。从图 3可知, 当ε=0.01, 0.05, 0.1, 0.2时, 群体观点分别在t=35, 22, 16, 10处收敛。不难发现, ε的变化只会影响到收敛速度 (收敛时间随ε的增大而减小), 并不会影响到群体观点的收敛性。本模型虽然在ε较小时 (如图 3(a)、(b)), 演化过程中也会出现观点分裂的现象, 但随着时间的推移, 个体之间并没有因ε的阻碍而停止交互, 并最终产生从舆论多元分化过渡到舆论一致的相变行为。
图 4展示了在不同信任阈值ε下亲密度调节参数λ和随机节点数量m对舆论收敛时间CT的影响。分析图 4(a), 首先固定m值不变, 只观察λ的变化对CT的影响。可以发现, λ > 0时的CT值普遍大于λ < 0时CT值; 且当λ > 0时, λ的减小对CT值几乎没有影响; 而当λ < 0时, CT值会随λ的减小而缓慢降低。固定λ值不变, 分析m与CT的关系, 由图可知收敛时间CT会随着m的增大而迅速减小, 当λ=-2, m=10时, CT仅为10左右。分析图 4(b) (ε=0.2) 有类似现象。总的来说, 当ε不变时, λ越小、m越大, 越能促进群体观点演化到一致, 加快舆论的收敛速度。根据式 (3), λ越小, 随机节点的选择概率受亲密个体的影响较小, 选取过程的随机性越大。这也就意味着, 加强关系疏远的个体之间的交流 (降低λ)、扩大阈值外个体的交流范围 (增加m) 会有利于群体形成舆论共识。
3.2 影响力构成因素中α对舆论形成的影响在舆论形成过程中, 决定个体观点的影响力因素主要来自个体之间的人际相似性和交互强度 (式 (8))。本节设定N=1 000, m0=5, pt=0.5;设定ε∈{0.01, 0.05, 0.1, 0.2}, λ=0, m=5, α∈[0, 1], 考察影响力构成因素配比系数α对舆论形成的影响, 结果如图 5所示。
从图 5可以看出, 在其他条件不变的情况下, ε越大, 舆论收敛速度越快, 这也进一步验证了3.1节所得结论。在ε=0.01,0.05时, 收敛时间CT基本上是随α的增大而呈现出减小趋势, 但其减小幅度并不均匀, 且震荡较为明显。当α增大时, 也即是增大了人际相似性在影响力构成中的比重, 削减了交互强度的比重。这也就意味着在ε较小时, 增大人际相似性的作用强度有利于全局性一致舆论的形成。而当ε=0.1, 0.2时, α的变化并未引起CT的变化, CT的值分别稳定于20和13附近。这可能是因为ε增大到一定程度时, 个体的阈值内交互集合扩大, 使得群体观点迅速收敛, α对舆论共识的促进作用被削弱。
3.3 网络结构特征对舆论形成的影响3.2节讨论了影响力构成因素与收敛时间的关系, 粗略得出提高人际相似性的作用强度有利于舆论收敛。而决定人际相似性的关键因素则是网络节点度数和节点间共同邻居数量 (式 (6))。因此本节尝试从平均度Degree和聚类系数Cluster的角度进一步探讨网络结构特征在舆论形成中的作用。首先令N=1 000, m0∈{5, 10, 15}, pt∈[0, 1], 根据第1章中的算法分别生成Degree∈{10, 20, 30}的三个可变聚类系数网络; 再固定ε=0.01, λ=0, m=5, α=0.5不变, 进行仿真实验, 所得结果如图 6所示。
由图 6可知, 随着pt增大 (Cluster增加), 群体观点收敛时间CT减小。而在相同pt情况下, Degree越大越能加快舆论共识的形成。这说明较高的聚类系数和平均度对观点的演化统一具有促进作用。主要原因在于聚类系数的增加会直接导致节点间共同邻居数量的增加, 彼此之间更容易建立起好友关系, 使得整个网络变得更加紧密, 从而更有利于局部个体之间产生趋同效应。而较大的平均度则意味着在舆论传播过程中个体的观点传播途径更广泛、沟通更加充分, 进而使得群体舆论共识更容易形成。
4 结语本文提出亲密度、人际相似性、交互强度等概念, 扩展经典HK有界信任模型, 并构造更符合真实社交网络环境的网络拓扑结构, 建立了社交网络上的舆论形成模型。通过理论分析和仿真实验, 重点研究了影响观点演化统一、舆论收敛速度的关键因素及其相互作用关系。仿真结果表明, 新模型较经典HK模型的演化过程更贴近现实社会中舆论的形成过程, 演化结果也更加丰富。具体结论如下:1) 信任阈值的变化只影响到舆论的收敛速度 (ε越大, CT越小), 并不阻碍群体观点达成共识; 2) 较小的亲密度调节参数λ和较大的随机节点数量m对舆论统一具有促进作用; 3) 相对于交互强度, 提高人际相似性的作用强度更能加快全局一致舆论的形成; 4) 在具有较高聚类系数和平均度的无标度网络中, 群体观点更容易产生趋同效应。
在下一步的工作中, 将从动态网络结构与舆论耦合演化的角度进一步完善模型。
[1] | SZNAJD-WERON K, SZNAJD J. Opinion evolution in closed community[J]. International Journal of Modern Physics C, 2000, 11 (6) : 1157-1165. doi: 10.1142/S0129183100000936 |
[2] | GRABOWSKI A, KOSINSKI R A. Ising-based model of opinion formation in a complex network of interpersonal interactions[J]. Physica A: Statistical Mechanics and its Applications, 2006, 361 (2) : 651-664. doi: 10.1016/j.physa.2005.06.102 |
[3] | DEFFUANT G, NEAU D, AMBLARD F, et al. Mixing beliefs among interacting Agents[J]. Advances in Complex System, 2000, 3 (01n04) : 87-98. doi: 10.1142/S0219525900000078 |
[4] | HEGSELMANN R, KRAUSE U. Opinion dynamics and bounded confidence: models, analysis and simulation[J]. Journal of Artificial Societies and Social Simulation, 2002, 5 (3) : 1-24. |
[5] | LI H, LI Z, WU Y, et al. An improved evolutionary model of public opinion based on KH model and BA scale-free network[J]. Journal of Information and Computational Science, 2013, 10 (12) : 3939-3955. doi: 10.12733/issn.1548-7741 |
[6] | SU J, LIU B, LI Q, et al. Coevolution of opinions and directed adaptive networks in a social group[J]. Journal of Artificial Societies and Social Simulation, 2014, 17 (2) : 4. doi: 10.18564/jasss.2424 |
[7] | CHEN S, GLASS D H, MCCARTNEY M. Characteristics of successful opinion leaders in a bounded confidence model[J]. Physica A: Statistical Mechanics and its Applications, 2016, 449 : 426-436. doi: 10.1016/j.physa.2015.12.107 |
[8] | 赵奕奕, 彭怡, 肖磊, 等. 突发事件下群体抢购行为的舆论传播机理研究[J]. 系统工程理论与实践, 2015, 35 (3) : 616-622. ( ZHAO Y Y, PENG Y, XIAO L, et al. On opinion propagation mechanism of collective panic buying under emergences[J]. System Engineering-Theory & Practice, 2015, 35 (3) : 616-622. ) |
[9] | LIU Q, WANG X. Opinion dynamics with similarity-based random neighbors[J]. Scientific Reports, 2013, 3 (10) : 2968. |
[10] | WANG H, SHANG L. Opinion dynamics in networks with common-neighbors-based connections[J]. Physica A: Statistical Mechanics and its Applications, 2015, 421 : 180-186. doi: 10.1016/j.physa.2014.10.090 |
[11] | 徐恪, 张赛, 陈昊, 等. 在线社会网络的测量与分析[J]. 计算机学报, 2014, 37 (1) : 165-188. ( XU K, ZHANG S, CHEN H, et al. Measurement and analysis of online social networks[J]. Chinese Journal of Computers, 2014, 37 (1) : 165-188. ) |
[12] | GHOSH S, GANGULY N. Social Networking[M]. Berlin: Spring International Publishing, 2014 : 23 -44. |
[13] | HOLME P, KIM B J. Growing scale-free networks with tunable clustering[J]. Physical Review E, 2002, 65 (2) : 95-129. |