文章主题:我们可以从这篇文章中提取出以下关键词:CGC, Contrastive Graph Clustering, 社区检测和跟踪, 图聚类

666AI工具大全,助力做AI时代先行者!

CGC:用于社区检测和跟踪的对比图聚类;包容性释放了团队中性别多样性的创造潜力;标记网络与未标记网络的熵;通过社会拓扑和双重角色用户依赖改进信息级联建模;俄乌战争推特数据集;用于量化社会网络两极分化的基于多意见的指标:来自印度的案例研究;通过有限回忆重复的影响;推特在预测选举结果方面的双层评估:2020 年德里议会选举;基于文本和社交图谱的自监督学习的谣言检测;机器人、虚假信息和特朗普的第一次弹劾;以太坊庞氏检测的异构特征增强;论邢天与网上反华情绪的坚守;二维 Motter 和 Lai 模型中的级联交通拥堵;使用基于主体的网络模型评估欧洲大学 Omicron 传输缓解策略的有效性;

CGC:用于社区检测和跟踪的对比图聚类

在现代复杂网络中,社区检测与跟踪是一个关键任务。为了提高性能,作者提出了一种名为CGC(对比性图聚类)的方法,它结合了图卷积神经网络和对比性损失函数,以实现在不同时间步长的数据上进行有效的社区识别和跟踪。

地址: http://arxiv.org/abs/2204.08504

作者:Namyong Park、Ryan Rossi、Eunyee Koh、Iftikhar Ahamath Burhanuddin、Sungchul Kim、Fan Du、Nesreen Ahmed以及Christos Faloutsos。

文章CGC:对比图聚类在社区检测与跟踪中的应用

原内容概述:本研究旨在解决网络数据中不同时间实体及其相互关系的识别问题,探讨如何定位实体社区并追踪其发展变化。文章采用图聚类的方法进行处理,重点关注深度图聚类(DGC)方法在图结构数据上的应用。尽管当前的DGC方法存在一定的局限性,如建模选择和自动编码器架构等,但它们仍然具有一定的优越性。为了克服这些问题,作者提出了一种名为CGC的新型图聚类框架,它在多级方案中 carefully 选择正样本和负样本,能够更好地反映分层社区结构和网络同质性。此外,CGC还扩展到了时间演化数据,实现了含时图聚类,具备检测变化点的能力。经过对真实世界图的广泛评估,证明了所提出的CGC方法在效果上超越了现有方法。改写后的全文:本研究的目的在于应对网络数据中不同时间实体及其相互关联的问题,探索如何识别实体社区并追踪其演变过程。本研究采用了图聚类的方法,着重于深度图聚类(DGC)在图结构数据中的应用。尽管现有的DGC方法在一定程度上受到局限,如建模选择和自动编码器架构等问题,但它们依然具备一定的优势。为了克服这些限制,本研究提出了一种名为CGC的新型图聚类框架。该框架在多级方案中精心选择正样本和负样本,能够更准确地反映出分层社区结构和网络的同质性。同时,CGC还拓展到了时间演化数据,实现了含时图聚类,具备了检测变化点的能力。通过对真实世界图的深入分析,证明了CGC方法在效果上超越了现有方法。

包容性释放了团队中性别多样性的创造潜力

性别多样性团队中的包容性释放了其创造潜力

地址: http://arxiv.org/abs/2204.08505

作者: Balazs Vedres, Orsolya Vasarhelyi

文章CGC:对比图聚类在社区检测与跟踪中的应用

原内容概述:研究显示,团队中的性别多样性有助于提高集体创造力。然而,要实现这一效果,性别多样性必须得到包容。本文分析了4011个视频博弈项目,结果表明,只有当团队具备一定的包容性时,性别多样性才能发挥其积极作用。作者基于过去合作的数据,提出了四种包容性衡量标准,并发现,缺乏包容性的性别多样性对创造力无贡献,而高度包容则能带来0.04至0.09的标准差变化。因此,为了从多元化中获取创造性收益,开发公司需要确保团队中有23%或更多的女性开发人员,并将其纳入团队的各个角落。研究表明,低多样性的包容性可能会产生负面影响。通过比较不同公司的多样性和包容性顺序,作者发现,先提高多样性,再发展包容性,能够带来更高的多样性和包容性。改写后的文章:性别多样性在团队中的价值已经被广泛证实,特别是在提升集体创造力方面。然而,要想真正发挥性别多样性的优势,团队合作需要具备足够的包容性。通过对4011个视频博弈项目的深入分析,我们发现,只有当团队包容性达到一定程度,性别多样性才能真正地为团队创造力和创新力带来积极影响。本研究针对过去合作的加权网络记录数据,提出了四种不同的包容性衡量标准。这些标准主要依据的是团队中是否存在隔离、性别之间的紧密联系,以及是否将女性纳入核心团队网络等因素。研究结果明确指出,如果团队缺乏包容性,那么性别多样性对团队创造力的提升就毫无作用。相反,如果在团队中提高了包容性,例如,将原本仅限于跨性别联系的女性开发者纳入团队,就可以看到显著的创造力提升效果,这种效果的范围甚至可以达到0.04到0.09个标准差的变化,具体数值则取决于所采用的包容性衡量标准。为了能够从多元化的团队中获得最大的创造性收益,开发公司需要确保团队中至少包含23%的女性开发人员,并且将这些女性开发人员融入到团队的各个方面。同时,我们还发现,低多样性的包容性可能会带来负面的影响。通过对比不同公司在处理多样性和包容性时的策略,我们得出了一个结论:先提高团队的多样性,然后再考虑包容性,这样能够更好地实现多样性和包容性的平衡。

标记网络与未标记网络的熵

在本文中,我们将探讨标记网络与未标记网络的熵差异。标记网络是指已经被标注出不同类别或属性的网络,而未标记网络则没有这些信息。通过对比这两种网络的熵,我们可以更好地理解它们之间的差异以及如何利用这些差异来提高网络的性能。

地址: http://arxiv.org/abs/2204.08508

作者: Jeremy Paton, Harrison Hartle, Jakob Stepanyants, Pim van der Hoorn, Dmitri Krioukov

摘要: 网络的结构是一个未标记的图,但大多数复杂网络模型中的图都是用无意义的随机整数标记的。相关的标签噪声总是可以忽略不计,还是可以压倒网络结构信号?为理解决这个问题,我们引入并考虑了流行网络模型的稀疏未标记版本,并将它们的熵与原始标记版本进行了比较。我们表明,标记和未标记的 Erdos-Renyi 图在熵上是等价的,即使它们的度数分布非常不同。配置模型的标记和未标记版本在它们的主要熵项中可能有不同的前因数,尽管这仍然是推测性的。我们的主要结果是标记和未标记的一维随机几何图的熵的上限和下限。我们表明,与标记的熵相比,它们的未标记熵可以忽略不计。这些结果表明,在稀疏网络中,无意义标记的熵可能会主导网络结构的熵,这表明需要彻底重新检查网络建模的统计基础。

通过社会拓扑和双重角色用户依赖改进信息级联建模

原文标题: Improving Information Cascade Modeling by Social Topology and Dual Role User Dependency

地址: http://arxiv.org/abs/2204.08529

作者: Baichuan Liu, Deqing Yang, Yueyi Wang, Yuchen Shi

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 在过去的十年中,社会网络上的信息传播(也称为信息级联)由于其在许多领域的应用价值而得到了广泛的研究。近年来,包括基于递归神经网络的模型在内的许多序列模型已被广泛用于预测信息级联。然而,序列模型刻画的级联序列中的用户依赖关系通常是单向的,并且与扩散树不一致。例如,后继的真正触发可能是非直接前驱,而不是序列中的直接前驱。为了更充分地刻画对精确级联建模至关重要的用户依赖关系,我们提出了一种非序列信息级联模型,称为 TAN-DRUD(具有双重角色用户依赖关系的拓扑感知注意网络)。 TAN-DRUD 受到经典通信理论的启发,通过刻画信息发送者和接收者的双重角色用户依赖关系,在信息级联建模上获得了令人满意的性能。此外,TANDRUD 将社会拓扑整合到两级注意网络中,以增强信息扩散预测。我们对三个级联数据集的广泛实验表明,我们的模型不仅优于最先进的级联模型,而且能够利用拓扑信息和推断扩散树。

俄乌战争推特数据集

原文标题: Twitter Dataset on the Russo-Ukrainian War

地址: http://arxiv.org/abs/2204.08530

作者: Alexander Shevtsov, Christos Tzagkarakis, Despoina Antonakaki, Polyvios Pratikakis, Sotiris Ioannidis

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 2022 年 2 月 24 日,俄罗斯入侵乌克兰,也就是现在的俄乌战争。我们已经从 Twitter API 发起了一个持续的数据集采集。直到撰写本文的那一天,数据集已达到 5730 万条推文,来自 770 万用户。我们应用了初始音量和情绪分析,而数据集可用于对主题分析、仇恨言论、宣传识别进行进一步探索性调查,甚至显示潜在的恶意实体,如僵尸网络。

用于量化社会网络两极分化的基于多意见的指标:来自印度的案例研究

原文标题: A Multi-Opinion Based Metric for Quantifying Polarization on Social Networks: A Case Study from India

地址: http://arxiv.org/abs/2204.08697

作者: Maneet Singh, S.R.S. Iyengar, Rishemjit Kaur

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 众所周知,社交媒体是政治和社会交流的温床,分析观点的两极分化一直受到关注。在这项研究中,我们提出了一种量化社会网络极化的措施。与最先进的方法不同,所提出的指标不假设两种意见的情况,而是适用于多种意见。我们的指标在基于二元意见的基准网络以及具有多意见场景和不同程度两极分化的综合意见标签社会网络上进行了测试。该指标显示了具有不同极化程度的社会网络的可喜结果。然后,该方法被用于使用从 Twitter 获得的关于印度实施《公民身份修正法》(CAA)的基于三意见(“赞成”、“反对”和“中立”)的通信的数据来研究两极分化。我们已经测量了各种社会网络上的两极分化,例如基于转发或提及的通信网络、基于关注者-关注者连接的社交关系网络以及最后通过将通信网络与社交关系网络相结合的混合网络。所提出的方法表明用户在 Twitter 上分享帖子方面存在高度两极分化,从而表明该问题具有高度争议性。我们还获得了社会关系网络的高极化分数。因此表明用户之间存在同质性,即对 CAA 的看法与他们在平台上的社会关系一致。对于基于转推的混合网络,我们的极化指标返回的分数强调了意见是转推行为的关键驱动因素,而与用户之间的社会关系无关。相反,用户之间基于提及的通信本质上并没有两极分化。

通过有限回忆重复的影响

原文标题: Influence of Repetition through Limited Recall

地址: http://arxiv.org/abs/2204.08741

作者: Jad Sassine, M. Amin Rahimian, Dean Eckles

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 接收到许多信号的决策者会受到不完全回忆的影响。当从社交媒体平台上从许多发件人那里汇总消息的提要中学习时,这一点尤其重要。在本文中,我们研究了一种从提要中学习的程式化模型,并强调了由于召回不完善而导致的低效率。在我们的模型中,无法回忆特定消息来自于产生干扰的消息累积。我们根据每个发送者发送消息的速率和干扰强度来描述每个发送者的影响。我们的分析表明,不完美的召回不仅会导致有限人口中的重复计算和极端意见,而且随着发送者人口的增加,还会阻碍接收者学习真实状态的能力。我们估计了在线实验中的干扰强度,其中参与者暴露于(非信息性)重复消息并且他们需要估计其他人的意见。结果表明,在意见不一的参与者中,干扰发挥了重要作用并且较弱。我们的工作对网络中的信息传播有影响,尤其是当它是虚假的,因为它比真实信息更容易被共享和重复。

推特在预测选举结果方面的双层评估:2020 年德里议会选举

原文标题: A Bi-level assessment of Twitter in predicting the results of an election: Delhi Assembly Elections 2020

地址: http://arxiv.org/abs/2204.08746

作者: Maneet Singh, S.R.S. Iyengar, Akrati Saxena, Rishemjit Kaur

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 选举是任何民主国家的支柱,选民选举候选人作为他们的代表。社交网站的出现为政党及其候选人提供了一个与选民联系以传播其政治思想的平台。我们的研究旨在使用 Twitter 评估 2020 年举行的德里议会选举的结果,采用双层方法,即关于政党及其候选人。我们分析了选举结果与不同候选人和政党在 Twitter 上的活动的相关性,以及选民对他们的反应,尤其是选民对政党的提及和情绪。候选人的 Twitter 个人资料在政党层面和候选人层面进行比较,以评估他们与选举结果的关联。我们观察到关注者的数量和对候选人推文的回复是预测实际选举结果的良好指标。然而,我们观察到,推文中提及某个政党的推文数量以及推文中显示的选民对该政党的情绪与选举结果不一致。我们还在语言、词嵌入和道德维度等各种特征上使用机器学习模型来预测选举结果(输赢)。使用推文特征的随机森林模型为预测推文是否属于获胜或失败的候选人提供了有希望的结果。

基于文本和社交图谱的自监督学习的谣言检测

原文标题: Rumor Detection with Self-supervised Learning on Texts and Social Graph

地址: http://arxiv.org/abs/2204.08838

作者: Yuan Gao, Xiang Wang, Xiangnan He, Huamin Feng, Yongdong Zhang

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 近年来,谣言检测已成为一个新兴且活跃的研究领域。其核心是对丰富信息中固有的谣言特征进行建模,例如社会网络中的传播模式和帖子内容中的语义模式,并将它们与真相区分开来。然而,现有的谣言检测工作在异构信息建模方面存在不足,要么仅使用单个信息源(例如社会网络或帖子内容),要么忽略多个源之间的关系(例如通过简单的连接融合社交和内容特征)。因此,他们在全面理解谣言和准确检测谣言方面可能存在缺陷。在这项工作中,我们探索了异构信息源上的对比自我监督学习,以揭示它们之间的关系并更好地表征谣言。从技术上讲,我们用一个辅助的自我监督任务来补充检测的主要监督任务,该任务通过后自我歧视丰富了后表示。具体来说,给定帖子的两个异构视图(即编码社交模式和语义模式的表示),通过最大化同一帖子的不同视图与其他帖子的视图之间的互信息来完成区分。考虑到信息源的不同关系,我们设计了集群方式和实例方式来生成视图并进行区分。我们将此框架称为自监督谣言检测 (SRD)。对三个真实世界数据集的广泛实验验证了 SRD 在社交媒体上自动检测谣言的有效性。

机器人、虚假信息和特朗普的第一次弹劾

原文标题: Bots, Disinformation, and the First Trump Impeachment

地址: http://arxiv.org/abs/2204.08915

作者: Michael Rossetti, Tauhid Zaman

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 我们在第一次弹劾美国总统唐纳德特朗普期间研究了 Twitter 上机器人和 Qanon 阴谋论支持者的行为。在涵盖弹劾的 103 天期间,我们收集了来自 360 万用户的超过 6770 万条推文,以及他们的 5360 万边追随者网络。我们发现机器人占所有用户的 1%,但在 Qanon 支持者中的流行率接近 10%。尽管数量不多,但机器人产生了超过 31% 的弹劾相关推文。我们还发现,机器人会分享更多虚假信息,但使用的有害语言比其他用户少。 Qanon 支持者的追随者网络呈现出分层结构,机器人充当中心枢纽,周围环绕着孤立的人类。我们使用广义谐波影响中心性度量来量化机器人对弹劾讨论的日常影响。总体而言,我们发现,由于数量较多,支持特朗普的机器人在大多数情况下具有更大的影响力。在每个机器人的基础上,反特朗普和支持特朗普的机器人具有相似的影响,而 Qanon 机器人的影响小于非 Qanon 机器人。

以太坊庞氏检测的异构特征增强

原文标题: Heterogeneous Feature Augmentation for Ponzi Detection in Ethereum

地址: http://arxiv.org/abs/2204.08916

作者: Chengxiang Jin, Jie Jin, Jiajun Zhou, Jiajing Wu, Qi Xuan

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 区块链技术在引发新的工业和技术革命的同时,也带来了新的挑战。近期,庞氏骗局、洗钱等一大批带有“区块链”傀儡的新型骗局不断涌现,严重威胁金融安全。区块链中现有的欺诈检测方法主要集中在人工特征和图分析上,首先使用部分区块链数据构建同质交易图,然后使用图分析检测异常,导致模式信息丢失。在本文中,我们主要关注庞氏骗局检测并提出了 HFAug,这是一个通用的异构特征增强模块,可以刻画与帐户行为模式相关的异构信息,并且可以与现有的庞氏检测方法相结合。 HFAug 在辅助异构交互图中学习基于元路径的行为特征,并将异构特征聚合到执行庞氏检测方法的同构中的相应帐户节点。综合实验结果表明,我们的 HFAug 可以帮助现有的庞氏检测方法在以太坊数据集上实现显著的性能提升,表明异构信息在检测庞氏骗局方面的有效性。

论邢天与网上反华情绪的坚守

原文标题: On Xing Tian and the Perseverance of Anti-China Sentiment Online

地址: http://arxiv.org/abs/2204.08935

作者: Xinyue Shen, Xinlei He, Michael Backes, Jeremy Blackburn, Savvas Zannettou, Yang Zhang

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 恐华症,即反华情绪,在网络上已经存在很长时间了。 COVID-19 的爆发和延长的隔离进一步扩大了它。然而,我们缺乏对恐华症的成因以及它如何随着时间演变的定量理解。在本文中,我们在 2016 年至 2021 年间对两个主流和边网络社区进行了大规模的恐华纵向测量。通过分析 Reddit 的 8B 帖子和 4chan /pol/ 的 206M 帖子,我们调查了恐华症的起源、演变和内容。我们发现,与中国没有直接关系的政治事件可能会引发反华内容,例如美国退出《巴黎协定》。在 COVID-19 大流行期间,即使有仇恨言论禁令政策,每天使用恐华诽谤的人也显著增加。我们还表明,随着 COVID-19 的兴起,“中国”和“中国人”这两个词的语义正在转向恐华诽谤,并且在大流行期间保持不变。我们进一步使用主题建模来展示恐华讨论的主题非常多样化和广泛。我们发现两个网络社区都有一些共同的恐华话题,比如民族、经济和商业、武器和军事、外交关系等。但是,与 4chan 的 /pol/ 相比,更多与日常生活相关的话题包括食物、博弈和股票在 Reddit 上找到。我们的发现还表明,与 COVID-19 相关和指责中国政府的话题在大流行期间更为普遍。据我们所知,这篇论文是对恐华症最长的量化测量。

二维 Motter 和 Lai 模型中的级联交通拥堵

原文标题: Cascading traffic jamming in a two-dimensional Motter and Lai model

地址: http://arxiv.org/abs/2204.09011

作者: Gabriel Cwilich, Sergey V. Buldyrev

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 我们使用 Motter 和 Lai 模型研究了二维随机几何图上的级联交通拥堵。交通拥堵是由局部攻击使圆形区域或一定大小的线失效,以及对随机选择的相同数量的节点的分散攻击造成的。我们调查是否存在攻击的临界尺寸,超过该临界尺寸的网络由于级联干扰而完全阻塞,以及该临界尺寸如何取决于图的平均度数langle krangle,节点数系统中的 N,以及 Motter 和 Lai 模型的公差参数 alpha。

使用基于主体的网络模型评估欧洲大学 Omicron 传输缓解策略的有效性

原文标题: Assessment of the effectiveness of Omicron transmission mitigation strategies for European universities using an agent-based network model

地址: http://arxiv.org/abs/2201.08850

作者: Jana Lasser, Timotheus Hell, David Garcia

文章CGC:对比图聚类在社区检测与跟踪中的应用

摘要: 在 COVID-19 大流行期间,让大学全面恢复校园运营一直是许多国家的一个有争议的讨论。密集课程环境中大规模爆发的风险与面对面教学的好处形成鲜明对比。传播风险取决于一系列参数,例如疫苗接种覆盖率和有效性、接触人数和采用非药物干预措施 (NPI)。由于欧洲普遍的学术自由,许多大学被要求自主决定和实施干预措施并规范校园运作。在疫苗接种覆盖率和病毒参数迅速变化的背景下,大学往往缺乏足够的科学洞察力来做出这些决定。为理解决这个问题,我们分析了一所欧洲中型大学的 10755 名学生和 974 名教职员工的传输动力学的校准、数据驱动的基于主体的模拟。我们使用从学生入学数据重建的协同定位网络,并根据教育机构的疫情规模分布校准传播风险。我们专注于可操作的干预措施,这些干预措施是大学现有决策过程的一部分,为具体的政策决策提供指导。在这里,我们表明,对于 SARS-CoV-2 病毒的 Omicron 变体,鉴于最近报告的奥地利学生的疫苗接种覆盖率约为 80%,即使减少 25% 的入住率和普遍使用口罩也不足以防止大规模爆发.我们的研究结果表明,如果需要在校园里有学生和教职员工,那么在大学环境中使用现有疫苗和 NPI 来控制病毒的传播是不可行的。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://netsci.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn

平台。

文章CGC:对比图聚类在社区检测与跟踪中的应用

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!