菜单

社会渠道

搜索存档

  • 类型

  • 主题

  • 排序

Twitter地图
信贷:约翰·斯温/右相关性
特性
2016年4月26日8点

在推特上映射:气候变化对话

约翰·斯温

约翰·斯温

04.26.16
约翰·斯温

约翰·斯温

26.04.2016 |上午8:00
特性 在推特上映射:气候变化对话

Twitter已经成为一个受欢迎的社交媒体平台,讨论气候变化问题。广泛的人在世界各地使用Twitter——科学家、政治家、活动家、记者等——交谈关于这个话题。

但在大量的喋喋不休,往往很难得到一个自顶向下的感觉在Twitter上最具影响力的用户是谁,他们“坐”在Twitter“宇宙”与其他用户。

所以碳必威手机官网短暂的委托正确的相关性开始收集数据从Twitter和定期使用它来构建地图显示气候变化对话转变中的影响力。

下面,约翰·斯温从右相关解释的方法和强调一些关键的发现第一波的分析。在接下来的几个月,碳短暂将发布更新地图由正确必威手机官网的相关性,以及扩展分析,看看Twitter讨论能源问题,如核电、风力发电、太阳能、页岩气和煤。必威体育在线注册

所以约翰始于2016年3月的分析…

你也可以看一下全屏版本

背景

正确的相关性我们提供的信息对社会媒体的影响,尤其是Twitter。我们有一个免费的服务,你可以发现局部有影响力的成千上万的主题的信息。我们提供一个API框架对影响者提供对数据的访问,我们称之为“相关性作为服务”。此外,我们进行更深层次的咨询项目提供详细的分析主题专门针对客户的需求。

我最近在博客中写道关于Twitter的影响主题,包括国民健康保险制度,Brexit在达沃斯世界经济论坛。在去年12月COP21气候会议在巴黎,我在博客中写道推特对话发生在第一天的会议。

这是一段非常大量的Twitter流量气候变化的主题。许多世界领导人出席在推特上和活跃。大约有600000条在第一天的会议相比,每周大约有200000在气候变化的主题。

会议后,碳短暂走近我们帮助开发一种更好地理解Twit必威手机官网ter正在进行的讨论气候变化的主题。例如:

  1. 那些有影响力的人们和组织内的对话。
  2. 什么组织和主题发展的上下文中整体气候变化的主题。

结合碳短暂工作,项目的对象被定义如下:必威手机官网

“显示,同时通过肉眼观察和排名,主要影响者是谁在推特上的术语“气候变化”。展示他们如何“集群”和互连。显示体积的互动和活动都在气候变化的“热点”Twitter的宇宙。使用透明和偏离的方法获取和表示数据。”

所以,在一段六周从2月底开始,我们收集微博覆盖广泛的气候变化的主题。我们收集了大约200万条发送的600000用户在Twitter上这个初始时期。下面是概述的方法和技巧使我们发现了有影响力的用户在Twitter上。

我将简要地定义我们所说的“影响”Twitter“对话”的背景下,以及显示,举个例子,我们如何应对一些固有的偏见在任何社交媒体。

影响

测量的影响不像测量海平面上升或空气污染。它本质上是短暂的,并受制于人类的认知偏见。然而,它是一个真正的和重要的现象每年数十亿美元被花在市场营销和公关活动。说某人很可能比另一个人更有影响力,给某种意义上的学位。

现在我们已经收获的日期,我们可以利用各种措施影响的计算方法“图论”,评估整体的谈话。这些都是在下面详细讨论。我们每天都使用这些技术。例如,著名的网页排名算法措施的重要性,网页和支撑了谷歌搜索引擎。

因此,我们将使用术语“影响”来描述能力影响他人的行为或观点。在推特对话的情况下,我们可以直接测量的行为用户转发的数量,和回复帖子提到的其他用户。

我们不要试图直接测量任何效果,或影响,在外面的世界,即人不发微博显式地对气候变化。然而,它是可能影响或告知人们在谈话,是否有与他们直接沟通,这是我们可以测量。

方法

传统Twitter性能分析使用,例如,直接转发的数量指标,或者发生标签表示支持的事业。这些简单的指标是有用的,但是受到各种问题,包括滥用spam-bot账户,或扭曲向用户提供大量的追随者。

图论是一种纠正这些问题并获得洞察影响在整个学科的兴趣。一个图表,在这种背景下,是表示数据,强调实体之间的连接。这是理想的一个社交网络对话在Twitter上的用户之间的通信。

如何看地图吗

网络的对话(图)得以成像在Twitter地图如下所示。

Twitter网络图,2016年3月,中央部分关闭。

Twitter网络图,2016年3月,中央部分关闭。

在这些地图上,每个点(或节点)代表一个Twitter用户和行加入他们代表用户之间的通信,根据转发和提到。点的大小代表了用户的网页排名。简单来说,网页排名衡量“重要”节点是基于节点连接到它的“重要性”——“重要性”用链接。

用户之间的宽度表示链接的数量。用户组与大量的链接(转发和提到)他们之间是厚和暗行。的“指定”算法建立了组织用户分组的相互交互,往往反映了共同利益。此外,你可以看到谁是迷人的“凯瑟琳轮”的方向线的一个点。如果行是显示一个顺时针运动,那个人被提到,转发很多。(参见“用户转发量和提及莱昂纳多·迪卡普里奥”地图)。

最高级别的用户
  • 与其他用户进行频繁的对话
  • 建设性地参与用户提供大量的追随者
  • 与各种各样的群体
  • 其他用户转发、回复和提到自然(没有使用自动化)

所以,而不仅仅是显示本身最重要的人是谁,这说明有影响力的人是谁在时间片的通信发生。例如,戈尔被认为是全球气候变化的影响与大量的Twitter追随者,但表示这是如何影响他在这段时间里。

颜色显示社区——或者“部落”,我们称之为——用户相互交流频繁,因此,有共同利益,其中一些下面突出显示。值得注意的是,我们还没有手动的这些部落,或分配一个特定的颜色。机器学习算法检测每一个“社区”和它们相应的颜色,为读者提供一个可视化表示。

Twitter网络图,2016年3月,整体与强调社区地图。

Twitter网络图,2016年3月,整体与强调社区地图。

取向

当进行一个总体的分析社交网络对话在一个相当广泛的话题,如气候变化,重要的是要首先理解的“风景”。

帮助消除日常谈话的波动,我们选择分析一段六周(-10年2月28日4月,包容,包括几天的日历月的3月主地图为基础)。这一时期包含大约2米微博发送超过800000用户。这包括任何微博发送包含少量的相关术语,如“气候变化”或“全球变暖”(见下文)。

同期的总连接数超过20米。主地图开始本文包含大约3000个用户和13000个连接从总体中提取“气候谈话”网络。给一种与整个全球对话发生在Twitter上所有主题,每天500通过Twitter发送tweet。

为了理解如此大量的信息,我们使用一个过程借鉴军事情报称为“OODA循环”,OODA代表观察到的地方,东方,决定行动。

下面的过程说明过程的概述与链接,您可以找到更多的信息的过程和技术来实现它。

OODA循环过程的概述。

OODA循环过程的概述。可以找到的细节过程在Prezi而在另一个博客

下面是总结的一些元素进行这个过程,我们为了评估水平的影响的气候变化对话在Twitter上。

我们给关注的例子“观察”和“方向”阶段展示特定事件的整体网络谈话的塑造了我们的知识。

所有这种类型的分析开始与我们的“隐性指导”。隐式指导的关键部分是不要花太多的时间和精力推测什么科目,人们会很重要。的原则是先做出一个合理的估计所需的信息,然后运行方向和反馈阶段完善。在这种情况下,我们开始搜索覆盖范围广泛的主题在气候变化的主题。

在此期间使用的搜索tweet英文匹配以下:

“全球变暖”(全球变暖)或“气候变化”或(气候变化)或全球变暖、气候变化或#气候'

莱昂纳多·迪卡普里奥

前几天发生的事从我们的分析提供了一个很好的例子,在实践中这一过程是如何工作的。我们刚刚开始收集数据在过去的几天里2月当演员莱昂纳多·迪卡普里奥获得奥斯卡奖,因气候变化在他的获奖感言。

这是一个最好的例子,“展开的情况下输入上面OODA循环流程图所示。奥斯卡赢得和语言创造了一个推特风暴——大量的tweet来自公众,我们捕捉到微博收集过程。

这是气候变化对话在Twitter上的地图是3月6日当周。

用户发微博莱奥纳多迪•迪卡普里奥高亮显示

Twitter网络图,截至2016年3月6日一周,近距离的中央部分。用户发微博对莱昂纳多·迪卡普里奥高亮显示。

不仅是莱昂纳多·迪卡普里奥最突出的用户在地图上,但是有很多人也在正常情况下不会有影响力的著名气候变化的主题。

在正常情况下,我们使用的图论技术能够纠正斜的各种元素,包括来自用户的微博粉丝数量非常大。

在这种情况下,然而,赢得奥斯卡的事件和使用演讲谈论气候变化是由其他有影响力的用户。不只是大批球迷创造流量,尽管这也是重要的。

下面的地图包括成千上万的较小的用户,我们的算法通常会过滤掉的地图,以便直观地说明影响的大小。左边,相比之下,你可以看到巴拉克•奥巴马(Barack Obama)的账户。

截至06 2016年3月,Twitter网络图,一周显示高亮显示用户转发的体积和提及莱昂纳多•迪卡普里奥。

Twitter网络图,截至2016年3月6日星期,显示用户转发并提及莱昂纳多·迪卡普里奥的体积。

下面是一个列表的顶部tweet的一周内从我们的数据集引用的莱昂纳多·迪卡普里奥。你可以看到,有一些严重的列表中有影响力的人,如白宫,绿色和平组织和联合国。

顶尖的微博列表(转发的数量)提及莱昂纳多迪•迪卡普里奥在截至2016年3月06的一周。

列表的tweet(转发的数量)提到在2016年3月6日当周莱昂纳多·迪卡普里奥。

很明显在接下来的几天奥斯卡颁奖典礼,这是一个显著的影响。它暗示我们,一个行动是需要在第四阶段的OODA循环过程——决定反馈到观察和定位阶段在随后的迭代。

正如上面提到的,图论方法包括纠正这种偏见的的技术。然而,在这种情况下,一个重要的部分目的是确保偏离的方法。因此,我们需要锻炼保健决策时可能过滤掉一定的代表性观点。

在这种情况下,很明显,莱昂纳多·迪卡普里奥情况引入了一个元素,显然是不相关的有关气候变化的对话。

Twitter地图强调某些知名用户显式地“专家”在其他领域比气候变化。例如,艾莉高尔丁和时尚不是已知的有关气候变化的对话,但推特对迪卡普里奥的奥斯卡演讲。这并不是说我们可以无视他们的贡献,但是,相反,我们可以决定评估影响的背景下这方面的知识。

截至06 2016年3月,Twitter网络图,一周关闭的中央部分。用户发微博莱奥纳多迪•迪卡普里奥高亮显示。

Twitter网络图,截至2016年3月6日星期,特写的中央部分。用户发微博对莱昂纳多·迪卡普里奥高亮显示。

在这一点上,因此,我们知道我们需要纠正偏差引入的奥斯卡事件。反馈这个信息到定向阶段,然后看着相同的信息方式不同。

东方的OODA循环过程。

东方的OODA循环过程。

同期的Twitter地图是截至3月6日(一周)。这个视图显示整体网络的一个子集被称为“强连通分量”。这意味着只有用户相互交流在两个方向上(例如,彼此互相转发或提及)。这仅仅的影响包括用户参与谈话。用户如莱昂纳多·迪卡普里奥和奥巴马总统不包括不参与与其他用户在这一组对话。

为强连通用户Twitter网络图,截至2016年3月06一周,近距离的中央部分。

为强连通用户Twitter网络图,截至2016年3月6日一周,近距离的中央部分。

这种新的信息现在美联储向前进方向分析过程。在这一点上,我们决定如何最好地实现我们的目标。在这种情况下,它是适当的放一个高权重的强连通网络的一部分,过滤掉一些“噪音”纳入更广泛的观点。

排名的影响

显示在文章的开始,其中一个目标是找到最“有影响力”的用户在气候变化的主题。下表显示了在这第一个星期前40名有影响力的人。

表截至2016年3月06整体影响力的一周。

表截至2016年3月06整体影响力的一周。

在奥斯卡的一周,我们已经确定了,莱奥纳多迪•迪卡普里奥和白宫,事实上,最具影响力的用户。两人都发表相关评论,认真参与气候变化辩论。

然而,我们只有排除无关紧要的用户评论在奥斯卡颁奖典礼赢得谈话和整体平衡的方式表示。正如您将看到的从最终Twitter本文顶部的地图,这个一次性的事件的影响进一步稀释。

“否认者”

接下来,让我们看看3月13日当周,我们可以看到另一种效应在起作用。

在这些地图,颜色显示不同社区的用户通过机器学习算法识别作为一个强大的社区。在这个层次上,地图上的分组和颜色很好地一致。

在下面的图中左边是两个用户组颜色的蓝色和橙色。

截至2016年3月13日Twitter网络图,一周。

截至2016年3月13日Twitter网络图,一周。

这是一个更紧密的观点。从这些群体用户的名称是不明显这一组感兴趣的共同话题。

截至2016年3月13日Twitter网络图,一周。近的两个有趣的社区。

截至2016年3月13日Twitter网络图,一周。近的两个有趣的社区。

然而,我们可以看到更多的细节关于这些组织在我们的仪表板应用程序中。

这是一个指示板的截图。强调“部落”列表中(我们的名字社区)是部落SteveSGoddard最有影响力的用户。这个部落大约与橙色集团对应地图所示。

仪表板截图截至3月13日的一周。支派SteveSGoddard高亮显示。

仪表板截图截至3月13日的一周。支派SteveSGoddard高亮显示。

通过过滤仪表板SteveSGoddard部落,我们可以了解感兴趣的话题导致成员聚集在一起。

仪表板截图截至3月13日的一周。支派SteveSGoddard选中。

仪表板截图截至3月13日的一周。支派SteveSGoddard选中。

“主题”列表中确定的中心是一个主题列表的内容推到一个机器学习的过程。一旦SteveSGoddard部落被选中时,这个话题是过滤到主题列表中发现的tweet部落。

高亮显示的术语“否认者”的潜在利益。(“否认者”我们选择不是一个词,而是一个tweet和突出的算法检测最佳代表这组)。

这是列表的主题SteveSGoddard是有影响力的,检测到正确的相关服务

史蒂夫·戈达德的主题是有影响力的。

史蒂夫·戈达德的主题是有影响力的。

这里是一个列表的顶部微博发送从这个部落。

列表顶部tweet(转发的数量)在3月13日当周SteveSGoddard支派。

列表顶部tweet(转发的数量)在3月13日当周SteveSGoddard支派。

清楚,整个感兴趣的主题是气候变化怀疑和“否认者”这个词出现在他们自己的一些顶级tweet(这就是为什么算法选择这个词来描述部落)。

作为一个例子,这个特别的故事在Twitter上生成的反应。

这是特别的故事在推特上生成反应。

这也解释了为什么洛雷塔(merrill Lynch)接近这些组织在Twitter地图。

截至2016年3月13日Twitter网络图,一周。近的两个有趣的社区。洛雷塔林奇强调接近怀疑论者的社区。

Twitter网络图,星期3月13日结束。近的两个有趣的社区。洛雷塔林奇强调接近怀疑论者的社区。

从地图和仪表板,我们已经确认有一个小,但很明显可识别的用户组的共同利益在气候变化怀疑论从事谈话在这个时期。

这个特定的群体最引人注目的是他们的比较孤立的地图。这意味着他们交谈了很多关于气候变化,但几乎完全在自己。他们很少转发或与人交谈以外的部落。同样,他们很少转发或提到的他们的部落以外的人。这将更通常被称为一个“回音室”。

因此,我们已经确定了社区我们可能想观察我们的监测气候变化对话在Twitter上建立。在未来的文章中,我们将关注一些其他的可检测的部落。

这是前40名最有影响力的用户SteveSGoddard部落的3月13日当周期间收集的数据:

表内的最高的整体影响力SteveSGoddard部落截至2016年3月13日的一周。

表内的最高的整体影响力SteveSGoddard部落截至3月13日的一周。

整整一个月

这个项目的一个关键目标,设立碳短暂,是排名最具影响力的用户。必威手机官网排名在这种情况下不像足球联赛的表哪里有控制规则和分数。在许多方面,主题的选择,因此,它包括tweet是任意的,只能反映一个在任何时间的世界观。在现实中,一个话题,比如气候变化,是由许多副标题和它是不可能的,在某种程度上,无意义的尝试捕捉一切。

时间和节奏

OODA循环过程的基本原则之一是时间。这经常是反应速度变化的事件。

到目前为止,在这种情况下,快速循环的能力与其说是应对短期的事件,但是,相反,通知我们理解短期事件如何影响整个画面。

我们的目标是建立一个长期稳定的主题地图正在讨论在Twitter上,然后用它来获得洞察用户交互的方式,形成部落和他们如何比较。然而,如果我们没有运行短期分析,检测在一定期限内倾斜和社区,我们就无法理解这些波动适应更大的图景。

正如上面提到的,在最初的一段六周我们一共收集了2 m tweet, 800000用户和21 m连接。

经过若干次迭代的短期(每日、每周)时期,分析解决问题,如每周时间上面提到的例子,我们得出的结论是,在这个问题上的波动会消除一个月的时间。因此本文使用的地图在我们收集的数据在3月。

我们决定没有一个很好的理由不运行分析自然每周和每月的周期。流程运行时不断,每天监测,所以当一个意想不到的事件发生(或计划的事件,例如COP21)我们可以切换到每天循环。

我们有生产表排名最具影响力的用户在这段时间(2016年3月)在三个类别如下:

最高的整体

最高的整体影响测量结合的连接数量(提到,转发回复),连接的质量(衡量网页排名)和范围(可以看到转发的用户数量)用户的tweet。这些调整折扣斜向用户提供非常大量的追随者通过使用一个因素基于日志的数量的追随者。

前连接器

用户的连通性的价值是用一种算法称为“中间性中心”。这个措施用户如何“连接”所有其他用户,而其他人。

最有趣的用户

“有趣”度量发现较小的用户做了一个相对较高的影响。比较用户如何在整体排名相比,他们将如何给定数量的追随者。

是有用的寻找利基或当地的故事在一个大型网络,他们很难找到。

下面的表显示了在3月这三个类别。

2016年3月表的影响者。

表2016年3月前有影响力的人。

Twitter的主要形象:部分地图。信贷:约翰·斯温/右相关性。
Sharelines从这个故事
  • 在推特上映射:气候变化对话

专家分析直接发送到您的收件箱中。

能聚集所有的重要的文章和论文选择碳简短的电子邮件。必威手机官网找到更多关于我们的时事通讯在这里