社会网络分析方法解析
美剧“数字追凶”(Numb3rs) 是一部描写将数学方法用于侦破的系列电视剧,其中有几集都用到了同一种数学方法,即将组织(譬如黑社会,反战组织)、人物或者事件间的联系,描绘成图形,探索其中的特征,最终发现重大线索。这类方法便是“社会网络分析”(Social Network Analysis,以下简称SNA)。
电视剧中的情节设置并非毫无根据,在真实世界里,SNA确实被应用于安全领域。譬如,据今日美国2006年的报道,“911事件”以后,美国国家安全局从AT&T、Verizon、BellSouth等三家美国主要电信公司搜集电话记录,从中分析和查找潜在的恐怖分子网络。 当然,SNA的应用远不局限在研究犯罪集团,实质上它是一门研究组织中不同实体间联系,以及信息在其间传播模式的方法。SNA也不是一门最新的学科,它的成型和发展在互联网和电脑时代来临之前就开始了。
早在上世纪30年代,美国的一批社会学家,如J.L.Moreno, W.Lloyd Warner等便开始尝试用节点和连线,来分别反映个人及人际关系,并且从中发现了人际关系最为密切的角色以及子群体的存在。之后随着图论等数学工具的引入,这一方法得到进一步巩固和发展,社会学家和数学家们联手建立了一套能够阐释社会学意义的基本计算指标体系,用于评估一个社区组织的结构形态。
随着互联网的兴起,社会网络分析和各类网络应用彼此也有着,或者说,潜在有着巨大的互相推动作用。
一方面,在线的人际数据非常便于获取,大量的Blog, 或者新型的SNS上能够直接展现人际的交往关系,而早期的研究者则不得不依赖于访谈和问卷。如果今天我们需要研究Blog圈时,只要顺着超链往下找,很短时间内就能积累数百万的样本。相比之下,1968年时,加拿大社会学家Barry Wellman在多伦多近郊研究当地社群,第一轮就访谈了845个人,让他们提供和自己关系最为紧密的人员,再继续约见那些人员,以此类推,可想工作量之巨大。
而另一方面,愈加廉价的计算和存储资源,更先进的算法和模型,也让SNA有机会在更多的领域大展身手。譬如Google的网页级别(Pagerank)算法,也可以看作是其应用之一。
从这一点上来说,SNA和网络口碑研究的结合是有相当应用潜力的。以BBS为例,虽然其同Blog或者SNS不同,用户之间没有显式的联系,但是直觉上我们认为论坛上的用户也像现实当中的人群一样,因为长期的交流或者是偏好,能够形成一定的稳定交流形态。由于BBS上交流形式是发贴和回帖,很自然我们可以将彼此间回帖的关系来作为用户之间的联系,建立网络模型。 更有意思的是,针对相同的论坛,如果生成不同月份的数据及相应的网络图形,就会发现对应的网络形态,以及相同指标排名下的关键用户,是具有相当的延续性的。这笔者更有信心社会网络分析以及相应的展示方法,是有助于进一步在IWOM领域探索和研究在线社群的性质,以及信息传播的模式的。
除了在线社区,我们也尝试了通过文本挖掘分析的公司和品牌作为研
究对象,分析它们在的关联关系,也取得了不错的效果。
在CIC的正式产品IWOM Master里,用户不仅能查看不同产品间是否存在联系,还可以进一步通过点击连线来显示印证这些联系的文章,来深入探索这些联系的实质,我们在研究的过程中,发现这些联系可以包括竞争,合作,OEM,仿制,共用部件等。
最后,SNA方法结合IWOM研究的应用只是刚刚开始,有待进一步发展的地方还很多,譬如SNA的大量指标和计算方法虽然已经可以用来阐释社会现象,但是在IWOM领域具备什么样的阐释力还需要探索;还有对于研究各种领域内不同对象之间的关系,也需要更加严格和形式化的定义;同时背后的文本挖掘和自然语言处理技术,需要相应进一步发展以期能够更加准确得定位文本中不同实体间的联系。
社会网络分析方法解析
美剧“数字追凶”(Numb3rs) 是一部描写将数学方法用于侦破的系列电视剧,其中有几集都用到了同一种数学方法,即将组织(譬如黑社会,反战组织)、人物或者事件间的联系,描绘成图形,探索其中的特征,最终发现重大线索。这类方法便是“社会网络分析”(Social Network Analysis,以下简称SNA)。
电视剧中的情节设置并非毫无根据,在真实世界里,SNA确实被应用于安全领域。譬如,据今日美国2006年的报道,“911事件”以后,美国国家安全局从AT&T、Verizon、BellSouth等三家美国主要电信公司搜集电话记录,从中分析和查找潜在的恐怖分子网络。 当然,SNA的应用远不局限在研究犯罪集团,实质上它是一门研究组织中不同实体间联系,以及信息在其间传播模式的方法。SNA也不是一门最新的学科,它的成型和发展在互联网和电脑时代来临之前就开始了。
早在上世纪30年代,美国的一批社会学家,如J.L.Moreno, W.Lloyd Warner等便开始尝试用节点和连线,来分别反映个人及人际关系,并且从中发现了人际关系最为密切的角色以及子群体的存在。之后随着图论等数学工具的引入,这一方法得到进一步巩固和发展,社会学家和数学家们联手建立了一套能够阐释社会学意义的基本计算指标体系,用于评估一个社区组织的结构形态。
随着互联网的兴起,社会网络分析和各类网络应用彼此也有着,或者说,潜在有着巨大的互相推动作用。
一方面,在线的人际数据非常便于获取,大量的Blog, 或者新型的SNS上能够直接展现人际的交往关系,而早期的研究者则不得不依赖于访谈和问卷。如果今天我们需要研究Blog圈时,只要顺着超链往下找,很短时间内就能积累数百万的样本。相比之下,1968年时,加拿大社会学家Barry Wellman在多伦多近郊研究当地社群,第一轮就访谈了845个人,让他们提供和自己关系最为紧密的人员,再继续约见那些人员,以此类推,可想工作量之巨大。
而另一方面,愈加廉价的计算和存储资源,更先进的算法和模型,也让SNA有机会在更多的领域大展身手。譬如Google的网页级别(Pagerank)算法,也可以看作是其应用之一。
从这一点上来说,SNA和网络口碑研究的结合是有相当应用潜力的。以BBS为例,虽然其同Blog或者SNS不同,用户之间没有显式的联系,但是直觉上我们认为论坛上的用户也像现实当中的人群一样,因为长期的交流或者是偏好,能够形成一定的稳定交流形态。由于BBS上交流形式是发贴和回帖,很自然我们可以将彼此间回帖的关系来作为用户之间的联系,建立网络模型。 更有意思的是,针对相同的论坛,如果生成不同月份的数据及相应的网络图形,就会发现对应的网络形态,以及相同指标排名下的关键用户,是具有相当的延续性的。这笔者更有信心社会网络分析以及相应的展示方法,是有助于进一步在IWOM领域探索和研究在线社群的性质,以及信息传播的模式的。
除了在线社区,我们也尝试了通过文本挖掘分析的公司和品牌作为研
究对象,分析它们在的关联关系,也取得了不错的效果。
在CIC的正式产品IWOM Master里,用户不仅能查看不同产品间是否存在联系,还可以进一步通过点击连线来显示印证这些联系的文章,来深入探索这些联系的实质,我们在研究的过程中,发现这些联系可以包括竞争,合作,OEM,仿制,共用部件等。
最后,SNA方法结合IWOM研究的应用只是刚刚开始,有待进一步发展的地方还很多,譬如SNA的大量指标和计算方法虽然已经可以用来阐释社会现象,但是在IWOM领域具备什么样的阐释力还需要探索;还有对于研究各种领域内不同对象之间的关系,也需要更加严格和形式化的定义;同时背后的文本挖掘和自然语言处理技术,需要相应进一步发展以期能够更加准确得定位文本中不同实体间的联系。