社交网络中的用户行为分析
来源:用户上传
作者:
【摘 要】社交网络的发展成为目前社会发展的一种常态,成为人与人之间交流互动、娱乐休闲的平台。网络平台逐渐成为人们生活中重要的工具。用户是组成这个平台的核心,对用户在网络平台上的种种行为进行分析是深入认识社交网络运行的重要起始点和关键价值之一。因此,对社交网络中用户行为的研究十分必要。
【Abstract】The development of social networks has become a normal state of social development. Social networks have become a platform for interaction, entertainment and leisure among people. Network platforms have gradually become an important tool in people's lives. Users are the core of this platform. The analysis of users' behaviors on the network platform is one of the important starting points and key values for understanding the operation of social networks. Therefore, research on user behavior in social networks is necessary.
【关键词】社交;网络平台;用户行为
【Keywords】social; network platform; user behavior
【中图分类号】TP393 【文献标志码】A 【文章編号】1673-1069(2019)08-0115-02
1 引言
在互联网技术快速发展的推动下,社交网站的出现和发展为社交网络用户行为的分析提供了更加详细的数据支持。通过对社交网络进行分析,一方面可以分析网络中用户的不同行为和特点,另一方面可以挖掘出隐含的信息。在对用户进行分析的时候,要从最基本的关注、评论、主页访问等互动功能方面分析,还要结合社交网络图的性质、活跃用户图等进行分析。
2 社交网络中用户分析的主要内容
2.1 社交网络结构用户行为分析
社交网络结构可以直观地表示用户社交行为的主要特征。分析点对应相关的图节点度分布、聚类系数、路径长度、强连通分支。节点度对应好友列表的数量分布,比如微博和Twitter有向图的出度和入度表示了粉丝和关注人的数量。聚类系数的取值在1~0,局部性质显示网络用户的聚集程度。而社交网络中不同的社交圈和社交圈在罕见的相关节点的聚类系数大。路径长度与六度分割理论想相关联,即真实世界中的任意两人可以通过不超过六次社交关系的跳转建立联系[1]。
2.2 社交网络功能用户行为分析
用户行为是社交网络的核心,点赞、评论、关注这些都是用户在微观上对社交网络使用功能的反应。通过分析可以深入了解分析用户的特征,为社交网络平台的运营提供理论支持。例如,开发流的应用和维护升级服务等。从大学生使用的主流社交网络QQ、微博、微信等平台功能的使用上来看,发现最常用的社交功能有主页查看、日志、状态、相册、分享等。对社交用户单个个体的分析的局限性在于用户的单向交互行为,不能全部地展示用户之间的交互,所以对用户功能活动分析十分重要。目前,对社交网络行为的分析涵盖了用户互相访问的内容、访问的动机和访问内容。分析出用户产生交互行为的三大动机,即用户之间的联系、协同创造信息、分享信息。
3 社交网络用户分析算法
3.1 卡方统计量特征提取法
Chi-square statisitic即CHI的概念来自Contingency Table Test,这种方式对于t、c的关联能够给出明确的表示。在运用这种方法的时候,要对照理论值和实验值,在此基础上充分探究存在的差异,在识别网络用户时,c代替永不,而t是代替yoghurt的特征。t与c的关系是满足CHI分布的,使用数学规律计算,检验最终的CHI是否成正比。相关程度高则数值大,卡方统计量可以由以下的方式来表示,如X2(t、c)=(AD-BC)2(A+B)(C+D),其中A、B、C表示不同的样本数,在这四个样本之中,AC表示用户c,AB则表示特征t,CHI表示X2(t、c)意味着用户c与t之间的关联程度。当X2(t、c)等于0的时候,两者属于独立的关系,当X2(t、c)不等于0的时候,两者之间有关系,关联性的程度随着X2(t、c)增大而更强,因此,X2(t、c)的大小决定了特征和用户之间的关系[2]。
3.2 TF-IDE算法
TF-IDE算法这种统计算法常见于评估工作,主要是评估一个字、文件或是重要程度。如果需要评估的字词出现的次数多则显示文章就更重要,在语料库出现的频率与出现的次数有很大的关系。TF-IDE算法主要包含两个方面,term frequency即TF,假设N为需要查询的关键词,W1、W2直到Wn,显示在同一个网页中的词汇频率是TF1、TF2直到TFn,那么最终的结果就是TF1+TF2+……TFn。但是需要注意的是term frequency即单文本词汇的漏洞,例如,“北邮的学生”这个词的查询无效,即停止词,可以不考虑这个词的度量相关性。另一方面是inverse document frequency即IDF,逆文本词汇,在信息检索的过程中使用的权重最多就是IDF,利用IDF来加权求和,即TF1×IDF1+ TF2×IDF2+……TFn×IDFn;其中TF-IDE算法的经典计算方式为weighTF-IDF(ti)=TF ti×IDF ti=tfi(d)×log(n+1/N),值得注意的是TFti表示ti在文档d中的频率TF,所以用
tf i(d)进行计算。
4 结语
TF-IDE算法能够很好地体现出相关的用户行为特征,操作容易简便,但是仍需要不断更新算法,因为这种传统的算法在特定的算法中存在缺陷。可以使用信息检索的方式来对网络用户进行分析,进而分析网络用户的行为特征,使用特定的词汇对网络用户进行分类,采用TF-IDE算法进行加权运算。但是这种分析方法存在一定的不足,需要不断更新、改进和完善,在以后的分析研究中,不断提高数据的准确性。
【参考文献】
【1】海昕.社交网络中的用户行为分析[J].软件,2017(02):55-58.
【2】李新焕,赵应丁.社交网络中用户行为分析研究[J].计算机时代,2017(6):29-31.
转载注明来源:https://www.xzbu.com/4/view-15026853.htm