分享好友 最新资讯首页 最新资讯分类 切换频道
淘宝关于用户行为的数据分析
2024-11-07 21:44

数据来源于:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1

淘宝关于用户行为的数据分析

 用户在网上购物会产生了一系列的行为,个人的一次行为对用户个人来说仅仅是一次简单的操作,但他所代表的是一大类人群对商品的一类交互行为。我们通过追踪和记录用户的一系列包括点击、收藏、加入购物车、下单、付款等行为,以监控和研究商品购买过程中的问题与异常点的发掘,迅速锁定需要重点关注的用户,有利于运营方的精准运营并且对业务有更正确的理解和判断。

 本数据集来源于天池关于淘宝APP在某一个月中的数据,数据包含了用户所浏览、收藏、加入购物车、和购买商品的行为,以及所对应的时间和商品种类。首先对数据进行整体的分析。

 首先调用分析过程用到的包

 

读取数据

 

image.png  数据总共包含了六列,依次为用户id、商品id、用户行为类型、用户地理位置、商品大类id、时间。其中用户行为类型中1代表点击(当做pv,2代表collect(收藏,3代表cart(加入购物车

在本次用户行为数据分析中,根据数据主要关注以下几个方面: 1)用户进行用户行为的时间趋势,熟悉用户行为的时间模式; 2)从pv到buy的路径分析,各个环节中的转化率分析,为精准运营作参考; 3)用户典型路径挖掘,一个购买过程中会产生多少次用户行为,以及购买路径的先后顺序; 4)根据用户特征进行聚类,根据不同类型用户进行行为分析,有利于锁定目标用户。 以下是整个分析过程 ##数据处理

 

##数据分析 ####1)时间维度上的分析

 

根据每日不同时间段进行汇总统计,在处于白天的时间,用户行为相对比较平稳,而从下午五点开始,用户行为激增并且一直持续到晚上十一点之前,表明在晚上是用户发生用户行为的高峰期。但是由于pv量显著高于其他用户行为的发生,因此需要根据不同行为进行研究。 image.png

image.png

 

下载 (1).png

下载 (2).png

下载 (3).png

下载.png  可以看出,点击、收藏、加入购物车的数量都在晚上存在明显的提升,但是相对而言在购买上晚上的提升没有其他用户行为显著。这方面我认为可能存在以下解释:首先晚上可能用户有大量的时间来上app进行浏览等,但并不一定会立马下单付款;而在白天当中有部分需求来自于工作日常的需要,能够使得订单量增多。

接下来对一个月整个的情况进行分析

 

下载 (8).png

下载 (9).png

下载 (10).png

下载 (11).png

 可以看到双12这天用户行为暴增,其中buy是双十二之前都属于非常平稳然后在这一天全部激增,而在当时没有像现在这样存在双十一之前便可以预定付尾款的形式,因此所有购买行为全部会堆积到这一天。在12月初,收藏量便逐步增加,表明进入12月便开始了活动的预热。而加入购物差以及点击则在双十二前三日左右开始上升。  从这些数据可以粗略地了解当时的情景,并且能够有效为以后的活动运营提供一些建议,重点研究活动期间数据可以为后续提供指导,针对活动数据可以分析预热阶段收藏,加入购物车后在双十二的购买率,活动发放的优惠与购买率的联系等等。

接下来针对每周分析用户行为数据

 

下载 (12).png

下载 (13).png

 从图中可以看出在工作日当中pv量高于周末时候,这与原本预想的不太一样。双十二当天为星期四,对结果也造成了一定影响,可以看出星期四的购买量显著高于其余时刻,而当天收藏量减少也与双十二为星期四有关。

从时间维度我们可以得出以下几点: 1.用户对商品的浏览,收藏,加入购物一般在晚上7点到11点最多,但是在这期间购买量并没有比白天有显著的提升; 2.双十一活动促销明显改变了一段时间内的用户行为,根据活动类型使得双十二之前几天的用户浏览、收藏、加入购物车行为猛增,而在双十二当天购买量成倍数增长。 3.非工作日的购买量低于工作日。 对工作日白天晚上进行观察

####2)用户行为路径分析

 

下载 (14).png

下载 (15).png

 路径上做了粗略的分析,并没有考虑collect和cart之间的先后顺序,用户点击商品之后可能收藏,可能加入购物车都当成一类。  可以看到,从早上八点开始购买率上涨,随后在中午达到顶峰,然后下降直到下午五六点,在工作时期,由于企业公司的需求使得购买率上升,也许这时候用户往往选择的是他们需要的东西,在这期间如何迅速满足用户的需求是商品所应该关注的。在晚上,购买率下降,而收藏率,加入购物车的转化率上升,在大部分用户处于休息期间时候,浏览可能补充或者额外的东西是重点,这时候商品不仅仅关注需要方面,还需要根据不同商品研究这段期间用户的购买习惯从而发掘出规律,以对商品属性做指导。

 

同样由于受到双十二的影响,用户购买率远高于其余日期。

 

[5214, 6639, 2102, 556358] [5949, 7607, 2206, 620156] [4889, 6252, 2219, 555777]  由于之前是对路径作粗略地分析,这里做了更细致的处理,例如点击之后是收藏还是加入购物车;随机采取500个用户的样进行分析,这里可以发现用户点击之后若有后续行为则大部分是加入购物车,然后是加入收藏和购买。仍然有部分商品用户是点击浏览之后直接购买的,在实际中可以着重研究购买的这类产品是什么以及它们的特性,通过对产品的优化以及精准运营能够加强这部分的转化。另外还可以对收藏到购买以及加入购物到购买的转化分析,有利于监控业务以及精细化运营。

 

 在用户购买一件商品之前会进行许多类似的点击收藏等行为,每个商品之间差别会比较大,因此在实际中需要针对某一商品进行深入的分析。  由于数据包含了不同种类的各种商品,因此无法进行更为精准的分析。从已有的分析可以看出,用户收藏加入购物车购买的行为仅占到总共的2.5%左右,大部分的用户行为还是对商品点击进行详情页访问,因此怎么加强点击到其他用户行为的转化是一个重点。APP可以优化商品推荐以及精准搜索使得用户能用更少的选择获得心仪的商品。另外,可以观察不同类型人群了解不同类型人群用户行为路径的差异,对转化率异常的人群进行调整。

 

 71%的商品都存在重复购买的现象,而当月重复购买四次以上的比例便只有9%左右了。最高的重复购买能够达到128次,这些相当高次数的购买极有可能是企业公司等的行为,这同时也可以作为筛选用户的一个特征。另外,这类商品的属性以及形式是否能给与其他商品借鉴也是一个值得注意的点。

 

 筛选一些购买次数超过80次所处的大类,这类购买次数超过80次的商品在大类中所占的比列都非常低,因此并不存在由于大类下品种少所造成的选择不足。对于商家商品来说,分析这些商品的特性(属性,价格,品牌,优惠等)并且进行针对性分析相信能够带来销售量的提升。 ####3)留存率与活跃度分析

 

3日留存率 image.png 7日留存率 image.png 每日活跃用户比例 image.png

(放宽活跃用户条件image.png  从留存率和活跃度可以得到以下启示:由于数据是一段截取数据,因此前一两天记录的用户可能大多数都是经常上APP的用户,所以留存较高,还从中间的数据可以看出留存率一般维持到40%到50%之间,而双十二作为活动日,大部分新用户都会在这天上线,所对应的留存率也较高。从活跃用户比例可以看出平均每日的活跃度在27%-28%,而双十二当天活跃用户比例下降到24.8%,表明这天普通用户的比例增多。通过更改活跃用户(放宽条件)的定义可以看出,双十二活跃用户比例下降更为明显,针对此类现象,重点研究是活动的某种属性刺激了非活跃用户在双十二这天的用户行为,例如优惠,玩法等。

####4)用户聚类

 

 在这里我先对聚类用到特征进行了筛选,首先选取了用户四类发生的次数,然后通过每日用户操作以及每周用户操作的用户行为预先做了聚类并将结果用作最终聚类的特征(根据聚类肘部规则将这两者都预先分为了3类,在最终聚类之前作了自定义的标准化操作,聚类类别设置为6类。

 

下载 (16).png

下载 (17).png

下载 (20).png

下载 (19).png

 可以看出用户类别所占比例最高的为第一类和最后一类,人数分别是1282和3163,这两类人群都是属于用户行为较少的,并且最后一类的平均购买也远低于平均值,从而拉低了总体的平均值,第一类用户的购买仅高于最后一类。由此可以知道绝大部分用户都属于这一部分用户,可以类比与2/8法则中对应的8。  其次是第四类和第五类用户,人数分别是344,155。第四类用户加入购物车多而收藏少,第五类用户点击和收藏多而加入购物车少。   最后人数最少的为第二类和第三类用户,人数分别为56和2人。第二类用户用户行为较多,并且更为重要的是其购买行为明显高于其他类型的用户,可以说这类用户属于高价值用户,高价值需要与其建立稳固的关系,维持活跃度并且及时阻止流失。第三类属于比较极端型的类型,他们的点击浏览行为特别高但是并没有带来所匹配的购买量。   这里用的是随机选取的5000名用户的分类,当数据量增大时,每个群体的特征会更加明显。这样的用户分群能够为业务分析、运营、管理提供更多的信息,有利于精细化运营,并且能够从用户行为上迅速地抓住目标用户。

最新文章
阿里伴侣配合阿里巴巴打造全方位线上推广
在当今竞争激烈的电商时代,企业的线上推广至关重要。阿里巴巴作为全球知名的电商平台,为众多企业提供了广阔的发展空间。而阿里
Python大数据分析&人工智能教程 - Scrapy工作原理详解与实操案例
Scrapy是一个开源的、用Python编写的高性能网络爬虫框架,用于抓取网站数据和提取结构性数据。它是基于Twisted异步网络框架构建
AI智能写作助手:一站式解决内容创作、文章润色与高效写作的全面工具
在信息爆炸的时代内容创作已经成为企业、媒体和个人展现自我、传递价值的不可或缺手。面对海量的信息与日益增强的内容品质需求高
你的站点抗压么?推荐一款超方便的开源压测工具
这里是 HelloGitHub 推出的《讲解开源项目》系列,本期介绍一款标星 17.7k 纯 Go 语言实现的 HTTP(S) 压测工具——vegetaVegeta
【系统架构设计】计算机网络
OSI/RM 结构模型 1977年,国际标准化组织为适应网络标准化发展的需求,制定了开放系统互联参考模型(Open System Interconnectio
全世界规模最大战争排名,第一名居然是清朝时期!
自打人类走上进化这条路,就想着法儿想要证明【一伙人就该被另一伙人支配】。古罗马角斗士时代一方有多大势力,就看他有多少人的
python tk随机内容生成器
MyRandom ran=new MyRandom();System.out.println(ran.nextString(1));System.out.println(ran.nextString(50, OnlyNum));System
ai自动写文章在线 在线写文章自动生成器
身为文案工作者,我深感写作之重要且充满挑战。如今,随着人工智能(AI)写作平台的出现,我的写作历程出现了巨大变革。在此,很
AI写系统性综述ChatGPT还远远不够未来百年能否实现
在科学研究的浩瀚海洋中,科研人员时常面临一个棘手的问题:如何有效整合和理解海量的科学文献。尽管网络的普及极大地丰富了文献
全球AI半导体技术排名:韩国强势第三,未来发展值得关注
近年来,人工智能(AI)技术的迅猛发展促进了相关硬件的创新,尤其是AI半导体的需求日益上升。根据最新的研究报告和韩国媒体的报