一、问题描述
随着移动互联网多年的快速发展,移动互联网已进入下半场 ,不再依靠用户红利来经营,发展业务,告别粗糙的/高成本企业发展的方式,开始转而精细化管理,结合市场、渠道、用户行为等数据分析,对用户展开有针对性的运营活动,提供个性化、差异化的运营策略,以实现运营目的行为。本文利用sql对淘宝用户行为数据进行分析,通过用户行为分析业务问题,提供针对性的运营策略。 本次分析的目的是想通过对淘宝用户行为数据分析,为以下问题提供解释和改进建议: 1.分析用户使用APP过程中的常见电商分析指标,确定各个环节的流失率,找到需要改进的环节 2.研究用户在不同时间尺度下的行为规律,找到用户在不同时间周期下的活跃规律 3.找到用户对不同种类商品的偏好,找到针对不同商品的营销策略 4.找出最具价值的核心付费用户群,对这部分用户的行为进行分析 为了分析这些问题,我们使用以下两种模型进行分析
二、数据集内容
UserBehavior.csv:
用户行为数据,包括用户ID,商品ID,商品类目ID,行为类型,时间戳信息。
淘宝用户行为数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的组织形式和MovieLens20M类似,即数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于数据集中每一列的详细描述如下:
列名称 | 说明 |
---|---|
用户ID | 整数类型,序列化后的用户ID |
商品ID | 整数类型,序列化后的商品ID |
商品类目ID | 整数类型,序列化后的商品所属类目ID |
行为类型 | 字符串,枚举类型,包括(‘pv’, ‘buy’, ‘cart’, ‘fav’) |
时间戳 | 行为发生的时间戳 |
注意到,用户行为类型共有四种,它们分别是
行为类型 | 说明 |
---|---|
pv | 商品详情页pv,等价于点击 |
buy | 商品购买 |
cart | 将商品加入购物车 |
fav | 收藏商品 |
关于数据集大小的一些说明如下
维度 | 数量 |
---|---|
用户数量 | 987,994 |
商品数量 | 4,162,024 |
用户数量 | 987,994 |
商品类目数量 | 9,439 |
所有行为数量 | 100,150,807 |
引用要求
1.Han Z, Xiang L, Pengye Z, et al. 2018. Learning Tree-based Deep Model for Recommender Systems. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining.
2. Han Z, Daqing C, Ziru X, et al. 2019. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems. In Advances in Neural Information Processing Systems.
3. Jingwei Z, Ziru X, Wei D, et al. 2020. Learning Optimal Tree Models under Beam Search. In International Conference on Machine Learning.
数据集版权许可协议
三、应用
【数据分析与挖掘】淘宝用户行为分析(带数据集和代码)_数据分析与挖掘典型案例:电商用户行为分析案例-CSDN博客
四、获取案例套件
文件包大小:930 MB
需要登录后才允许下载文件包。登录