电商复盘项目

本文将进行电商唯品会商品的复盘问题,在此将会按照数据分析的流程进行以下操作:
1.目标确定: 1.1 背景介绍 唯品会上各种折扣、特卖的实用商品深受大家的喜爱。最早的线下模式(实体店打折促销、街边的大甩卖、一时兴起的两元店等)到如今的快速分销、消除内存的线上模式(唯品会,直播带货)无不显示着电商的繁荣发展,当业绩达成率,业绩增长率,销售利润率各个指标都在一片向好,老板提出更快更好的促销需求时,优化商品结构,完成复盘分析已经成了必须的数据分析要求。
1.2 目标确定 主要进行描述性分析,首先对此次促销活动的结果进行各项指标的统计,并以此指标数据表为依据,挑选可行的角度来优化商品结构,以达到更快促销的效果。
2.数据获取

dt1 = pd.read_excel(’商品信息表.xlsx') dt1[:5] dt2 = pd.read_excel('商品热度表.xlsx') dt2[:5] dt3 = pd.read_excel('用户销售明细表.xlsx') dt3[:5]



商品信息表dt1: 电商复盘项目
文章图片
商品信息表

商品信息表dt2: 电商复盘项目
文章图片
商品信息表
客户销售明细表 dt3: 电商复盘项目
文章图片
客户销售明细表 3.数据清洗 将用户明细表中的"是否退货"字段改为数字变量(是=1,否=0)
dt3['是否退货']=dt3["是否退货"].map({"是":1,"否":0}) dt3[:5]



清洗后的客户销售明细表: 电商复盘项目
文章图片
清洗后的客户销售明细表 4.数据整理
  • 将上述三个表合并为同一个表,得到每一件商品的具体信息。
  • 合并商品信息表和商品热度表得到dt_product表 。
  • 用户销售明细表以商品名进行聚合处理得到product_sales表。
  • 将 dt_product表和product_sales表合并得到总商品信息表dt_product_sales表。
dt_product = pd.merge(dt1,dt2,how="left",on="商品名") dt_product[:5] product_sales = dt3.groupby("商品名").agg({"购买数量":"sum", "购买金额":"sum", "退货件数":"sum", "退货金额":"sum", "购买单价":"mean", "用户id":pd.Series.nunique}).reset_index()# nunique去重计数 product_sales.columns = ['商品名','商品销售数量',"商品销售金额","商品退货数量","商品退货金额","商品销售单价","购买用户数量"]dt_product_sales = pd.merge(dt_product,product_sales,how="left",on="商品名") dt_product_sales[:5]



商品销售明细表如图所示: 电商复盘项目
文章图片
商品销售明细表 5.描述分析 5.1 总体流程图解: 电商复盘项目
文章图片
分析流程图 5.2 总体指标分析 确定各指标:
  • GMV:总消费额,包括退货额
  • 销量:累计销售量,包含退货量
  • 实际销售额:GMV – 退货额
  • 客单价:GMV / 客户数
  • UV:unique view 商品所在页面的独立访问数。
  • 转化率:客户数 / UV
  • 折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量)
  • 备货值:吊牌价 * 库存数
  • 售卖比:售罄率,GMV / 备货值
  • 收藏数:收藏某种商品的用户量
  • 加购数:加购物车人数
  • SKU数:最小品类单元
  • SPU数:款号
  • 拒退量:退货总数量
  • 拒退额:退货总金额
#1、GMV:销售额 gmv = dt_product_sales["商品销售金额"].sum() #2、实际销售额=GMV - 退货金额 return_money = gmv - dt_product_sales["商品退货金额"].sum() #3、销量 all_sales = dt_product_sales["商品销售数量"].sum() #4、客单价:GMV / 客户数 custom_price = gmv / dt_product_sales["购买用户数量"].sum() # 5、UV:商品所在页面的独立访问数 uv_cons = dt_product_sales["UV数"].sum() # 6、转化率:客户数 / UV。 uv_rate = dt_product_sales["购买用户数量"].sum() / dt_product_sales["UV数"].sum() # 7、折扣率:GMV / 吊牌总额(吊牌总额 = 吊牌价 * 销量) tags_sales = np.sum(dt_product_sales["吊牌价"] * dt_product_sales["商品销售数量"]) discount_rate= gmv / tags_sales # 8、备货值:吊牌价 * 库存数。 goods_value = https://www.it610.com/article/dt_product_sales["货值"].sum() # 9、售卖比:又称售罄率,GMV / 备货值。 sales_rate = gmv / goods_value # 10、收藏数:收藏某款商品的用户数量。 coll_cons = dt_product_sales["收藏数"].sum() # 11、加购数:加购物车人数。 add_shop_cons = dt_product_sales["加购物车数"].sum() # 12、SKU数:促销活动中的最小品类单元(一般指货号)。 sku_cons = dt_product_sales["SKU"].sum() # 13、SPU数:促销活动中的SPU计数(一般指款号)。 spu_cons = len(dt_product_sales["商品名"].unique()) # 14、拒退量:拒收和退货的总数量。退货件数 reject_cons = dt_product_sales["退货件数"].sum() # 15、拒退额:拒收和退货的总金额。 reject_money = dt_product_sales["商品退货金额"].sum() # 汇总统计 sales_state_jin = pd.DataFrame( {"GMV":gmv,"实际销售额":return_money,"销量":all_sales,"客单价":custom_price, "UV数":uv_cons,"UV转化率":uv_rate,"折扣率":discount_rate,"货值":goods_value, "售卖比":sales_rate,"收藏数":coll_cons,"加购数":add_shop_cons,"sku数":sku_cons, "spu数":spu_cons,"拒退量":reject_cons,"拒退额":reject_money},index = [0] ) sales_state_jin_s = sales_state_jin.T.reset_index() sales_state_jin_s.columns = ["指标","今年双11"] sales_state_jin_ssales_state_qu = pd.DataFrame( {"GMV":2261093,"实际销售额":1464936.517,"销量":7654,"客单价":609.34567, "UV数":904694,"UV转化率":0.0053366,"折扣率":0.46,"货值":12610930, "售卖比":0.1161,"收藏数":4263,"加购数":15838,"sku数":82, "spu数":67,"拒退量":2000,"拒退额":651188.57} ,index = [1] ) sales_state_qu_s = sales_state_qu.T.reset_index() sales_state_qu_s.columns = ["指标","去年双11"]sales_state = pd.merge(sales_state_jin_s, sales_state_qu_s,on="指标") sales_state["同比"] = (sales_state["今年双11"] - sales_state["去年双11"]) / sales_state["去年双11"] sales_state


【电商复盘项目】
对比图如下: 电商复盘项目
文章图片
同比对比图
从上表可以看出今年双十一比去年规模更大,范围更广。销售额和销量同比增加超过50%,说明今年的营销宣传、造势和效果是不错的。但是客单价和折扣率呈下降趋势,在此首先猜测客单价下降原因,因为客单价=GMV/(UV*UV转化率),这三个指标同比全部增长,所以可能的原因是客户质量下降(高付费客户流失,买低价产品的客户过多;促销价格过于低廉,销量增长成倍数增加)。接下来折扣率是也是促销运营的重要节点,上述表可看出打的折扣过猛,所以需要对折扣寻找合理区间。
5.2 从价格区间来优化商品结构 我们在这里采用的是经典细分思想方法:ABC分析法,因为多个特征可以充分满足ABC分析法的应用范围,所提采用此方法进行商品结构的优化。我们需要做的是,深入探究不同区间的数据,以此来优化后期的促销结构。首先我们需要找到在本次促销中此区间的销售源数据,源数据要求显示具体的款号、销售额、销量等信息。第二步,计算出每个款的转化率、折扣率等指标。
查看指标:销售额,销量,件单价,客户数,UV,转换率,库存,货值,售卖比
# 划分价格区间段 listBins = [0,200, 400, dt_product_sales['售卖价'].max()] listLabels = ['1_200','200_400','400及以上'] dt_product_sales['价格分组'] = pd.cut( dt_product_sales['售卖价'],bins=listBins,labels=listLabels,include_lowest=True) dt_product_sales[:5] #价格区间销售情况统计指标: 价格区间、货值、货值占比、销售额、售卖比、销售占比、销量、客单价、UV、收藏数、加购数、转化率 dt_product_sales_info = dt_product_sales.groupby("价格分组").agg({ "货值":"sum", "商品销售金额":"sum","商品销售数量":"sum", "UV数":"sum", "购买用户数量":"sum", "收藏数":"sum", "加购物车数":"sum" }).reset_index() # 货值占比 售卖比 销售占比 客单价 转化率 dt_product_sales_info['货值占比'] = dt_product_sales_info['货值']/dt_product_sales_info['货值'].sum() dt_product_sales_info['售卖比'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['货值'] dt_product_sales_info['销售占比'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['商品销售金额'].sum() dt_product_sales_info['客单价'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['商品购买用户数量'] dt_product_sales_info['转化率'] = dt_product_sales_info['商品购买用户数量'] /dt_product_sales_info['UV数']



价格区间销售表如下: 电商复盘项目
文章图片
价格区间销售表
电商复盘项目
文章图片
价格区间的销售占比图
如上图所示,价格在400以上的商品,销售占比、客单价均比另外两个价格区间的商品占优,转化率也不分伯仲,因此选取价格在400以上的商品单独分析。
product_400 = dt_product_sales[dt_product_sales["价格分组"]=='400及以上'] #利用转换率和售卖比这两个指标进行商品分类 product_400['转换率'] = product_400['商品购买用户数量']/product_400['UV数'] product_400['备货值'] = product_400['吊牌价'] * product_400['库存量'] product_400['售卖比'] = product_400['商品销售金额']/product_400['货值'] # 提取出 商品名,商品销售金额,商品销售数量,商品销售单价,购买用户数量,UV数,转换率,库存量,备货值,售卖比 product_400[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数",'转换率',"库存量","备货值","售卖比"]]

电商复盘项目
文章图片
价值区间在400及以上的商品
# 1、A类商品:转化率大于0.7%的商品予以保留 select_product=product_price_400[product_price_400['转换率'] > 0.007] # 2、B类商品:找出转化率小于0.7% 但是售卖比大于33%的部分予以保留 select_product_info=product_price_400[(product_price_400['转换率'] < 0.007) & (product_price_400['售卖比']>=0.33)] # 3、C类商品,找出转化率小于0.7%并且售卖比小于33%的部分进行清仓处理 delect_product=product_price_400[(product_price_400['转换率'] < 0.007) & (product_price_400['售卖比']<0.33)]

统计得出A类保留商品共12种,B类保留商品共1种,C类清仓处理商品共10种。
5.3 从折扣区间来优化商品结构
listBins = [0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 1] #设置切分后对应标签 listLabels = ['0.15_0.2','0.2_0.25','0.25_0.3','0.3_0.35','0.35_0.4','0.4_0.45','0.45_0.5','0.5_0.55','0.55_0.6','0.6_0.65','0.65_0.7','0.7_1'] dt_product_sales['折扣区间'] = pd.cut(dt_product['折扣率'], bins=listBins, labels=listLabels, include_lowest=True) dt_product_sales[:5] # 折扣区间销售情况统计:价格区间、货值、货值占比、销售额、售卖比、销售占比、销量、客单价、UV、收藏数、加购数、转化率 dt_product_discount_info= dt_product_sales.groupby('折扣区间').agg({'货值':'sum', '商品销售金额':'sum', '商品销售数量':'sum', 'UV数':'sum', '收藏数':'sum', '加购物车数':'sum', '购买用户数量':'sum' }).reset_index() # 求货值占比、售卖比、销售占比、客单价、转化率 dt_product_discount_info['货值占比']=dt_product_discount_info['货值']/dt_product_discount_info['货值'].sum() dt_product_sales_info['售卖比'] = dt_product_sales_info['商品销售金额']/dt_product_sales_info['货值'] dt_product_discount_info['销售占比']=dt_product_discount_info['商品销售金额']/dt_product_discount_info['商品销售金额'].sum() dt_product_discount_info['客单价']=dt_product_discount_info['商品销售金额']/dt_product_discount_info['购买用户数量'] dt_product_discount_info['转化率']=dt_product_discount_info['购买用户数量']/dt_product_discount_info['UV数'].sum() dt_product_discount_info



折扣区间商品信息表: 电商复盘项目
文章图片
折扣区间商品信息表
电商复盘项目
文章图片
折扣区间商品信息图
如折扣区间的销售额所示,0.35-0.4的折扣所卖出的商品销售额是最高的,所以对该区间进行商品优化。
product_354 = dt_product_sales[dt_product_sales["折扣区间"]=='0.35_0.4'] #利用转换率和售卖比这两个指标进行商品分类 product_354['转换率'] = product_354['商品购买用户数量']/product_354['UV数'] product_354['备货值'] = product_354['吊牌价'] * product_354['库存量'] product_354['售卖比'] = product_354['商品销售金额']/product_354['货值'] # 提取出 商品名,商品销售金额,商品销售数量,商品销售单价,购买用户数量,UV数,转换率,库存量,备货值,售卖比 product_354[["商品名","商品销售金额","商品销售数量","商品销售单价","购买用户数量","UV数",'转换率',"库存量","备货值","售卖比"]]

电商复盘项目
文章图片
0.35-0.4折扣区间表
# 1、A类商品:折扣率大于37%的部分找出售卖比大于36.5%且转化率大于0.7%的商品予以保留 stay_stocks1 = product_354[(product_354["折扣率"]>0.37)&(product_354["售卖比"]>0.365)&(product_354["转换率"]>0.007)] # 2、C类商品:折扣率大于37%的部分找出售卖比小于36.5%或转化率小于0.7%的商品进行清仓处理 stay_stocks2 = product_354[(product_354["折扣率"]>=0.37)&((product_354["售卖比"]<=0.365)|(product_354["转换率"]<=0.007))] # 3、B类商品:在折扣率小于37%的部分找出售卖比大于36.5%且转化率大于0.7%的部分予以保留,留作下次促销活动 stay_stocks3 = product_354[(product_354["折扣率"]<=0.37)&(product_354["转换率"]>0.007)&(product_354["售卖比"]>0.365)] # 4、C类商品:在折扣率小于37%的部分找出售卖比小于36.5%或转化率小于0.7%的商品进行清仓处理 stay_stocks4 = product_354[((product_354["折扣率"]<0.37) & ((product_354["售卖比"]<0.365)|(product_354["转换率"]<0.007)))]

最终统计,A类保留商品共1件,B类保留商品共1件,C类清仓商品共23件.
注: 本文只阐述了热门价格区间(400及以上)的ABC类商品分类,热门折扣区间的ABC商品。其余的区间也可以同等分析,将这些商品进行有效的剥离分类,可以实现商品更好的销售情况。
结论
  1. 获得当期和同期的销售额、售卖比、UV、转化率等数据指标,两者进行同比对比分析,得出客单价有20%的下降,折扣率有9%的降低,因此从这两个细分维度着手,进行商品结构优化。
  2. 对于热点价格区间或热点折扣区间的A类商品,可以将它们放在网页首页作为主推商品,以及下次促销的同类商品。
  3. 对于热点价格区间或热点折扣区间的B类商品,可以将他们放在页面尾端,占据流量少的地方进行处理,如果库存少的话,可以进行少量销售;如果占据了主推位置,建议将主推位置留给A类商品。
  4. 对于不热门的商品(C类商品)建议更换主图,降价,快抢或者清仓处理。
自我总结(该项目+自我查询资料总结的数据指标体系): 电商复盘项目
文章图片
业务指标.png

    推荐阅读