9种最常用数据分析方法,解决90%分析难题

VSole2023-04-03 10:12:54

“分享九个数据分析的方法。”

 一、关联分析 

关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。

关联分析目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。关联分析在电商分析和零售分析中应用相当广泛。

关联分析需要考虑的常见指标:

  • 支持度:指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。
  • 置信度:指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率。
  • 提升度:先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值。

 二、对比分析 

对比法就是用两组或两组以上的数据进行比较。对比法是一种挖掘数据规律的思维,能够和任何技巧结合,一次合格的分析一定要用到N次对比。

对比主要分为以下几种:

  • 横向对比:同一层级不同对象比较,如江苏不同市茅台销售情况。
  • 纵向对比:同一对象不同层级比较,如江苏南京2021年各月份茅台销售情况。
  • 目标对比:常见于目标管理,如完成率等。
  • 时间对比:如同比、环比、月销售情况等,很多地方都会用到时间对比。

 三、聚类分析 

聚类分析属于探索性的数据分析方法。从定义上讲,聚类就是针对大量数据或者样品,根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类,最终将相似数据分为一组,也就是“同类相同、异类相异”。

在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。

常见的聚类方法有不少,比如K均值(K-Means),谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering)。

以最为常见的K-means为例,可以看到,数据可以被分到黄蓝绿三个不同的簇(cluster)中,每个簇有其特有的性质。

 四、留存分析 

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中, 经过一段时间后仍然存在客户行为(如登录、消费)。留存不仅是个可以反映客户粘性的指标,更多地反映产品对用户的吸引力。

按照不同周期,留存率分为三类:

第一种是日留存,日留存又可以细分为以下几种:

  • 次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数;
  • 第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数;
  • 第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数;
  • 第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数;
  • 第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数。

第二种是周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数。

第三种是月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数。

留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。

下面以月留存为例生成的月用户留存曲线:

 五、帕累托分析 

帕累托法则,源于经典的二八法则——“世界上80%的财富掌握在20%的富人手里”。而在数据分析中,这句话可以理解为20%的数据产生了80%的效果,需要围绕找到的20%有效数据进行挖掘,使之产生更大的效果。

比如一个商超进行产品分析的时候,就可以对每个商品的利润进行排序,找到前20%的产品,那这些产品就是能够带来较多价值的商品,可以再通过组合销售、降价销售等手段,进一步激发其带来的收益回报。

帕累托法则一般会用在产品分类上,此时就表现为ABC分类。常见的做法是将产品SKU作为维度,并将对应销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算累计销售额占比。

百分比在 70%(含)以内,划分为 A 类。百分比在 70~90%(含)以内,划分为 B 类。百分比在 90~100%(含)以内,划分为 C 类。

按照A、B、C分组对产品进行了分类,根据产品的效益分为了三个等级,这样就可以针对性投放不同程度的资源,来产出最优的效益。

 六、象限分析 

象限法是通过对两种及以上维度的划分,运用坐标的方式,人工对数据进行划分,从而传递数据价值,将之转变为策略。象限法是一种策略驱动的思维,常应用在产品分析、市场分析、客户管理、商品管理等场景,像RFM模型、波士顿矩阵都是象限法思维。

下面这个RFM模型就是利用象限法,将用户分为8个不同的层级,从而对不同用户制定不同的营销策略。

象限法的优势:

(1)找到问题的共性原因

通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。例如上面广告的案例中,第一象限的事件可以提炼出有效的推广渠道与推广策略,第三和第四象限可以排除一些无效的推广渠道;

(2)建立分组优化策略

针对投放的象限分析法可以针对不同象限建立优化策略,例如RFM客户管理模型中按照象限将客户分为重点发展客户、重点保持客户、一般发展客户、一般保持客户等不同类型。给重点发展客户倾斜更多的资源,比如VIP服务、个性化服务、附加销售等。给潜力客户销售价值更高的产品,或一些优惠措施来吸引他们回归。

 七、ABtest 

A/Btest,是将Web或App界面或流程的两个或多个版本,在同一时间维度,分别让类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本正式采用。

A/Btest的流程如下:

  1. 现状分析并建立假设:分析业务数据,确定当前最关键的改进点,作出优化改进的假设,提出优化建议;比如说我们发现用户的转化率不高,我们假设是因为推广的着陆页面带来的转化率太低,下面就要想办法来进行改进了。
  2. 设定目标,制定方案:设置主要目标,用来衡量各优化版本的优劣;设置辅助目标,用来评估优化版本对其他方面的影响。
  3. 设计与开发:制作2个或多个优化版本的设计原型并完成技术实现。
  4. 分配流量:确定每个线上测试版本的分流比例,初始阶段,优化方案的流量设置可以较小,根据情况逐渐增加流量。
  5. 采集并分析数据:收集实验数据,进行有效性和效果判断:统计显著性达到95%或以上并且维持一段时间,实验可以结束;如果在95%以下,则可能需要延长测试时间;如果很长时间统计显著性不能达到95%甚至90%,则需要决定是否中止试验。
  6. 最后:根据试验结果确定发布新版本、调整分流比例继续测试或者在试验效果未达成的情况下继续优化迭代方案重新开发上线试验。

 八、漏斗分析 

漏斗思维本质上是一种流程思路,在确定好关键节点之后,计算节点之间的转化率。这个思路同样适用于很多地方,像电商的用户购买路径分析、app的注册转化率等等。

上图是经典的营销漏斗,形象展示了从获取用户到最终转化成购买这整个流程中的一个个子环节。

整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。

著名的海盗模型AARRR模型就是以漏斗模型作为基础的,从获客、激活、留存、变现、自传播五个关键节点,分析不同节点之间的转化率,找到能够提升的环节,采取措施。

 九、路径分析 

用户路径分析追踪用户从某个开始事件直到结束事件的行为路径,即对用户流向进行监测,可以用来衡量网站优化的效果或营销推广的效果,以及了解用户行为偏好,其最终目的是达成业务目标,引导用户更高效地完成产品的最优路径,最终促使用户付费。

如何进行用户行为路径分析?

  1. 计算用户使用网站或APP时的每个第一步,然后依次计算每一步的流向和转化,通过数据,真实地再现用户从打开APP到离开的整个过程。
  2. 查看用户在使用产品时的路径分布情况。例如:在访问了某个电商产品首页的用户后,有多大比例的用户进行了搜索,有多大比例的用户访问了分类页,有多大比例的用户直接访问的商品详情页。
  3. 进行路径优化分析。例如:哪条路径是用户最多访问的;走到哪一步时,用户最容易流失。
  4. 通过路径识别用户行为特征。例如:分析用户是用完即走的目标导向型,还是无目的浏览型。
  5. 对用户进行细分。通常按照APP的使用目的来对用户进行分类。如汽车APP的用户可以细分为关注型、意向型、购买型用户,并对每类用户进行不同访问任务的路径分析,比如意向型的用户,他进行不同车型的比较都有哪些路径,存在什么问题。还有一种方法是利用算法,基于用户所有访问路径进行聚类分析,依据访问路径的相似性对用户进行分类,再对每类用户进行分析。

大数据留存率
本作品采用《CC 协议》,转载必须注明作者和本文链接
数据安全研究
2021-09-26 08:14:19
随着人工智能、云计算、移动互联网和物联网等技术的融合发展,传统的基于边界安全域和基于已知特征库的网络安全防护方式已经无法有效应对数据环境下新的安全威胁。
当前,以数字经济为代表的新经济成为经济增长新引擎,数据作为核心生产要素成为了基础战略资源,数据安全的基础保障作用也日益凸显。伴随而来的数据安全风险与日俱增,数据泄露、数据滥用等安全事件频发,为个人隐私、企业商业秘密、国家重要数据等带来了严重的安全隐患。近年来,国家对数据安全与个人信息保护进行了前瞻性战略部署,开展了系统性的顶层设计。《中华人民共和国数据安全法》于2021年9月1日正式施行,《中华人
Sora的问世立刻引发了“百家争鸣”,有人欣喜不已,有人抱以担忧;有人更关注其不足之处,也有人面向“如何迎头赶上”的问题进行了深入思考……无论如何,Sora为虚拟和现实世界建立起的链接,已经让“未来世界到底是怎样”的问题充满了更的可能性。
工业互联网安全的落地第一步,是确保工控环境中的防护能力,之后是检测/审计能力。本次《工业互联网安全能力指南》的发布内容为报告中的工控防护能力部分,以及工控检测/审计能力部分。
上网容易,退网难。被注销账号困扰的网友不少,注销账号难在找不到入口、流程复杂、需要提交的资料多、审核时间长等等,以至于很多人最后的解决办法是不了了之。而让个人信息被“非法持有”,而用户在应用程序上的“痕迹”也无法消除,这无疑增加了隐私外泄的风险。 误注册了众包平台 注销前要先签协议成为骑手 注销账号难,难在有的APP在注销时
近日,国务院办公厅印发了《全国一体化政务数据体系建设指南》,正式拉开政务领域全国一体化数据体系建设的序幕。可见,此次发布《建设指南》是“全国一体化数据中心”战略体系的重要一环,与此前的相关战略、政策体系一脉相承,而又因承载新时代对政务数据发展的要求,具有重要的时代特征和丰富内涵。三是提出了建立并实施相关标准规范体系要求。二是提出了加强数据安全常态化检测和监测的要求。
第二条 本市行政区域内数字经济促进相关活动适用本条例。第七条 市统计部门会同经济和信息化部门完善数字经济统计测度和评价体系,开展数字经济评价,定期向社会公布主要统计结果、监测结果和综合评价指数。市人民政府及其有关部门可以探索设立公共数据特定区域,建立适应数字经济特征的新型监管方式。
数据安全是建立在价值基础上,实现数据准确的记录的同时完成安全交互和指定对象的加工与访问使用,防止数据被破坏、盗用及非授权访问。数据安全能力是指数据在流动过程中,组织为了保障数据的保密性、完整性、可用性而在安全规划、安全管理、安全技术、安全运营等方面所采取的一系列活动。
各经济体更加重视数据竞争力,纷纷制定出台数据战略,宣誓数据安全和主权。因此,欧盟认为必须建立欧洲数据主权。近年来,我国陆续发布了一系列数据及其安全相关的法律法规和标准规范,数据资产价值得到确认。2020年6月,12部委联合发布《网络安全审查办法》,推动建立国家网络安全审查工作机制。
VSole
网络安全专家