数据分析方法(综合)v0.5

常见数据分析方法与图表表达

Teredata 2012-01

数据分析方法概览

趋 势

2 > 3/19/2012

结 构

Teradata Confidential

对 比

关 系

趋势分析的概念

• 趋势分析(Trend Analysis)指收集历史数据,并从中发现事物的 发展模式或趋势(Pattern or Trend)的分析方法。趋势分析可以 用于描述过去,也可以用于预测未来。 • 专题分析重点关注

> 描述事物的变化趋势或潜在模式 > 量化和预测事物的发展趋势

3 > 3/19/2012

Teradata Confidential

趋势分析的图表表达

• 趋势分析通常用以时间为横坐标的折线图或者连续排列的柱状图来 表达

说明:宽带和手机上半年的趋势不断上升, 下半年有下降的趋势,在9月的收入出现拐 点。固话的收入持续下降。

说明:出账收入在本年度不断上升。(同时, 上半年上升速度比下半年快)

4 > 3/19/2012

Teradata Confidential

趋势分析的常见模式

• 趋势分析的常见模式包括:

> 在一段时间内随机无趋势,例如围绕一条直线上下随机波动 > 上升或下降趋势,还可以细分为直线趋势、指数趋势或其它模式的趋势 > 周期性趋势 > 异常点、拐点 > 多种趋势的综合,如长期上升趋势和季节性波动的综合

• 注意:某些长期趋势或周期性趋势需要足够的样本数据才能观察到

5 > 3/19/2012

Teradata Confidential

趋势分析案例:新入网用户离网趋势

分析结果示例

说明问题

• 新入网用户在入网4个月形成离网高峰平均达 到27%,后逐渐减少,六个月后离网用户累 计达到52%,后逐渐稳定接近4%的全网用户 月平均离网率。

计算方法 • 锁定某个月新增用户,跟踪后续 N个月的状态

6 > 3/19/2012

Teradata Confidential

趋势分析案例:KPI趋势监控(异常点监控)

分析结果示例

流失率趋势监控

2.4% 2.2% 2.0% 1.8% 1.6% 1.4% 1.2% 1.0% 流失率 平均 上限 下限

说明问题 •监控流失率的变化趋势,201102 到201107呈下降趋势 •监控流失率变化的异常,201107 流失率下降超过下限

计算方法 •平均:流失率平均值 •上限:平均+1倍标准差 •下限:平均-1倍标准差

7 > 3/19/2012

Teradata Confidential

趋势分析案例:用户离网趋势的比较

分析结果示例 说明问题 •说明:宏观比较一段时间的发展趋 势,而对象大于3个以上的对比情 况。了解各地区一段时间内的发展 趋势对比,区分哪些地区的发展状 况较差,哪些相对比较好。 计算方法 •在各时间段内,把各地区的离网用 户数按口径统计出来

8 > 3/19/2012

Teradata Confidential

趋势预测

• 趋势预测是根据事物历史的变化趋势来预测未来的发展趋势,前提假设 是事物的发展具有保持历史趋势的特点 • 常用的趋势预测方法包括

> 移动平均法,又分为简单

移动平均法和加权移动平均法 > 指数平滑法,特殊的加权移动平均法 > 趋势拟合法,如直线拟合、曲线拟合等 > 时间序列分析法,把趋势分解为长期趋势、季节性和随机波动

• Excel的数据分析加载项可以实现移动平均、指数平滑和回归的预测 • Excel图形的布局中可以添加线性趋势线、指数趋势线、线性预测趋势线 和双周期移动平均趋势线

9 > 3/19/2012

Teradata Confidential

趋势分析案例:存量用户的收入预测

曲线拟合

观察最近6月数据呈现比较规律的指数曲线发展趋势,对历史数据运用曲线拟合方 法模拟其走势。

3,400,000

相对差异

消费金额

列帐收入金额

50% 40% 2,500,000 拟合曲线 y = a1*EXP(a0*x) 2,000,000

2,900,000 30% 2,400,000 4.22% 1,900,000 -0.08% 1,400,000 200811 200812 200901 200902 200903 200904 200905 200906 200907 200908 7.52% 5.71% 4.84% 2.84% -0.13% 2.90% -0.19% -0.08% -10% 20% 1,500,000 10% 0% 1,000,000

200903 200904 200905 200906 200907 200908 Y= 2105242.34899755*EXP(-0.[**************]6*X) 90.00% 70.00% 50.00% 30.00% 10.00%

拟合效果评估

2,200,000 2,000,000 1,800,000 1,600,000 1,400,000 1,200,000 1,000,000 相对误差 列帐金额 200903 -0.63% 200904 -0.65% 200905 2.10% 200906 -1.78% 200907 -0.02% 200908 0.38% 200909 200910 200911 200912

-10.00%

2118495.821917110.41759461.34 1754474.78 1668997.99 1619191.08

预测

列帐金额-拟合值 2105242.35 1904737.25 1796422.55 1723328.43 1668686.67 1625329.71 1589552 1559197.14 1532903.79 1509759.51 10 > 3/19/2012 Teradata Confidential

数据分析方法概览

趋 势

11 > 3/19/2012

结 构

Teradata Confidential

对 比

关 系

结构分析法的概念

• 结构分析法

> 结构分析是对问题的构成要素进行分析的方法。其目的是为了寻找主因,调 整结构。

• 结构分析法可以分为以下几种类型:

> 单层次构成分析:比如移动用户收入由月租、语音、数据、增值4部分构成,分析每部 分的比重大小。 > 多层次构成分析:比如移动用户收入第一层由月租、语音、数据、增值4部分构成,其 中语音收入占比最高,需要把语音收入再细分为本地收入、长途收入、港澳台及国际长 途、国内漫游收入、港澳台及国际漫游收入,即对整体中的某部分的构成要素再次细分 研究其构成。 > 动态构成分析:引起总量变化的各成份的细分,各成分可能引起总量的增加或减少,也 就是说存在负成份和正成份。比如净增用户数=本期用户数-上期用户数,引起变化的 因素有存量流失、自有渠道新增、社会渠道新增,其中存量流失即是负成份。

12 > 3/19/2012 Teradata Confidential

结构分析的常见图表表达

部分占总体的构成

说明:饼图是最常见的结构表达形式,表达各部 分占总体的比例,包括单层饼图和多层饼图。

说明:

当超过四个项目时,饼图表达效果不佳,此时可 以使用条形图或者柱形图来表达结构。

层层分解的构成

净增量的构成

说明:复合条饼图和百分比复合堆积图常用来表达 构成的构成。

13 > 3/19/2012

说明:描述对象的增加或减少来表达净增的构 成。

Teradata Confidential

结构分析案例:各年龄段离网构成分析

分析结果示例 说明问题 •28岁以下和57岁以上的用户离网率 比较高,特别是28岁以下的用户离 网率达到18.92%。

计算方法 •按流失口径计算各部分数据再求占 比

注:构成项目较多,所以用条图

14 > 3/19/2012

Teradata Confidential

结构分析案例:全球通套餐构成分析

分析结果示例 说明问题 •当前全球通套餐以标准全球通为 主,为了规范套餐的构成,后期将 把这部分用户向集团标准的88套餐 迁移。

计算方法 •按具体口径计算各部分数据再求占 比

15 > 3/19/2012

Teradata Confidential

结构分析案例:全球通套餐构成分析

分析结果示例 说明问题 •其他全球通套餐中,了解包含了哪 些具体的套餐结构,以便向哪些具 体的主流全球通套餐签转

计算方法 •按具体套餐口径统计

16 > 3/19/2012

Teradata Confidential

结构分析案例:3G流失客户构成分析

分析结果示例

3G流失客户构成分析

100% 终端在用, 25,257 80% 捆绑到期, 20,366 手机, 60% 终端不在 40% 用, 99,542 20% 非捆绑到 期, 79,176 固话, 23,608 其他, 3,928 终端不在用 非捆绑到期 51,640

说明问题 •从终端、捆绑、终端等角度对3G流 失客户的构成进行分析,发现主要 流失原因。

计算方法 •根据终端是否在用、捆绑是否到 期、终端类型对3G流失用户按口径 进行统计。

0% TD流失客户

17 > 3/19/2012

Teradata Confidential

结构分析案例:有效通信用户净增构成

分析结果示例

有效通信用户净增构成

单位:万户 45 40 35 30 25 20 15 10 5 0 40.4 10.8 0.3 5.2 4.7 39.8

说明问题 •了解有效通信用户净增数增加或减 少的构成。 •了解有效通信用户数变化的原因。

计算方法 •将有效通信用户数各流入项和流出 项的用户数按口径统计出来。

18 > 3/19/2012

Teradata Confidential

数据分析方法概览

趋 势

19 > 3/19/2012

结 构

Teradata Confidential

对 比

关 系

对比分析法的概念

• 定义与描述

> 对比分析法(Comparative Analysis Approach),也称比较分析法,是按 照特定的参照系将客观事物加以比较,以达到认识事物的本质和规律并做 出正确的评价。

• 对比的原则:可比性原则

> 对比对象可比:内涵一致 > 对比指标可比:口径定义一致

20 > 3/19/2012

Teradata Confidential

对比的标准

• 对比标准存在以下4种:

> 时间标准即选择不同时间的指标数值作为对比标准,

最常用的是与上年同期 比较即“同比”,还可以与前一时期比较即“环比”;还可以与历史最好水 平的时期或历史关键时期进行比较。 > 空间标准即选择不同空间指标数据进行比较。

– 与相似的空间比较,如分公司与某些条件相似的分公司比较 – 与先进空间比较,如浙江移动与广东移动比较 – 与扩大的空间标准比较,如分公司水平与省公司水平比较

回顾平时分 析的“维 度”有哪 些?

> 经验或理论标准:经验标准是通过对大量历史资料的归纳总结而得到的标准 。如衡量生活质量的恩格尔系数。理论标准则是通过已知理论经过推理得到 的依据。 > 计划标准:计划标准即与计划数、定额数、目标数对比。

21 > 3/19/2012 Teradata Confidential

对比的指标

• 对比分析法根据分析的特殊需要有以下2种形式

> 绝对数比较:它是利用绝对数进行对比,从而寻找差异的一种方法。 > 相对数比较:它是由两个有联系的指标对比计算的,用以反映客观现象之间

数量联系程度的综合指标,其数值表现为相对数。  强度相对数:将两个性质不同但有一定联系的总量指标对比,用以说明现象的强

度、密度和普遍程度。如,人均费用ARPU用“元/人”表示,人均时长MOU用“分

钟/人长25%以上

•锁定号码抽样一定规模客户近一段 时间各月ARPU •确定比较对象:前后两个月,或前 后两阶段多月平均ARPU值 •计算ARPU变化幅度,划分4-6个档 次,各档次幅度不一定对等 •根据早期ARPU值档次和对应变化 档次制图

25 > 3/19/2012

Teradata Confidential

对比分析案例:各地市公司ARPU比较

空间标准比较

分析结果示例

说明问题 •了解各地区ARPU的对比情况,该 图也可以用柱图来表达,只是当比 较的对象名字较长时,用条图更清 晰。

计算方法 •在某时期,把各地区的ARPU按口 径统计出来

26 > 3/19/2012

Teradata Confidential

对比分析案例:热点健康度评估矩阵

空间标准比较

分析结果示例

说明问题

明星:多为流动性场所虽然使用的绝对量不大但 使用率高且使用规模大,是持续投入的关键区 域! 奶牛:热点利用率高时长贡献率高,重点经营的 核心区域! 问题:热点利用率低,大规模的部署热点虽会带 来一定规模的使用人数和使用量,但热点闲置率 高带来的资源浪费不得忽视;如写字楼很多部署 在大堂1楼,优化区域! 瘦狗:热点的大量部署只会带来资源的浪费,带 动不了使用人数和使用量的大规模上升,规避区 域!

计算方法

27 > 3/19/2012

•在某时期,把各地区的活跃和时长分布统计出来

Teradata Confidential

对比分析案例:各年龄段离网率比较

空间标准比较

分析结果示例

说明问题 •各年龄段的用户离网情况存在较大 的差异,35岁-57岁之间的用户离 网率较低,剩下两头的离网率较 高。

计算方法 •具体的离网口径

28 > 3/19/2012

Teradata Confidential

数据分析方法概览

趋 势

29 > 3/19/2012

结 构

Teradata Confidential

对 比

关 系

关系分析法的概念

• 关系分析法用于分析因子之间的关系以及 因子和目标变量之间的关系。常见的分析 方法有:

> 单因素频数分析 分析目标变量和因变量 间的关系。 > 列联表分析法(多变量频数分析)同时描 述两个或两个以上变量的联合分布的统计 技术。 > 相关性分析 相关性分析是指对两个或多 个具备相关性的变量元素进行分析,从而 衡量两个变量因素的相关密切程度 > 因子分析 是指研究从变量群中提取共性 因子的统计技术。

30 > 3/19/2012 Teradata Confidential

单因素频数分析

 单因素频数分析 通常用来分析目标变量在单个因变量上 的属性特征。  图表展现 通常以柱形图或者条形图来表示。

案例:分析全网离网用户年龄特征 即分析离网用户在年龄层次维度的频数分布 情况。

31 > 3/19/2012

Teradata Confidential

列联表分析

 列联表分析 是同时描述两个或两个以上变量的联合分布的统计技术。要求变量必

须是离散变量,否 则要进行离散化。  展现形式 通常以数据表的形式展现。 案例:用户价值等级与终端价格范围选择的分布情况。

终端选择

低价值 中低价值 中高价值 高价值 总计

低档终端

59.21% 45.93% 36.50% 17.97% 49.23%

中低档终端

26.36% 30.52% 30.25% 22.17% 28.47%

中等终端

11.46% 16.85% 20.70% 22.71% 15.40%

中高档终端

1.68% 3.08% 4.51% 11.31% 2.93%

高档终端

1.29% 3.62% 8.04% 25.84% 3.97%

总计

100% 100% 100% 100% 100%

终端档次说明:

800元以下 801-1500元 1501-2500元 2501-3500元 3501元以上 低档 中低档 中等档 中高档 高档

用户价值说明:

低价值 0-50元 中低价值 50-100元 中高价值 100-300元 高价值 300以上

32 > 3/19/2012

Teradata Confidential

相关性分析的常见关系

相关性分析 相关性分析是指对两个或多个具备相关性的变量元素进行分 析,从而衡量两个变量因素的相关密切程度,常见的相关性关系如下:

A.无关系

16 12

效果 效果

B.递增关系

16 12 8 4

效果

C.递减关系

16 12 8 4

8 4 0 0 5 10 15 20 25 潜在原因

0 0 10 潜在原因 20 30

0 0 10 20 潜在原因 30

D.阈值关系

16 12 8 4 0 0 10 20 潜在原因 30 12

效果 效果

E.曲线关系

16 12

效果

F.聚类关系

8 4 0 0 10 潜在原因 20 30

8 4 0 0 10 20 30 潜在原因

33 > 3/19/2012

Teradata Confidential

四种分析方法的差异

分析方法 要点说明 差异说明

对比分析

一定包含比较的标准,比较标准有时间标准、空间标准、 经验标准或计划标准 1)时间标准强调的是时点上的差异,通常比较的时点 强调对象间的差异 不超过3个; 2)空间标准的比较强调是各分部间的比较或分部与总 体的比较,分部间不要求MECE原则。 强调连续时间的变 化模式 强调整体的部分构 成关系 强调对象间的相互 影响 分析维度一定包括时间周期。时间周期的个数一定在3 个或以上。显示上升、下降趋势或过程中的异常点。 整体与部分是包含关系,各部分需满足MECE原则。 说明总体由哪几部分组成以及各部分的占比。 分析因素与因素之间,因素与目标之间,强调影响的方 向和大小

趋势分析 结构分析

关系分析

34 > 3/19/2012

Teradata Confidential

对比分析与趋势分析案例比较说明

比较分析 趋势分析

比较标准为时间标准,本期与上期 两个时间点进行比较

2011年1月到4月,4个周期用户数 的发展趋势分析。总体成下降趋 势。

35 > 3/19/2012

Teradata Confidential

对比分析与构成分析案例比较说明

比较&构成分析

本地计费时长 a:[0,5) b:[5,10) c:[10,20) d:[20,30) e:[30,50) f:[50,80) g:[80,100) h:[100,120) i:[120,150) j:[150,200) k:[200,300) l:[300,500) m:[500,+) 总计 流失用户数 流失用户占比 9460 13753 25547 22750 43630 46395 24247 20924 26603 34487 44070 43937 45888 401691

2.36% 3.42% 6.36% 5.66% 10.86% 11.55% 6.04% 5.21% 6.62% 8.59% 10.97% 10.94% 11.42% 100.00% 流失率 50.75% 52.76% 40.66% 33.49% 31.69% 25.28% 22.49% 21.26% 20.35% 19.09% 17.00% 14.74% 11.08% 20.23%

构成分析

收入项目 集团统付收入 宽带收入 个人类收入 统筹收入 来访结算折让 总计 收入 831343.1 0 55926471 2106935.9 916040.55 59780790 收入占比 1.39% 0.00% 93.55% 3.52% 1.53%

说明收入由哪几部分构成,哪个是 最重要的收入来源。

构成分析,说明流失用 户数主要的本地计费时 长主要分部在哪一段

比较分析:比较本地计费 时长不同分段的用户流失 率的差异

构成分析和比较分析通常在同一个表格中呈现,需要根据分析目的确定主要分析因素。

36 > 3/19/2012 Teradata Confidential

练习题

• 请根据以下提供的数据,选择合适的图表来表达相关分析目的。

年龄区间 用户数 离网率 平均离网率

0-28 29-34 35-38 39-42 43-45 46-47 48-49 50-53 54-57 58以上

35,336 37,883 29,388 40,965 36,277 31,380 25,052 36,704 33,174 30,285

0.85% 0.57% 0.39% 0.36% 0.36% 0.34% 0.35% 0.37% 0.42% 0.48%

0.45% 0.45% 0.45% 0.45% 0.45% 0.45% 0.45% 0.45% 0.45% 0.45%

• 问题1:图表表达各个年龄段的离网率,以及与平均离网率的对比情况。 • 问题2:总结出该表数据呈现的所有信息。

37 > 3/19/2012

Teradata Confidential

常见数据分析方法与图表表达

Teredata 2012-01

数据分析方法概览

趋 势

2 > 3/19/2012

结 构

Teradata Confidential

对 比

关 系

趋势分析的概念

• 趋势分析(Trend Analysis)指收集历史数据,并从中发现事物的 发展模式或趋势(Pattern or Trend)的分析方法。趋势分析可以 用于描述过去,也可以用于预测未来。 • 专题分析重点关注

> 描述事物的变化趋势或潜在模式 > 量化和预测事物的发展趋势

3 > 3/19/2012

Teradata Confidential

趋势分析的图表表达

• 趋势分析通常用以时间为横坐标的折线图或者连续排列的柱状图来 表达

说明:宽带和手机上半年的趋势不断上升, 下半年有下降的趋势,在9月的收入出现拐 点。固话的收入持续下降。

说明:出账收入在本年度不断上升。(同时, 上半年上升速度比下半年快)

4 > 3/19/2012

Teradata Confidential

趋势分析的常见模式

• 趋势分析的常见模式包括:

> 在一段时间内随机无趋势,例如围绕一条直线上下随机波动 > 上升或下降趋势,还可以细分为直线趋势、指数趋势或其它模式的趋势 > 周期性趋势 > 异常点、拐点 > 多种趋势的综合,如长期上升趋势和季节性波动的综合

• 注意:某些长期趋势或周期性趋势需要足够的样本数据才能观察到

5 > 3/19/2012

Teradata Confidential

趋势分析案例:新入网用户离网趋势

分析结果示例

说明问题

• 新入网用户在入网4个月形成离网高峰平均达 到27%,后逐渐减少,六个月后离网用户累 计达到52%,后逐渐稳定接近4%的全网用户 月平均离网率。

计算方法 • 锁定某个月新增用户,跟踪后续 N个月的状态

6 > 3/19/2012

Teradata Confidential

趋势分析案例:KPI趋势监控(异常点监控)

分析结果示例

流失率趋势监控

2.4% 2.2% 2.0% 1.8% 1.6% 1.4% 1.2% 1.0% 流失率 平均 上限 下限

说明问题 •监控流失率的变化趋势,201102 到201107呈下降趋势 •监控流失率变化的异常,201107 流失率下降超过下限

计算方法 •平均:流失率平均值 •上限:平均+1倍标准差 •下限:平均-1倍标准差

7 > 3/19/2012

Teradata Confidential

趋势分析案例:用户离网趋势的比较

分析结果示例 说明问题 •说明:宏观比较一段时间的发展趋 势,而对象大于3个以上的对比情 况。了解各地区一段时间内的发展 趋势对比,区分哪些地区的发展状 况较差,哪些相对比较好。 计算方法 •在各时间段内,把各地区的离网用 户数按口径统计出来

8 > 3/19/2012

Teradata Confidential

趋势预测

• 趋势预测是根据事物历史的变化趋势来预测未来的发展趋势,前提假设 是事物的发展具有保持历史趋势的特点 • 常用的趋势预测方法包括

> 移动平均法,又分为简单

移动平均法和加权移动平均法 > 指数平滑法,特殊的加权移动平均法 > 趋势拟合法,如直线拟合、曲线拟合等 > 时间序列分析法,把趋势分解为长期趋势、季节性和随机波动

• Excel的数据分析加载项可以实现移动平均、指数平滑和回归的预测 • Excel图形的布局中可以添加线性趋势线、指数趋势线、线性预测趋势线 和双周期移动平均趋势线

9 > 3/19/2012

Teradata Confidential

趋势分析案例:存量用户的收入预测

曲线拟合

观察最近6月数据呈现比较规律的指数曲线发展趋势,对历史数据运用曲线拟合方 法模拟其走势。

3,400,000

相对差异

消费金额

列帐收入金额

50% 40% 2,500,000 拟合曲线 y = a1*EXP(a0*x) 2,000,000

2,900,000 30% 2,400,000 4.22% 1,900,000 -0.08% 1,400,000 200811 200812 200901 200902 200903 200904 200905 200906 200907 200908 7.52% 5.71% 4.84% 2.84% -0.13% 2.90% -0.19% -0.08% -10% 20% 1,500,000 10% 0% 1,000,000

200903 200904 200905 200906 200907 200908 Y= 2105242.34899755*EXP(-0.[**************]6*X) 90.00% 70.00% 50.00% 30.00% 10.00%

拟合效果评估

2,200,000 2,000,000 1,800,000 1,600,000 1,400,000 1,200,000 1,000,000 相对误差 列帐金额 200903 -0.63% 200904 -0.65% 200905 2.10% 200906 -1.78% 200907 -0.02% 200908 0.38% 200909 200910 200911 200912

-10.00%

2118495.821917110.41759461.34 1754474.78 1668997.99 1619191.08

预测

列帐金额-拟合值 2105242.35 1904737.25 1796422.55 1723328.43 1668686.67 1625329.71 1589552 1559197.14 1532903.79 1509759.51 10 > 3/19/2012 Teradata Confidential

数据分析方法概览

趋 势

11 > 3/19/2012

结 构

Teradata Confidential

对 比

关 系

结构分析法的概念

• 结构分析法

> 结构分析是对问题的构成要素进行分析的方法。其目的是为了寻找主因,调 整结构。

• 结构分析法可以分为以下几种类型:

> 单层次构成分析:比如移动用户收入由月租、语音、数据、增值4部分构成,分析每部 分的比重大小。 > 多层次构成分析:比如移动用户收入第一层由月租、语音、数据、增值4部分构成,其 中语音收入占比最高,需要把语音收入再细分为本地收入、长途收入、港澳台及国际长 途、国内漫游收入、港澳台及国际漫游收入,即对整体中的某部分的构成要素再次细分 研究其构成。 > 动态构成分析:引起总量变化的各成份的细分,各成分可能引起总量的增加或减少,也 就是说存在负成份和正成份。比如净增用户数=本期用户数-上期用户数,引起变化的 因素有存量流失、自有渠道新增、社会渠道新增,其中存量流失即是负成份。

12 > 3/19/2012 Teradata Confidential

结构分析的常见图表表达

部分占总体的构成

说明:饼图是最常见的结构表达形式,表达各部 分占总体的比例,包括单层饼图和多层饼图。

说明:

当超过四个项目时,饼图表达效果不佳,此时可 以使用条形图或者柱形图来表达结构。

层层分解的构成

净增量的构成

说明:复合条饼图和百分比复合堆积图常用来表达 构成的构成。

13 > 3/19/2012

说明:描述对象的增加或减少来表达净增的构 成。

Teradata Confidential

结构分析案例:各年龄段离网构成分析

分析结果示例 说明问题 •28岁以下和57岁以上的用户离网率 比较高,特别是28岁以下的用户离 网率达到18.92%。

计算方法 •按流失口径计算各部分数据再求占 比

注:构成项目较多,所以用条图

14 > 3/19/2012

Teradata Confidential

结构分析案例:全球通套餐构成分析

分析结果示例 说明问题 •当前全球通套餐以标准全球通为 主,为了规范套餐的构成,后期将 把这部分用户向集团标准的88套餐 迁移。

计算方法 •按具体口径计算各部分数据再求占 比

15 > 3/19/2012

Teradata Confidential

结构分析案例:全球通套餐构成分析

分析结果示例 说明问题 •其他全球通套餐中,了解包含了哪 些具体的套餐结构,以便向哪些具 体的主流全球通套餐签转

计算方法 •按具体套餐口径统计

16 > 3/19/2012

Teradata Confidential

结构分析案例:3G流失客户构成分析

分析结果示例

3G流失客户构成分析

100% 终端在用, 25,257 80% 捆绑到期, 20,366 手机, 60% 终端不在 40% 用, 99,542 20% 非捆绑到 期, 79,176 固话, 23,608 其他, 3,928 终端不在用 非捆绑到期 51,640

说明问题 •从终端、捆绑、终端等角度对3G流 失客户的构成进行分析,发现主要 流失原因。

计算方法 •根据终端是否在用、捆绑是否到 期、终端类型对3G流失用户按口径 进行统计。

0% TD流失客户

17 > 3/19/2012

Teradata Confidential

结构分析案例:有效通信用户净增构成

分析结果示例

有效通信用户净增构成

单位:万户 45 40 35 30 25 20 15 10 5 0 40.4 10.8 0.3 5.2 4.7 39.8

说明问题 •了解有效通信用户净增数增加或减 少的构成。 •了解有效通信用户数变化的原因。

计算方法 •将有效通信用户数各流入项和流出 项的用户数按口径统计出来。

18 > 3/19/2012

Teradata Confidential

数据分析方法概览

趋 势

19 > 3/19/2012

结 构

Teradata Confidential

对 比

关 系

对比分析法的概念

• 定义与描述

> 对比分析法(Comparative Analysis Approach),也称比较分析法,是按 照特定的参照系将客观事物加以比较,以达到认识事物的本质和规律并做 出正确的评价。

• 对比的原则:可比性原则

> 对比对象可比:内涵一致 > 对比指标可比:口径定义一致

20 > 3/19/2012

Teradata Confidential

对比的标准

• 对比标准存在以下4种:

> 时间标准即选择不同时间的指标数值作为对比标准,

最常用的是与上年同期 比较即“同比”,还可以与前一时期比较即“环比”;还可以与历史最好水 平的时期或历史关键时期进行比较。 > 空间标准即选择不同空间指标数据进行比较。

– 与相似的空间比较,如分公司与某些条件相似的分公司比较 – 与先进空间比较,如浙江移动与广东移动比较 – 与扩大的空间标准比较,如分公司水平与省公司水平比较

回顾平时分 析的“维 度”有哪 些?

> 经验或理论标准:经验标准是通过对大量历史资料的归纳总结而得到的标准 。如衡量生活质量的恩格尔系数。理论标准则是通过已知理论经过推理得到 的依据。 > 计划标准:计划标准即与计划数、定额数、目标数对比。

21 > 3/19/2012 Teradata Confidential

对比的指标

• 对比分析法根据分析的特殊需要有以下2种形式

> 绝对数比较:它是利用绝对数进行对比,从而寻找差异的一种方法。 > 相对数比较:它是由两个有联系的指标对比计算的,用以反映客观现象之间

数量联系程度的综合指标,其数值表现为相对数。  强度相对数:将两个性质不同但有一定联系的总量指标对比,用以说明现象的强

度、密度和普遍程度。如,人均费用ARPU用“元/人”表示,人均时长MOU用“分

钟/人长25%以上

•锁定号码抽样一定规模客户近一段 时间各月ARPU •确定比较对象:前后两个月,或前 后两阶段多月平均ARPU值 •计算ARPU变化幅度,划分4-6个档 次,各档次幅度不一定对等 •根据早期ARPU值档次和对应变化 档次制图

25 > 3/19/2012

Teradata Confidential

对比分析案例:各地市公司ARPU比较

空间标准比较

分析结果示例

说明问题 •了解各地区ARPU的对比情况,该 图也可以用柱图来表达,只是当比 较的对象名字较长时,用条图更清 晰。

计算方法 •在某时期,把各地区的ARPU按口 径统计出来

26 > 3/19/2012

Teradata Confidential

对比分析案例:热点健康度评估矩阵

空间标准比较

分析结果示例

说明问题

明星:多为流动性场所虽然使用的绝对量不大但 使用率高且使用规模大,是持续投入的关键区 域! 奶牛:热点利用率高时长贡献率高,重点经营的 核心区域! 问题:热点利用率低,大规模的部署热点虽会带 来一定规模的使用人数和使用量,但热点闲置率 高带来的资源浪费不得忽视;如写字楼很多部署 在大堂1楼,优化区域! 瘦狗:热点的大量部署只会带来资源的浪费,带 动不了使用人数和使用量的大规模上升,规避区 域!

计算方法

27 > 3/19/2012

•在某时期,把各地区的活跃和时长分布统计出来

Teradata Confidential

对比分析案例:各年龄段离网率比较

空间标准比较

分析结果示例

说明问题 •各年龄段的用户离网情况存在较大 的差异,35岁-57岁之间的用户离 网率较低,剩下两头的离网率较 高。

计算方法 •具体的离网口径

28 > 3/19/2012

Teradata Confidential

数据分析方法概览

趋 势

29 > 3/19/2012

结 构

Teradata Confidential

对 比

关 系

关系分析法的概念

• 关系分析法用于分析因子之间的关系以及 因子和目标变量之间的关系。常见的分析 方法有:

> 单因素频数分析 分析目标变量和因变量 间的关系。 > 列联表分析法(多变量频数分析)同时描 述两个或两个以上变量的联合分布的统计 技术。 > 相关性分析 相关性分析是指对两个或多 个具备相关性的变量元素进行分析,从而 衡量两个变量因素的相关密切程度 > 因子分析 是指研究从变量群中提取共性 因子的统计技术。

30 > 3/19/2012 Teradata Confidential

单因素频数分析

 单因素频数分析 通常用来分析目标变量在单个因变量上 的属性特征。  图表展现 通常以柱形图或者条形图来表示。

案例:分析全网离网用户年龄特征 即分析离网用户在年龄层次维度的频数分布 情况。

31 > 3/19/2012

Teradata Confidential

列联表分析

 列联表分析 是同时描述两个或两个以上变量的联合分布的统计技术。要求变量必

须是离散变量,否 则要进行离散化。  展现形式 通常以数据表的形式展现。 案例:用户价值等级与终端价格范围选择的分布情况。

终端选择

低价值 中低价值 中高价值 高价值 总计

低档终端

59.21% 45.93% 36.50% 17.97% 49.23%

中低档终端

26.36% 30.52% 30.25% 22.17% 28.47%

中等终端

11.46% 16.85% 20.70% 22.71% 15.40%

中高档终端

1.68% 3.08% 4.51% 11.31% 2.93%

高档终端

1.29% 3.62% 8.04% 25.84% 3.97%

总计

100% 100% 100% 100% 100%

终端档次说明:

800元以下 801-1500元 1501-2500元 2501-3500元 3501元以上 低档 中低档 中等档 中高档 高档

用户价值说明:

低价值 0-50元 中低价值 50-100元 中高价值 100-300元 高价值 300以上

32 > 3/19/2012

Teradata Confidential

相关性分析的常见关系

相关性分析 相关性分析是指对两个或多个具备相关性的变量元素进行分 析,从而衡量两个变量因素的相关密切程度,常见的相关性关系如下:

A.无关系

16 12

效果 效果

B.递增关系

16 12 8 4

效果

C.递减关系

16 12 8 4

8 4 0 0 5 10 15 20 25 潜在原因

0 0 10 潜在原因 20 30

0 0 10 20 潜在原因 30

D.阈值关系

16 12 8 4 0 0 10 20 潜在原因 30 12

效果 效果

E.曲线关系

16 12

效果

F.聚类关系

8 4 0 0 10 潜在原因 20 30

8 4 0 0 10 20 30 潜在原因

33 > 3/19/2012

Teradata Confidential

四种分析方法的差异

分析方法 要点说明 差异说明

对比分析

一定包含比较的标准,比较标准有时间标准、空间标准、 经验标准或计划标准 1)时间标准强调的是时点上的差异,通常比较的时点 强调对象间的差异 不超过3个; 2)空间标准的比较强调是各分部间的比较或分部与总 体的比较,分部间不要求MECE原则。 强调连续时间的变 化模式 强调整体的部分构 成关系 强调对象间的相互 影响 分析维度一定包括时间周期。时间周期的个数一定在3 个或以上。显示上升、下降趋势或过程中的异常点。 整体与部分是包含关系,各部分需满足MECE原则。 说明总体由哪几部分组成以及各部分的占比。 分析因素与因素之间,因素与目标之间,强调影响的方 向和大小

趋势分析 结构分析

关系分析

34 > 3/19/2012

Teradata Confidential

对比分析与趋势分析案例比较说明

比较分析 趋势分析

比较标准为时间标准,本期与上期 两个时间点进行比较

2011年1月到4月,4个周期用户数 的发展趋势分析。总体成下降趋 势。

35 > 3/19/2012

Teradata Confidential

对比分析与构成分析案例比较说明

比较&构成分析

本地计费时长 a:[0,5) b:[5,10) c:[10,20) d:[20,30) e:[30,50) f:[50,80) g:[80,100) h:[100,120) i:[120,150) j:[150,200) k:[200,300) l:[300,500) m:[500,+) 总计 流失用户数 流失用户占比 9460 13753 25547 22750 43630 46395 24247 20924 26603 34487 44070 43937 45888 401691

2.36% 3.42% 6.36% 5.66% 10.86% 11.55% 6.04% 5.21% 6.62% 8.59% 10.97% 10.94% 11.42% 100.00% 流失率 50.75% 52.76% 40.66% 33.49% 31.69% 25.28% 22.49% 21.26% 20.35% 19.09% 17.00% 14.74% 11.08% 20.23%

构成分析

收入项目 集团统付收入 宽带收入 个人类收入 统筹收入 来访结算折让 总计 收入 831343.1 0 55926471 2106935.9 916040.55 59780790 收入占比 1.39% 0.00% 93.55% 3.52% 1.53%

说明收入由哪几部分构成,哪个是 最重要的收入来源。

构成分析,说明流失用 户数主要的本地计费时 长主要分部在哪一段

比较分析:比较本地计费 时长不同分段的用户流失 率的差异

构成分析和比较分析通常在同一个表格中呈现,需要根据分析目的确定主要分析因素。

36 > 3/19/2012 Teradata Confidential

练习题

• 请根据以下提供的数据,选择合适的图表来表达相关分析目的。

年龄区间 用户数 离网率 平均离网率

0-28 29-34 35-38 39-42 43-45 46-47 48-49 50-53 54-57 58以上

35,336 37,883 29,388 40,965 36,277 31,380 25,052 36,704 33,174 30,285

0.85% 0.57% 0.39% 0.36% 0.36% 0.34% 0.35% 0.37% 0.42% 0.48%

0.45% 0.45% 0.45% 0.45% 0.45% 0.45% 0.45% 0.45% 0.45% 0.45%

• 问题1:图表表达各个年龄段的离网率,以及与平均离网率的对比情况。 • 问题2:总结出该表数据呈现的所有信息。

37 > 3/19/2012

Teradata Confidential


相关文章

  • 企业综合优势多层次模糊评价模型
  • --第6届全国青年管理科学与系统科学学术会议论文集 2001年·大连 企业综合优势多层次模糊评价模型 许良 (燕山大学经济管理学院,066004) 摘要 本文根据企业综合优势评价指标体系的特征,采用模糊方法评价企业综合优势,建立了多层次模 ...查看


  • 曲线运动知识点总结与经典题
  • "曲线运动"习题归类例析 物理组:吴廷忠 曲线运动是高中物中的难点,由于其可综合性较强,在高考中常常与其他章节的知识综合出现.因 此,在本章中,弄清各种常见模型,熟悉各种分析方法,是高一物理的重中之重. 以下就本章中一些 ...查看


  • 晶体管放大器的设计
  • 晶体管放大器的设计 一.实验目的 1. 熟悉晶体管放大器的工作原理,体会晶体管放大器的作用. 2. 掌握晶体管放大器静态工作点的测试和调整方法以及测量晶体管放大器各项动态性能指标的方法. 3. 学习和掌握设计.调试具体晶体管放大器电路的方法 ...查看


  • [平抛运动]说课稿
  • <平抛运动>说课稿 一.教材分析 (一)教材简介 这节课要探究的内容比较丰富,在运动的合成与分解的基础上, 给出了什么叫平 抛运动,提出了探究的问题:探究平抛运动的特点.探究的过程既有实验现象的观察.又有分析.推理的过程,还将实 ...查看


  • 鲁科版高中物理必修2第3章第2节竖直方向上的抛体运动教案1
  • 教 学 课 题 学 习 任 务 分 析 重 点 难 点 分 析 学 情 分 析竖直方向上的抛体运动 本课题是在学习了匀变速直线运动.自由落体运动和运动的合成与分解的 基础上,探索和研究竖直方向上的抛体运动.这不仅有利于学生对匀变速直线 运动 ...查看


  • 高中物理渗透法制教育教案
  • 生活中的圆周运动(渗透法制教育教案) 榕江县第一中学潘世宇 一.三维目标 1.知识与技能 (1).引导学生应用牛顿第二定律和有关向心力知识分析实例,使学生掌握应用向心力知识分析两类圆周运动模型(竖直面内仅要求最高点和最底点). (2).会在 ...查看


  • 带电粒子在电场中加速与偏转
  • 带电粒子在电场中的加速和偏转 (1)带电粒子在匀强电场中运动的计算方法 用牛顿第二定律计算:带电粒子受到恒力的作用,可以方便的由牛顿第二定律以及匀变速直线运动的公式进行计算. 用动能定理计算:带电粒子在电场中通过电势差为UAB 的两点时动能 ...查看


  • 最小生成树问题
  • 河南城建学院 课 程设计 报告书 专 业:计算机科学与技术 课程设计名称:<数据结构课程设计> 题 目:最小生成树问题 班 级: 学 号: 姓 名: 同 组 人 员: 指 导 老 师: 完 成 时 间: 2012年2月17日 摘 ...查看


  • 基于层次分析法的股票价值评估模型
  • 基于层次分析法的股票价值评估模型 摘 要:为了改进股票价值评估方法,提出一种基于层次分析法的股票价值评估模型.介绍市盈率估值法.折现法和剩余收益估值法这3种基本的股票价值评估方法,并分析各自的优缺点:将3种基本的股价评估方法纳入基于层次分析 ...查看


  • 抛体运动教案(教师用)
  • 抛体运动 制作人:江老师 知识导 一.平抛运动 1.定义:将物体用一定的初速度沿水平方向抛出,不考虑空气阻力,物体只在重力作用下所做的运动,叫做平抛运动. 举例:用力打一下桌上的小球,使它以一定的水平初速度离开桌面,小球所做的运动就是平抛运 ...查看


热门内容