'互联网+'时代的出租车资源配置问题

“互联网+”时代的出租车资源配置问题

摘要

本文基于各城市存在“打车难”问题,针对打车软件的兴起是否能够解决问题。首先收集各个城市有可能影响出租车的数据,然后通过主成分分析、多元线性回归等统计和MATLAB编程计算一一解决问题。

问题一中,通过统计年鉴我们可以得到各城市的出租车供应量,需求量则通过收集数据,然后进行主成分分析,得到它的三个主成分,然后利用线性回归预测法预测出各城市的出租车需求量,将出租车供应量与出租车需求量进行偏离度分析,得到2005年到2013年北京市的供需匹配偏离度的绝对值均小于0.2%,其他城市历年的供需匹配偏离度的绝对值均小于5%,都属于是供需匹配的正常范围,由此得知城市的出租车供应量是可以满足居民出行的需要。

问题二中,首先通过分析得到最有可能影响“打车难”问题的几个主要指标分别为出租车月均载客量、出租车载客里程、人均消费、人均收入,然后综合上各个打车软件的补贴方案,将以上指标通过灰色关联度分析法知道出租车补贴对“打车难”问题影响的权重仅为0.7105,在四项指标中排行第四,可以得到,出租车补贴对缓解“打车难”问题有一定影响,但效果并不显著。

问题三中,基于问题二的分析上,通过灰色关联度分析的原理,要使补贴方案对“打车难”问题的影响程度的相关性增大,根据灰色关联度系数公式,可知补贴方案的指标与参考指标的相差值应尽可能趋于0,得到新补贴方案为:根据司机接单的时间长短,对短途每单对司机端补贴1-3块,长途不进行补贴。再将得到新补贴方案与影响“打车难”问题的相关数据进行灰色关联度分析,将得到结果与问题二中的补贴方案进行比较,得到新出租车补贴对“打车难”问题影响的权重为0.6684,在四项指标中排行第二,明显优于现有的补贴方案,说明方案是可行的。

关键词:打车软件、出租车、主成分分析、多元线性回归预测法、灰色关联度分析法

一、问题提出

出租车是市民出行的重要交通工具之一,“打车难”是人们关注的一个社会热点问题。随着“互联网+”时代的到来,有多家公司依托移动互联网建立了打车软件服务平台,实现了乘客与出租车司机之间的信息互通,同时推出了多种出租车的补贴方案。

请搜集相关数据,建立数学模型研究如下问题:

(1) 试建立合理的指标,并分析不同时空出租车资源的“供求匹配”程度。 (2) 分析各公司的出租车补贴方案是否对“缓解打车难”有帮助?

(3) 如果要创建一个新的打车软件服务平台,将设计什么样的补贴方案,并论证其合理性。

二、基本假设

1、假设所有从各市统计年鉴中获得的数据都是准确无误的; 2、假设问题分析的背景下,没有任何城市实施汽车单双日限行;

3、假设各个城市在2005年到2013年都处于稳定发展状态,排除金融危机对发展情况的影响。

三、符号说明

四、问题分析

4.1. 问题一的分析

针对于问题一,首先考虑不同时空的情况,在数据的选择上区分不同地区不同年份

的城市出租车相关影响因素,根据因素分析出其下的指标量。因为问题提出分析“供需匹配”程度,而供应量即为城市出租车运营的数量,通过各城市的统计年鉴可以的到。而出租车的需求量则需要分析出其相关影响因素,在此,我们利用SPSS统计软件对其进行主成分分析,剔除相关性相对较小的指标,然后再进行一次主成分分析得到它的主成分,将得到的主成分通过多元线性回归预测法预测出城市每一年的出租车需求量,最后,将需求量与供应量进行偏离度分析,两者之间的偏离程度即为“供需匹配”程度。 4.2. 问题二的分析

在问题一的基础上,筛选出最能影响“打车难”问题的相关数据与补贴方案进行灰色关联度分析,分析补贴方案对“打车难”问题的影响程度在各个因素中的排行,从而得到打车软件对缓解“打车难”是否有帮助。 4.3. 问题三的分析

通过灰色关联度分析的原理,要使补贴方案对“打车难”问题的影响程度的相关性增大,则尽量使补贴方案的指标与参考指标的相差值趋于0,再将得到新补贴方案与影响“打车难”问题的相关数据进行灰色关联度分析,将得到结果与问题二中的补贴方案进行比较,看是否能优于现有的补贴方案。

五、模型的建立与求解

5.1 问题一模型建立与求解 5.1.1 问题一的分析

针对于问题一需要分析不同时空的出租车资源,因此我们选取的一二三线城市中具有代表性的几个城市的2005年到2013年的数据作为我们的数据基础,其中有一线城市有深圳、上海、北京,二线城市有长沙、汕头,三线城市有湛江、哈尔滨。

由于一个城市出租车的供应量是可以由城市统计年鉴中得到,城市出租车供应量等于城市出租车数量。

不同城市之间的政府政策,城市规模、城市基本情况是不相一的,因此不同城市之间是不能统一分析,因此在下面只选择北京2005年到2013年的数据作为代表,通过具体的分析求出出租车需求量,然后与供应量作匹配程度对比,其他城市也是通过相同的模型得到求得需求量与供应量的匹配程度。

乘客出租车需求量的影响因素是多样的,不同影响因素都包含有一定量的信息,考虑到在北京统计局网站上获得资料的可能性和相关因素的可量化性,总结得到如下表量化指标:

表1:北京出租车数量影响因素量化指标

根据以上以上确定的量化指标,我们通过北京市级统计局网站、城市期刊、和网上统计调研报告,搜集北京市2005年-2013年的统计数据作为建模的数据,由于地区面积每一年是不变的由此在相关因素分析中剔除这一项数据,综上整理得到以下表格:

表2:北京出租车需求量影响因素相关统计量

以上表2为北京的数据,完整表格为附件1。

通过SPSS统计软件对以上数据进行主成分分析,对数据进行标准化处理得到以下统

计数据,以下将其一一说明:

表3:相关系数矩阵

从以上相关系数矩阵可以看出年末人口、人均GDP、人均收入、人均消费、公交车数量、公交车客运量、旅游人数、旅游总收入、汽车保有量、公交汽车运营里程之间是存在显著关系的,而城市出租车投资额、城市道路面积是存在显著差异,因此在数据中剔除这两项,以减少数据误差。在剔除这两项数据后,我们在利用这项数据进行一次主成分分析。

表4:方差分解主成分提取分析表

通过再一次主成分分析得到的方差分解主成分提取分析表(表4)可以得到头3个特征值已经累计占了总方差的99.189%,说明了前三个主成分对总体数据贡献最大,越往后的数据贡献率越少,因此这项数据中取三个主成分。

表5:成分矩阵

从成分矩阵分析得到,第一主成分偏向于年末常住人口、人均收入、人均消费、汽车保有量等城市经济发展水平因素及城市规模等相关因素,第二主成分主要偏向与之竞

争的公交车服务质量因素,第三主成分则是偏向于旅游有关的城市性质职能。 5.1.2 问题一模型的建立

主成分分析是一种降维的统计方法,借助于一个正交矩阵,将原来众多具有一定相关性的向量转化成为不相关的新向量,这在代数上表现为将原向量的协方差变换成对角矩阵,在几何上表现为将原来坐标系变换成新的正交坐标系,使之指向样本点散布最开

p个正交方向,然后通过对多维变量系统进行降维处理,使之能以一个较高的精度转换

成地位变量系统,再通过构造适当的函数,进以将低维系统转化为一维系统,构造以下数学模型:

(1)原数据指标的为p维向量x(x1,x2,

xp)T,一个有n个数据样本即

xi(xi1,xi2,

xip)T,i1n。

np,构造样本数据矩阵,对样本矩阵进行标准化变换:

Zij

xijxj

sj

n

,i1n;j1p

其中,xj



n

i1ij

x

n

,s

2

j

x

i1

ij

xj

2

n1

,得到标准化矩阵Z。

(2)对标准化矩阵Z求相关系数矩阵:

ZTZ

Rrijpxpn1

其中rij

z

ki

zkj

n1

,i,j1,2p。

(3)解相关矩阵的特征方程RIp0得p个特征根,确定主成分按

mj1pj1

jj

0.85确定m值,使信息的利用率达到85%,对每个,i,j1,2m,解得方程

组Rbjb得到单位特征向量boj。

(4)将标准化后的指标变量转换为主成分:

UijziTboj,j1,2

m

U1称为第一主成分,U2称为第二主成分,„„Up称为第p主成分。

(5)对m个主成分进行加权求和,即得到最终评价值,权数为每个主成分的方差贡献率。

由此可得主成分为:

U1U2

Um

x1x1x2x2

xn,xn,

x1x2

xn.

其中ri为每个主成分方差的贡献率,i1n。

根据以上模型代入通过SPSS统计软件得到权数和特征向量列出个主成分计算公式:

第一主成分:

U1

x1x2x3x4x5x6

x78x9x10

第二主成分:

U2

x1x23x4x5x6

x7x8x9x10

第三主成分:

U3

x1x2x3x4x5x6

x78x9x10

我们将北京出租车需求量影响因素相关统计量(表2)相关数据带入通过Excel处

理得到数据处理结果表(表6):

表6:数据处理结果表

将以上得到的处理结果通过多元线性回归预测法预测出北京市2005年到2013年的出租车需求量。

多元线性回归预测法,是指通过对两个或两个以上的自变量与另一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,就称为多元线性回归分析。

设y为因变量,u1,u2

元线性回归的模型为:

un为自变量,由于自变量与因变量之间存在线性关系,则多

yb0b1u1b2u2bkuke

其中,b0为常数项,b1,b2bk为回归系数,e为误差值。

由此可得北京2005年-2013年出租车需求量的多元线性回归模型为:

y1b0b1u11b2u21b3u31e1,ybbububue,[1**********]2

y8b0b1u18b2u28b3u38e8.

将得到的模型通过SPSS统计软件的回归分析得到:

5.1.3 问题一模型的求解

由模型得到的需要量预测值和原来实际出租车供应量作偏离度分析,可以得到以下

结果:

5.1.4 问题一结果的分析

从出租车的供应量与需求量的偏离度的值极少可以得到,北京的出租车供求匹配程度是可以满足居民出行的需要,同样通过上述分析其他一线二线三线城市的供需匹配的偏离度均少于5%,由此可见这些城市的出租车供应量是可以满足居民出行的需要。但这些城市仍然出现居民“打车难”等问题,其原因是可能出租车运营配置效率不高,由《打车软件对北京市出租汽车运营影响分析》调查报告可以知道2013年的北京出租车的空驶率达到15%-50%,最厉害的程度时有一半运营时间是空驶的,而打车软件的兴起后,北京的空驶率有了一定程度的影响,其运营的效率得到提高,空驶率得到减少。但“打车难”问题是否因为有了打车软件的兴起而得到缓解,我们将在问题二中利用模型进行解答。

5.2 问题二模型建立与求解 5.2.1 问题二的分析

由问题一的模型可以知道,众多的因素都有可能影响出租车的需求量,因此要解决“打车难”也需要有问题一涉及的众多因素,在此我们选取关系系数相对较大的几个指标包括出租车月均载客量、出租车载客里程、人均消费、人均收入。

从相关的报道,打车软件从2014年1月到2014年7月补贴是不断变化的,从最初开始的2014年1月10日的滴滴打车乘客车费立减10元、司机立奖10元到最后乘客端取消补贴,司机端补贴两元一单,我们总结得到打车软件从1月到7月的补贴分别是10元、15元、20元、10元、12元、5元、2元。

因为打车软件的补贴是根据月份变化的,因此我们分析整体影响是是采取月份的数据,通过北京市级统计局网站搜集得到所需数据,整理得到下表:

由于各个因素都有可能影响是否能够解决“打车难”,但其关系并不明确,因此引入灰灰色关联度分析,对各个因素进行分析。 5.2.2 问题二模型的建立

灰色关联度分析法(Grey Relational Analysis)是灰色系统分析方法的一种。是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。

假设h0(h10,h20,...,hn0)T为母序列,h1(h11,h21,...,hn1)T,...,hm(h1m,h2m,...,hnm)T为子序列(比较序列),则定义zi与z0在第k点的关联系数li(k)为:

li(k)

(pq)

(i(k)q)

其中:i(k)hkihoi i1,2,...,m;k1,2,...,n,

aminmini(k),

1kn

1in

bmaxmaxi(k),

1kn

1in

为分辨系数,通常取0.5。

hi与h0的关联度为:

1n

siyi(k),i1,2,...,m

nk1

由上述模型看以看出最能“打车难”问题的因素是出租车月均载客客运量,所以用其作为母序列,出租车月均载客里程、人均月消费、人均月收入、出租车补贴作为子序列。因为各个指标的量纲不同,指标的数量级相差很大,为了利用这些数据进行从何评测,对原始数据作以下处理:

hi(j)'

hi(j)

n

h(j)/n

ij1

关联度可以表示两个指标在同一点的关联度,而目标需要的是各个指标的权重,综合各个关联度,计算得到各指标的权重,并对其归一化。计算式如下:

1n

siyi(j)

nj1

si'

si

s

i1

m

通过上述模型我们可以得到影响“打车难”问题的几个因素的关联程度。 5.2.3 问题二模型的求解

将以上模型通过MATLAB软件代入处理后的数据进行编程,得到各个因素对“打车难”问题影响的权重表:

11

表2.1 “打车难”问题影响的权重表

出租车月均载客里程(公里) 月均消费(元) 月均收入(元)

0.8076

0.8194

0.8264

出租车补贴

(元)

0.6427

5.2.4 问题二结果的分析

将权重表以数据进行排序,我们可以得到影响程度的排序:人均收入>人均消费> 出租车月均载客里程>出租车补贴。由此可见,出租车补贴方案对于解决“打车难”问题影响程度不大,但从实际出发,补贴在一定程度上会调动司机的积极性,从而缓解“打车难”的问题。

5.3 问题三模型建立与求解 5.3.1 问题三的分析

由灰色关联系数li(k)

(pq)

可知,要使 li(k)尽可能的增大且因p,q,均为

(i(k)q)

常数,则需i(k)的值尽可能小,而i(k)hkihoi,即变量hki与hoi相差值尽可能的小。由于数据均通过无量纲化处理,因此hoi与hki波动幅度相一致。根据以上分析得到新补贴方案为10元、12元、8元、9元、14元、8元、9元。

5.3.2 问题三模型的建立与求解

在问题二的模型基础上进行数据更改,得到将以上模型通过MATLAB软件代入处理后的数据进行编程,得到新方案及各因素对“打车难”问题影响的权重表:

出租车月均载客

里程(公里) 月均消费(元) 月均收入(元) 出租车补贴(元)

0.6378

0.6553

12

0.6809 0.6684

5.3.3 问题三结果的分析

得到新补贴方案为:根据司机接单的时间长短,对短途每单对司机端补贴1-3块,长途不进行补贴。将权重表以数据进行排序,我们可以得到影响程度的排序:人均收入>出租车补贴>人均消费> 出租车月均载客里程。由此可见,出租车新补贴方案较问题二的补贴方案对于解决“打车难”问题影响有了很大程度上的提高。

六、模型的评价

7.1 模型的评价

对于模型一,我们进行了两次主成分分析,第一次是用于剔除相关性较小的指标,将得到的数据再进行一次主成分分析,得到最影响需求量的三个主成分,,使模型的结果尽可能的减少不相关指标的影响,对于预测出的出租车需求量增加了说服力。

对于模型二与模型三,运用灰色关联体系,对影响因素进行模糊化,最后得到影响程度排行,分析比较下得到相对准确的说明。灰色体系的计算量小,应用方便,对样本数量的多少和对数据是否存在典型分布规律要求度低,可以推广使用。 7.2 模型的缺点

对于模型一,由于对“不同时空”的理解,也可以建立模型分析在还没有打车软件时一个城市里早午晚不同时间段,不同地区的出租车供应量和需求量的匹配程度,但由于并没有具体的数据资源,且数据收集相对较为困难,建立模型的可能性不太。 对于模型二,在分析打车软件是否能缓解“打车难”的问题上,最好的解决方法是对比无打车软件和有打车软件后出租车的相关量的变化,但现在各城市统计局的年鉴大部分都只是更新到2013年,而打车软件的兴起是在2014年之后,没办法收集到打车软件兴起后的数据。另外,虽然对影响指标模糊化处理可以得到量化的指标来衡量补贴方案对缓解“打车难”问题的影响程度,但由于灰色关联度分析法,指标的内在联系本来就是未知的,这也将会对预测到的结果造成不可测量的误差。

对于模型三,分析司机积极性的相关指标存在太多主观因素,实际结果容易出现误差。

七、参考文献

[1]孙芳芳,浅议灰色关联度分析方法及其应用,科技信息—公路与管理,第十七期:880-882,2010

[2]金错刀,滴滴打车天价补贴后的惊人内幕:为什么越烧钱越有钱?,http://news.pedaily.cn/201505/[1**********]052.shtml,2015.09.13

[3]平影影,零补贴:滴滴快的取消司机补贴,你在用吗,法制晚报,2014.08.10 [4]王树佳,沈增鸿,龚翔,城市出租车需求量的测定及比较标准,特区经济,2009年7月:270-271,2009

13

[5]北京市统计局 统计年鉴 2005年-2013年 [6]上海市统计局 统计年鉴 2005年-2013年 [7]深圳市统计局 统计年鉴 2005年-2013年 [8]长沙市统计局 统计年鉴 2005年-2013年 [9]汕头市统计局 统计年鉴 2005年-2013年 [10]湛江市统计局 统计年鉴 2005年-2013年 [11]哈尔滨市统计局 统计年鉴 2005年-2013年

[12]主成分分析议论文

http://www.docin.com/p-307269932.html?qq-pf-to=pcqq.discussion ,2015.09.13 [13] 打车软件对北京市出租汽车运营影响分析

http://www.chinautc.com/templates/H_dongtai/H_content.aspx?nodeid=202&page=ContentPage&contentid=79490 ,2015.09.13

八、附录

8.1 附录清单

附录1:各个城市2005年到2013年出租车需求量分析表 附录2:问题一SPSS软件分析结果 附录3:问题二MATLAB软件运行程序 附录4:问题三MATLAB运行程序 8.2 附录正文

14

15

16

17

18

附录2: 问题一SPSS软件分析结果

19

20

21

附录3: 问题二MATLAB软件运行程序

x(1,:)=[38699.2/38699.2 54884.5/38699.2 34405.8/38699.2 38835/38699.2 37712.8/38699.2 36873.6/38699.2 37855/38699.2];

x(2,:)=[2270/2270 2457/2270 2206/2270 2294/2270 2340/2270 2161/2270 2180/2270];

x(3,:)=[4059/4059 4003/4059 3926/4059 3980/4059 3907/4059 4103/4059 4072/4059];

x(4,:)=[10/10 15/10 20/10 10/10 12/10 5/10 2/10]; m=4;n=7;

x0=[5092/5092 6457/5092 5213/5092 4736/5092 6752/5092 5092]; for j=1:m

for i=1:n

delta(j,i)=abs(x(j,i)-x0(i));

end end

max=delta(1,1); for j=1:m

for i=1:n

if delta(j,i)>max max=delta(j,i);

end end

end min=0;

for j=1:m

xgd(j)=0;

for i=1:n

glxs(j,i)=0.5*max/(0.5*max+delta(j,i));

xgd(j)=xgd(j)+glxs(j,i); end xgd(j)=xgd(j)/n; end xgd

运行结果 xgd =

0.8076 0.8194 0.8264 0.6427

22

5546/5092 5344/

附录4:问题三MATLAB运行程序

x(1,:)=[38699.2/38699.2 54884.5/38699.2 34405.8/38699.2 38835/38699.2 37712.8/38699.2 36873.6/38699.2 37855/38699.2];

x(2,:)=[2270/2270 2457/2270 2206/2270 2294/2270 2340/2270 2161/2270 2180/2270];

x(3,:)=[4059/4059 4003/4059 3926/4059 3980/4059 3907/4059 4103/4059 4072/4059]; x(4,:)=[10/10 12/10 8/10 9/10 14/10 8/10 9/10]; m=4;n=7;

x0=[5092/5092 6457/5092 5213/5092 4736/5092 6752/5092 5546/5092 5344/5092]; for j=1:m

for i=1:n

delta(j,i)=abs(x(j,i)-x0(i)); end end

max=delta(1,1); for j=1:m

for i=1:n

if delta(j,i)>max max=delta(j,i);

end end

end min=0;

for j=1:m

xgd(j)=0; for i=1:n

glxs(j,i)=0.5*max/(0.5*max+delta(j,i)); xgd(j)=xgd(j)+glxs(j,i); end

xgd(j)=xgd(j)/n; end xgd

运行结果:

xgd =

0.6378 0.6553 0.6809 0.6684

23

“互联网+”时代的出租车资源配置问题

摘要

本文基于各城市存在“打车难”问题,针对打车软件的兴起是否能够解决问题。首先收集各个城市有可能影响出租车的数据,然后通过主成分分析、多元线性回归等统计和MATLAB编程计算一一解决问题。

问题一中,通过统计年鉴我们可以得到各城市的出租车供应量,需求量则通过收集数据,然后进行主成分分析,得到它的三个主成分,然后利用线性回归预测法预测出各城市的出租车需求量,将出租车供应量与出租车需求量进行偏离度分析,得到2005年到2013年北京市的供需匹配偏离度的绝对值均小于0.2%,其他城市历年的供需匹配偏离度的绝对值均小于5%,都属于是供需匹配的正常范围,由此得知城市的出租车供应量是可以满足居民出行的需要。

问题二中,首先通过分析得到最有可能影响“打车难”问题的几个主要指标分别为出租车月均载客量、出租车载客里程、人均消费、人均收入,然后综合上各个打车软件的补贴方案,将以上指标通过灰色关联度分析法知道出租车补贴对“打车难”问题影响的权重仅为0.7105,在四项指标中排行第四,可以得到,出租车补贴对缓解“打车难”问题有一定影响,但效果并不显著。

问题三中,基于问题二的分析上,通过灰色关联度分析的原理,要使补贴方案对“打车难”问题的影响程度的相关性增大,根据灰色关联度系数公式,可知补贴方案的指标与参考指标的相差值应尽可能趋于0,得到新补贴方案为:根据司机接单的时间长短,对短途每单对司机端补贴1-3块,长途不进行补贴。再将得到新补贴方案与影响“打车难”问题的相关数据进行灰色关联度分析,将得到结果与问题二中的补贴方案进行比较,得到新出租车补贴对“打车难”问题影响的权重为0.6684,在四项指标中排行第二,明显优于现有的补贴方案,说明方案是可行的。

关键词:打车软件、出租车、主成分分析、多元线性回归预测法、灰色关联度分析法

一、问题提出

出租车是市民出行的重要交通工具之一,“打车难”是人们关注的一个社会热点问题。随着“互联网+”时代的到来,有多家公司依托移动互联网建立了打车软件服务平台,实现了乘客与出租车司机之间的信息互通,同时推出了多种出租车的补贴方案。

请搜集相关数据,建立数学模型研究如下问题:

(1) 试建立合理的指标,并分析不同时空出租车资源的“供求匹配”程度。 (2) 分析各公司的出租车补贴方案是否对“缓解打车难”有帮助?

(3) 如果要创建一个新的打车软件服务平台,将设计什么样的补贴方案,并论证其合理性。

二、基本假设

1、假设所有从各市统计年鉴中获得的数据都是准确无误的; 2、假设问题分析的背景下,没有任何城市实施汽车单双日限行;

3、假设各个城市在2005年到2013年都处于稳定发展状态,排除金融危机对发展情况的影响。

三、符号说明

四、问题分析

4.1. 问题一的分析

针对于问题一,首先考虑不同时空的情况,在数据的选择上区分不同地区不同年份

的城市出租车相关影响因素,根据因素分析出其下的指标量。因为问题提出分析“供需匹配”程度,而供应量即为城市出租车运营的数量,通过各城市的统计年鉴可以的到。而出租车的需求量则需要分析出其相关影响因素,在此,我们利用SPSS统计软件对其进行主成分分析,剔除相关性相对较小的指标,然后再进行一次主成分分析得到它的主成分,将得到的主成分通过多元线性回归预测法预测出城市每一年的出租车需求量,最后,将需求量与供应量进行偏离度分析,两者之间的偏离程度即为“供需匹配”程度。 4.2. 问题二的分析

在问题一的基础上,筛选出最能影响“打车难”问题的相关数据与补贴方案进行灰色关联度分析,分析补贴方案对“打车难”问题的影响程度在各个因素中的排行,从而得到打车软件对缓解“打车难”是否有帮助。 4.3. 问题三的分析

通过灰色关联度分析的原理,要使补贴方案对“打车难”问题的影响程度的相关性增大,则尽量使补贴方案的指标与参考指标的相差值趋于0,再将得到新补贴方案与影响“打车难”问题的相关数据进行灰色关联度分析,将得到结果与问题二中的补贴方案进行比较,看是否能优于现有的补贴方案。

五、模型的建立与求解

5.1 问题一模型建立与求解 5.1.1 问题一的分析

针对于问题一需要分析不同时空的出租车资源,因此我们选取的一二三线城市中具有代表性的几个城市的2005年到2013年的数据作为我们的数据基础,其中有一线城市有深圳、上海、北京,二线城市有长沙、汕头,三线城市有湛江、哈尔滨。

由于一个城市出租车的供应量是可以由城市统计年鉴中得到,城市出租车供应量等于城市出租车数量。

不同城市之间的政府政策,城市规模、城市基本情况是不相一的,因此不同城市之间是不能统一分析,因此在下面只选择北京2005年到2013年的数据作为代表,通过具体的分析求出出租车需求量,然后与供应量作匹配程度对比,其他城市也是通过相同的模型得到求得需求量与供应量的匹配程度。

乘客出租车需求量的影响因素是多样的,不同影响因素都包含有一定量的信息,考虑到在北京统计局网站上获得资料的可能性和相关因素的可量化性,总结得到如下表量化指标:

表1:北京出租车数量影响因素量化指标

根据以上以上确定的量化指标,我们通过北京市级统计局网站、城市期刊、和网上统计调研报告,搜集北京市2005年-2013年的统计数据作为建模的数据,由于地区面积每一年是不变的由此在相关因素分析中剔除这一项数据,综上整理得到以下表格:

表2:北京出租车需求量影响因素相关统计量

以上表2为北京的数据,完整表格为附件1。

通过SPSS统计软件对以上数据进行主成分分析,对数据进行标准化处理得到以下统

计数据,以下将其一一说明:

表3:相关系数矩阵

从以上相关系数矩阵可以看出年末人口、人均GDP、人均收入、人均消费、公交车数量、公交车客运量、旅游人数、旅游总收入、汽车保有量、公交汽车运营里程之间是存在显著关系的,而城市出租车投资额、城市道路面积是存在显著差异,因此在数据中剔除这两项,以减少数据误差。在剔除这两项数据后,我们在利用这项数据进行一次主成分分析。

表4:方差分解主成分提取分析表

通过再一次主成分分析得到的方差分解主成分提取分析表(表4)可以得到头3个特征值已经累计占了总方差的99.189%,说明了前三个主成分对总体数据贡献最大,越往后的数据贡献率越少,因此这项数据中取三个主成分。

表5:成分矩阵

从成分矩阵分析得到,第一主成分偏向于年末常住人口、人均收入、人均消费、汽车保有量等城市经济发展水平因素及城市规模等相关因素,第二主成分主要偏向与之竞

争的公交车服务质量因素,第三主成分则是偏向于旅游有关的城市性质职能。 5.1.2 问题一模型的建立

主成分分析是一种降维的统计方法,借助于一个正交矩阵,将原来众多具有一定相关性的向量转化成为不相关的新向量,这在代数上表现为将原向量的协方差变换成对角矩阵,在几何上表现为将原来坐标系变换成新的正交坐标系,使之指向样本点散布最开

p个正交方向,然后通过对多维变量系统进行降维处理,使之能以一个较高的精度转换

成地位变量系统,再通过构造适当的函数,进以将低维系统转化为一维系统,构造以下数学模型:

(1)原数据指标的为p维向量x(x1,x2,

xp)T,一个有n个数据样本即

xi(xi1,xi2,

xip)T,i1n。

np,构造样本数据矩阵,对样本矩阵进行标准化变换:

Zij

xijxj

sj

n

,i1n;j1p

其中,xj



n

i1ij

x

n

,s

2

j

x

i1

ij

xj

2

n1

,得到标准化矩阵Z。

(2)对标准化矩阵Z求相关系数矩阵:

ZTZ

Rrijpxpn1

其中rij

z

ki

zkj

n1

,i,j1,2p。

(3)解相关矩阵的特征方程RIp0得p个特征根,确定主成分按

mj1pj1

jj

0.85确定m值,使信息的利用率达到85%,对每个,i,j1,2m,解得方程

组Rbjb得到单位特征向量boj。

(4)将标准化后的指标变量转换为主成分:

UijziTboj,j1,2

m

U1称为第一主成分,U2称为第二主成分,„„Up称为第p主成分。

(5)对m个主成分进行加权求和,即得到最终评价值,权数为每个主成分的方差贡献率。

由此可得主成分为:

U1U2

Um

x1x1x2x2

xn,xn,

x1x2

xn.

其中ri为每个主成分方差的贡献率,i1n。

根据以上模型代入通过SPSS统计软件得到权数和特征向量列出个主成分计算公式:

第一主成分:

U1

x1x2x3x4x5x6

x78x9x10

第二主成分:

U2

x1x23x4x5x6

x7x8x9x10

第三主成分:

U3

x1x2x3x4x5x6

x78x9x10

我们将北京出租车需求量影响因素相关统计量(表2)相关数据带入通过Excel处

理得到数据处理结果表(表6):

表6:数据处理结果表

将以上得到的处理结果通过多元线性回归预测法预测出北京市2005年到2013年的出租车需求量。

多元线性回归预测法,是指通过对两个或两个以上的自变量与另一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,就称为多元线性回归分析。

设y为因变量,u1,u2

元线性回归的模型为:

un为自变量,由于自变量与因变量之间存在线性关系,则多

yb0b1u1b2u2bkuke

其中,b0为常数项,b1,b2bk为回归系数,e为误差值。

由此可得北京2005年-2013年出租车需求量的多元线性回归模型为:

y1b0b1u11b2u21b3u31e1,ybbububue,[1**********]2

y8b0b1u18b2u28b3u38e8.

将得到的模型通过SPSS统计软件的回归分析得到:

5.1.3 问题一模型的求解

由模型得到的需要量预测值和原来实际出租车供应量作偏离度分析,可以得到以下

结果:

5.1.4 问题一结果的分析

从出租车的供应量与需求量的偏离度的值极少可以得到,北京的出租车供求匹配程度是可以满足居民出行的需要,同样通过上述分析其他一线二线三线城市的供需匹配的偏离度均少于5%,由此可见这些城市的出租车供应量是可以满足居民出行的需要。但这些城市仍然出现居民“打车难”等问题,其原因是可能出租车运营配置效率不高,由《打车软件对北京市出租汽车运营影响分析》调查报告可以知道2013年的北京出租车的空驶率达到15%-50%,最厉害的程度时有一半运营时间是空驶的,而打车软件的兴起后,北京的空驶率有了一定程度的影响,其运营的效率得到提高,空驶率得到减少。但“打车难”问题是否因为有了打车软件的兴起而得到缓解,我们将在问题二中利用模型进行解答。

5.2 问题二模型建立与求解 5.2.1 问题二的分析

由问题一的模型可以知道,众多的因素都有可能影响出租车的需求量,因此要解决“打车难”也需要有问题一涉及的众多因素,在此我们选取关系系数相对较大的几个指标包括出租车月均载客量、出租车载客里程、人均消费、人均收入。

从相关的报道,打车软件从2014年1月到2014年7月补贴是不断变化的,从最初开始的2014年1月10日的滴滴打车乘客车费立减10元、司机立奖10元到最后乘客端取消补贴,司机端补贴两元一单,我们总结得到打车软件从1月到7月的补贴分别是10元、15元、20元、10元、12元、5元、2元。

因为打车软件的补贴是根据月份变化的,因此我们分析整体影响是是采取月份的数据,通过北京市级统计局网站搜集得到所需数据,整理得到下表:

由于各个因素都有可能影响是否能够解决“打车难”,但其关系并不明确,因此引入灰灰色关联度分析,对各个因素进行分析。 5.2.2 问题二模型的建立

灰色关联度分析法(Grey Relational Analysis)是灰色系统分析方法的一种。是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。

假设h0(h10,h20,...,hn0)T为母序列,h1(h11,h21,...,hn1)T,...,hm(h1m,h2m,...,hnm)T为子序列(比较序列),则定义zi与z0在第k点的关联系数li(k)为:

li(k)

(pq)

(i(k)q)

其中:i(k)hkihoi i1,2,...,m;k1,2,...,n,

aminmini(k),

1kn

1in

bmaxmaxi(k),

1kn

1in

为分辨系数,通常取0.5。

hi与h0的关联度为:

1n

siyi(k),i1,2,...,m

nk1

由上述模型看以看出最能“打车难”问题的因素是出租车月均载客客运量,所以用其作为母序列,出租车月均载客里程、人均月消费、人均月收入、出租车补贴作为子序列。因为各个指标的量纲不同,指标的数量级相差很大,为了利用这些数据进行从何评测,对原始数据作以下处理:

hi(j)'

hi(j)

n

h(j)/n

ij1

关联度可以表示两个指标在同一点的关联度,而目标需要的是各个指标的权重,综合各个关联度,计算得到各指标的权重,并对其归一化。计算式如下:

1n

siyi(j)

nj1

si'

si

s

i1

m

通过上述模型我们可以得到影响“打车难”问题的几个因素的关联程度。 5.2.3 问题二模型的求解

将以上模型通过MATLAB软件代入处理后的数据进行编程,得到各个因素对“打车难”问题影响的权重表:

11

表2.1 “打车难”问题影响的权重表

出租车月均载客里程(公里) 月均消费(元) 月均收入(元)

0.8076

0.8194

0.8264

出租车补贴

(元)

0.6427

5.2.4 问题二结果的分析

将权重表以数据进行排序,我们可以得到影响程度的排序:人均收入>人均消费> 出租车月均载客里程>出租车补贴。由此可见,出租车补贴方案对于解决“打车难”问题影响程度不大,但从实际出发,补贴在一定程度上会调动司机的积极性,从而缓解“打车难”的问题。

5.3 问题三模型建立与求解 5.3.1 问题三的分析

由灰色关联系数li(k)

(pq)

可知,要使 li(k)尽可能的增大且因p,q,均为

(i(k)q)

常数,则需i(k)的值尽可能小,而i(k)hkihoi,即变量hki与hoi相差值尽可能的小。由于数据均通过无量纲化处理,因此hoi与hki波动幅度相一致。根据以上分析得到新补贴方案为10元、12元、8元、9元、14元、8元、9元。

5.3.2 问题三模型的建立与求解

在问题二的模型基础上进行数据更改,得到将以上模型通过MATLAB软件代入处理后的数据进行编程,得到新方案及各因素对“打车难”问题影响的权重表:

出租车月均载客

里程(公里) 月均消费(元) 月均收入(元) 出租车补贴(元)

0.6378

0.6553

12

0.6809 0.6684

5.3.3 问题三结果的分析

得到新补贴方案为:根据司机接单的时间长短,对短途每单对司机端补贴1-3块,长途不进行补贴。将权重表以数据进行排序,我们可以得到影响程度的排序:人均收入>出租车补贴>人均消费> 出租车月均载客里程。由此可见,出租车新补贴方案较问题二的补贴方案对于解决“打车难”问题影响有了很大程度上的提高。

六、模型的评价

7.1 模型的评价

对于模型一,我们进行了两次主成分分析,第一次是用于剔除相关性较小的指标,将得到的数据再进行一次主成分分析,得到最影响需求量的三个主成分,,使模型的结果尽可能的减少不相关指标的影响,对于预测出的出租车需求量增加了说服力。

对于模型二与模型三,运用灰色关联体系,对影响因素进行模糊化,最后得到影响程度排行,分析比较下得到相对准确的说明。灰色体系的计算量小,应用方便,对样本数量的多少和对数据是否存在典型分布规律要求度低,可以推广使用。 7.2 模型的缺点

对于模型一,由于对“不同时空”的理解,也可以建立模型分析在还没有打车软件时一个城市里早午晚不同时间段,不同地区的出租车供应量和需求量的匹配程度,但由于并没有具体的数据资源,且数据收集相对较为困难,建立模型的可能性不太。 对于模型二,在分析打车软件是否能缓解“打车难”的问题上,最好的解决方法是对比无打车软件和有打车软件后出租车的相关量的变化,但现在各城市统计局的年鉴大部分都只是更新到2013年,而打车软件的兴起是在2014年之后,没办法收集到打车软件兴起后的数据。另外,虽然对影响指标模糊化处理可以得到量化的指标来衡量补贴方案对缓解“打车难”问题的影响程度,但由于灰色关联度分析法,指标的内在联系本来就是未知的,这也将会对预测到的结果造成不可测量的误差。

对于模型三,分析司机积极性的相关指标存在太多主观因素,实际结果容易出现误差。

七、参考文献

[1]孙芳芳,浅议灰色关联度分析方法及其应用,科技信息—公路与管理,第十七期:880-882,2010

[2]金错刀,滴滴打车天价补贴后的惊人内幕:为什么越烧钱越有钱?,http://news.pedaily.cn/201505/[1**********]052.shtml,2015.09.13

[3]平影影,零补贴:滴滴快的取消司机补贴,你在用吗,法制晚报,2014.08.10 [4]王树佳,沈增鸿,龚翔,城市出租车需求量的测定及比较标准,特区经济,2009年7月:270-271,2009

13

[5]北京市统计局 统计年鉴 2005年-2013年 [6]上海市统计局 统计年鉴 2005年-2013年 [7]深圳市统计局 统计年鉴 2005年-2013年 [8]长沙市统计局 统计年鉴 2005年-2013年 [9]汕头市统计局 统计年鉴 2005年-2013年 [10]湛江市统计局 统计年鉴 2005年-2013年 [11]哈尔滨市统计局 统计年鉴 2005年-2013年

[12]主成分分析议论文

http://www.docin.com/p-307269932.html?qq-pf-to=pcqq.discussion ,2015.09.13 [13] 打车软件对北京市出租汽车运营影响分析

http://www.chinautc.com/templates/H_dongtai/H_content.aspx?nodeid=202&page=ContentPage&contentid=79490 ,2015.09.13

八、附录

8.1 附录清单

附录1:各个城市2005年到2013年出租车需求量分析表 附录2:问题一SPSS软件分析结果 附录3:问题二MATLAB软件运行程序 附录4:问题三MATLAB运行程序 8.2 附录正文

14

15

16

17

18

附录2: 问题一SPSS软件分析结果

19

20

21

附录3: 问题二MATLAB软件运行程序

x(1,:)=[38699.2/38699.2 54884.5/38699.2 34405.8/38699.2 38835/38699.2 37712.8/38699.2 36873.6/38699.2 37855/38699.2];

x(2,:)=[2270/2270 2457/2270 2206/2270 2294/2270 2340/2270 2161/2270 2180/2270];

x(3,:)=[4059/4059 4003/4059 3926/4059 3980/4059 3907/4059 4103/4059 4072/4059];

x(4,:)=[10/10 15/10 20/10 10/10 12/10 5/10 2/10]; m=4;n=7;

x0=[5092/5092 6457/5092 5213/5092 4736/5092 6752/5092 5092]; for j=1:m

for i=1:n

delta(j,i)=abs(x(j,i)-x0(i));

end end

max=delta(1,1); for j=1:m

for i=1:n

if delta(j,i)>max max=delta(j,i);

end end

end min=0;

for j=1:m

xgd(j)=0;

for i=1:n

glxs(j,i)=0.5*max/(0.5*max+delta(j,i));

xgd(j)=xgd(j)+glxs(j,i); end xgd(j)=xgd(j)/n; end xgd

运行结果 xgd =

0.8076 0.8194 0.8264 0.6427

22

5546/5092 5344/

附录4:问题三MATLAB运行程序

x(1,:)=[38699.2/38699.2 54884.5/38699.2 34405.8/38699.2 38835/38699.2 37712.8/38699.2 36873.6/38699.2 37855/38699.2];

x(2,:)=[2270/2270 2457/2270 2206/2270 2294/2270 2340/2270 2161/2270 2180/2270];

x(3,:)=[4059/4059 4003/4059 3926/4059 3980/4059 3907/4059 4103/4059 4072/4059]; x(4,:)=[10/10 12/10 8/10 9/10 14/10 8/10 9/10]; m=4;n=7;

x0=[5092/5092 6457/5092 5213/5092 4736/5092 6752/5092 5546/5092 5344/5092]; for j=1:m

for i=1:n

delta(j,i)=abs(x(j,i)-x0(i)); end end

max=delta(1,1); for j=1:m

for i=1:n

if delta(j,i)>max max=delta(j,i);

end end

end min=0;

for j=1:m

xgd(j)=0; for i=1:n

glxs(j,i)=0.5*max/(0.5*max+delta(j,i)); xgd(j)=xgd(j)+glxs(j,i); end

xgd(j)=xgd(j)/n; end xgd

运行结果:

xgd =

0.6378 0.6553 0.6809 0.6684

23


相关文章

  • 出租车数学建模
  • 针对 "互联网+"时代的出租车供求和补贴的相关研究 摘要 改革开放以来,随着居民收入的增加, 居民生活水平在逐渐提高,对出行方便与舒适要求也在不断提高,出租车成为市民出行的重要交通工具之一.随着汽车油价的升高和国家对出租 ...查看


  • 基于共享经济的商业模式创新_李怀勇
  • 创新工场Innovation Workshop 将空闲的资源充分利用,不仅提高资源存量的利用率,而且使不同角色的个体受益.共享经济带来的最显著变化是快速提升总供给能力,它对现有的资源在短暂的时间内进行重新配置,释放了增长潜能.在互联网时代下 ...查看


  • 2015数学建模互联网出租车
  • "互联网+"时代的出租车资源配置 摘要:本文从出租车资源合理配置的基本问题出发,对我国大城市"打车难"问题产生的原因进行分析与探讨.为有效解决"打车难"问题,通过收集和分析相关数据 ...查看


  • 新规视野下我国网约车规制探究
  • 摘 要 网约车作为互联网经济大环境下涌现出的新兴业态,在愈发影响公众出行生活的同时,对传统交通运输的固有利益造成了巨大冲击,同时对交通运输的政府规制和法律监管形成了巨大挑战.从立法角度来看,网约车纳入监管具有必然性,<北京市网络预约出 ...查看


  • "互联网+"时代的出租车资源配置
  • "互网+"联时代的出租车资配置 源摘 出租车是要市民行的出要交通重工具之."互一网联"+代时到来,有多的家公 依托互联司建网立了车打件软务服台,平 现了乘客与实出租司机之车间信的息 通互.本对&quo ...查看


  • 贯彻五中全会精神大力发展分享经济
  • [摘要]基于互联网的分享经济是大势所趋,党中央审时度势.超前谋划,科学把握新一代信息技术带来的分享经济迅速发展这一趋势,在十八届五中全会作出了"大力发展分享经济"的重大部署,有望重塑从政府.到企业和个人的每一个社会领域. ...查看


  • 互联网+如何改变生活
  • "互联网+ "如何改变生活 2015年下半年,国务院印发了<关于积极推进"互联网+"行动的指导意见>,出台关于"互联网+"的顶层设计,明确未来三年以及十年的互联网+的发 ...查看


  • 腾讯研究院:互联网+公共服务篇 迈入普惠包容的时代
  • 近几年,中国政府职能重心从经济建设向民生建设转变,对医疗.教育等公共服务的财政支出不断加大. 先对比看几组数据: 2007-2013年,国家在医疗卫生.教育等公共服务的财政支出年均增幅达22% 2013年,我国在公共服务方面的财政支出超6万 ...查看


  • 共享经济时代下的信任问题与解决办法
  • 共享经济时代下的信任问题与解决办法 摘要:共享经济因为颠覆了传统的商业模式,提高了闲置资源的利用率而在国内迅速发展,各领域都出现了大量的共享平台中国也出台相关政策鼓励共享经济的健康发展.虽然共享经济发展迅猛但是出现了很多问题,最核心的问题是 ...查看


热门内容