第26卷 第1期
文章编号:1006-9348(2009) 01-0296-05
计 算 机 仿 真
2009年1月
几种巴斯模型参数估计方法的比较研究
孟繁东, 何明升
(哈尔滨工业大学, 黑龙江哈尔滨150001)
摘要:在创新扩散的巴斯模型的基础上, 提出了一种新的模型参数估计方法———采用蚁群算法作为巴斯模型参数估计方法。给出了运用蚁群算法思想设计的具体参数估计方法, 并以中国移动通信技术的扩散为例, 应用巴斯模型对其扩散趋势进行了实证研究, 通过对蚁群算法和最小二乘法、遗传算法等传统参数估计方法估计结果的比较分析, 得出结论, 采用蚁群算法作为巴斯模型的参数估计方法效果更好。最后对中国移动通信技术的扩散趋势进行了预测并提出策略建议。关键词:巴斯模型; 参数估计; 蚁群算法; 比较研究中图分类号:F 713 文献标识码:A
C o m p a r i s o na n dR e s e a r c ho f S e v e r a l P a r a m e t e r E s t i m a t i o n
A p p r o a c h e s o f B a s s Mo d e l
———T a k i n gt h e D i f f u s i o n o f M o b i l e C o m m u n i c a t i o nT e c h n o l o g y i n C h i n a a s a nE x a m p l e
M E N GF a n -d o n g , H EM i n g -s h e n g
(H a r b i n I n s t i t u t e o f T e c h n o l o g y , H a r b i n H e i l o n g j i a n g 150001, C h i n a )
A B S T R A C T :T h i s p a p e r g i v e s ad e t a i l e di n t r o d u c t i o no f an e wp a r a m e t e r e s t i m a t i o na p p r o a c ho f B a s s m o d e l c a l l e d A n t C o l o n y O p t i m i z a t i o n (A C O )w h i c h i s b a s e d o n B a s s m o d e l . A s a n e x a m p l e , t h e p r o l i f e r a t i o n o f m o b i l e c o m m u n i -c a t i o nt e c h n o l o g y i nC h i n a w a s u s e d t o d e m o n s t r a t e t h i s a l g o r i t h m .T h e L e a s t S q u a r e s m e t h o d , G e n e t i c A l g o r i t h m s , a n dA C O w e r e a p p l i e dt o t h em o b i l e c o m m u n i c a t i o nt e c h n o l o g yr e s p e c t i v e l ya s t h ep a r a m e t e r e s t i m a t i o na p p r o a c h e s a n dt h e r e s u l t s w e r e t h e na n a l y z e da n dc o m p a r e d .T h r o u g ht h e c o m p a r i s o na n da n a l y s i s o f t h et h r e ea p p r o a c h e s , i t w a s c o n c l u d e d t h a t t h e A C Oi s a b e t t e r a p p r o a c h t o u s e a s t h e p a r a m e t e r e s t i m a t i o n a p p r o a c h o f B a s s m o d e l . K E Y WO R D S :B a s s m o d e l ; P a r a m e t e r e s t i m a t i o n ;A n t c o l o n y o p t i m i z a t i o n ;C o m p a r i s o na n dr e s e a r c h
1 引言
西方经济学者在长期的研究中建立了多个新产品扩散模型用来预测新产品及新技术的扩散。而对这种扩散规律的准确描述, 无论是对管理者或是对市场研究者都是非常重要的。新产品扩散模型以巴斯(1969) 提出的耐用品首次购买模型(简称巴斯模型) 最为著名, 尽管后来的学者在扩散模型的研究上有很多建树, 但是几乎都是以巴斯模型为基础发展而来的, 特别是能用于实证研究的扩散模型更是如此。
本文以一种全局寻优性能更好的算法———蚁群算法, 作为巴斯模型的参数估计方法, 不仅能使模型曲线的拟合效果更好, 而且还能在模型数据不足的情况下, 提供准确的预测, 这对预测尚处在成长期的创新扩散具有非常重要的意义。本文采用蚁群算法对巴斯模型进行参数估计, 对中国移动通
信技术的扩散进行实证研究, 通过采用不同模型参数估计方法与蚁群算法的对比, 证明蚁群算法的优越性, 这是对巴斯模型参数估计方法的重要发展; 同时, 运用巴斯模型对中国移动通信技术的扩散趋势进行实证研究, 无论对于把握创新扩散的一般规律还是对我国移动通信产业以及未来3G 的发展进行指导, 都有重要的理论与现实意义。
2 巴斯模型
在诸多扩散模型中, 巴斯模型及其后来的扩展型是其中最重要的组成部分, 特别是用于实证分析的应用模型, 几乎都是以巴斯模型为基础展开研究的。1969年, 巴斯(F r a n k M .B a s s ) 融合了F o u r t 和Wo o d l o c k 与M a n s f i e l d 提出的两种模式, 并假设新产品的潜在采用者会受到两种传播方式的影响[1]:一是潜在采用者会受到大众媒体的影响, 又称为外部影响(E x t e r n a l I n f l u e n c e ) , 此类的采用者称为创新者(I n n o v a -t o r ) 。二是潜在采用者会受到口头传播的影响, 又称为内部影响(I n t e r n a l I n f l u e n c e ) , 此类的采用者称为模仿者(I m i t a -
基金项目:教育部高等学校博士学科点专项基金资助项目
([1**********])
收稿日期:2007-12-13 修回日期:2007-12-27
t o r ) , 通过对11个耐用品的市场扩散研究, 提出了耐用品的一次购买模型, 简称巴斯模型。其形式为:
f (t )
=p=qF (t )
[1-F (t ) ]
例) ;
F (t ) 为在第t 时间累积采用者占全部采用者的比率; 令m f (t ) =n(t ) , F (0)=0, 其中m 表示潜在的采纳者总数(即市场的最大潜力) , 则累积采纳者人数为N (t ) =mF (t ) , 因此可得巴斯基本模型的累积采用者S 型曲线N (t ) :
-(p +q ) 1-e
N (t ) -(p +q ) 1e
p
往食物所在地的标记。后面的蚂蚁, 会沿着有信息素的路径行走
, 并且信息素越多引诱蚂蚁的能力就越强, 而同时, 信息素会逐渐挥发。通过这一原理, 蚂蚁群能够很快找出通往食物源的最短路程。如图1所示。
(1)
f (t ) 为在第t 时刻采用者的采用速度(非累计采用者比
(2)
图1 蚂蚁寻食路径示意图
巴斯将p 视为创新系数, q 视为模仿系数。
蚂蚁寻食时, 由蚁穴出发, 可沿A C 路径到达食物, 也可
3 巴斯模型的参数估计方法
参数估计方法的选择是扩散模型创建能否成功的关键因素之一。新产品市场扩散模型的参数估计方法大致分为两大类:一类是时不变估计方法, 包括普通最小二乘法(L S ) 、最大似然估计法(M L E ) 和非线性最小二乘法(N L S ) 等; 另一类是时变估计方法, 包括自适应滤波法(A F ) 、层次贝叶斯方法(R B ) 等[2]。
巴斯模型参数估算的准确性是扩散模型创建成功的关键因素之一。不同的参数估计方法, 会使模型拟合结果相差很大, 很多学者都在尝试用不同的方法来提高模型参数估计的准确性, 进而提高模型的预测质量。目前大量统计学以及计算机技术被应用到这个领域。尤其是越来越多的优化算法, 如遗传算法、模拟退火算法等被研究人员所应用。
[3]
R a j k u m a r 提出采用遗传算法(G A ) 进行参数估计, 并与其
沿A B C 路径到达食物, 如果每只蚂蚁寻到食物后沿原路回蚁巢, 并在路上留下信息素, 那么因为A C 路径短, 所以当它们沿A C 返回时, 就在A C 上留下两次信息素。而在相同时间内沿A B C 返回者, 因其路径长, 此时仅回到D 点, 于是A D 一段只留过一次信息素(即其上的信息素浓度比A C 上的浓度低) , 所以这时从蚁穴出来的后续寻食者就会沿浓度大的路径A C 行走。经过一段时间以后, 大多数的蚂蚁都会沿较短的路程进行寻食。学者们就是利用这个原理设计了蚁群算法, 以求解最短路程问题。4. 2 蚁群算法模型
下面以求解n 城市的T S P (旅行商) 问题为背景来说明基本的蚁群算法[6]。
设a 为蚁群中蚂蚁的数量, n 为旅行商要走过的城市数, d (i , j =1, 2, 3, …, n) 为城市i 到j 的距离, b (t ) 为t 时刻i , j i 位于城市i 的蚂蚁个数, 则a=
t ) , τ(t ) 为t 时刻在i j ∑b (
i
i j
i =0n
它参数估计方法进行了比较, 收到了更好的效果。我国学者杨敬辉[4]在其研究中应用遗传算法对巴斯模型的参数进行了估计, 也取得了较好的效果。
连线上残留的信息量, 初始时刻各条路径上的信息量相等, 即τ(t )=c。i j
如果在时间间隔(t , t +1) 中a 个蚂蚁都从当前城市选择下一个城市, 则经过n 个时间间隔, 所有蚂蚁都走完n 个城市, 构成一轮循环。此时, 按如下方法修改个各条路径上的残留信息:
τ(t +n)=ρτi j i j +■τi j
ρ(ρ∈(0, 1) ) 为信息残留系数, 1-ρ表征了从时刻t 到t +n 路径i j 上残留信息的挥发程度。■τ为本次循环流在路i j 径i j 上的信息量。
根据D o r i g o 的A n t -C i r c l e S y s t e m 模型, 式中Q 为常量, L 只蚂蚁在本次循环中所走路径的长度。k 为第k
Q
, 若第k 只蚂蚁在本次循环中途径i j
■τL
k i j
4 蚁群算法
[5]
蚁群算法(A n t C o l o n y O p t i m i z a t i o n ) 是一种新型的具
有全局搜索能力模拟生物的人工智能算法, 1996年由意大利学者M . D o r i g o 等人提出。通过仿生学研究, 蚂蚁在运动过程中, 个体之间通过“信息素”(P h e r o m o n e ) 这种物质进行相关信息的传递, 蚂蚁能在运动过程中感知信息素信息, 并确定运动方向, 因此大量蚂蚁组成的蚁群的集体行为便表现出一种信息的正反馈现象:某路径上走过的蚂蚁越多, 后来者选择该路径的概率越大, 蚁群个体间通过这种信息交流, 协同完成任务。它的优点表现在:具有很强的发现较好解的能力, 并具有很强的并行性和鲁棒性。4. 1 蚁群算法的基本原理
生物学家通过对蚂蚁生活习性的研究发现, 蚁群寻找食物时会派出一些蚂蚁分头在四周游荡, 如果一只蚂蚁找到食物, 它就返回蚁巢中通知同伴并沿途留下信息素作为蚁群前
0, 否
k
P 为t 时刻蚂蚁k (k=1, 2, …, n ) 由城市i 到j 的选择i j
概率,
0, 否
P i j αβ
τ(t ) η(t ) i j i j
Θ*=(Θ1+Θ2+…+ΘA )/A
, 若j ∈S αβτ(t ) η(t ) i s i s
5 巴斯模型的应用方法
技术创新扩散理论的价值在于它能够解释现实的技术创新扩散问题,
巴斯模型已经被大量的产品扩散实例证明为行之有效的扩散模型。巴斯模型可将产品扩散过程中各种复杂的因素以及它们之间的关系, 用三个简单的参数加以控制, 因此可以通过控制产品扩散过程中几个有规律的变量, 对新产品的未来的市场扩散趋势进行把握。巴斯模型的应用流程如图2。
s ∈S
式中, S 为在城市i 蚂蚁k 允许选择的城市,
η(t ) 为t 时刻蚂蚁由城市i 选择城市j 的启发式信息, i j
1
在T S P 问题中, η, α和β分别为残留信息和启发信息i j =d i j 的相对重要程度系数。
4. 3 基于蚁群算法的巴斯模型参数估计算法
根据巴斯模型中对数据点数量、时间段的敏感性, 我们采用具有人工智能的蚁群优化算法, 得到了较好的结果, 因其算法具有智能, 使其对问题具有更高的适应性[7]。
可以将巴斯模型的参数估计简化为这样一个优化问题:1) 数学模型:
N (t ) =F [Θ, t ]
其中:Θ是待估计的模型参数集合, Θ={m , p , q }共有3个参数。
2) 已知一个训练数据集合D ={(N , t ) l=1, 2, l l
…T}, 包含T 个训练数据。理论上应该有:N [Θ, t ]; 而l =F l 实际上对于一个给定的参数集合, 按照模型仅仅能给出一个
′对已知数据的逼近N [Θ, t ]。则问题转化为如何在给定l =F l
图2 巴斯模型的应用流程
数据的基础上, 找到一个参数集合的最优估计, 使得数据逼近的误差最小, 即:
Θ
*
6 几种巴斯模型参数估计方法的比较研究
本文以中国移动通信技术的扩散为例, 采用最小二乘法、遗传算法和蚁群算法作为巴斯模型的参数估计方法进行比较研究。巴斯模型有一个重要假设条件是新产品上市以后, 每人只购买一个单位的产品, 并且只购买一次, 不考虑重复购买。在本研究中, 可以将中国移动通信用户数视为移动通信技术的采用量, 以用户数的变化来反映技术扩散的趋势。
6. 1 模型数据的选取
我国移动通信产业发展很快, 截至2007年6月30日, 我国的移动通信用户数已经达到5. 165亿户, 是目前世界拥有移动用户最多的国家。这为3G 标准培育了巨大的市场, 因此人们对中国即将推出的3G 非常关注。从现有的中国移动通信技术的扩散情况, 预测和分析未来的扩散趋势, 显得非常重要。从中国国家信息产业部的网站统计数据和《中国统计年鉴》可获得从1987-2007年的移动用户历年的累积数。根据巴斯模型对起始点的界定, 模型起始点的值要大于p *m。如果参考国外移动用户的普及率, 占全国人口总数的60%为最大市场潜力(m ) 的参考值, 按13亿人口计算, m 值为7. 8亿。中国是发展中国家, 创新系数值(P ) 都较低, 参考相关产品的经验数据(张彬等, 2002) (互联网用户扩散创新系数) P 值在万分位上, 即取P =0. 0001, 这样计算的p m 值为7. 8万户。论文采取模型数据从1992年开始见表1。
=ar g m i n {
∑ N -N }
l
′
l
算法如下:1) 初始化:
根据参数的可能取值范围, 随即初始化A 只蚂蚁, 最大迭代次数K 。
对每只蚂蚁a :取一组参数Θa , 初始位置(N i r ) , 0, t 0, d 有:N [Θa , t 这里的d i r 为移动方向, d i r =1表示向前0=F 0]; 移动, d i r=0表示向后移动。
2) 开始一轮新的蚁群移动, 对每一只蚂蚁:
2. 1) 每只蚂蚁按照它所对应的函数曲线移动N =F [Θa , t ];
2. 2) 移动的方式为:按照当前的方向d i r 移动一步, 到达曲线头或尾后, 改变方向d i r ;
2. 3) 计算蚂蚁当前位置与最近邻的已知数据的距离d ; 2. 4) 每只蚂蚁按照:距离d , 当前位置信息素浓度, 移动惯性等因素决定本次移动的步长和信息素释放强度;
2. 5) 在移动路径上释放信息素;
2. 6) 采用N e w t o n 梯度下降法, 根据距离d 调整参数Θa
※Θ′; a
2. 7) 所有A 只蚂蚁均移动后, 完成本一轮蚁群移动。3) 进行全局信息素的蒸发, 蒸发策略可采用传统蚁群算法中的信息素蒸发策略。
4) 返回2) , 直到完成K 次蚁群移动。
5) 取所有蚂蚁参数的平均值作为最终结果:Θ*
表1 中国移动用户累计数N (t ) 随时间变化的数据(单位:万户, 取整)
时间t 用户数
1992118
1993264
19943167
19954363
19965685
199761323
199872386
199984330
200098453
200110
200211
200312
200413
200514
200615
[***********][1**********]8
6. 2 模型参数取值范围的确定
根据式(2) , 本文模型需要估计的参数共有3个, 分别为m 、p、q。根据模型定义, m 代表最大市场潜力、p代表创新系数、q代表模仿系数。按照上面的分析, m 可由经验取值为7. 8亿。p 、q的取值范围, 按照巴斯模型的定义为0与1之间。
蚁群算法本身几个特有的经验参数的取值为:训练数据(已知数据点) 个数T =15, 蚂蚁个数A=150, 蚂蚁移动次数K =180, 信息素遗留量和蒸发量的计算与经典蚁群算法中相同。
6. 3 参数估计方法及计算工具
本文将分别采用最小二乘法、遗传算法、蚁群算法对巴斯模型的参数进行估计, 以对三种方法的效果进行比较。
最小二乘法、遗传算法计算工具选择的是M a t l a b 平台, 蚁群算法由于是比较新的算法, 目前M a t l a b 上还没有相应的软件包供使用, 因此选择V C++作为开发工具编写估计程序, 对模型参数进行估计。为更直观地对上述三种参数估计方法的结果进行比较, 本文将输出结果统一为m 、p、q的最优取值组合以及该组合对应的用于比较拟合效果的残差d e t a 。还将蚁群算法的计算结果输入M a t l a b , 与最小二乘法、遗传算法的计算结果一起绘图进行比较。
这样, 运用蚁群算法进行参数估计的已知条件为表2和表3所示。
表2 模型参数的取值范围
序号123
模型参数最大潜力m 创新系数p 模仿系数q
范围界定78000万0-10-1
6. 4 结果讨论
各种算法估计的参数结果如表4所示, 三种算法对移动通信用户数的模型计算值见表5, 图3为实际值与各种算法计算值的对比曲线, 表6为三种算法对今后一段时间移动通信用户发展的预测。
表3 蚁群算法的经验参数取值
序号123
蚁群算法的经验参数训练数据个数T 蚂蚁个数A 蚂蚁移动次数K
参数值15150180
表4 蚁群算法、遗传算法、最小二乘法
进行参数估计的输出结果比较
序号1234
模型参数最大潜力m 创新系数p 模仿系数q 残差d e t a
蚁群算法A C Q 78000万0. 0010. 40518200
遗传算法最小二乘法
G A 78000万0. 0030. 35220564
L S 78000万0. 0060. 27145158
由表4的残差值大小可以明显地发现采用蚁群算法进行参数估计的拟合度最好, 这一点从图3的曲线对比上也能很直观的表现出来, 这表明蚁群算法用于巴斯模型参数估计误差较小, 预测结果可信度高。这是由于最小二乘法等传统优化算法是按梯度方向搜索局部最优解, 而遗传算法是随机搜索全局最优解, 因此遗传算法优于传统优化算法。而蚁群算法是一种人工智能算法, 可以克服遗传算法随机选择的盲目性, 从而提高算法的性能。因此从参数估计的角度看, 蚁群算法的效果最好。
表5 三种算法的巴斯模型计算值(单位:万户, 取整)
时间t 用户数L S G A A C O
[**************]4
[**************]35
[***********]5
[***********]80
[***********]40
[***********]710
199872386
199984330
200098453
[***********]14212850
[***********]06917906
[***********]89024179
[***********]41931473
[***********]32639342
[***********]19547173
[***********]4122
[1**********]45
8984
表6 三种算法对未来几年移动用户数的预测值(单位:万户, 取整)
时间t L S G A A C O
[***********]364
[***********]497
[***********]405
[***********]138
[***********]867
[***********]807
参考文献:
[1] MB a s s F r a n k .An e wp r o d u c t g r o w t hm o d e l f o r c o n s u m e r d u r a b l e
[J ]. M a n a g e m e n t S c i e n c e , 1969, 15:215-227.
[2] 盛亚. 技术创新扩散与新产品营销[M ]. 北京:中国发展出版
社, 2002. 106-111.
[3] Ra j k u m a r V e n k a t e s a n , VK u m a r . Ag e n e t i c a l g o r i t h m s a p pr o a c ht o
g r o w t hp h a s e f o r e c a s t i n go f w i r e l e s s s u b s c r i b e r s [J ].I n t e r n a t i o n a l J o u r n a l o f F o r e c a s t i n g , 2002, 18:625-646.
[4] 杨敬辉.B a s s 模型及其两种扩展型的应用研究[D ]. 大连理工
大学, 2005-9. 109-118.
[5] MD o r i g oa n dTS t e z l e . T h e A n t C o l o n yO p t i m i z a t i o nM e t a h e u r i s -t i c :Al g o r i t h m s , A p p l i c a t i o n sa n dA d v a n c e s [J ].F .G l o v e r a n d G .K o c h e n b e r g e r , e d i t o r s , H a n d b o o ko f M e t a h e u r i s t i c s , K l u w e r A c a d e m i c P u b l i s h e r s , 2002.
[6] MDo r i g o a n d NG a m b a r d e l l a . A n t C o l o n i e s f o r t h e T r a v e l i n g S a l e s -m a nP r o b l e m [J ].IE E ET r a n s a t i o n s o nE v o l u t i o n a r y C o m p u t a t i o n , 1997, 1(1) :53-66.
[7] NMe u l e a ua n dMD o r i g o . A n t C o l o n y O p t i m i z a t i o na n dS t o c h a s t i c
G r a d i e n t D e s c e n t [J ], A r t i f i c i a l L i f e , 2002, 8(2) :103-121.
图3 移动用户实际值与三种算法计算值曲线对比
[作者简介]
7 结论
本文以中国移动通信技术的扩散为例, 分别采用最小二乘法、遗传算法和蚁群算法作为巴斯模型的参数估计方法, 通过比较研究, 蚁群算法完全适用于巴斯模型的参数估计, 对于预测处于成长期时的创新扩散趋势比传统的参数估计方法效果更好。预测表明, 我国移动通信产业仍有广阔的发展前景, 未来3G 蕴含的巨大经济利益要求我国企业必须把握这一发展机遇, 使民族标准在激烈的标准竞争中占有一席之地。
孟繁东(1975—) , 男(汉族) , 黑龙江省哈尔滨人,
哈尔滨工业大学讲师, 博士研究生, 主要研究方向:技术经济、产业政策;
何明升(1953—) , 男(汉族) , 黑龙江省哈尔滨人,
博士, 哈尔滨工业大学教授, 博士生导师, 主要研究
方向:技术经济、产业政策。
(上接第208页)
[2] KCCh a n , YS M o o n , PSC h e n g .F a s t f i n g e r p r i n t v e r i f i c a t i o n u -s i n g s u b r e g i o n s o f f i n g e r p r i n t i m a g e s [J ]. I E E ET r a n s a c t i o n s o n C i r -c u i t s a n dS y s t e m s f o r V i d e o T e c h n o l o g y , J a n . 2004, 14, (1) :95-101
[3] Da r i o M a i o , D a v i d e M a l t o n i , D i r e c t g r a y -s c a l e m i n u t i a e d e t e c t i o n
i n f i n g e r p r i n t s [J ].I E E ET r a n s .P a t t e r nA n a l y s i s a n d M a c h i n e I n -t e l l i g e n c e , 1997, 19:27-40.
[4] Xu d o n g J i a n g , We i -Y u nY a u , W e e S e r . D e t e c t i n g t h e f i n g e r p r i n t
m i n u t i a e b ya d a p t i v et r a c i n gt h eg r a y -l e v e l r i d g e [J ].P a t t e r n R e c o g n i t i o n , 2001, 34:999-1013.
[5] An i l J a i n , L i n H o n g , R u u dB o l l e . O n -l i n e f i n g e r p r i n t v e r i f i c a t i o n
[J ].I E E E T r a n s .P a t t e r nA n a l y s i sa n dM a c h i n eI n t e l l i g e n c e , 1997, 19:302-314.
[6] Ar u nR o s s , A n i l J a i n , J a m e s R e i s m a n .Ah y b r i d f i n g e r p r i n t m a t c -h e r [J ].P a t t e r n R e c o g n i t i o n , 2003, 36:1661-1673.
[7] Da r i o M a i o , D a v i d e M a l t o n i .N e u r a l n e t w o r k b a s e dm i n u t i a e f i l t e -r i n g f i n g e r p r i n t s [C ].P r o c . 14t hI n t e r n a t i o n a l C o n f e r e n c eo nP a t -t e r n R e c o g n i t i o n . B r i s b a n e :I E E EC S P r e s s , 1998. 1654-1658
.
[作者简介]
李 夏(1981. 5-) , 男(汉族) , 山东菏泽人, 工学
硕士, 现就读于西北工业大学软件与微电子学院, 主要研究方向为网络技术及人工智能;
武君胜(1962. 2-) , 男(汉族) , 陕西礼泉人, 博士,
教授, 西北工业大学软件与微电子学院院长助理, 主
要研究方向为软件工程与计算机应用系统研发。
第26卷 第1期
文章编号:1006-9348(2009) 01-0296-05
计 算 机 仿 真
2009年1月
几种巴斯模型参数估计方法的比较研究
孟繁东, 何明升
(哈尔滨工业大学, 黑龙江哈尔滨150001)
摘要:在创新扩散的巴斯模型的基础上, 提出了一种新的模型参数估计方法———采用蚁群算法作为巴斯模型参数估计方法。给出了运用蚁群算法思想设计的具体参数估计方法, 并以中国移动通信技术的扩散为例, 应用巴斯模型对其扩散趋势进行了实证研究, 通过对蚁群算法和最小二乘法、遗传算法等传统参数估计方法估计结果的比较分析, 得出结论, 采用蚁群算法作为巴斯模型的参数估计方法效果更好。最后对中国移动通信技术的扩散趋势进行了预测并提出策略建议。关键词:巴斯模型; 参数估计; 蚁群算法; 比较研究中图分类号:F 713 文献标识码:A
C o m p a r i s o na n dR e s e a r c ho f S e v e r a l P a r a m e t e r E s t i m a t i o n
A p p r o a c h e s o f B a s s Mo d e l
———T a k i n gt h e D i f f u s i o n o f M o b i l e C o m m u n i c a t i o nT e c h n o l o g y i n C h i n a a s a nE x a m p l e
M E N GF a n -d o n g , H EM i n g -s h e n g
(H a r b i n I n s t i t u t e o f T e c h n o l o g y , H a r b i n H e i l o n g j i a n g 150001, C h i n a )
A B S T R A C T :T h i s p a p e r g i v e s ad e t a i l e di n t r o d u c t i o no f an e wp a r a m e t e r e s t i m a t i o na p p r o a c ho f B a s s m o d e l c a l l e d A n t C o l o n y O p t i m i z a t i o n (A C O )w h i c h i s b a s e d o n B a s s m o d e l . A s a n e x a m p l e , t h e p r o l i f e r a t i o n o f m o b i l e c o m m u n i -c a t i o nt e c h n o l o g y i nC h i n a w a s u s e d t o d e m o n s t r a t e t h i s a l g o r i t h m .T h e L e a s t S q u a r e s m e t h o d , G e n e t i c A l g o r i t h m s , a n dA C O w e r e a p p l i e dt o t h em o b i l e c o m m u n i c a t i o nt e c h n o l o g yr e s p e c t i v e l ya s t h ep a r a m e t e r e s t i m a t i o na p p r o a c h e s a n dt h e r e s u l t s w e r e t h e na n a l y z e da n dc o m p a r e d .T h r o u g ht h e c o m p a r i s o na n da n a l y s i s o f t h et h r e ea p p r o a c h e s , i t w a s c o n c l u d e d t h a t t h e A C Oi s a b e t t e r a p p r o a c h t o u s e a s t h e p a r a m e t e r e s t i m a t i o n a p p r o a c h o f B a s s m o d e l . K E Y WO R D S :B a s s m o d e l ; P a r a m e t e r e s t i m a t i o n ;A n t c o l o n y o p t i m i z a t i o n ;C o m p a r i s o na n dr e s e a r c h
1 引言
西方经济学者在长期的研究中建立了多个新产品扩散模型用来预测新产品及新技术的扩散。而对这种扩散规律的准确描述, 无论是对管理者或是对市场研究者都是非常重要的。新产品扩散模型以巴斯(1969) 提出的耐用品首次购买模型(简称巴斯模型) 最为著名, 尽管后来的学者在扩散模型的研究上有很多建树, 但是几乎都是以巴斯模型为基础发展而来的, 特别是能用于实证研究的扩散模型更是如此。
本文以一种全局寻优性能更好的算法———蚁群算法, 作为巴斯模型的参数估计方法, 不仅能使模型曲线的拟合效果更好, 而且还能在模型数据不足的情况下, 提供准确的预测, 这对预测尚处在成长期的创新扩散具有非常重要的意义。本文采用蚁群算法对巴斯模型进行参数估计, 对中国移动通
信技术的扩散进行实证研究, 通过采用不同模型参数估计方法与蚁群算法的对比, 证明蚁群算法的优越性, 这是对巴斯模型参数估计方法的重要发展; 同时, 运用巴斯模型对中国移动通信技术的扩散趋势进行实证研究, 无论对于把握创新扩散的一般规律还是对我国移动通信产业以及未来3G 的发展进行指导, 都有重要的理论与现实意义。
2 巴斯模型
在诸多扩散模型中, 巴斯模型及其后来的扩展型是其中最重要的组成部分, 特别是用于实证分析的应用模型, 几乎都是以巴斯模型为基础展开研究的。1969年, 巴斯(F r a n k M .B a s s ) 融合了F o u r t 和Wo o d l o c k 与M a n s f i e l d 提出的两种模式, 并假设新产品的潜在采用者会受到两种传播方式的影响[1]:一是潜在采用者会受到大众媒体的影响, 又称为外部影响(E x t e r n a l I n f l u e n c e ) , 此类的采用者称为创新者(I n n o v a -t o r ) 。二是潜在采用者会受到口头传播的影响, 又称为内部影响(I n t e r n a l I n f l u e n c e ) , 此类的采用者称为模仿者(I m i t a -
基金项目:教育部高等学校博士学科点专项基金资助项目
([1**********])
收稿日期:2007-12-13 修回日期:2007-12-27
t o r ) , 通过对11个耐用品的市场扩散研究, 提出了耐用品的一次购买模型, 简称巴斯模型。其形式为:
f (t )
=p=qF (t )
[1-F (t ) ]
例) ;
F (t ) 为在第t 时间累积采用者占全部采用者的比率; 令m f (t ) =n(t ) , F (0)=0, 其中m 表示潜在的采纳者总数(即市场的最大潜力) , 则累积采纳者人数为N (t ) =mF (t ) , 因此可得巴斯基本模型的累积采用者S 型曲线N (t ) :
-(p +q ) 1-e
N (t ) -(p +q ) 1e
p
往食物所在地的标记。后面的蚂蚁, 会沿着有信息素的路径行走
, 并且信息素越多引诱蚂蚁的能力就越强, 而同时, 信息素会逐渐挥发。通过这一原理, 蚂蚁群能够很快找出通往食物源的最短路程。如图1所示。
(1)
f (t ) 为在第t 时刻采用者的采用速度(非累计采用者比
(2)
图1 蚂蚁寻食路径示意图
巴斯将p 视为创新系数, q 视为模仿系数。
蚂蚁寻食时, 由蚁穴出发, 可沿A C 路径到达食物, 也可
3 巴斯模型的参数估计方法
参数估计方法的选择是扩散模型创建能否成功的关键因素之一。新产品市场扩散模型的参数估计方法大致分为两大类:一类是时不变估计方法, 包括普通最小二乘法(L S ) 、最大似然估计法(M L E ) 和非线性最小二乘法(N L S ) 等; 另一类是时变估计方法, 包括自适应滤波法(A F ) 、层次贝叶斯方法(R B ) 等[2]。
巴斯模型参数估算的准确性是扩散模型创建成功的关键因素之一。不同的参数估计方法, 会使模型拟合结果相差很大, 很多学者都在尝试用不同的方法来提高模型参数估计的准确性, 进而提高模型的预测质量。目前大量统计学以及计算机技术被应用到这个领域。尤其是越来越多的优化算法, 如遗传算法、模拟退火算法等被研究人员所应用。
[3]
R a j k u m a r 提出采用遗传算法(G A ) 进行参数估计, 并与其
沿A B C 路径到达食物, 如果每只蚂蚁寻到食物后沿原路回蚁巢, 并在路上留下信息素, 那么因为A C 路径短, 所以当它们沿A C 返回时, 就在A C 上留下两次信息素。而在相同时间内沿A B C 返回者, 因其路径长, 此时仅回到D 点, 于是A D 一段只留过一次信息素(即其上的信息素浓度比A C 上的浓度低) , 所以这时从蚁穴出来的后续寻食者就会沿浓度大的路径A C 行走。经过一段时间以后, 大多数的蚂蚁都会沿较短的路程进行寻食。学者们就是利用这个原理设计了蚁群算法, 以求解最短路程问题。4. 2 蚁群算法模型
下面以求解n 城市的T S P (旅行商) 问题为背景来说明基本的蚁群算法[6]。
设a 为蚁群中蚂蚁的数量, n 为旅行商要走过的城市数, d (i , j =1, 2, 3, …, n) 为城市i 到j 的距离, b (t ) 为t 时刻i , j i 位于城市i 的蚂蚁个数, 则a=
t ) , τ(t ) 为t 时刻在i j ∑b (
i
i j
i =0n
它参数估计方法进行了比较, 收到了更好的效果。我国学者杨敬辉[4]在其研究中应用遗传算法对巴斯模型的参数进行了估计, 也取得了较好的效果。
连线上残留的信息量, 初始时刻各条路径上的信息量相等, 即τ(t )=c。i j
如果在时间间隔(t , t +1) 中a 个蚂蚁都从当前城市选择下一个城市, 则经过n 个时间间隔, 所有蚂蚁都走完n 个城市, 构成一轮循环。此时, 按如下方法修改个各条路径上的残留信息:
τ(t +n)=ρτi j i j +■τi j
ρ(ρ∈(0, 1) ) 为信息残留系数, 1-ρ表征了从时刻t 到t +n 路径i j 上残留信息的挥发程度。■τ为本次循环流在路i j 径i j 上的信息量。
根据D o r i g o 的A n t -C i r c l e S y s t e m 模型, 式中Q 为常量, L 只蚂蚁在本次循环中所走路径的长度。k 为第k
Q
, 若第k 只蚂蚁在本次循环中途径i j
■τL
k i j
4 蚁群算法
[5]
蚁群算法(A n t C o l o n y O p t i m i z a t i o n ) 是一种新型的具
有全局搜索能力模拟生物的人工智能算法, 1996年由意大利学者M . D o r i g o 等人提出。通过仿生学研究, 蚂蚁在运动过程中, 个体之间通过“信息素”(P h e r o m o n e ) 这种物质进行相关信息的传递, 蚂蚁能在运动过程中感知信息素信息, 并确定运动方向, 因此大量蚂蚁组成的蚁群的集体行为便表现出一种信息的正反馈现象:某路径上走过的蚂蚁越多, 后来者选择该路径的概率越大, 蚁群个体间通过这种信息交流, 协同完成任务。它的优点表现在:具有很强的发现较好解的能力, 并具有很强的并行性和鲁棒性。4. 1 蚁群算法的基本原理
生物学家通过对蚂蚁生活习性的研究发现, 蚁群寻找食物时会派出一些蚂蚁分头在四周游荡, 如果一只蚂蚁找到食物, 它就返回蚁巢中通知同伴并沿途留下信息素作为蚁群前
0, 否
k
P 为t 时刻蚂蚁k (k=1, 2, …, n ) 由城市i 到j 的选择i j
概率,
0, 否
P i j αβ
τ(t ) η(t ) i j i j
Θ*=(Θ1+Θ2+…+ΘA )/A
, 若j ∈S αβτ(t ) η(t ) i s i s
5 巴斯模型的应用方法
技术创新扩散理论的价值在于它能够解释现实的技术创新扩散问题,
巴斯模型已经被大量的产品扩散实例证明为行之有效的扩散模型。巴斯模型可将产品扩散过程中各种复杂的因素以及它们之间的关系, 用三个简单的参数加以控制, 因此可以通过控制产品扩散过程中几个有规律的变量, 对新产品的未来的市场扩散趋势进行把握。巴斯模型的应用流程如图2。
s ∈S
式中, S 为在城市i 蚂蚁k 允许选择的城市,
η(t ) 为t 时刻蚂蚁由城市i 选择城市j 的启发式信息, i j
1
在T S P 问题中, η, α和β分别为残留信息和启发信息i j =d i j 的相对重要程度系数。
4. 3 基于蚁群算法的巴斯模型参数估计算法
根据巴斯模型中对数据点数量、时间段的敏感性, 我们采用具有人工智能的蚁群优化算法, 得到了较好的结果, 因其算法具有智能, 使其对问题具有更高的适应性[7]。
可以将巴斯模型的参数估计简化为这样一个优化问题:1) 数学模型:
N (t ) =F [Θ, t ]
其中:Θ是待估计的模型参数集合, Θ={m , p , q }共有3个参数。
2) 已知一个训练数据集合D ={(N , t ) l=1, 2, l l
…T}, 包含T 个训练数据。理论上应该有:N [Θ, t ]; 而l =F l 实际上对于一个给定的参数集合, 按照模型仅仅能给出一个
′对已知数据的逼近N [Θ, t ]。则问题转化为如何在给定l =F l
图2 巴斯模型的应用流程
数据的基础上, 找到一个参数集合的最优估计, 使得数据逼近的误差最小, 即:
Θ
*
6 几种巴斯模型参数估计方法的比较研究
本文以中国移动通信技术的扩散为例, 采用最小二乘法、遗传算法和蚁群算法作为巴斯模型的参数估计方法进行比较研究。巴斯模型有一个重要假设条件是新产品上市以后, 每人只购买一个单位的产品, 并且只购买一次, 不考虑重复购买。在本研究中, 可以将中国移动通信用户数视为移动通信技术的采用量, 以用户数的变化来反映技术扩散的趋势。
6. 1 模型数据的选取
我国移动通信产业发展很快, 截至2007年6月30日, 我国的移动通信用户数已经达到5. 165亿户, 是目前世界拥有移动用户最多的国家。这为3G 标准培育了巨大的市场, 因此人们对中国即将推出的3G 非常关注。从现有的中国移动通信技术的扩散情况, 预测和分析未来的扩散趋势, 显得非常重要。从中国国家信息产业部的网站统计数据和《中国统计年鉴》可获得从1987-2007年的移动用户历年的累积数。根据巴斯模型对起始点的界定, 模型起始点的值要大于p *m。如果参考国外移动用户的普及率, 占全国人口总数的60%为最大市场潜力(m ) 的参考值, 按13亿人口计算, m 值为7. 8亿。中国是发展中国家, 创新系数值(P ) 都较低, 参考相关产品的经验数据(张彬等, 2002) (互联网用户扩散创新系数) P 值在万分位上, 即取P =0. 0001, 这样计算的p m 值为7. 8万户。论文采取模型数据从1992年开始见表1。
=ar g m i n {
∑ N -N }
l
′
l
算法如下:1) 初始化:
根据参数的可能取值范围, 随即初始化A 只蚂蚁, 最大迭代次数K 。
对每只蚂蚁a :取一组参数Θa , 初始位置(N i r ) , 0, t 0, d 有:N [Θa , t 这里的d i r 为移动方向, d i r =1表示向前0=F 0]; 移动, d i r=0表示向后移动。
2) 开始一轮新的蚁群移动, 对每一只蚂蚁:
2. 1) 每只蚂蚁按照它所对应的函数曲线移动N =F [Θa , t ];
2. 2) 移动的方式为:按照当前的方向d i r 移动一步, 到达曲线头或尾后, 改变方向d i r ;
2. 3) 计算蚂蚁当前位置与最近邻的已知数据的距离d ; 2. 4) 每只蚂蚁按照:距离d , 当前位置信息素浓度, 移动惯性等因素决定本次移动的步长和信息素释放强度;
2. 5) 在移动路径上释放信息素;
2. 6) 采用N e w t o n 梯度下降法, 根据距离d 调整参数Θa
※Θ′; a
2. 7) 所有A 只蚂蚁均移动后, 完成本一轮蚁群移动。3) 进行全局信息素的蒸发, 蒸发策略可采用传统蚁群算法中的信息素蒸发策略。
4) 返回2) , 直到完成K 次蚁群移动。
5) 取所有蚂蚁参数的平均值作为最终结果:Θ*
表1 中国移动用户累计数N (t ) 随时间变化的数据(单位:万户, 取整)
时间t 用户数
1992118
1993264
19943167
19954363
19965685
199761323
199872386
199984330
200098453
200110
200211
200312
200413
200514
200615
[***********][1**********]8
6. 2 模型参数取值范围的确定
根据式(2) , 本文模型需要估计的参数共有3个, 分别为m 、p、q。根据模型定义, m 代表最大市场潜力、p代表创新系数、q代表模仿系数。按照上面的分析, m 可由经验取值为7. 8亿。p 、q的取值范围, 按照巴斯模型的定义为0与1之间。
蚁群算法本身几个特有的经验参数的取值为:训练数据(已知数据点) 个数T =15, 蚂蚁个数A=150, 蚂蚁移动次数K =180, 信息素遗留量和蒸发量的计算与经典蚁群算法中相同。
6. 3 参数估计方法及计算工具
本文将分别采用最小二乘法、遗传算法、蚁群算法对巴斯模型的参数进行估计, 以对三种方法的效果进行比较。
最小二乘法、遗传算法计算工具选择的是M a t l a b 平台, 蚁群算法由于是比较新的算法, 目前M a t l a b 上还没有相应的软件包供使用, 因此选择V C++作为开发工具编写估计程序, 对模型参数进行估计。为更直观地对上述三种参数估计方法的结果进行比较, 本文将输出结果统一为m 、p、q的最优取值组合以及该组合对应的用于比较拟合效果的残差d e t a 。还将蚁群算法的计算结果输入M a t l a b , 与最小二乘法、遗传算法的计算结果一起绘图进行比较。
这样, 运用蚁群算法进行参数估计的已知条件为表2和表3所示。
表2 模型参数的取值范围
序号123
模型参数最大潜力m 创新系数p 模仿系数q
范围界定78000万0-10-1
6. 4 结果讨论
各种算法估计的参数结果如表4所示, 三种算法对移动通信用户数的模型计算值见表5, 图3为实际值与各种算法计算值的对比曲线, 表6为三种算法对今后一段时间移动通信用户发展的预测。
表3 蚁群算法的经验参数取值
序号123
蚁群算法的经验参数训练数据个数T 蚂蚁个数A 蚂蚁移动次数K
参数值15150180
表4 蚁群算法、遗传算法、最小二乘法
进行参数估计的输出结果比较
序号1234
模型参数最大潜力m 创新系数p 模仿系数q 残差d e t a
蚁群算法A C Q 78000万0. 0010. 40518200
遗传算法最小二乘法
G A 78000万0. 0030. 35220564
L S 78000万0. 0060. 27145158
由表4的残差值大小可以明显地发现采用蚁群算法进行参数估计的拟合度最好, 这一点从图3的曲线对比上也能很直观的表现出来, 这表明蚁群算法用于巴斯模型参数估计误差较小, 预测结果可信度高。这是由于最小二乘法等传统优化算法是按梯度方向搜索局部最优解, 而遗传算法是随机搜索全局最优解, 因此遗传算法优于传统优化算法。而蚁群算法是一种人工智能算法, 可以克服遗传算法随机选择的盲目性, 从而提高算法的性能。因此从参数估计的角度看, 蚁群算法的效果最好。
表5 三种算法的巴斯模型计算值(单位:万户, 取整)
时间t 用户数L S G A A C O
[**************]4
[**************]35
[***********]5
[***********]80
[***********]40
[***********]710
199872386
199984330
200098453
[***********]14212850
[***********]06917906
[***********]89024179
[***********]41931473
[***********]32639342
[***********]19547173
[***********]4122
[1**********]45
8984
表6 三种算法对未来几年移动用户数的预测值(单位:万户, 取整)
时间t L S G A A C O
[***********]364
[***********]497
[***********]405
[***********]138
[***********]867
[***********]807
参考文献:
[1] MB a s s F r a n k .An e wp r o d u c t g r o w t hm o d e l f o r c o n s u m e r d u r a b l e
[J ]. M a n a g e m e n t S c i e n c e , 1969, 15:215-227.
[2] 盛亚. 技术创新扩散与新产品营销[M ]. 北京:中国发展出版
社, 2002. 106-111.
[3] Ra j k u m a r V e n k a t e s a n , VK u m a r . Ag e n e t i c a l g o r i t h m s a p pr o a c ht o
g r o w t hp h a s e f o r e c a s t i n go f w i r e l e s s s u b s c r i b e r s [J ].I n t e r n a t i o n a l J o u r n a l o f F o r e c a s t i n g , 2002, 18:625-646.
[4] 杨敬辉.B a s s 模型及其两种扩展型的应用研究[D ]. 大连理工
大学, 2005-9. 109-118.
[5] MD o r i g oa n dTS t e z l e . T h e A n t C o l o n yO p t i m i z a t i o nM e t a h e u r i s -t i c :Al g o r i t h m s , A p p l i c a t i o n sa n dA d v a n c e s [J ].F .G l o v e r a n d G .K o c h e n b e r g e r , e d i t o r s , H a n d b o o ko f M e t a h e u r i s t i c s , K l u w e r A c a d e m i c P u b l i s h e r s , 2002.
[6] MDo r i g o a n d NG a m b a r d e l l a . A n t C o l o n i e s f o r t h e T r a v e l i n g S a l e s -m a nP r o b l e m [J ].IE E ET r a n s a t i o n s o nE v o l u t i o n a r y C o m p u t a t i o n , 1997, 1(1) :53-66.
[7] NMe u l e a ua n dMD o r i g o . A n t C o l o n y O p t i m i z a t i o na n dS t o c h a s t i c
G r a d i e n t D e s c e n t [J ], A r t i f i c i a l L i f e , 2002, 8(2) :103-121.
图3 移动用户实际值与三种算法计算值曲线对比
[作者简介]
7 结论
本文以中国移动通信技术的扩散为例, 分别采用最小二乘法、遗传算法和蚁群算法作为巴斯模型的参数估计方法, 通过比较研究, 蚁群算法完全适用于巴斯模型的参数估计, 对于预测处于成长期时的创新扩散趋势比传统的参数估计方法效果更好。预测表明, 我国移动通信产业仍有广阔的发展前景, 未来3G 蕴含的巨大经济利益要求我国企业必须把握这一发展机遇, 使民族标准在激烈的标准竞争中占有一席之地。
孟繁东(1975—) , 男(汉族) , 黑龙江省哈尔滨人,
哈尔滨工业大学讲师, 博士研究生, 主要研究方向:技术经济、产业政策;
何明升(1953—) , 男(汉族) , 黑龙江省哈尔滨人,
博士, 哈尔滨工业大学教授, 博士生导师, 主要研究
方向:技术经济、产业政策。
(上接第208页)
[2] KCCh a n , YS M o o n , PSC h e n g .F a s t f i n g e r p r i n t v e r i f i c a t i o n u -s i n g s u b r e g i o n s o f f i n g e r p r i n t i m a g e s [J ]. I E E ET r a n s a c t i o n s o n C i r -c u i t s a n dS y s t e m s f o r V i d e o T e c h n o l o g y , J a n . 2004, 14, (1) :95-101
[3] Da r i o M a i o , D a v i d e M a l t o n i , D i r e c t g r a y -s c a l e m i n u t i a e d e t e c t i o n
i n f i n g e r p r i n t s [J ].I E E ET r a n s .P a t t e r nA n a l y s i s a n d M a c h i n e I n -t e l l i g e n c e , 1997, 19:27-40.
[4] Xu d o n g J i a n g , We i -Y u nY a u , W e e S e r . D e t e c t i n g t h e f i n g e r p r i n t
m i n u t i a e b ya d a p t i v et r a c i n gt h eg r a y -l e v e l r i d g e [J ].P a t t e r n R e c o g n i t i o n , 2001, 34:999-1013.
[5] An i l J a i n , L i n H o n g , R u u dB o l l e . O n -l i n e f i n g e r p r i n t v e r i f i c a t i o n
[J ].I E E E T r a n s .P a t t e r nA n a l y s i sa n dM a c h i n eI n t e l l i g e n c e , 1997, 19:302-314.
[6] Ar u nR o s s , A n i l J a i n , J a m e s R e i s m a n .Ah y b r i d f i n g e r p r i n t m a t c -h e r [J ].P a t t e r n R e c o g n i t i o n , 2003, 36:1661-1673.
[7] Da r i o M a i o , D a v i d e M a l t o n i .N e u r a l n e t w o r k b a s e dm i n u t i a e f i l t e -r i n g f i n g e r p r i n t s [C ].P r o c . 14t hI n t e r n a t i o n a l C o n f e r e n c eo nP a t -t e r n R e c o g n i t i o n . B r i s b a n e :I E E EC S P r e s s , 1998. 1654-1658
.
[作者简介]
李 夏(1981. 5-) , 男(汉族) , 山东菏泽人, 工学
硕士, 现就读于西北工业大学软件与微电子学院, 主要研究方向为网络技术及人工智能;
武君胜(1962. 2-) , 男(汉族) , 陕西礼泉人, 博士,
教授, 西北工业大学软件与微电子学院院长助理, 主
要研究方向为软件工程与计算机应用系统研发。