对“狼来了”问题概率模型构建的探讨
摘要:书中对小孩信任问题的数模构建采用了贝叶斯概率模型。这个模型对于解释小孩信誉下降已经起到了很直观的作用,但是这个模型本身比较简单,难以进行更多的推广。就信誉问题而言,主要问题是考虑因素过于单一,没有考虑到其他因素对信誉的影响。本文借助计算机信息技术中的信任模型,利用借鉴和类比的方式给出对于“狼来了”问题的另一种模型构建。
关键词:信任模型
多因素影响
引言:问题介绍(略)
本文参考了信息技术中的信任模型。信任模型是PKI原理中的一个重要概念,指建立信任关系和验证证书时寻找和遍历信任路径的模型。PKI(Public Key Infrastructure )即“公开密钥体系”,是一种遵循既定标准的密钥管理平台。他能够为所有网络应用提供加密和数字签名等密码服务及所必需的密钥和证书管理体系,简单来说,PKI就是利用公钥理论和技术建立的提供安全服务的基础设施。信息技术中对于解决这个问题及衍生问题,提出了很多信任模型,因此对于解决“狼来了”问题有借鉴之处,相同的理论可以直接引用。
在“狼来了”问题中,对小孩信誉评价仅仅有以前对同一件事情的信誉记录这一个指标,现实生活中这肯定是不够的。因此要加入一些影响因素,例如小孩平时在其他事情上的信誉记录、其他人对小孩的感情或说信誉印象等等。
借助文献1中模型,将信任分为三方面:主观信任、直接信任和推荐信任。
信任实体和被信任实体之间的信任关系首先决定于信任实体的主观观察,按照信任实体的意图、状态、行为等因素对被信任实体的属性进行评估,得到主观信任;另外,只有通过观察得到的信任是不够的,因为它仅仅是一个主观的评价,信任值不够精确,因此需要通过与被信任实体之间以往的交互经历来决定,即直接信任。信任实体利用交互时间,被信任实体的历史行为、当前行为等信息进行信任的动态评估形成直接信任值;如果信任实体与被信任实体之间交互少甚至没有交互,不足以形成直接信任,那么就需要中问实体的信任传递。所以,信任关系也依赖于第三方的信息,通过第三方的推荐建立信任关系和获取推荐的信任值,也就是说信任实体对一个陌生被信任实体的信任建立在多个已经信任的被信任实体之上。(引自文献1)
在“狼来了”问题中做出直观解释如下:
主观信任就是当小孩告诉大家狼来了时,大家根据他当时的状态(比如气喘吁吁的样子,很害怕紧张的状态等等)对他得出的一个信任值,这个信任值可能是不准确的,因为小孩可以假装很害怕等等。
直接信任是根据大家平时和小孩的接触有关的,比如有的人以前被他骗过,这次就不大愿意相信他,直接信任值较低;但假如是他的父母,即便知道他可能会撒谎,但是遇到可能事关孩子安全的问题,还是会选择相信。
推荐信任适用于那些与小孩不太熟的人,也没有什么接触,所以要按照他人对小孩的评价选择是否信任。假如别人告诉他小孩经常撒谎,那么推荐信任值较低;假如别人都说他很诚实,那么推荐信任值较高。
因此最终的信任值由实体的主观信任、直接信任和推荐信任决定,用公式表示如下: T=aT1+bT2+cT3 。其中:T1表示主观信任;T2表示直接信任值;T3表示推荐信任值;a,b,c分别表示这三种信任的重要程度,即权值,a+b+c =1,它依赖于具体问题中的具体情况,比如
如果大家更相信自己对小孩的直接经验,那么就选择较大直接信任值权值;如果大家是第一次和小孩接触,那么权值的取值尽可能参考推荐信任值。
利用这种模型再次设计计算狼来了问题。假设这个村子除了小孩共有100个人,信任值设每人满分为10,则总信任值应为1000,利用频率方法计算信任概率。
100人中分4类:1、他的家人好友等关系紧密的人,这些人再两次受骗后仍会选择相信他。按照定义,信任值主要来自于前两者,设T1=8、T2=10、T3=8、a=0.3、b=0.6、c=0.1,共10人;
2、和他不认识的人,则主要决定于最后一个,设T1=8、T2=0、T3=8、a=0.3、b=0、c=0.7,共20人;
3、平时和他接触过反应良好的人,设T1=8、T2=10、T3=8、a=0.3、b=0.6、c=0.1,共20人;
4、平时和他接触过反应不好的人,设T1=8、T2=0、T3=6、a=0.3、b=0.6、c=0.1,共50人; (说明:每类人对他的总信任值不到10,说明总有怀疑的因素;考虑到小孩两次撒谎,接触不好的人设置比反应良好的人多;以上数据只是自己根据实际情况大概设的,为了检验自己的模型,无须细究)
则可计算得小孩第一次说狼来了后大家对他的总信任值T=92+160+184+150=586,则对他的信任概率为P=586/1000=0.586
这可以看出撒谎一次后大家总体上对他的信任还是比较高的,与书上结论很不同。直观上可以认为有很多和他关系好的人和平时对他感觉还不错的人一直比较相信他,而一些不认识他的人在面对这样的问题时也会选择相信他,个人觉得这是比较符合生活实际的。
当小孩第二次说谎时,设在a、b、c权重比不变的情况下大家对他的信任值均有降低,具体的降低值应根据实际情况决定,在此为了简单分析起见,设大家的T1、T2、T3均降低了3,
这样得到第二次说谎后大家对他的信任值T=62+100+124+90=376,则信任概率
P=376/1000=0.376
前后比较发现模型对开始的分析比较合理,之后可能不如实际情况合理,造成这样的原因主要是在假设模型中具体数据的变化较小,假如实际情况中可以给出数据的详细变化,或许会更贴近真实情况。
这个模型的一个问题就是在解决“狼来了”问题时无法给出较为准确合理的权重比、信任值及其在发展之后的变化,但是这个模型考虑了更多实际情况中更合理的存在情况,较之贝叶斯模型更符合实际。利用频率计算的方式给出的概率模型,在解决其他一些容易给出信任值、权重比量化的实际问题时可能具有更大优势。
最后是自己的体会,第一次做数学上的大作业,开始毫无头绪,看了一点东西后有了一
些自己的想法,这时很容易受到书中给出答案的影响造成思维定势,因此借鉴其他理论中的概念和模型方法给出了一个全新的模型。在这个模型构建计算过程中我发现这个模型最麻烦的就是给出合理的数据,而且如果实际情况越复杂,分类越多,这个工作量就越大越麻烦。从这个角度说,对于“狼来了”这样的问题,在没有实际应用意义的情况下,利用贝叶斯模型做一个简单的定性分析就足够了。当然在我设计模型的过程中对这种数学的问题也有了更多的思考,还是非常有益的。
参考文献:
1、《基于概率和可信度方法的普适计算信任模型》 孙凌,辛艳,罗长远
2、《基于多影响因素的网上信任模型》
版)2006年第46卷第s1期
张巍,刘鲁,朱艳春清华大学学报(自然科学
对“狼来了”问题概率模型构建的探讨
摘要:书中对小孩信任问题的数模构建采用了贝叶斯概率模型。这个模型对于解释小孩信誉下降已经起到了很直观的作用,但是这个模型本身比较简单,难以进行更多的推广。就信誉问题而言,主要问题是考虑因素过于单一,没有考虑到其他因素对信誉的影响。本文借助计算机信息技术中的信任模型,利用借鉴和类比的方式给出对于“狼来了”问题的另一种模型构建。
关键词:信任模型
多因素影响
引言:问题介绍(略)
本文参考了信息技术中的信任模型。信任模型是PKI原理中的一个重要概念,指建立信任关系和验证证书时寻找和遍历信任路径的模型。PKI(Public Key Infrastructure )即“公开密钥体系”,是一种遵循既定标准的密钥管理平台。他能够为所有网络应用提供加密和数字签名等密码服务及所必需的密钥和证书管理体系,简单来说,PKI就是利用公钥理论和技术建立的提供安全服务的基础设施。信息技术中对于解决这个问题及衍生问题,提出了很多信任模型,因此对于解决“狼来了”问题有借鉴之处,相同的理论可以直接引用。
在“狼来了”问题中,对小孩信誉评价仅仅有以前对同一件事情的信誉记录这一个指标,现实生活中这肯定是不够的。因此要加入一些影响因素,例如小孩平时在其他事情上的信誉记录、其他人对小孩的感情或说信誉印象等等。
借助文献1中模型,将信任分为三方面:主观信任、直接信任和推荐信任。
信任实体和被信任实体之间的信任关系首先决定于信任实体的主观观察,按照信任实体的意图、状态、行为等因素对被信任实体的属性进行评估,得到主观信任;另外,只有通过观察得到的信任是不够的,因为它仅仅是一个主观的评价,信任值不够精确,因此需要通过与被信任实体之间以往的交互经历来决定,即直接信任。信任实体利用交互时间,被信任实体的历史行为、当前行为等信息进行信任的动态评估形成直接信任值;如果信任实体与被信任实体之间交互少甚至没有交互,不足以形成直接信任,那么就需要中问实体的信任传递。所以,信任关系也依赖于第三方的信息,通过第三方的推荐建立信任关系和获取推荐的信任值,也就是说信任实体对一个陌生被信任实体的信任建立在多个已经信任的被信任实体之上。(引自文献1)
在“狼来了”问题中做出直观解释如下:
主观信任就是当小孩告诉大家狼来了时,大家根据他当时的状态(比如气喘吁吁的样子,很害怕紧张的状态等等)对他得出的一个信任值,这个信任值可能是不准确的,因为小孩可以假装很害怕等等。
直接信任是根据大家平时和小孩的接触有关的,比如有的人以前被他骗过,这次就不大愿意相信他,直接信任值较低;但假如是他的父母,即便知道他可能会撒谎,但是遇到可能事关孩子安全的问题,还是会选择相信。
推荐信任适用于那些与小孩不太熟的人,也没有什么接触,所以要按照他人对小孩的评价选择是否信任。假如别人告诉他小孩经常撒谎,那么推荐信任值较低;假如别人都说他很诚实,那么推荐信任值较高。
因此最终的信任值由实体的主观信任、直接信任和推荐信任决定,用公式表示如下: T=aT1+bT2+cT3 。其中:T1表示主观信任;T2表示直接信任值;T3表示推荐信任值;a,b,c分别表示这三种信任的重要程度,即权值,a+b+c =1,它依赖于具体问题中的具体情况,比如
如果大家更相信自己对小孩的直接经验,那么就选择较大直接信任值权值;如果大家是第一次和小孩接触,那么权值的取值尽可能参考推荐信任值。
利用这种模型再次设计计算狼来了问题。假设这个村子除了小孩共有100个人,信任值设每人满分为10,则总信任值应为1000,利用频率方法计算信任概率。
100人中分4类:1、他的家人好友等关系紧密的人,这些人再两次受骗后仍会选择相信他。按照定义,信任值主要来自于前两者,设T1=8、T2=10、T3=8、a=0.3、b=0.6、c=0.1,共10人;
2、和他不认识的人,则主要决定于最后一个,设T1=8、T2=0、T3=8、a=0.3、b=0、c=0.7,共20人;
3、平时和他接触过反应良好的人,设T1=8、T2=10、T3=8、a=0.3、b=0.6、c=0.1,共20人;
4、平时和他接触过反应不好的人,设T1=8、T2=0、T3=6、a=0.3、b=0.6、c=0.1,共50人; (说明:每类人对他的总信任值不到10,说明总有怀疑的因素;考虑到小孩两次撒谎,接触不好的人设置比反应良好的人多;以上数据只是自己根据实际情况大概设的,为了检验自己的模型,无须细究)
则可计算得小孩第一次说狼来了后大家对他的总信任值T=92+160+184+150=586,则对他的信任概率为P=586/1000=0.586
这可以看出撒谎一次后大家总体上对他的信任还是比较高的,与书上结论很不同。直观上可以认为有很多和他关系好的人和平时对他感觉还不错的人一直比较相信他,而一些不认识他的人在面对这样的问题时也会选择相信他,个人觉得这是比较符合生活实际的。
当小孩第二次说谎时,设在a、b、c权重比不变的情况下大家对他的信任值均有降低,具体的降低值应根据实际情况决定,在此为了简单分析起见,设大家的T1、T2、T3均降低了3,
这样得到第二次说谎后大家对他的信任值T=62+100+124+90=376,则信任概率
P=376/1000=0.376
前后比较发现模型对开始的分析比较合理,之后可能不如实际情况合理,造成这样的原因主要是在假设模型中具体数据的变化较小,假如实际情况中可以给出数据的详细变化,或许会更贴近真实情况。
这个模型的一个问题就是在解决“狼来了”问题时无法给出较为准确合理的权重比、信任值及其在发展之后的变化,但是这个模型考虑了更多实际情况中更合理的存在情况,较之贝叶斯模型更符合实际。利用频率计算的方式给出的概率模型,在解决其他一些容易给出信任值、权重比量化的实际问题时可能具有更大优势。
最后是自己的体会,第一次做数学上的大作业,开始毫无头绪,看了一点东西后有了一
些自己的想法,这时很容易受到书中给出答案的影响造成思维定势,因此借鉴其他理论中的概念和模型方法给出了一个全新的模型。在这个模型构建计算过程中我发现这个模型最麻烦的就是给出合理的数据,而且如果实际情况越复杂,分类越多,这个工作量就越大越麻烦。从这个角度说,对于“狼来了”这样的问题,在没有实际应用意义的情况下,利用贝叶斯模型做一个简单的定性分析就足够了。当然在我设计模型的过程中对这种数学的问题也有了更多的思考,还是非常有益的。
参考文献:
1、《基于概率和可信度方法的普适计算信任模型》 孙凌,辛艳,罗长远
2、《基于多影响因素的网上信任模型》
版)2006年第46卷第s1期
张巍,刘鲁,朱艳春清华大学学报(自然科学