互联网金融大数据垂直搜索
一、互联网的大数据正深刻地影响着银行的未来。
以银行为代表的金融企业和以电商企业为代表的互联网企业,正在掀起金融互联网化和互联网金融化新的热浪。
互联网触“金”可追溯到2003年,支付宝最初作为淘宝网一个解决网上支付信任问题的方案,创造性地采取了“担保交易”模式,解决了早期网购双方互不信任的难题。随后,P2P贷款平台和网络信贷机构也风生水起,颇成气候。
此后,阿里巴巴发布的“余额宝”, 新浪发布的“微银行”, 腾讯发布的微信5.0与“财付通”的打通等更是密集登场,互联网巨头们抢滩金融市场,可谓动作频频。
而传统金融机构也在积极“触网”。 国泰君安、中信证券在内的五家券商近日已向证监会上报互联网金融创新方案。近期,30多家基金公司的淘宝直营店也将陆续开业,各大银行、保险公司纷纷成立电子互联网金融平台;保监会首次批准设立纯互联网保险公司;中投副总经理谢平将互联网金融发展归纳为六大模式,它们是:第三方支付、P2P贷款模式、供应链金融、众筹模式、互联网整合销售金融产品、互联网货币。
金融与互联网之所以能够握手联姻,在于它们的诸多相通之处。谢平分析,“首先所有的金融都只是数据,不需要任何物流的支持。所有的金融产品都是各种数据的组合,这些数据在网上实现数量匹
配、期限匹配和风险定价,再加上网上支付就形成了互联网金融的核心。”
二、市场潜力大,创新尺度大
记者在8月13日的互联网大会上发现,“金融人”很亢奋。无疑,这些传统领域从业者正从互联网中感觉到了颠覆性的力量。马云[微博]已成为互联网金融标杆性人物,阿里金融已经成为一个“搅局者”。
互联网金融的优势在于惠及大量无法从银行贷款的中小企业和个人。过去几个月,P2P贷款疯长,电商小额贷款业务快速铺开。支付宝旗下一个名为余额宝的小产品,上线18天累积用户数就超过250万,存量转入资金规模达到57亿元。
目前,第三方银行支付牌照已经发放了250多个,其中真正从事互联网支付的企业有97家,另有150多家预付卡公司。互联网支付企业的支付总量约达6万亿,占到整个支付总量的0.5%。虽然从金额上看占比很小,但是从交易笔数上看,互联网支付的交易指令已经占到整体的40%,互联网支付表现出单笔量很小,但是呈现海量长尾的特征。
SOHU董事局主席张朝阳关心的是“微支付”的问题,“如果这个能解决的话,微电影、游戏等娱乐的爆炸将来到。”因此,如何让移动支付更便捷值得思考,因为移动支付屏幕非常小,此前在PC端的那种快捷支付模式并不适用于移动端。所以,解决背后的风险问题,让
支付更便捷,将会让支付规模扩大十倍。
互联网金融的创新尺度不可谓不大。“P2P贷款”的核心,是利用互联网几亿人之间的信息不对称,让他们相互对接,把信息的不对称减少到无穷小。例如人人贷等公司,利用信息的不对称,在俱乐部成员之间互相借贷;“阿里小贷模式”和传统银行的做法则完全不同,是一种自动放贷机制。例如淘宝商户所有的行为构成了本身风险的定价,然后阿里小贷根据风险定价,给它授信额度,可以随时贷款、随时还息。最终形成一个动态的风险定价过程;而“众筹融资”比创投、天使投资又大大前进了一步,全世界只有美国正式通过法律规定,小企业可以通过这种方式获得股权融资;“余额宝模式” 把货币市场基金具有货币的功能和网络支付结合在一起,突破了时间和空间的界限,这是一般的物理网点做不到的;而“互联网货币”挑战的不只是商业银行、证券公司,将来可能对央行构成巨大挑战。
有创业者认为,在互联网金融里没有任何的政策、资金或人才的障碍,最大的障碍是基因。
三、监管风险待解
互联网金融在一些领域呈现野蛮发展的特点,相对于传统金融,它没有传统金融的规则,未来的监管不确定性成为这个行业的最大风险。部分P2P的平台内部已经出现了道德问题,“注意操作和信用风险”拉响了警报。
中国人民银行副行长刘士余表示,“互联网金融无论怎么做,有两个底线是不能碰的,一是非法吸收公共存款,二是非法集资。我最担心有部分P2P贷款平台脱离了网络平台便成为所谓的线下,脱离平台的操作功能之后,会演变成资金池,成为影子银行。希望大家能在不违法的底线下寻找空间。”
中央财经大学教授黄震表示,“目前有四种说法。第一,不需要监管;第二,可以先发展,再监管;第三,创新协同监管;第四,尽快立法,设立新机构,进行专门监管。”网上调查显示,有80%的人认同第二种做法,也有人希望尽快立法。商务部电子商务和信息化司司长聂林海透露,互联网金融相关法律仍在制定阶段,商务部正加大研究力度。
在互联网金融峰会上,中国工商银行等25家单位发出中国互联网金融行业自律813倡议:“第一,自觉遵守法律法规,合法合规是生命。第二,自觉维护金融稳定,国家利益是根本。第三,自觉防范管控风险,公共利益是底线。第四,自觉接受社会监督,客户利益是中心。第五,自觉抵制恶性竞争,行业利益是关键。”
四、垂直搜索,可以燎原
1、信息检索
2、搜索技术的趋势
个性化、社区化、智能化、精准化、垂直化
3、垂直跨媒体搜索技术
以深度发掘为主要特点的垂直搜索技术我国与国际处于同一起跑线上,是我国实现在搜索领域实现跨越式发展的契机
—我国在垂直搜索引擎市场占有率超过50%
—我国在机器翻译以及跨媒体搜索方面已有很好的基础,技术与国际处于同一起跑线上
—垂直和跨媒体搜索引擎具有良好的商业盈利模式
4、垂直搜索完全相对立的业内评论
1) 肯定者
① “渐成主流需求”
② “是重大机遇”
③ “已成为搜索市场的第三极”
2) 否定者
① “不靠谱”
② “是忽悠人的伪概念”
③ “是注定被扼杀的幼苗”
5、什么是垂直搜索
垂直搜索
针对某一特定领域或对象,面向特定需求提供的信息搜索服务
6、一个号的垂直搜索引擎应该具备7个特征
1) 面向特定领域或对象、
选择领域、选择的原则
① 这个行业要有垂直搜索的大量需求
② 息来源相对集中,避免采集全网,降低采集成本
③ 不分领域的人物搜索、图片搜索就要抓全网
④ 信息处理量要足够大,太小了可以被人工代替
⑤ 根据自己的情况选择专业深度
⑥ 生活:几乎不存在专业壁垒
⑦ 金融:需要较多的专业知识
⑧ 用户购买能力强,厂商投放广告的资金量大
⑨ 目前热门的垂直搜索
⑩ 生活、旅游、房产、交友、职位、汽车等
2) 面向特定需求
垂直搜索的用户是有特定需求的
① 以汽车为例,主要需求有:购车,用车,修车,转让二手车,选驾校,选4S店等等
② 酷讯做“火车票”搜索,就是把握了出行高峰购票难的需求 ③ 起步时,应该选定一种需求,深入地做下去
3) 全面
① 既然已经受限到特定领域,就要把这个领域的信息尽可能都收集全
② 抓取多少个网站算是全?多少个页面没有抓下来?多少个页面抓下来了但是没有正确解析?不能严重牺牲召回率
4) 深入
借助行业知识进行深度挖掘
① 积累行业背景知识(学名叫“领域本体”),利用数据挖掘等手段,发现信息之间的关联和趋势
② 给用户提供可以用来指导实践,解决问题的“知识”,从而达到“深”的效果
③ 这是垂直搜索超越通用搜索的一个关键点
5) 准确
① 由于限定了领域,因此搜索结果有更好的相关性
比如输入“Polo”,在汽车领域就是Polo汽车,而不会返回Polo衬衫或者Polo皮带等等
② 由于有领域知识的支持,用户的需求又比较集中,因此有理由给出更准确的检索结果。
6) 及时
① 通用搜索缺乏时效性
② 垂直搜索中存在“时间维”
a. 不能总把所谓最相关内容的排在最前面,因为有可能已经过时了,
比如房产信息,时效性很强
b. 垂直搜索的搜索范围小,也为及时更新创造了条件
7) 结构化
① 非结构化信息的结构化
a. 利用信息抽取技术把非结构化信息自动转换为结构化信息,并与
原有的结构化信息整合检索
b. 这是垂直搜索的关键一步
② 好处
a. 大幅度地减少用户获取信息的速度
b. 在数据库中可以方面地进行深层的归并、统计、挖掘等
7、其他特征
1) 个性化
2) 商务化
和交易平台(如B2C)相关联
3) 社区化
8、垂直搜索系统框架
互联网金融大数据垂直搜索
一、互联网的大数据正深刻地影响着银行的未来。
以银行为代表的金融企业和以电商企业为代表的互联网企业,正在掀起金融互联网化和互联网金融化新的热浪。
互联网触“金”可追溯到2003年,支付宝最初作为淘宝网一个解决网上支付信任问题的方案,创造性地采取了“担保交易”模式,解决了早期网购双方互不信任的难题。随后,P2P贷款平台和网络信贷机构也风生水起,颇成气候。
此后,阿里巴巴发布的“余额宝”, 新浪发布的“微银行”, 腾讯发布的微信5.0与“财付通”的打通等更是密集登场,互联网巨头们抢滩金融市场,可谓动作频频。
而传统金融机构也在积极“触网”。 国泰君安、中信证券在内的五家券商近日已向证监会上报互联网金融创新方案。近期,30多家基金公司的淘宝直营店也将陆续开业,各大银行、保险公司纷纷成立电子互联网金融平台;保监会首次批准设立纯互联网保险公司;中投副总经理谢平将互联网金融发展归纳为六大模式,它们是:第三方支付、P2P贷款模式、供应链金融、众筹模式、互联网整合销售金融产品、互联网货币。
金融与互联网之所以能够握手联姻,在于它们的诸多相通之处。谢平分析,“首先所有的金融都只是数据,不需要任何物流的支持。所有的金融产品都是各种数据的组合,这些数据在网上实现数量匹
配、期限匹配和风险定价,再加上网上支付就形成了互联网金融的核心。”
二、市场潜力大,创新尺度大
记者在8月13日的互联网大会上发现,“金融人”很亢奋。无疑,这些传统领域从业者正从互联网中感觉到了颠覆性的力量。马云[微博]已成为互联网金融标杆性人物,阿里金融已经成为一个“搅局者”。
互联网金融的优势在于惠及大量无法从银行贷款的中小企业和个人。过去几个月,P2P贷款疯长,电商小额贷款业务快速铺开。支付宝旗下一个名为余额宝的小产品,上线18天累积用户数就超过250万,存量转入资金规模达到57亿元。
目前,第三方银行支付牌照已经发放了250多个,其中真正从事互联网支付的企业有97家,另有150多家预付卡公司。互联网支付企业的支付总量约达6万亿,占到整个支付总量的0.5%。虽然从金额上看占比很小,但是从交易笔数上看,互联网支付的交易指令已经占到整体的40%,互联网支付表现出单笔量很小,但是呈现海量长尾的特征。
SOHU董事局主席张朝阳关心的是“微支付”的问题,“如果这个能解决的话,微电影、游戏等娱乐的爆炸将来到。”因此,如何让移动支付更便捷值得思考,因为移动支付屏幕非常小,此前在PC端的那种快捷支付模式并不适用于移动端。所以,解决背后的风险问题,让
支付更便捷,将会让支付规模扩大十倍。
互联网金融的创新尺度不可谓不大。“P2P贷款”的核心,是利用互联网几亿人之间的信息不对称,让他们相互对接,把信息的不对称减少到无穷小。例如人人贷等公司,利用信息的不对称,在俱乐部成员之间互相借贷;“阿里小贷模式”和传统银行的做法则完全不同,是一种自动放贷机制。例如淘宝商户所有的行为构成了本身风险的定价,然后阿里小贷根据风险定价,给它授信额度,可以随时贷款、随时还息。最终形成一个动态的风险定价过程;而“众筹融资”比创投、天使投资又大大前进了一步,全世界只有美国正式通过法律规定,小企业可以通过这种方式获得股权融资;“余额宝模式” 把货币市场基金具有货币的功能和网络支付结合在一起,突破了时间和空间的界限,这是一般的物理网点做不到的;而“互联网货币”挑战的不只是商业银行、证券公司,将来可能对央行构成巨大挑战。
有创业者认为,在互联网金融里没有任何的政策、资金或人才的障碍,最大的障碍是基因。
三、监管风险待解
互联网金融在一些领域呈现野蛮发展的特点,相对于传统金融,它没有传统金融的规则,未来的监管不确定性成为这个行业的最大风险。部分P2P的平台内部已经出现了道德问题,“注意操作和信用风险”拉响了警报。
中国人民银行副行长刘士余表示,“互联网金融无论怎么做,有两个底线是不能碰的,一是非法吸收公共存款,二是非法集资。我最担心有部分P2P贷款平台脱离了网络平台便成为所谓的线下,脱离平台的操作功能之后,会演变成资金池,成为影子银行。希望大家能在不违法的底线下寻找空间。”
中央财经大学教授黄震表示,“目前有四种说法。第一,不需要监管;第二,可以先发展,再监管;第三,创新协同监管;第四,尽快立法,设立新机构,进行专门监管。”网上调查显示,有80%的人认同第二种做法,也有人希望尽快立法。商务部电子商务和信息化司司长聂林海透露,互联网金融相关法律仍在制定阶段,商务部正加大研究力度。
在互联网金融峰会上,中国工商银行等25家单位发出中国互联网金融行业自律813倡议:“第一,自觉遵守法律法规,合法合规是生命。第二,自觉维护金融稳定,国家利益是根本。第三,自觉防范管控风险,公共利益是底线。第四,自觉接受社会监督,客户利益是中心。第五,自觉抵制恶性竞争,行业利益是关键。”
四、垂直搜索,可以燎原
1、信息检索
2、搜索技术的趋势
个性化、社区化、智能化、精准化、垂直化
3、垂直跨媒体搜索技术
以深度发掘为主要特点的垂直搜索技术我国与国际处于同一起跑线上,是我国实现在搜索领域实现跨越式发展的契机
—我国在垂直搜索引擎市场占有率超过50%
—我国在机器翻译以及跨媒体搜索方面已有很好的基础,技术与国际处于同一起跑线上
—垂直和跨媒体搜索引擎具有良好的商业盈利模式
4、垂直搜索完全相对立的业内评论
1) 肯定者
① “渐成主流需求”
② “是重大机遇”
③ “已成为搜索市场的第三极”
2) 否定者
① “不靠谱”
② “是忽悠人的伪概念”
③ “是注定被扼杀的幼苗”
5、什么是垂直搜索
垂直搜索
针对某一特定领域或对象,面向特定需求提供的信息搜索服务
6、一个号的垂直搜索引擎应该具备7个特征
1) 面向特定领域或对象、
选择领域、选择的原则
① 这个行业要有垂直搜索的大量需求
② 息来源相对集中,避免采集全网,降低采集成本
③ 不分领域的人物搜索、图片搜索就要抓全网
④ 信息处理量要足够大,太小了可以被人工代替
⑤ 根据自己的情况选择专业深度
⑥ 生活:几乎不存在专业壁垒
⑦ 金融:需要较多的专业知识
⑧ 用户购买能力强,厂商投放广告的资金量大
⑨ 目前热门的垂直搜索
⑩ 生活、旅游、房产、交友、职位、汽车等
2) 面向特定需求
垂直搜索的用户是有特定需求的
① 以汽车为例,主要需求有:购车,用车,修车,转让二手车,选驾校,选4S店等等
② 酷讯做“火车票”搜索,就是把握了出行高峰购票难的需求 ③ 起步时,应该选定一种需求,深入地做下去
3) 全面
① 既然已经受限到特定领域,就要把这个领域的信息尽可能都收集全
② 抓取多少个网站算是全?多少个页面没有抓下来?多少个页面抓下来了但是没有正确解析?不能严重牺牲召回率
4) 深入
借助行业知识进行深度挖掘
① 积累行业背景知识(学名叫“领域本体”),利用数据挖掘等手段,发现信息之间的关联和趋势
② 给用户提供可以用来指导实践,解决问题的“知识”,从而达到“深”的效果
③ 这是垂直搜索超越通用搜索的一个关键点
5) 准确
① 由于限定了领域,因此搜索结果有更好的相关性
比如输入“Polo”,在汽车领域就是Polo汽车,而不会返回Polo衬衫或者Polo皮带等等
② 由于有领域知识的支持,用户的需求又比较集中,因此有理由给出更准确的检索结果。
6) 及时
① 通用搜索缺乏时效性
② 垂直搜索中存在“时间维”
a. 不能总把所谓最相关内容的排在最前面,因为有可能已经过时了,
比如房产信息,时效性很强
b. 垂直搜索的搜索范围小,也为及时更新创造了条件
7) 结构化
① 非结构化信息的结构化
a. 利用信息抽取技术把非结构化信息自动转换为结构化信息,并与
原有的结构化信息整合检索
b. 这是垂直搜索的关键一步
② 好处
a. 大幅度地减少用户获取信息的速度
b. 在数据库中可以方面地进行深层的归并、统计、挖掘等
7、其他特征
1) 个性化
2) 商务化
和交易平台(如B2C)相关联
3) 社区化
8、垂直搜索系统框架