实习五 国内外搜索引擎的调研
[1**********] 杨倩 电商本
一、 A. 名称:百度搜索 网址:http://www.baidu.com 创建者名称:李彦宏和徐勇 创建的时间:2000年1月 搜索引擎的类型:主题搜索引擎、综合门户搜索引擎。
B. 收录范围(学科或专业、地域、语言、资源类型范围):百度只收录对用户有价值的网页。任何网页在搜索结果中的去留变化,都是机器算法计算和调整的结果。下述类型的网页,百度明确不会欢迎:
1.网页做了很多针对搜索引擎而非用户的处理,使得用户从搜索结果中看到的内容与页面实际内容完全不同,或者使得网页在搜索结果中获得了不恰当的排名,从而导致用户产生受欺骗感觉。
如果您的网站中有较多这种页面,那么这可能会使您的整个网站的页面收录和排序受到影响。
2. 网页是复制自互联网上的高度重复性的内容。
3. 网页中有不符合中国法律和法规的内容。
C. 信息组织方式(首页栏目、分类或主题等组织法):基于Robot的搜索引擎是指利用一个称为Robot(也叫做Spider、Web Crawler或Web Wanderer)的程序自动访问Web站点,提取站点上的网页,并根据网页中的链接进一步提取其它网页,或转移到其它站点上的搜索引擎。Robot搜集的网页被加入到搜索引擎的数据库中,供用户查询使用。
D. 提供的产品与服务项目:全能搜索 (除网页搜索外,百度还提供MP3、图片、视频、地图等多样化的搜索服务)、语音搜索、Flash搜索。
E. 搜索功能(搜索方法、途径、搜索结果的显示、搜索示例):百度目前主要提供中文(简/繁体)网页搜索服务。如无限定,默认以关键词精确匹配方式搜索。支持“-”号、“.”号、“|”号、“link:”、书名号“《》”等特殊搜索命令。在搜索结果页面,百度还设置了关联搜索功能,方便访问者查询与输入关键词有关的其他方面的信息。提供“百度快照”查询。其他搜索功能包括新闻搜索、MP3搜索、图片搜索、Flash搜索等。
例如:百度(baidu)搜索高级语法:
1.把搜索范围限定在网页标题中——intitle
使用的方式,是把查询内容中,特别关键的部分,用“intitle:”领起来。如:seo intitle:数控机床
2.要求搜索结果中不含特定查询词
使用方法用减号语法,就可以去除所有这些含有特定关键词的网页。如:seo服务 -数控机床
3.把搜索范围限定在url链接中——inurl
网页url中的某些信息,常常有某种有价值的含义。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。如:inurl:数控机床
4.精确匹配——双引号和书名号
若输入的查询词很长,百度分析后,给出的搜索结果可能是拆分的.可给查询词加上双引号。如:数控机床seo服务
二、A. 名称:Yahoo! 网址:http://www.google.com 创建者名称:大卫·费罗(David Filo) 和杨致远(Jerry Yang) 创建的时间:1994年4月 搜索引擎的类型:目录索引类搜索引擎
B. 收录范围(学科或专业、地域、语言、资源类型范围):(1) 商业网站必须具有正式的商业名字,并在网站显著位置。(2) 网站必须定位明确。(3) 网站没有被Yahoo目录收录过。
(4) 保证所递交网站,其内容在Yahoo目录里是“惟一”内容。(5) 如果网站是有地域特征的
网站,必须有详细的地址。(6) 没有„正在建设网页‟。(7) 网站链接全部有效,并指向相关内容。(8) 有比较完整的meta标记。(9) 网站兼容多种浏览器,比如,不是纯Java网站。(10)网站必须24小时与互联网相连。确保yahoo检查网站时,可以顺利访问。
C. 信息组织方式(首页栏目、分类或主题等组织法):以人工方式或半自动方式搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。
D. 提供的产品与服务项目:网页搜索、图片搜索、音乐搜索、资讯搜索、雅虎搜索社区、地址栏搜索 。
E. 搜索功能(搜索方法、途径、搜索结果的显示、搜索示例):雅虎为用户提供了强大的搜索功能,通过其14类简单易用、手工分类的简体中文网站目录及强大的搜索引擎,用户可以轻松搜索到政治、经济、文化、科技、房地产、教育、艺术、娱乐、体育等各方面的信息。 例如:高级搜索可以满足您的特殊搜索需求。您可以在雅虎首页、雅虎搜索首页、和网页搜索结果页中找到高级搜索的入口。在高级搜索中可以进行以下操作:
1、对出现的搜索结果是否包含查询词、是否完整包含查询词进行设置;
2、对查询词在网页中出现的位置进行设置;
3、选择搜索结果的更新时间;
4、搜索文档格式;
5、选择要搜索的网页语言;
6、站内搜索;
7、链接搜索。
三、概括的评价该搜索引擎的学术价值、应用价值、编辑水平等。
百度起步早,实力强,服务于企业和个人,有优秀团队,直接出来百度百科了解到其定义,信息价值度较高,比较详细,支持二次检索;适用于国内生产厂商、贸易商,是全球最大中文搜索引擎,每天有超过100,000,000人次访问百度或查询信息,是使用量最大的中文搜索引擎,在市场永远是先入为主,抢先为王。是一种熟悉工具,惯性思维在长时间里还是很难改变的,百度仍是国内贸易推广的王道。雅虎在MBA智库百科中有显示其定义,搜索量最大链接分解能力很强提供信息浏览、主题查询和关键词搜索信息更具科学性,全球最大的商业搜索流量,有全球最大的免费邮箱,死链率较高,大部分页面无法反映了用户关心的页面内容,缺少某些高级搜索特性,有些需要付费才能加入站点,描述与提示说明不太清晰,搜索的易用性稍差,是最为人熟悉及最有价值的互联网品牌之一。
四、比较不同搜索引擎的特点。
百度是全球最大中文搜索引擎,每天有超过100,000,000人次访问百度或查询信息,是使用量最大的中文搜索引擎,在市场永远是先入为主,抢先为王。是一种熟悉工具,惯性思维在长时间里还是很难改变的,百度仍是国内贸易推广的王道。雅虎是全球第一家提供互联网导航服务的网站,不论在浏览量、网上广告、家庭或商业用户接触面上,yahoo都居于领导地位,也是最为人熟悉及最有价值的互联网品牌之一。
实习五 国内外搜索引擎的调研
[1**********] 杨倩 电商本
一、 A. 名称:百度搜索 网址:http://www.baidu.com 创建者名称:李彦宏和徐勇 创建的时间:2000年1月 搜索引擎的类型:主题搜索引擎、综合门户搜索引擎。
B. 收录范围(学科或专业、地域、语言、资源类型范围):百度只收录对用户有价值的网页。任何网页在搜索结果中的去留变化,都是机器算法计算和调整的结果。下述类型的网页,百度明确不会欢迎:
1.网页做了很多针对搜索引擎而非用户的处理,使得用户从搜索结果中看到的内容与页面实际内容完全不同,或者使得网页在搜索结果中获得了不恰当的排名,从而导致用户产生受欺骗感觉。
如果您的网站中有较多这种页面,那么这可能会使您的整个网站的页面收录和排序受到影响。
2. 网页是复制自互联网上的高度重复性的内容。
3. 网页中有不符合中国法律和法规的内容。
C. 信息组织方式(首页栏目、分类或主题等组织法):基于Robot的搜索引擎是指利用一个称为Robot(也叫做Spider、Web Crawler或Web Wanderer)的程序自动访问Web站点,提取站点上的网页,并根据网页中的链接进一步提取其它网页,或转移到其它站点上的搜索引擎。Robot搜集的网页被加入到搜索引擎的数据库中,供用户查询使用。
D. 提供的产品与服务项目:全能搜索 (除网页搜索外,百度还提供MP3、图片、视频、地图等多样化的搜索服务)、语音搜索、Flash搜索。
E. 搜索功能(搜索方法、途径、搜索结果的显示、搜索示例):百度目前主要提供中文(简/繁体)网页搜索服务。如无限定,默认以关键词精确匹配方式搜索。支持“-”号、“.”号、“|”号、“link:”、书名号“《》”等特殊搜索命令。在搜索结果页面,百度还设置了关联搜索功能,方便访问者查询与输入关键词有关的其他方面的信息。提供“百度快照”查询。其他搜索功能包括新闻搜索、MP3搜索、图片搜索、Flash搜索等。
例如:百度(baidu)搜索高级语法:
1.把搜索范围限定在网页标题中——intitle
使用的方式,是把查询内容中,特别关键的部分,用“intitle:”领起来。如:seo intitle:数控机床
2.要求搜索结果中不含特定查询词
使用方法用减号语法,就可以去除所有这些含有特定关键词的网页。如:seo服务 -数控机床
3.把搜索范围限定在url链接中——inurl
网页url中的某些信息,常常有某种有价值的含义。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。如:inurl:数控机床
4.精确匹配——双引号和书名号
若输入的查询词很长,百度分析后,给出的搜索结果可能是拆分的.可给查询词加上双引号。如:数控机床seo服务
二、A. 名称:Yahoo! 网址:http://www.google.com 创建者名称:大卫·费罗(David Filo) 和杨致远(Jerry Yang) 创建的时间:1994年4月 搜索引擎的类型:目录索引类搜索引擎
B. 收录范围(学科或专业、地域、语言、资源类型范围):(1) 商业网站必须具有正式的商业名字,并在网站显著位置。(2) 网站必须定位明确。(3) 网站没有被Yahoo目录收录过。
(4) 保证所递交网站,其内容在Yahoo目录里是“惟一”内容。(5) 如果网站是有地域特征的
网站,必须有详细的地址。(6) 没有„正在建设网页‟。(7) 网站链接全部有效,并指向相关内容。(8) 有比较完整的meta标记。(9) 网站兼容多种浏览器,比如,不是纯Java网站。(10)网站必须24小时与互联网相连。确保yahoo检查网站时,可以顺利访问。
C. 信息组织方式(首页栏目、分类或主题等组织法):以人工方式或半自动方式搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。
D. 提供的产品与服务项目:网页搜索、图片搜索、音乐搜索、资讯搜索、雅虎搜索社区、地址栏搜索 。
E. 搜索功能(搜索方法、途径、搜索结果的显示、搜索示例):雅虎为用户提供了强大的搜索功能,通过其14类简单易用、手工分类的简体中文网站目录及强大的搜索引擎,用户可以轻松搜索到政治、经济、文化、科技、房地产、教育、艺术、娱乐、体育等各方面的信息。 例如:高级搜索可以满足您的特殊搜索需求。您可以在雅虎首页、雅虎搜索首页、和网页搜索结果页中找到高级搜索的入口。在高级搜索中可以进行以下操作:
1、对出现的搜索结果是否包含查询词、是否完整包含查询词进行设置;
2、对查询词在网页中出现的位置进行设置;
3、选择搜索结果的更新时间;
4、搜索文档格式;
5、选择要搜索的网页语言;
6、站内搜索;
7、链接搜索。
三、概括的评价该搜索引擎的学术价值、应用价值、编辑水平等。
百度起步早,实力强,服务于企业和个人,有优秀团队,直接出来百度百科了解到其定义,信息价值度较高,比较详细,支持二次检索;适用于国内生产厂商、贸易商,是全球最大中文搜索引擎,每天有超过100,000,000人次访问百度或查询信息,是使用量最大的中文搜索引擎,在市场永远是先入为主,抢先为王。是一种熟悉工具,惯性思维在长时间里还是很难改变的,百度仍是国内贸易推广的王道。雅虎在MBA智库百科中有显示其定义,搜索量最大链接分解能力很强提供信息浏览、主题查询和关键词搜索信息更具科学性,全球最大的商业搜索流量,有全球最大的免费邮箱,死链率较高,大部分页面无法反映了用户关心的页面内容,缺少某些高级搜索特性,有些需要付费才能加入站点,描述与提示说明不太清晰,搜索的易用性稍差,是最为人熟悉及最有价值的互联网品牌之一。
四、比较不同搜索引擎的特点。
百度是全球最大中文搜索引擎,每天有超过100,000,000人次访问百度或查询信息,是使用量最大的中文搜索引擎,在市场永远是先入为主,抢先为王。是一种熟悉工具,惯性思维在长时间里还是很难改变的,百度仍是国内贸易推广的王道。雅虎是全球第一家提供互联网导航服务的网站,不论在浏览量、网上广告、家庭或商业用户接触面上,yahoo都居于领导地位,也是最为人熟悉及最有价值的互联网品牌之一。