认识搜索引擎

实验四 认识搜索引擎

一、实验目的

1、认识搜索引擎

2、了解搜索引擎原理及使用方法

3、在线查找搜索引擎

学时安排:2学时

二、实验内容

1、在IE浏览器输入网址:http://www.moon-soft.com/web/searchengine.htm,或是利用Google搜索引擎查询【认识搜索引擎】,找到该网页,了解搜索引擎的原理极其发展过程。

2、打开http://www.sowang.com/index.htm和http://www.sskb.cn/,查看站点中文搜索引擎指南网(搜网)和搜索快报,了解搜索引擎有关新闻、使用技巧、排名规则、以及在商业上的应用。

3、在线查找搜索引擎,列出你所熟悉的中文引擎的前5名,英文引擎的前5名

4、列出至少20个搜索引擎(包括一个能够搜索—搜索引擎的引擎,报告中请注明)

5、使用不同的英文搜索引擎分别给出歌德巴赫猜想(Goldbach's conjecture)和世界名画《蒙娜丽莎》(Mona Lisa )的英文详细介绍网址,并分别给出内容的英文简介。

6、针对你的选题自选检索词利用英文搜索引擎检索,记录检索结果

三、实验报告

1、搜索引擎的原理

搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。

1. 从互联网上抓取网页

利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。

2. 建立索引数据库

由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

3. 在索引数据库中搜索排序

当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到

符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。

最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

2、搜索引擎的使用技巧

对于搜索引擎的使用,简单的就是输入你的语言想法。通过提交获得,这中间就要求你懂得搜索引擎的一个搜索因素。就是搜索关键字或关键词。这个一般不会被大众用户所了解,普通用户只是简单的思考就形成一种搜索习惯。比较准确一点的话就是关键词组,例如:考试模拟题,上海到北京线路等等这些就是关键词组,再比较专业一点的就是关键字,这个主要是一些特殊定义的词,例如:北京旅游,上海酒店,成人高考,一心一意等等。

另一方面就是搜索引擎的专业使用,主要是搜索引擎命令搜索和搜索引擎的分类搜索。搜索引擎的命令搜索主要有查看网站收录情况,使用site:命令;查看网站的外链情况,使用domain:或者link:命令等。搜索文档等,使用filetype:文档格式

(DOC,PDF,XLS,PPT等);还有使用函数符号搜索,使用加号(+)或者减号(-)号等来匹配内容;其次还有很多函数符号的使用,如:&,intitle,inurl,tag,“”,(),related,url,image等等。另一方面就是类型搜索,如:百度文档搜索,百度音乐搜索,谷歌文档,字典搜索,地图,交通搜索等等。

搜索引擎的使用有很多比较巧妙的东西,很多都可以灵活运用,也可以综合使用。如:在指定的网站中搜索某一类的东西:site:lvmama.com 欢乐谷 ,这里是在驴妈妈网站搜索关于欢乐谷的东西;site:lvmama.com 欢乐谷&攻略 ,这里是在驴妈妈网站搜索包含欢乐谷和攻略的信息。Inurl:bbs欢乐谷 这里是指在所有包含欢乐谷的信息,条件是同时要在url中出现bbs,这里还有一层意思是指,将bbs本身定义为论坛,这里总的意思也就是只在论坛中搜索包含欢乐谷的信息。

3、中文引擎前5名:

百度

谷歌

Bing(必应) 搜搜

雅虎全能搜索

英文引擎前5名:

4、不少于20个搜索引擎名称及链接地址

(1) 百度

(2) Google中文

(3) Alltheweb(Fast)

(4) Openfind中文

(5) 北大天网

(6) Google

(7) Alltheweb(Fast)

(8) Altavista

(9) Inktomi

(10) Openfind

(11) Northernlight

(12) Wisenut

(13) Teoma

(14) Gigablast

(15) Inktomi/MSN

(16) 搜狗

(17) Bing(必应)

(18) 雅虎全能搜索

(19) SOSO搜搜

(20) 有道

(21) 即刻搜索

(22) 盘古搜索

(23) 爱问搜索引擎

(24) o123网址之家

(25) 120ask有问必答

5、Goldbach's conjecture的详细介绍网址及英文简介

中文网址:http://baike.baidu.com/view/1808.htm

英文网址:http://en.wikipedia.org/wiki/Goldbach's_conjecture

英文简介:Goldbach's conjecture is one of the oldest unsolved problems in number theory and in all of . It states:Every greater than 2 can be expressed as the sum of two . A Goldbach number is a number that can be expressed as the sum of two odd primes. Therefore, another statement of Goldbach's conjecture is that all even integers greater than

4 are Goldbach numbers.

The expression of a given even number as a sum of two primes is called a Goldbach of the number. For example,

4 = 2 + 2

6 = 3 + 3

8 = 3 + 5

10 = 7 + 3 or 5 + 5

12 = 5 + 7

14 = 3 + 11 or 7 + 7

Mona Lisa的详细介绍网址及英文简介

中文网址:http://baike.baidu.com/view/27894.htm

英文网址:http://www.newworldencyclopedia.org/entry/Mona_Lisa

英文简介:Mona Lisa (also known as La Gioconda) is a sixteenth century portrait painted in oil on a panel by during the . The work is owned by the French government and hangs in the in , with the title Portrait of Lisa Gherardini, wife of Francesco del Giocondo.

The painting is a half-length portrait and depicts a woman whose expression is often described as enigmatic. The ambiguity of the sitter's expression, the monumentality of the

half-figure composition, and the subtle modeling of forms and atmospheric illusionism were novel qualities that have contributed to the painting's continuing fascination. Few other works of art have been subject to as much scrutiny, study, mythologizing and parody.

It is one of the great icons of Western painting, perhaps the best known painting in the entire world

6、使用引擎名称及链接:Google

检索词(至少2个):文本挖掘(Text Mining),知识发现(knowledge Discovery)

检索表达式:文本挖掘(Text Mining)*知识发现(knowledge Discovery)

第一个检索词的检索结果(摘录至少5条):

1. Text mining

2. KNOWLEDGE MANAGEMENT, DATA MINING, AND TEXT MINING IN MEDICAL

INFORMATICS

3. Survey of Text Mining: Clustering, Classification, and Retrieval ...

4. The Text Mining Handbook: Advanced Approaches to ...

5. Text mining with Information Extratction

第二个检索词的检索结果(摘录至少5条):

1. From Data Mining toKnowledge Discovery inDatabases

2. An Internet-enabled Knowledge Discovery Process

3. Knowledge Discovery and Data Mining: Concepts and Fundamental Aspects *

4. Knowledge Discovery from data

5. Trends inData Mining and Knowledge Discovery

按以下内容给出一篇由检索表达式得到的检索结果:

[Title] From Data Mining toKnowledge Discovery inDatabases

[Author] Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth

[Organization] American Association for Artificial Intelligence

[Journal] 1996 37

[Key words] Data mining knowledge discovery Databases

[Abstract] Data mining and knowledge discovery indatabases have been attracting a significantamount of research, industry, and media atten-tion of late. What is all the excitement about?This article provides an overview of this emergingfield, clarifying how data mining and knowledgediscovery in databases are related both to eachother and to related fields, such as machinelearning, statistics, and databases. The articlementions particular real-world applications,specific data-mining techniques, challenges in-volved in real-world applications of knowledgediscovery, and current and future research direc-tions in the field.

实验四 认识搜索引擎

一、实验目的

1、认识搜索引擎

2、了解搜索引擎原理及使用方法

3、在线查找搜索引擎

学时安排:2学时

二、实验内容

1、在IE浏览器输入网址:http://www.moon-soft.com/web/searchengine.htm,或是利用Google搜索引擎查询【认识搜索引擎】,找到该网页,了解搜索引擎的原理极其发展过程。

2、打开http://www.sowang.com/index.htm和http://www.sskb.cn/,查看站点中文搜索引擎指南网(搜网)和搜索快报,了解搜索引擎有关新闻、使用技巧、排名规则、以及在商业上的应用。

3、在线查找搜索引擎,列出你所熟悉的中文引擎的前5名,英文引擎的前5名

4、列出至少20个搜索引擎(包括一个能够搜索—搜索引擎的引擎,报告中请注明)

5、使用不同的英文搜索引擎分别给出歌德巴赫猜想(Goldbach's conjecture)和世界名画《蒙娜丽莎》(Mona Lisa )的英文详细介绍网址,并分别给出内容的英文简介。

6、针对你的选题自选检索词利用英文搜索引擎检索,记录检索结果

三、实验报告

1、搜索引擎的原理

搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。

1. 从互联网上抓取网页

利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。

2. 建立索引数据库

由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

3. 在索引数据库中搜索排序

当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到

符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。

最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

2、搜索引擎的使用技巧

对于搜索引擎的使用,简单的就是输入你的语言想法。通过提交获得,这中间就要求你懂得搜索引擎的一个搜索因素。就是搜索关键字或关键词。这个一般不会被大众用户所了解,普通用户只是简单的思考就形成一种搜索习惯。比较准确一点的话就是关键词组,例如:考试模拟题,上海到北京线路等等这些就是关键词组,再比较专业一点的就是关键字,这个主要是一些特殊定义的词,例如:北京旅游,上海酒店,成人高考,一心一意等等。

另一方面就是搜索引擎的专业使用,主要是搜索引擎命令搜索和搜索引擎的分类搜索。搜索引擎的命令搜索主要有查看网站收录情况,使用site:命令;查看网站的外链情况,使用domain:或者link:命令等。搜索文档等,使用filetype:文档格式

(DOC,PDF,XLS,PPT等);还有使用函数符号搜索,使用加号(+)或者减号(-)号等来匹配内容;其次还有很多函数符号的使用,如:&,intitle,inurl,tag,“”,(),related,url,image等等。另一方面就是类型搜索,如:百度文档搜索,百度音乐搜索,谷歌文档,字典搜索,地图,交通搜索等等。

搜索引擎的使用有很多比较巧妙的东西,很多都可以灵活运用,也可以综合使用。如:在指定的网站中搜索某一类的东西:site:lvmama.com 欢乐谷 ,这里是在驴妈妈网站搜索关于欢乐谷的东西;site:lvmama.com 欢乐谷&攻略 ,这里是在驴妈妈网站搜索包含欢乐谷和攻略的信息。Inurl:bbs欢乐谷 这里是指在所有包含欢乐谷的信息,条件是同时要在url中出现bbs,这里还有一层意思是指,将bbs本身定义为论坛,这里总的意思也就是只在论坛中搜索包含欢乐谷的信息。

3、中文引擎前5名:

百度

谷歌

Bing(必应) 搜搜

雅虎全能搜索

英文引擎前5名:

4、不少于20个搜索引擎名称及链接地址

(1) 百度

(2) Google中文

(3) Alltheweb(Fast)

(4) Openfind中文

(5) 北大天网

(6) Google

(7) Alltheweb(Fast)

(8) Altavista

(9) Inktomi

(10) Openfind

(11) Northernlight

(12) Wisenut

(13) Teoma

(14) Gigablast

(15) Inktomi/MSN

(16) 搜狗

(17) Bing(必应)

(18) 雅虎全能搜索

(19) SOSO搜搜

(20) 有道

(21) 即刻搜索

(22) 盘古搜索

(23) 爱问搜索引擎

(24) o123网址之家

(25) 120ask有问必答

5、Goldbach's conjecture的详细介绍网址及英文简介

中文网址:http://baike.baidu.com/view/1808.htm

英文网址:http://en.wikipedia.org/wiki/Goldbach's_conjecture

英文简介:Goldbach's conjecture is one of the oldest unsolved problems in number theory and in all of . It states:Every greater than 2 can be expressed as the sum of two . A Goldbach number is a number that can be expressed as the sum of two odd primes. Therefore, another statement of Goldbach's conjecture is that all even integers greater than

4 are Goldbach numbers.

The expression of a given even number as a sum of two primes is called a Goldbach of the number. For example,

4 = 2 + 2

6 = 3 + 3

8 = 3 + 5

10 = 7 + 3 or 5 + 5

12 = 5 + 7

14 = 3 + 11 or 7 + 7

Mona Lisa的详细介绍网址及英文简介

中文网址:http://baike.baidu.com/view/27894.htm

英文网址:http://www.newworldencyclopedia.org/entry/Mona_Lisa

英文简介:Mona Lisa (also known as La Gioconda) is a sixteenth century portrait painted in oil on a panel by during the . The work is owned by the French government and hangs in the in , with the title Portrait of Lisa Gherardini, wife of Francesco del Giocondo.

The painting is a half-length portrait and depicts a woman whose expression is often described as enigmatic. The ambiguity of the sitter's expression, the monumentality of the

half-figure composition, and the subtle modeling of forms and atmospheric illusionism were novel qualities that have contributed to the painting's continuing fascination. Few other works of art have been subject to as much scrutiny, study, mythologizing and parody.

It is one of the great icons of Western painting, perhaps the best known painting in the entire world

6、使用引擎名称及链接:Google

检索词(至少2个):文本挖掘(Text Mining),知识发现(knowledge Discovery)

检索表达式:文本挖掘(Text Mining)*知识发现(knowledge Discovery)

第一个检索词的检索结果(摘录至少5条):

1. Text mining

2. KNOWLEDGE MANAGEMENT, DATA MINING, AND TEXT MINING IN MEDICAL

INFORMATICS

3. Survey of Text Mining: Clustering, Classification, and Retrieval ...

4. The Text Mining Handbook: Advanced Approaches to ...

5. Text mining with Information Extratction

第二个检索词的检索结果(摘录至少5条):

1. From Data Mining toKnowledge Discovery inDatabases

2. An Internet-enabled Knowledge Discovery Process

3. Knowledge Discovery and Data Mining: Concepts and Fundamental Aspects *

4. Knowledge Discovery from data

5. Trends inData Mining and Knowledge Discovery

按以下内容给出一篇由检索表达式得到的检索结果:

[Title] From Data Mining toKnowledge Discovery inDatabases

[Author] Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth

[Organization] American Association for Artificial Intelligence

[Journal] 1996 37

[Key words] Data mining knowledge discovery Databases

[Abstract] Data mining and knowledge discovery indatabases have been attracting a significantamount of research, industry, and media atten-tion of late. What is all the excitement about?This article provides an overview of this emergingfield, clarifying how data mining and knowledgediscovery in databases are related both to eachother and to related fields, such as machinelearning, statistics, and databases. The articlementions particular real-world applications,specific data-mining techniques, challenges in-volved in real-world applications of knowledgediscovery, and current and future research direc-tions in the field.


相关文章

  • 认识世界的窗口--搜索引擎
  • 周五晚和Kevin http://blog.iynew.com/ 聊天的时候,突然间想起来要看<The Search: How Google and it's Rivals Rewrote The Rules of Business ...查看


  • 获取网络信息的策略与技巧
  • <获取网络信息的策略与技巧>教学设计 亳州一中 梁老师 一.教材分析 1.教材的地位和作用 本节是高中信息技术必修模块的第二章第二节的内容,本节分两个课时来完成,我的说课是第一个课时.在信息社会,网络成为人们获取信息的主要渠道之 ...查看


  • 网上获取信息的策略
  • 网上获取信息的策略 [教材分析] 本节是中国地图出版社高中信息技术基础(必修)教材中的第二章有效获取信息第二节网上获取信息的策略.本节旨在培养和提升学生获取网络信息的能力,使其成为每位学生在信息社会必须掌握的生存技能,并为学生学会有效组织和 ...查看


  • 2.2因特网信息查找教案
  • 高一信息技术教案 课题 教学目标 2.2 因特网信息查找 第 3 课时 知识与技能:了解因特网信息检索的相关知识,知道常用的几类搜索引擎,学 会利用搜索引擎有效的获取信息. 过程与方法:通过信息检索案例,帮助学生发现问题,在教师引导下的主动 ...查看


  • 2.2获取网络信息的策略与技巧
  • 第二章 信息的获取 第二节 获取网络信息的策略与技巧 一.基本说明 (二)教学内容 1.教学内容所属模块:信息技术 信息技术基础(必修) 2.年级:高一年级 3.所用教材出版单位:广东教育出版社 4.所属的章节:第二章 信息的获取 第二节 ...查看


  • 解析搜索引擎的发展历程
  • 解析搜索引擎的发展历程 搜索引擎营销的发展历程是随着搜索引擎的发展而发展的,在搜索引擎营销发展历史中值得关注的一些重要事件: 1.1994年,Yahoo.Lycos等分类目录型搜索引擎诞生,搜索引擎的网络营销价值逐渐体现出来,搜索引擎网络营 ...查看


  • 我所认识的信息高速公路与因特网
  • 我所认识的信息高速公路与因特网 --网络信息检索的技术与发展 摘要:本文通过系统论述信息社会发展过程,说明了网络信息在人类社会中所起到的重要作用,也具体阐述了社会信息化的必然趋势,探讨了网络信息检索技术的应用与未来的发展趋势.本文通过对网络 ...查看


  • 网络营销实验报告二
  • 实验二 认识常用网络营销工具及其信息传递特征 1.实验目的 了解用户通过企业网站.搜索引擎.电子邮件等常用网络营销工具获取商品/服务信息的特征,认识各网络营销工具的作用及其信息传递的特点,为接下来的课程学习增加感性认识. 2.实验内容和步骤 ...查看


  • 网络推广策划方案
  • 目 录 分析现状 ......................................................................................... 2 潜在客户 .............. ...查看


热门内容