邢志宇
计算机和互联网是20世纪人类最伟大的发明,人类社会以此为标志步入了“信息时代”。
互联网正改变着人类的生存方式和生活质量,我们与互联网的关系愈来愈密切。曾几何时,收发电邮、浏览新闻、查找资料、阅读电子书刊、建立个人博客、开展远程教学和电子商务等网络活动,已成为人们日常生活不可缺少的内容,不经意间,“有事发E-mail”、“QQ上见”成了都市白领的口头禅,就是在小小的名片上,网址、E-mail、QQ号码也已经是屡见不鲜。
网络浩如烟海,信息杂乱无序,对网络信息有效地查询和利用,犹如大海捞针,乱麻析缕,并不是一件容易的事情。如同字典定音释义、类书征引辑佚、表谱纪年系事一样,查询和利用网络信息也需借助一定的工具。
一、搜索的工具
搜索引擎(search engine)是对网络信息资源进行整序和查询的系统,是目前人们利用网络信息最有效的工具。
中国互联网络信息中心 (CNNIC)最新数据显示:我国上网用户总数为8700万,上网计算机达到3630万台,在网民使用的网络服务中,88.4%的用户经常使用电子邮箱服务,61.6%的用户经常使用搜索引擎服务,搜索引擎已成为仅次于电子邮件的第二大网络应用工具。
搜索引擎是网上冲浪不可或缺的得力助手和查找网络信息的专用工具。搜索引擎按其对网络信息的整序和检索的原理不同,分为关键词搜索引擎(Search Engine)和分类搜索引擎(Directory)。关键词搜索引擎是基于程序的网页级全文搜索引擎,分类搜索引擎是由人工建立和管理的网站级主题分类体系。基于程序的关键词搜索引擎又分为可以同时调用多个搜索引擎的元搜索引擎(Metasearch Engine)和专门用于检索图形(Graphics)、动画(Animation)、声频(Audio)、视频(Video)等媒体元素的多媒体搜索引擎(multisearch engine),以及新闻搜索引擎(news search engine)、购物搜索引擎(shopping search engine)、MP3搜索引擎(mp3 search engine)、FTP搜索引擎(Ftp search engine)、 博客搜索引擎(Blog Search Engine)等等多种专用搜索引擎(Specialized Search Engine)类型。
目前互联网上的搜索引擎数以千计,世界上公认的最好而且也是使用人数最多的英文搜索引擎有Google、Yahoo!、AskJeeves等,国内常用的中文搜索引擎有中文Google、百度、搜狗、天网、中国搜索等。
由于所采用的索引技术、分词技术、排序算法、搜索语法、收录范围以及智能化水平等等方面的诸多不同,搜索引擎各自具有不同的功能和特色,满足不同的搜索需要,给人以不同的搜索体验。
“因为我善于搜索,所以我了解世界”,互联网和搜索技术的发展,不但使人们体会到了“秀才不出门能知天下事”的乐趣,而且也使“秀才不出门能做天下事”成为可能。
二、搜索的魅力
只要拥有一台电脑和上网账号,你就可以尽情地在互联网中遨游,只要你身在网中,就一定会通过搜索去求知、探寻,去征引、求证,去体验网络的神奇和妙用。只要你无法抵御网络的诱惑,你就能够体验到搜索的魅力。
当你忽然想起失去联系多年的同桌的她,心急火燎而又不好意思四处打探,唯一的方法就是上网搜索,您一定可以在大学的就业名单、新闻报道、论文数据库,抑或在某个论坛中寻觅到她的芳踪。
撰写论文或课题调研,舍不得花费银子而又想尽可能多地收集资料,最有效的方法就是利用学术搜索引擎和预印本、期刊、专利、标准等专用检索系统。网络世界有许多称之为“免费午餐”的公用数据库倍受布衣学子和一介寒儒的青睐,即使是设防森严的商用数据库,我们也可以在搜索中曲径通幽“得其门而入”。
新闻记者更是离不开网络,利用新闻搜索引擎能够查找5分钟前发布的新闻报道,并可对新闻进行分类整理和专题订阅。门户新闻浏览是记者每日的必修课程,新闻搜索是记者的基本从业技能。
报刊编辑对搜索引擎情有独钟,只需抽取稿件中的关键词语或似曾相识的句子进行搜索,剽窃、抄袭之作无不立刻现形,劫运难逃。
为教学、研究或专题展览需要动植物生态或标本图像、天体图像、数字地图、各国古今钱币或邮品图案等等,因费用紧缺无法购买,或因资料罕见难以寻觅时,网络搜索可使你足不出户便可获得美国国会图书馆、伦敦大英图书馆、台湾“中央图书馆”、北京国家图书馆、著名大学和研究机构的珍贵、精美图像资料,解你燃眉之急,给你意外的惊喜。
身处经济欠发达地区学校的教师,大可不必为付不起远程教育费用而发愁,一台网络终端就就可以架起联系名校、名师的桥梁,只要善于搜索精于搜索,相关网站中的名师讲义、名校试卷、各科课件、教法教案等等尽可为你所用。
如果你是厌倦撰写公文的职业“笔吏”,或是不屑于官样文章的清高“白领”,搜索引擎是一付救急的“灵丹妙药”,使用诸如“在市场经济条件下......”之类的的词语搜索,可以使您大受启发进而笔走龙蛇,一时三刻立马“交差”。只要关键词使用得当,“造”几篇应景的“总结”、“心得体会”、“思想汇报”、“申请书”之类更是不在话下,保不准还能讨得领导“文笔长进不少”的夸奖。
如果你是囊中羞涩的音乐爱好者,音乐搜索引擎可以为你找到免费下载的音乐和歌曲。只要有足够娴熟的搜索技巧,古今中外的音乐、歌曲手到“擒”来,任你收藏。
中外影视作品几乎都可以在线观看和下载,只要能在适当的时间、准确的地方,“抓”到理想的BT种子,你就可以打造一个令人羡慕的影视资料馆和家庭影院。
……
网络犹如汹涌无际的海洋,无数的宝藏隐匿在经纬难料的角落等待着你去搜寻。网络搜索充满着激情和喜悦,对信息和知识需求的满足更使搜索魅力无穷。
三、搜索的技巧
网络搜索需要一定的技巧。“工欲善其事,必先利其器”,掌握了搜索技巧就如同拥有了“芝麻开门”的“咒语”,在键盘轻快的敲击声中阿里巴巴的“财富”之门就会向你敞开。
搜索技巧是由搜索工具决定的,不同的搜索引擎有着不同的使用方法和搜索技巧。一般来说,分类搜索引擎常用于族性检索,适合查询具有同一特征的多个目标和主题范围广、概念宽泛的问题,而关键词搜索引擎的特性检索功能更为突出,多用于查询主题范围狭小而不甚明了的信息和交叉性、细节性问题。
使用分类搜索引擎进行分类搜索,如同利用图书馆的分类目录一样,根据查询内容的学科属性或主题归属,自上而下地逐级寻检即类以求,“按图索骥”一检即得。然而,不同的分类搜索引擎由于收录范围和立类原则的限定,类目体系多有不同,同样的内容在不同的分类搜索引擎中可能分属不同的类目和不同的级次,查找起来多有不便。不熟悉分类体系而又必须使用分类搜索的用户,应注意利用试查结果条目下的路径指示和其分类数据库的关键词搜索功能。
关键词搜索引擎是使用频率最高的网络搜索工具。近年来,各搜索引擎之间几近白热化的竞争,促使了搜索技术发展的日新月异,GOOGLE、百度等中外著名搜索引擎无不争先恐后地以最快的频率更新版本,以最短的时间推出新的功能。搜索技术的提高和搜索功能的增强,为我们提供了网络搜索的极大便利,但随之而来的问题是,你对搜索引擎有多大程度的了解,能够驾御和熟练地使用一、二种常用的搜索引擎吗?
关键词搜索引擎采用的是程序索引、自动算法、形式匹配、智能学习等原理和机制,为追求搜索结果的最大相关性必须应用布尔逻辑符和多种搜索指令,由关键词、布尔逻辑符和搜索指令构成检索式在庞大的索引数据库中进行快速、精确的匹配查询。
所谓的搜索技巧多是针对关键词搜索引擎而言的,解读搜索技巧首先要了解关键词。
关键词是描述搜索内容的关键性词语,网络搜索中的关键词是一个广义的概念,属于非受控自由词,凡是具有实际意义的表达及其书写形式,如字、词、词组、短语和字母、数字、符号、公式等,都可以用作搜索关键词。使用关键词搜索引擎的基本功是对关键词的提炼和选择。
从形式上看,关键词的数量与结果输出成反比,使用关键词越多结果输出越少;从语义上分析,关键词的外延越小结果越趋于准确;从词间的逻辑关系讲,“与”和“非”(and & not)采用多词限制和无关排除的方法缩小搜索范围,用于提高查准率;“或”(OR)利用多词扩展的方法扩大搜索范围,可以得到较高的查全率。
准确选择关键词需要从表述方式、行文习惯、书写规则等方面揣度查询内容,力求关键词与内容描述词的一致。由于搜索引擎的形式匹配原理,使用同一概念的不同词语搜索的结果截然不同。例如,用“北京”搜索不会出现“首都”字样,“北京图书馆”找不到“国图”的有关内容,“WTO”与“世界贸易组织”的搜索结果大向径庭等等。因此,必须注意对习惯用语、专业术语、全称、简称、同义词、近义词,以及拼音文字的前缀、后缀的了解和运用,尽可能地提高关键词的形式匹配几率,最大限度地减少误检和漏检。
关键词可以分为主题关键词和特征关键词。主题关键词是指表述主要搜索内容必须使用的词语,不使用主题关键词就不能准确地搜索到特定的内容。特征关键词是指在内容描述中与主题关键词同时出现且位置较近的量词、形容词、名词等进一步说明和限定主题关键词的词语,特征关键词可以有效地缩小搜索范围,使相关度较高结果排序更加趋前。在搜索实践中经常会遇到这样的情况:即尽管主题关键词选择准确、使用得当,查询内容仍然不在结果首页或前三页之中,这时如果增加使用特征关键词,搜索结果就会明显改善。例如,查找国际象棋有几个棋子,如果用“国际象棋+棋子”搜索,有42400项结果,前几项结果的摘要中均无明确的答案,而增加特征关键词“个”,以“国际象棋+个棋子”搜索,结果减少至2550项,结果首页第一项即显示“国际象棋共有32个棋子,依颜色不同分为两方:浅色的白棋和深色的黑棋。每方各拥有1王、1后、2车、2象、2马、8兵共6兵种16个棋子……”的网页摘要。
准确地选择关键词是网络搜索的前提,但一次成功的搜索往往不是仅靠准确的关键词所能够完成的。关键词搜索的结果动乍成千上万,而成功搜索的标志是所需信息一定出现在结果首页之中。搜索引擎为快速、准确的搜索提供了足够的技术支持。下面以著名搜索引擎GOOGLE为例介绍逻辑运算符和常用搜索指令的使用技巧。
1、一个字、词不能准确地表达搜索意图而需要使用多个词语搜索时,用“AND”或“+”号表示词间的逻辑“与”关系,用“OR”表示逻辑“或”关系,“OR”前后各空一字符。多词间的“与”关系常用空格代替。例如,检索式“警犬+德国黑(贝 OR 背)”查找同时有“警犬”和“德国黑贝”或“德国黑背”的网页。“与”关系表示只查找作为警犬的一种德国犬种,“或”关系是为了查全同一犬种不同称谓的资料。
2、用逻辑“非”排除无关信息,多词间“非”关系用“NOT”或减号“-”号表示,“-”前空一字符。例如,检索式“图书馆 -大学”结果中将不会出现“大学图书馆”的内容。
3、中文或英文引号(“ ”或" ")表示短语搜索和精确搜索。如果引号内是词组或短语,则该词组或短语必须出现在搜索结果中,如果引号内是句子或连续的字符,则该句子或连续的字符一定是按照引号中的顺序出现在结果中。
4、“site:”域名、网站或网站频道限定搜索。如“site:cn”在cn域名中搜索、“site:people.com.cn”在人民网中搜索、“site:legal.people.com.cn”在人民网法治频道中搜索。“site:”前面(空一字符,下同)可使用关键词,用于在特定网站或网站频道中查找特定的内容,如“见义勇为 site:legal.people.com.cn”在人民网法治频道中搜索有关“见义勇为”的文章。
5、“filetype:”文件格式限定搜索。目前Google可以搜索的文件格式有:Adobe Portable Document Format (pdf)、Adobe PostScript (ps)、Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)、Lotus WordPro (lwp)、MacWrite (mw)、Microsoft Excel (xls)、Microsoft PowerPoint (ppt)、Microsoft Word (doc)、Microsoft Works (wks, wps, wdb)、Microsoft Write (wri)、Rich Text Format (rtf)、Shockwave Flash (swf)、Text (ans, txt)、dwg (AutoCAD)、3ds (3D-Studio)、c4d (Cinema 4D)、lwo (LightWave) 、obj、WMV、MPEG等20多种,而且还在不断增加。实际上,凡是Google能够索引到的可以识别的各种格式的文件,都可以用“filetype:文件后缀名”搜索到。例如,检索式“filetype:PPT 和谐社会”查找有关阐述 “和谐社会”的PPT课件。
6、“inurl:”限定在URL中搜索,返回的网页链接中包含第一个关键词,后面的关键词则出现在链接或者网页文字中。如“老鼠爱大米 inurl:mp3”的搜索结果都是《老鼠爱大米》MP3的试听或下载链接,“搜索技巧 inurl:bbs”则可以查找各种论坛中有关“搜索技巧的帖子。
7、“allinurl:”限定在URL中搜索,返回的网页链接中包含所有的关键词。如“allinurl:image Lenin”的搜索结果都是列宁的图片链接。
8、“intitle:”限定在网页标题中搜索,搜索结果的网页标题一定包含第一个关键词,其它关键词则出现在网页文字中。如“intitle:图书馆 文献检索”的搜索结果,关键词“图书馆”和“文献检索”分别包含在网页标题中和网页内容之中,“MP3 intitle:bookmarks”则可以让你尽情“窥视”全国内外音乐爱好者的个人收藏夹和MP3网络书签。
9、“allintext:”限定在网页的正文中搜索,如在“allintext:搜索引擎 搜索技巧”搜索中,“搜索引擎”和“搜索技巧”两个关键词只会出现在网页正文中,主要用于查找标题无明显主题词,但内容却高度相关的文章。
10、“link:” 搜索指向某个URL的所有链接,如“link:www.xcinfo.ha.cn”搜索,可以得到所有链接到许昌信息港网站的页面,常用来评价某一网站质量或知名度。
11、 “related:”用来搜索结构、内容等方面相似的网页。如用“related:www.people.com.cn”搜索与人民网相似的网页,网页制作者可籍此查找和借鉴经典网页,或评价网页的独特性与新颖性。
在搜索引擎的结果列表中,每一网页都包括网页标题、网页摘要、网址、文件类型等基本信息单元,我们可以根据需要利用搜索指令重点或仅仅在某一信息单元中限定搜索。限定搜索首先要分析信息单元的构成及其特征,如各种论坛的URL都有bbs或forum字串,图书在线阅览页面必有ebook或book字串,download是下载链接标志,lecture中一定有各种讲义,rm、wmv、rmvb、asf是常用的电影文件格式,swf、xls、ppt分别用于查找动画、表格、幻灯课件等等。据此,我们可以用“inurl:ebook 鲁迅”查找鲁迅的著作的在线阅读页面,用“free "shoot game" download”查找免费射击类游戏的下载地址,用“《布拉格恋人》rmvb”查找该影片的介绍、海报和下载链接,用“inurl:lecture 孔子”查找有关孔子的讲义和讲座,用“filetype:xls 成绩”去“窥测”各种成绩单......
搜索技巧不仅仅局限在上述网页和各种文档搜索方面,新闻搜索、图像搜索、多媒体搜索、购物搜索、论坛搜索、博客搜索、音乐搜索、“看不见的网页(The Invisible Web)”搜索等等都有自己独特的方法和技巧。其实,网络搜索并不神秘,人人都可以在搜索体验的积累中感悟搜索的魅力提高搜索的技能。
搜索技巧是网络搜索实践经验的总结和基本搜索方法的升华。搜索技巧具有较强的针对性,可以有效地解决某一方面的搜索难题。学习和借鉴搜索技巧,可以获得按图索骥、事半功倍的检索效果。但是,要想真正地提高自己的搜索技能,成为搜索高手,必须重视对搜索引擎的研究和搜索方法的训练,注意掌握其原理和精髓,做到融会贯通、举一反三、触类旁通。熟生巧、巧生妙、妙生神、神生奇,搜索技巧的巧、妙、神、奇,是在熟练地掌握基本的搜索方法的基础上,在网络搜索的实践中去体验和感悟出来的。只要你善于搜索,就一定会精于搜索。
你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=4161623