邢志宇
元搜索引擎(Metasearch Engine),是一种调用其它独立搜索引擎的引擎,亦称"搜索引擎之母(The mother of searce engines)"。在这里,"元"(Meta)为"总的"、"超越"之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。相对元搜索引擎,可被利用的独立搜索引擎称为"源搜索引擎"(source Engine),或"搜索资源"(searcing resources),整合、调用、控制和优化利用源搜索引擎的技术,称为"元搜索技术"(Meta-searching technique),元搜索技术是元搜索引擎的核心。
元搜索引擎分为并行处理式和串行处理式两大类。并行处理式元搜索引擎将用户的查询请求同时转送给它调用链接的多个独立型搜索引擎进行查询处理,串行处理式元搜索引擎将用户的查询请求依次转送给它调用链接的每一个独立型搜索引擎进行查询处理。
元搜索引擎是用户同时利用多引擎进行网络搜索的中介。检索时,元搜索引擎根据用户提交的检索请求,调用源搜索引擎进行搜索,对搜索结果进行汇集、筛选、删并等优化处理后,以统一的格式在同一界面集中显示。元搜索引擎虽没有网页搜寻机制,亦无独立的索引数据库,但在检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术支持。如提交检索请求时,根据源搜索引擎的特点和技术参数,指定优先顺序,并对检索时间、检索结果数量进行控制;作为若干源搜索引擎的检索接口代理,元搜索引擎必须具有较强的字符和语法转换功能,使用户的检索请求为各具语法特点的不同的源搜索引擎所人知和接受; 而对检索结果的显示,不同的元搜索引擎有不同的处理技术,由于元搜索引擎设定的检索结果排序依据、最大返回结果数量、相关度参数及优化机制等不同,调用相同的源搜索引擎的不同元搜索引擎显示检索结果的数量多少、排序先后、结果信息描述选择亦有较大差异。
一款理想的元搜索引擎应该具备以下特点和功能:第一,含盖较多的搜索资源,可随意选择和调用源搜索引擎;其次,具备尽可能多的可选择功能,如资源类型(网站、网页、新闻、软件、FTP、MP3、图像等)选择、返回结果数量控制、结果时段选择、过滤功能选择等;第三,强大的检索请求处理功能(如支持逻辑匹配检索、短语检索、自然语言检索等)和不同搜索引擎间检索语法规则、字符的转换功能(如对不支持"NEAR"算符的搜索引擎,可自动实现由"NEAR"向"AND"算符的转换等);第四,详尽全面的检索结果信息描述(如网页名称、URL、文摘、源搜索引擎、结果与用户检索需求的相关度等);第五,支持多种语言检索。
目前运营的元搜索引擎各具特色,功能各有侧重,完全"理想"的尚不多见。一些元搜索引擎在某些方面较为优秀,而其它功能则欠缺或需改进:如大多元搜索引擎不支持多语种,尤其是汉语检索;一些元搜索引擎实现检索语法转换的能力有限,不支持指定字段检索,不能充分发挥各个独立搜索引擎的高级检索功能;部分元搜索引擎无源搜索引擎列表,用户不能自主选择和调用源搜索引擎;大部分元搜索引擎仅支持调用AltaVista、Excite、GoTo.com、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人为地限制了搜索资源的利用;在检索结果上,元搜索引擎只能返回十几、数十条"相关度"较高的结果,大量可能有价值的源搜索引擎的检索结果被忽视,影响检索结果的全面性。元搜索引擎的功能受着源搜索引擎和元搜索技术的双重制约:一方面,源搜索引擎的各具特色的强大功能在元搜索引擎中受到限制而不能充分体现,而另一方面,任何一种元搜索技术都不能发掘和利用源搜索引擎的全部功能。
中文元搜索引擎
1、万纬搜索(http://www.widewaysearch.com)
中文元搜索引擎,可以调用Google、Yahoo、HotBot等3个英文搜索引擎,天网、中文雅虎、新浪GB、中文 Google、搜狐、百度等6个中文搜索引擎,搜索结果可按相关度、时间、域名和引擎分类。
2、metaFisher(http://www.hsfz.net/fish/)
搜索范围覆盖Google、Yahoo、AlltheWeb、百度、OpenFind、MSN 等主要搜索引擎,cooRank网页评级系统,更好的优化结果的排序,提供网站的准确性参考。cooWord(Beta)关键词自动分析归纳算法,协助增加搜索的深度与广度。采用相关搜索提示和多线程搜索技术,可以提示修正可能错误的搜索关键词,提供热门网站缩略图,提供在结果页面直接预览网站功能。
3、搜星(http://www.soseen.com)
它可以同时搜索7个大型搜索引擎,如中文Google,百度,中文雅虎,搜狐,新浪网,中华网和TOM等,其搜索出的结果可以过滤掉重复的网站
英文元搜索引擎
1、MetaCrawler ( http://www.metacrawler.com)
1995年由华盛顿大学推出,1997年被InfoSpace购买。支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务,可使用*通配符和+、-操作,支持词组查询方式。其检索特性非常丰富,包括常规检索、高级检索、定制检索、国家或地区的资源检索等检索服务模式。其中,高级检索模式可实现:搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,设定检索结果排序依据(包括相关度、域名、源搜索引擎)等。以上内容均可作为定制检索的个性化选项并予以保存。另外,检索结果中包括一个以1000为最大值的相关度指标。
2、Mamma ( http://www.mamma.com)
1996年面世,自称为"搜索引擎之母"的并行元搜索引擎,可同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo等常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。其特点是检索界面友好,检索选项丰富,主要包括:可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。另外,Mamma支持常用检索语法在不同搜索引擎中的转换,还提供了专门检索页面文件标题的特殊检索服务,以及通过E-mail传输检索结果的特色功能。检索结果以相关性排序,内容包括网页名称、URL、文摘、源搜索引擎。
3、AskJeeves(http://www.askjeeves.com)
AskJeeves提供同时搜索AltaVista、Excite、Yahoo、Infoseek、Lycos和WebCrawler的功能,此外还能同时搜索自己独立的数据库。支持语词搜索与高级搜索,但不支持目录搜索。
4、ProFusion ( http://www.profusion.com)
1995年在堪萨斯大学创制的并行式元搜索引擎,拥有智能化的搜索技术,可同时调用AltaVista、Excite、HotBot、InfoSeek、Lycos、Magellan、OpenText、WebCrawler和Yahoo等9个独立搜索引擎,提供诸如搜索引擎选择、检索类型、结果显示、摘要选项、链接检查等较多的检索选项,支持个性化设置,可以选择三个最好的搜索引擎(Infoseek、AltaVista、Excite)、或三个最快的搜索引擎(Infoseek、Yahoo、Magellan)、或全部搜索引擎、或手工选择任意几个搜索引擎来进行搜索。自动实现符合特殊检索语法要求的转换,如在调用Excite、InfoSeek、WebCrawler时将"NEAR"转换成"AND",在调用GoTo、Yahoo时将"NOT"删除等。原为堪萨斯州大学所有,2000年四月被Intelliseek 搜索公司购买。
5、Dogpile http://www.dogpile.com/)
InfoSpace所属的元搜索引擎,可以同时调用25个万维网搜索引擎(Web Search Engine)、新闻论坛搜索引擎(Usenet Search Engine)和FTP搜索引擎(FTP Search Engine)等。它采用独特的并行和串行相结合的查询方式:首先并行地调用3个搜索引擎,如果没有得到10个以上的结果,则并行地调用另外3个搜索引擎,如此重复直到获得至少10条结果为止。可使用布尔算符和模糊查询,即使是高级运算符和连接符,它也能将其转化为符合每个搜索引擎的语法,可以使用*作为通配符,支持+、-词操作,美中不足是不能够指定选择使用独立搜索引擎。
6、ByteSearch ( http://www.bytesearch.com)
搜索速度快,可检索资源丰富,搜索范围包括Web、城市信息、公司名录、域名、FTP网站、多媒体、新闻组、包裹跟踪等,并提供新闻浏览、URL提交、最新的20个检索浏览、联机商店等内容方面的服务。支持完全匹配(All)、部分匹配(Any)、短语检索(Phrase)等特性检索功能,没有搜索引擎列表,不能控制源搜索引擎的选择。
7、SavvySearch ( http://savvy.cs.colostate.edu:2000/)
可调用200多个搜索引擎或指南,内容涵盖新闻、共享软件、Usenet等27个主题范畴,一次可并行调用5个搜索引擎,也可以作为一个专用搜索引擎的导航工具使用。简单的搜索界面允许用户选择搜索类目,支持And和短语检索类型。最具特色的是其个性化检索设置服务,用户有机会从100多个搜索工具中选择调用并指定重要性系数(First、Middle、Last),建立自己的搜索模型。用户可选择显示搜索引擎的所有搜索结果,默认值是每个搜索引擎返回20个命中记录,并以相关度排列输出。SavvySearch同时提供23种语言版本,但其高级功能只适用于英文版。
8、Cyber411(http://www.cyber411.com)
并行式元搜索引擎,可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo等15个独立搜索引擎,它可以选择源搜索引擎,对查出结果进行组织并指出信息源,但其高级查询功能尚不完善。
9、DigiSearch(http://www.digiway.com/digisearch)
并行式元搜索引擎,它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo、OpenText和Magellen等18个独立万维网搜索引擎、DejaNews等3个新闻论坛搜索引擎和Four11等3个个人信息和商界信息搜索引擎。允许使用*作为通配符,支持+、-词操作,可以设置最大搜索时间(分钟),放弃超过该时间后返回的信息,用户可自行选择调用哪些搜索引擎,查询结果按来源引擎依次排出。但从每个独立引擎返回的结果都被不加处理地列出,甚至包括每个独立引擎的部分界面,利用起来稍显不便。
10、Highway61(http://www.highway61.com)
并行式元搜索引擎,可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo等6个独立引擎,提供AND和OR两种逻辑组合选择搜索,每次查询的参数保存在"cookie"中,下次查询时会自动设置好,对查出结果进行组织,按页面评分排序,并在查询结果中指出信息源。
11、Isleuth(http://www.isleuth.com).
并行式元搜索引擎,可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6个万维网搜索引擎,也可查新闻、商业黄页以及分类信息等,可使用*作为通配符,支持+、-词操作,支持分类目录搜索,但它对结果不进行筛选和整理,直接按数据库来源列出。
12、C4 http://www.c4.com/ )
并行元搜索引擎,可对网页,健康,商业,财经新闻,科技新闻,标题新闻,家庭工作,mp3,体育,公司名录和新闻组共11大类53个搜索引擎发送搜索请求。支持AND,OR,NOT和短语搜索,支持自然语言搜索,但没有自己的标准问答库,返回结果每页显示可从5到50条自选,默认20条。搜索结果以相关性排序,每条结果旁都有来源搜索引擎的标志,如果对哪个搜索引擎满意,可以点击"MORE FROM XXXX"直接用那个搜索引擎搜索。注册后可保存个性化设置,在任何地方登录后均可进行个性化搜索,还提供在线收藏夹,可以保存复杂或常用的搜索请求,提供了有多达5种很酷截界面的搜索功能代码免费下载安装在用户主页上。
13、InfoGrid ( http://www.infogrid.com/)
提供与主要搜索网站的直接连结和目录检索,具有强大的元搜索和新闻搜索功能。
14、Infonetware RealTerm Search ( http://www.infonetware.com/)
原为检验网络分类技术而设计。它以元搜索引擎知名,但具有强大的对搜索结果进行主题分类的功能。与众不同的是,用户可选择不同的主题,并得到来自所有主题搜索结果,而不是仅仅把搜索结果限制在一个主题范围之内。
15、Ithaki ( http://www.ithaki.net/dir.html)
支持包括中文在内的20种不同语言搜索。它的高级搜索很有特色,用户可以在输入搜索词之前重定义关键词达到最精确的搜索请求。另一特色就是预览"preview"功能,使得用户点击进入网站之前先了解网站大致内容。
16、Ixquick ( http://www.ixquick.com/)
可搜索网站、MP3、新闻、图象等多种网络资源。该元搜索引擎根据网站在其他搜索引擎上排名前十名的次数重新排列其搜索结果。每个列入前十名的网站中的相关网页都带有一颗星的标志。如果你想寻找某网站在网络搜索引擎上的总体状况,那么这个元搜索引擎的帮助再好不过了。
17、Vivisimo ( http://vivisimo.com/)
调用多种搜索引擎,不仅搜索许多顶级搜索引擎新的网上资源,而且可以根据用户的搜索词将搜索结果简单归类,按照分目录的形式显示出来。
18、EZ2WWW ( http://www.ez2www.com/)
调用AllTheWeb, AltaVista, Google, Open Directory, Teoma, Wisenut and Yahoo等搜索引擎,高级搜索功能提供1000多种专项资源检索,可进行目录检索。
19、Kartoo ( http://www.kartoo.com/)
在搜索结果中显示链接各相关页面的关键词。
20、SurfWax ( http://www.surfwax.com/)
有一个其它元搜索引擎没有的独特功能,即点击每条结果左边的"网址揿钮"图标,可浏览该结果包括的任何页面,并显示搜索语句在文件中的位置。可以把搜索结果和文件存储起来以备后用。
21、Fazzle ( http://www.fazzle.com/)
即可进行一般的网址搜索,又有一个主题目录提供专题资源搜索。其前身为SearchOnline
22、Turbo10(http://turbo10.com/)
不但可以搜索一般网页,也能够搜索"不可见网页数据库(invisible web databases)"
23、Search.com (http://www.search.com/)
美国CNET科技资讯网运行的元搜索引擎,1999年10月收购了SavvySearch,而SavvySearch原隶属于科罗拉多州立大学(Colorado State University),早在1995年5月就开始提供元搜索服务。
24、Webcrawler (http://www.webcrawler.com/)
初期为隶属于Excite的基于蜘蛛程序的普通搜索引擎,2002年归于InfoSpace旗下,开始使用InfoSpace的元搜索技术。
25、Family Friendly Search(http://www.familyfriendlysearch.com)
可以同时调用 Yahooligans、AOL Kids、Kids Click、Saluki Search等主要少儿搜索引擎。
26、Supercrawler(http://www.supercrawler.com/)
通过分类目录结构搜索lycos、infoseek、altavista、excite、yahoo等五个主要搜索引擎,也就是利用了五个搜索引擎的"在本目录下搜索"的功能来做它的专业搜索。
27、Searches(http://www.searches.com)
可调用7个搜索引擎,支持Web搜索,工作搜索,拍卖搜索,论坛搜索,支持短语,有成人内容过滤功能,速度快。
28、OneSeek(http://www.oneseek.com/)
一个并行显示搜索结果的快速元搜索引擎,它有一个特别的分类目录使用了"webchains" ,可以让你用录象机控制风格(VCR-style controls)浏览网络上最好的那些网站。有专业的科技新闻搜索、商业搜索、普通新闻搜索、娱乐搜索、体育搜索、健康搜索、科学搜索、股票搜索和天气搜索,它的搜索工具非常丰富,有分类明确的书、音乐、程序代码等。
29、One2Seek(http://one2seek.com/)
可搜索的搜索引擎有45 个,可选择快速、主流、全面三种程度搜索,有保护儿童的家庭过滤功能。支持自然语言搜索,支持各种语言包括中文。支持翻译搜索结果,可选择在新窗口中打开搜索结果。 高级检索功能设置很丰富,可以对搜索时间、每页显示搜索结果数、摘要和来源显示形式、语言和搜索内容进行设置。
30、ArborSearch(http://www.arborsearch.com/)
有一个能同时搜索11个主流搜索引擎的元搜索引擎,按相关性统一显示20条搜索结果。有Ann Arbor 网站目录,还有20个独立搜索引擎可选择搜索。
31、Chubba(http://chubba.whatuseek.com/)
一次同时搜索whatUseek, AltaVista, Kanoodle, Infoseek, GoTo.com 和 Lycos六个搜索引擎和法律和分类目录。还可搜索字典,新闻组,百科全书,天气和拍卖。用户可以在几分钟内申请自己的网站内搜索功能。
32、Debriefing(http://debriefing.ixquick.com/)
由ixquick支持,搜索网页,mp3,新闻,图片,并行搜索最多14个主流搜索引擎。搜索结果只取各搜索引擎中排名前十位的,按搜索结果在不同搜索引擎中的排名决定顺序。支持+号和-号搜索。
33、Infozoid(http://www.infozoid.com/)
同时搜索15个(默认或自选)主流搜索引擎,另有新闻组搜索、新闻搜索、健康搜索、体育搜索、FTP检索。支持布尔检索, 短语检索, 和native检索。有英法德意西版。每页显示搜索结果可选择10条到无限。除了可选择是否显示网站摘要外,它最大的特色是可以选择按不同搜索引擎显示搜索结果或统一显示处理后的搜索结果。
34、Ixquick(http://www.ixquick.com)
可同时调用14个主流搜索引擎。在检索性能的完善程度上,Ixquick突破了传统元搜索引擎在这方面的局限性,支持各种基本的和高级的检索功能,包括关键词检索、短语检索、截词检索、布尔检索、概念检索、自然语言检索、指定字段检索、包含(+)或排除(-)检索等;尤其难能可贵的是,Ixquick 知道哪些搜索引擎能够处理短语、布尔逻辑、截词等等,Ixquick将负责把"翻译"后的查询请求直接递交到那些能够处理这些复杂请求的搜索引擎中,实现更加有针对性的搜索服务,瞄准更加高精专的检索结果。为了方便用户了解和使用这些高级检索功能,Ixquick以表格的形式和具体的检索实例,给用户提供了清晰和实用的帮助。
35、Sleuth(http://www.isleuth.com)
并行式元搜索引擎,它可以调用10个独立的搜索引擎,还可以查询新闻组、FTP、天气和商业黄页,提供度量衡转换功能。有众多主题搜索。收集了3000余个搜索引擎、资源指南和资源数据库,分为27个大类,几百个小类。它可以为用户注册URL。缺点是无筛选和整理。
其它英文元搜索引擎
36、Query Server(http://www.queryserver.com)
37、ZapMeta(http://www.zapmeta.com)
38、1Blink(http://www.1blink.com/)
39、Gimenei(http://gimenei.com/)
40、Meceoo(http://www.meceoo.com/)
41、One Blink - 1Blink(http://www.1blink.com/)
42、IcySpicy(http://www.icyspicy.com/)
43、MetaEureka(http://www.metaeureka.com/)
44、Moonmist(http://www.moonmist.info/)
45、Widow Meta Search(http://www.widow.com/)
46、Family Friendly Search(http://www.familFamily Friendly Searchyfriendlysearch.com/)
29、Searchy.co.uk(http://www.searchy.co.uk/)
47、TeRespondo(http://sl.terespondo.com/home/)
48、Watson for the Macintosh
(http://www.apple.com/downloads/macosx/internet_utilities/watson.html)
49、Infind(http://www.infind.com/)
50、Query Server(http://www.queryserver.com/general.htm)
51、Proteus(http://www.thrall.org/proteus.html)
52、Searchbug(http://www.searchbug.com/)
53、Skworm(http://www.skworm.com/)
54、SurfWax(http://www.surfwax.com/)
55、qbSearch(http://www.qbsearch.com/)
你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=726412
|
- 评论人:火狐浏览器
2007-06-07 06:50:03
|
|||
元搜索引擎是不是带有聚合功能呀? |
||||
|
- 评论人:xiuhe
2007-02-18 06:02:22
|
|||
中文元搜索引擎
|
||||
|
- 评论人:zjianmin
2005-11-25 21:36:57
|
|||
此文章让我茅塞顿开 |
||||
|
- 评论人:慕以
2005-10-18 14:33:54
|
|||
已经先连上以表敬意
|
||||
|
- 评论人:慕以
2005-10-18 14:24:37
|
|||
同样喜欢搜索
|
||||