Skip to content

Files

Latest commit

c482542 · Jan 8, 2022

History

History
54 lines (28 loc) · 4.34 KB

01.md

File metadata and controls

54 lines (28 loc) · 4.34 KB

一、为什么是 Solr 和企业搜索?

搜索无处不在

互联网搜索,主要是因为谷歌,有一个有趣的副作用:人们期望搜索无处不在。

有数十亿人在全球范围内接受搜索培训,这是你根本负担不起的培训费用。然而,谷歌正是以其做生意的方式做到了这一点——而且大部分是零成本的,确保了截至 2013 年的数十亿次每日搜索,并且还在增长。

我们在哪里可以看到搜索应用程序?你有 YAHOO!对于网络搜索,在 Windows 资源管理器右上角的搜索框中搜索您的文件,在 Mac 中搜索聚光灯,在 Windows 8、Bing、Outlook、iPhone 和 Android 中搜索魅力栏;名单很大,而且似乎永无止境。

搜索无处不在,让你的生活各方面都轻松。

图 2:各种搜索工具

然而,要寻找的远不止眼前的东西。搜索技术公司的首席执行官卡姆兰·汗先生说,在大多数情况下,只有两种类型的搜索:防火墙外和防火墙内。防火墙外面是用来赚钱的,而防火墙里面是用来省钱的。

于是我问:“为什么?”

  • 防火墙外搜索是一个强大的销售工具。例如,想想易贝和亚马逊。在电子商务网站上进行良好的搜索可以让客户找到他或她正在寻找和购买的东西。嘉庆!收银机高兴了!
  • 在防火墙内进行搜索有助于找到预先存在的项目、相关工作或内部文档,所有这些都使员工能够充分利用该技术,避免重复工作。

人们期望快速找到东西——人性渴望简单和准确。

定义

让我们看看搜索的定义:

彻底检查,仔细检查以发现某物。

仔细检查或调查,探查。或者进行彻底的调查,寻求。

来源:美国英语遗产词典,第四版(或谷歌“定义:搜索”)

正如定义所指出的,寻找是寻找某样东西的行为,然而寻找某样东西最重要的部分是找到它的能力。我已经对多个搜索工程师说过几次了:我们不应该称他们为“搜索引擎”,而应该称他们为“查找引擎”,但是这个想法并没有吸引我。

抛开语义不谈,这本书将专注于企业搜索,尤其是 Solr。我们将企业搜索定义为从多个企业类型的数据源(如数据库或内容管理系统)中生成内容并使其可被定义的受众搜索的实践。

例如,如果您在组织中使用 SharePoint,右上角的搜索输入将被归类为企业搜索解决方案。任何试图从众多不同的公司内部数据源中获取大量复杂数据,并允许对这些数据进行索引、过滤和组织以更容易找到内部信息的行为,都被归类为基于企业的搜索解决方案,并适用于该解决方案。

为什么是索尔?

Apache Solr 是开源的,它有一个快速和复杂的文本搜索,它高度可扩展,高度可伸缩,并且可以处理动态内容。当适当缩放时,它具有很高的查询速度,原因还有很多。Solr 还有一个非常活跃的开发社区,由个人和公司组成,他们定期贡献新特性和错误修复。

从历史的角度来看,搜索从来都不是为胆怯的人准备的。一些旧的解决方案非常非常复杂,很容易花费数万美元;一个完全商业支持的解决方案甚至可能花费数百万美元。然后 Solr 很大程度上改变了游戏的名字,现在它留在了这里。

搜索引擎是完全不同的动物。你要么会爱上你可以用搜索引擎做的事情,要么如果你试图在没有适当资源的情况下正面解决它们,你可能会彻底讨厌它们。有了 Solr,你很幸运:这是一个合适的资源,有一个小预算和一群帮手来帮助你顺利有效地开始。

索尔的历史和名胜

CNET 网络公司(从 2004 年开始,由尤尼克·西利(Yonik Seeley)开发了太阳能(带 A)作为内部平台,为公司网站增加搜索功能。2006 年,CNET 网络公司决定公开发布该代码,在 Lucene 顶级项目下将其捐赠给 Apache 基金会,并成为 Solr。如果你想知道,Solr 不是一个首字母缩略词。

现在,Apache Solr 为一些最大的企业搜索网站和机构提供支持,如白宫、美国在线、美国电话电报公司互动、黄页、Instagram、Usados.cr、eHarmony、西尔斯、网飞、Zappos、迪士尼、美国宇航局等。