有没有可能在内部网络利用开源工具建一个类似百度的搜索引擎?能够搜索一下文档,网页之类的? 有开源的可以部署吗?硬件都需要怎么配置?
1
2lecl 2018-03-05 11:14:59 +08:00 via iPhone
solr ?
|
2
jahan OP 刚查了一个雅虎的 Vespa。solr 和 vespa 是不是都没有爬虫呢?
|
3
yuyongji1987 2018-03-05 12:37:55 +08:00 via iPhone
elasticsearch
|
4
linyinma 2018-03-05 12:50:12 +08:00
[内网搭建一个搜索引擎] : 你提的的仅仅是搜索, 搜索引擎最重要的功能都是日常站点的收录,你内网有多少站点啊,这些站点被收录前提需要向站长平台提交站点,然后站长平台去抓取~~ 仅仅打个搜索引擎有什么意思额
|
6
katsusan 2018-03-05 14:09:51 +08:00 via iPhone
问这个问题至少说明下检索的对象是什么,对象以什么形式存在好一点
|
7
likuku 2018-03-05 14:13:12 +08:00
搜互联网上的公开信息?搜局域网内企业 /自己保存的信息?(以前 google 有供个人下载使用的 桌面搜索软件)
|
8
likuku 2018-03-05 14:14:49 +08:00
对企业自己存储的文档资料进行检索,记得 IBM 很早就有成熟商业产品。
|
9
jahan OP 所搜特定的 10 几个网站。想做一个只针对这 10 几个网站的小型的百度。
|
10
simapple 2018-03-05 14:44:11 +08:00
es
|
12
coreos 2018-03-05 18:21:46 +08:00
可以做特定的网站地图,简单的爬虫
|
13
ddup 2020-01-12 21:10:20 +08:00
我的,归海数据桌面搜索,可以全文搜索,可以部署在内网然后通过浏览器访问,不过需要配置一下。
|