在Lucene/Solr的SVN trunk中的SolrCloud已经可用, 在即将发布的4.0版本中将正式包含.
目前SolrCloud已经成熟, 可以支持分布式索引和分布式搜索. 下面是我们一个项目采用新的SolrCloud的部署结构图:
看起来是否非常简单? 下面我们看看内部的一些实现细节.
SolrCloud功能和架构
下面是SolrCloud一些不错的功能:
- 中心化集群配置
- 自动容灾
- 近实时搜索
- 领导选举
- 索引持久化
另外SolrCloud也能被配置成:
分片(shard)索引
每个shard可以有一个或多个副本(replica)
多个shard和replica可以组成一个Collection(从图中可以看出就是一个SolrCloud), 多个Collection可以部署到一个SolrCloud集群. 而一个搜索请求可以同时搜索多个Collection. 其工作流程就像下图中那样.
SolrCloud Shard, Replica, Replication
就像上图那样, 一个新的doc将发送到一个SolrCloud集群中任何一个节点. doc能自动选择发送到哪一个Shard, 如果Shard有多个副本, doc会自动进行同步, 与原来的master/slave结构有所不同, 数据同步是实时的(原来则是定期批量同步).
集群配置
SolrCloud集群的所有的配置存储在ZooKeeper. 一旦一个SolrCloud节点启动, 该节点的配置信息将发送到ZooKeeper上存储.
Shard Replica除了作为容灾备份存在, 另外一个作用就是分散查询请求, 提高整个集群的查询能力.
索引处理
索引文档的更新在Shard和Replica之间是自动和实时的. 因为不存在master server, doc可以发送到任何一个SolrCloud(也就是一个Collection), 然后由SolrCloud完成剩下的事情. 这样就不再存在以前master/slave的单点问题.
搜索方式
有三种不同的搜索方式:
在单个Solr实例上搜索
在单个Collection上搜索(即在一个Collection的多个Shard上搜索)
在指定的Shard上搜索
在多个Collection上搜索, 并将最后merge的结果返回.
运维管理
除了原来的标准core admin, 还增加了其他方式:
在一个Collection上创建一个Shard
新建一个Collection
增加节点.
下一步 这里
参考原文:http://blog.sematext.com/2012/02/01/solrcloud-distributed-realtime-search/
相关推荐
solrcloud环境搭建 windows平台搭建档案 全文检索实现
solrcloud6安装配置
SolrCloud集群搭建和使用步骤
solrcloud5结合zookeeper搭建、使用详解,是一部难得的好教程
文件内含有solrcloud搭建需要的文件,内含:IK中文解析器、tomcat7.0、安装solr的文件solr4.10.3版本、zookeeper3.4.6版本。如需要请下载。也可以直接使用solr+tomcat搭建单机版的solr服务也可以。
Win7 下面 安装solrCloud5.2.1 + tomcat7 + zookeeper3.4.6 集成。 有安装步骤,裁图和说明 1分物超所值 哈哈
centos下搭建好solrcloud集群,可以直接使用!!!!!!
solrcloud高可用集群搭建: 1.jdk安装 2.zookeeper集群安装 3.solr集群安装
SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。此文档参考培训机构资料,适合初学者参考使用。
一个简单的关于Solr集群部署的,SolrCloud集群架构图
solrcloud 搭建solr集群 solr4.7.2+zookeeper3.4.14 用到的工具包
这是一份关于SolrCloud的文档,有需要的可以下载看一看。
Tomcat上部署SolrCloud.txt
为三台远程Linux服务器搭建SolrCloud 本次目的是在tomcat以及zookeeper的基础上,搭建三台远程服务器的SolrCloud 工具:WinSCP,SecureCRT,apache-tomcat-7.0.62,solr-4.10.4,zookeeper-3.4.6 WARNING: 版本注意 ...
SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,搜索请求并发很高,这时...
solr-sql是针对solrcloud封装的sql编程接口,主要支持SELECT...FROM...WHERE查询语句。 SolrCloud是基于ZooKeeper和Solr的分布式解决方案,为Solr添加分布式功能,用于建立高可用,高伸缩,自动容错,分布式...
这是solrCloud的集群搭建和部署,详细讲解了solr集群的部署
NULL 博文链接:https://rayoo.iteye.com/blog/2121443
solrcloud5_多数据源导入成功的例子
详细描述solrCloud单机以及单机伪集群在windows下的部署安装并配图。