一、概述

UDH1.0.3增加了在线上传下载分词库功能，使用者可以通过 UDH Manager手动查看、修改 Search集群的分词库，而不用单独到操作每个 Search服务，简化了 Search分词库管理工作。

二、环境准备

通过UDH Manager 安装Search服务的时候，同时会安装分词处理程序udh-search-ik ，同时会在的schema.xml模板中添加应用分词功能的字段类型：text_ik 。

打开Solr Web 管理界面，选择已有的 collection，在A nalysis 界面输入一段文字，看下分词情况，效果如下图：

3.1 进入管理-> 分词管理下载已有的分词文件。

3 .2根据需要修改分词文件（注意，词库中每个中文词汇独立占一行，文件编码需要 UTF-8 ）。

3 .3 上传修改后的分词文件。

3.4 手动重启Search服务。

这里以批量构建 hbase索引的方式创建基于分词器的Collection 。

$C:\Users\kongml\AppData\Local\Temp\SNAGHTML4ce60908.PNG$

$ solrctl instancedir --generate /tmp/hbase-demo

$ vim /tmp/hbase-demo/conf/schema.xml

在schema.xml的fields标签里添加：

然后依次执行：

$ solrctl instancedir --create hbase-demo /tmp/hbase-demo

$ solrctl collection --create hbase-demo

$ vim /tmp/ morphline-hbase-mapper.xml

$vim /etc/hbase-solr/conf/morphlines-demo.conf

执行命令：

这个过程可能需要几分钟，出现“hadoop.ForkedMapReduceIndexerTool: Succeeded with job: jobName”语句表明执行成功。

注：构建 collection 和构建索引阶段如果出现Direct buffer memory相关错误时，可以先关闭 solr_hdfs_blockcache_direct_memory_allocation特性，具体见 s earch配置项页面。