—— UDH v1.0.1

1. Llama 简介

L lama (Long-Lived Application Master) 是位于 Cloudera Impala 和 Hadoop YARN 之间，用于协调资源管理的服务系统。在一个 Hadoop 集群中， Impala 可以通过 Llama 预约、使用以及释放资源分配，以减少执行 Impala 查询时过多的资源管理用度。只有在 Impala 中启用资源管理，集群中的 Llama 服务才真正运作。

默认情况下， YARN 根据 MapReduce 工作的需要按位分配资源，而 Impala 则需要所有资源在同一时间可用，以保证查询的中间结果能够在不同节点间交换，而不需要拖延查询时间来等待新的资源分配， Llama 就是为了在每个 Impala 查询开始执行前就可保证其需要的资源都可用而出现。

若一个查询执行完毕， Llama 会将资源进行缓存，确保在执行 Impala 子查询时可以使用。这种缓存机制避免了每个查询执行前都需要进行新的资源请求。同时，如果 YARN 需要该资源用于其他工作， Llama 就会将这部分资源还给 YARN 。

需要注意的是： Llama 仅支持 YARN ，不能与 MRv1 结合使用，同时， Llama 也是通过 YARN 的配置文件与 Hadoop 进行协作的。

2. Llama 安装配置 ( UDH )

利用 UDH 安装向导可将 Llama 与其他服务一起安装，仅需要在向导的 “选择服务 ” 步骤勾选 “ Llama ”服务，按照向导逐步安装即可，无需更改配置参数及文件。

注意，由于 Llama 主要服务于 Impala 和 Yarn 之间的协作，因此安装 Llama 必须确保 Impala 和 Yarn 服务的安装， UDH 中安装 Llama 服务时将提示安装 Impala 和 Yarn 服务。

其中， Llama 安装后相关配置文件的位置如下表所示：

文件类型	存放位置
二进制文件	/usr/lib/llama /
配置文件	/etc/llama/conf /
日志文件	/var/log/llama/
PID 文件	/var/run/llama/

成功安装 Llama 后，将在服务界面查看到 Llama 的相关信息，具体见在以下小节中介绍。

2.1. Llama概要信息

UDH “ Llama 服务”界面的概要部分显示了 Llama Server 的运行状态 ( 如下图 ) 。

2.2. Llama 配置信息

下面的表格列出一些 Llama 配置项的基本设置，用户可根据具体集群环境设置 Llama 相关的一般及高级的配置属性。

 Llama 设置：一般

配置项	说明	默认值
L lama Server 主机	用于运行 L lama Server 的主机	运行 L lama Server 的主机名

 Llama 设置：高级

配置项	说明	默认值
L lama 日志路径	L lama 日志路径	/var/log/llama/
Llama PID 文件路径	Llama PID 文件路径	/var/run/llama/
llama.am.cache.enabled	全局设置，说明 Llama 是否应该将分配的内存在释放时缓存	true
llama.am.cache.eviction.policy.class	缓存资源的回收机制，超时回收机制回收在缓存中保留时间等于或大于时限的资源。	com.cloudera.llama.am.cache.ResourceCache$TimeoutEvictionPolicy
llama.am.hadoop.user.name	与 Yarn 互动时， Llama 使用的用户名。	llama
llama.am.rm.connector.class	支持使用 LlamaAM 实现。功能测试时可用： MockRMLlamaAMConnector	com.cloudera.llama.am.yarn.YarnRMConnector
llama.am.server.thrift.address	LlamaAM server 监听的地址。	0.0.0.0:15000

3. Llama 使用

Llama 的使用主要通过启用 Impala 资源管理 ( Resource Management ) 实现。

为 Impala 设置资源管理，需要启用 Impala 的配置参数：

 -enable_rm: 该参数用于控制是否启用资源管理，类型为 Boolean ，默认值为 false ，表示资源管理未启用；只有在设置为 true 时，资源管理选项才可能生效。

在 UDH 中，若安装 Llama 服务，则在 Impala 的“服务操作 ”下拉菜单选择“启用 yarn 资源管理 ”可自动设置 enable_rm 参数，达到启用资源管理的目的。

enable_rm 参数值的显示位于 UDH Impala 配置页面“资源管理”配置组下，显示为“启用 yarn 资源管理”。未启用 yarn 资源管理时， “启用 yarn 资源管理”显示为 false ( 如下图 ) 。

启用资源管理后，下面几个参数便会生效：

 -llama_host ： Llama 服务所在的主机名或 IP 地址，供 Impala 连接使用。默认值为 127.0.0.1 ；

 -llama_port ： Llama 服务端口，，供 Impala 连接使用。默认为 15000 ；

 -llama_callback_port: Impala 启用 Llama 回调服务的端口。 Llama 从该服务报告资源的批准或优先占有。

 -staging_group: YARN 和 Llama 创建已批准资源的 CGroups 的路径， Impala 假设一个已分配容器的 CGroup 在目录 'cgroup_hierarchy_path +container_id' 下创建。

 -fair_cheduler_allocation_path: fair-scheduler.xml 文件存放位置。启用 Llama 后， YARN 默认使用 fair-scheduler.xml 中定义的调度方式进行资源调度， fair-scheduler.xml 位于 /etc/impala/conf/ 目录下。

此时， “启用 yarn 资源管理”显示为 true ，同时，该配置项下方将增加上述 llama 相关配置信息显示，如下图所示。

启用资源管理后，可在执行 impala 查询时，自动通过 Llama 服务进行 yarn 资源调度，调度方式定义在 fair-scheduler.xml 中。 UDH 支持在线修改和保存 fair-scheduler.xml 内容，以修改 Yarn 资源调度方式。

启动资源管理后，选择相同位置的 “禁用 yarn 资源管理 ”可以使资源管理失效，即禁用 Llama 服务。

知识库 : Llama使用手册 ---UDH v1.0.1

1. Llama 简介

2. Llama 安装配置 ( UDH )

2.1. Llama概要信息

2.2. Llama 配置信息

3. Llama 使用

Attachments:

知识库 : Llama使用手册 ---UDH v1.0.1

1. Llama 简介

2. Llama 安装 配置 ( UDH )

2.1. Llama概要信息

2.2. Llama 配置 信息

3. Llama 使用

Attachments:

2. Llama 安装配置 ( UDH )

2.2. Llama 配置信息