我在12节点集群上安装了HDP . 我使用了Hortonworks自动ambari安装 . 一切都在工作,除了Ambari指标收集器 . 这是我第三次尝试此安装,尝试自定义某些组件的分发位置 . 每当我遇到无法隔离的错误时,我都会对机器进行重新格式化并再次尝试,每次都会简化 . 最后一次我没有做任何改动,除了Hive和Oozie数据库的位置 . 但我仍然遇到与Metrics收集器无法启动相同的问题 . 我已经没想完了 . 从/var/lib/ambari-agent/data/errors-376.txt的错误文件中:

Traceback (most recent call last):
  File "/var/lib/ambari-agent/cache/common-services/AMBARI_METRICS/0.1.0/package/scripts/metrics_collector.py", line 131, in <module>
    AmsCollector().execute()
  File "/usr/lib/python2.6/site-packages/resource_management/libraries/script/script.py", line 219, in execute
    method(env)
                      ...
  File "/usr/lib/python2.6/site-packages/ambari_jinja2/environment.py", line 891, in render
    return self.environment.handle_exception(exc_info, True)
  File "<template>", line 5, in top-level template code
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2028' in position 1341: ordinal not in range(128)

我不确定它是不是试图在模板中读取你无法找到的u /'u2028'字符,还是其他的东西?我还在/var/lib/ambari-agent/data/output-376.txt中的StdOut中看到以下内容:

...
2016-04-06 06:55:20,967 - Generating config: /etc/ambari-metrics-collector/conf/ams-site.xml
2016-04-06 06:55:20,968 - File['/etc/ambari-metrics-collector/conf/ams-site.xml'] {'owner': 'ams', 'content': InlineTemplate(...), 'group': 'hadoop', 'mode': None, 'encoding': 'UTF-8'}

在这里我想知道为什么这个文件不在/ etc / hadoop / conf /或/ usr / hdp / current / hadoop-client / conf /的其他配置文件中

我觉得这在我的设置中是一个简单的错误,因为我已经使用自动安装几个月在虚拟机上运行了很好的集群 . 他的安装虽然规模较大,但却装在容量较大的裸机上 . 还有其他地方我应该寻找答案吗?感谢您的帮助或指导 .

哦是的,..我也遇到了三个连接错误:

FQDN:61310    Connection failed [errno 111] Connection refused
0.0.0.0:6188   Connection failed [errno 111] Connection refused
FQDN:61181   Connection failed [errno 111] Connection refused

我让Ambari指标运行,至少是暂时的,通过将其模式更改为从嵌入式分发 . Insodoing,当我保存配置更改时,提供了新建议,这些建议多次切换hbase_regionserver_heaqpsize和metrics_collector_heapsize的值 . 在大约三到四轮更改值后,我选择了Proceed Anyways,到目前为止它正在运行 .