-
2 votesanswersviews
用于监控google cloud pub / sub的Stackdriver延迟
记录自https://cloud.google.com/monitoring/api/v3/metrics#time-series 度量标准数据是根据受监视资源不同的计划收集的 . Stackdriver Monitoring会定期从受监视资源中“拉出”某些数据,某些数据会被应用程序,服务或Stackdriver Monitoring代理“推送” . 我想知道stackdriver如何从Go... -
3 votesanswersviews
是否可以查询Stackdriver v3 API以获取正常运行时检查数据?
上下文 Stackdriver Monitoring API (v3) docs显示如何query for data from a specific timeseries 例如,一个类似的查询(格式化为可读性) GET https://monitoring.googleapis.com/v3/projects/{project_id}/timeSeries? filter= metric.... -
11 votesanswersviews
监控和警告pod状态或使用Google Container Engine(GKE)和Stackdriver重新启动
有没有办法监控pod状态并重启使用Stackdriver在GKE集群中运行的pod的数量? 虽然我可以看到Stackdriver中所有pod的CPU,内存和磁盘使用情况指标,但似乎无法获得有关由于崩溃而重新启动副本集中的pod或pod的崩溃的指标 . 我正在使用Kubernetes副本集来管理pod,因此它们会在重新生成时重新生成并在崩溃时使用新名称创建 . 据我所知,Stackdriver中的指... -
0 votesanswersviews
Stackdriver自定义多行日志记录,时间格式
我一直在尝试设置一个自定义多行日志解析器,以使用一些可读字段将日志导入Stackdriver . 目前它看起来像这样: <source> type tail read_from_head true path /root/ansible.log pos_file /var/lib/google-fluentd/pos/ansible.pos tim... -
3 votesanswersviews
Stackdriver中的Google Cloud IoT核心状态数据
我想知道是否有任何方法可以将通过Google IoT Core发送的设备状态数据显示在Stackdriver中,可能作为自定义指标 . 本质上,我想使用Stackdriver来监控我的设备,而不是将代理部署到所有设备,我可以利用现有的安全连接,因为它们连接到IoT Core . 我可以从设备向状态主题发布MQTT消息,其中包含一些相关信息(例如,CPU百分比,运行的进程数等) . 然后我可以使用S... -
1 votesanswersviews
如何使用stackdriver为dataproc集群创建空闲/正常运行时间度量标准
我想为我正在运行的所有数据集群创建一个空闲或正常运行时间指标,而且从我在stackdriver中看到的情况来看,我无法这样做 . 我的方案是我有每天运行的定时数据业务作业,在作业完成后我删除了集群 . 我想通过电子邮件创建一个警报,如果有空闲的数据集群在一小时内什么也不做,或者数据集群的正常运行时间超过24(甚至20)小时 . 谢谢 . -
3 votesanswersviews
Google App Engine - Cloud 控制台Stackdriver跟踪详细信息
我正在尝试更好地了解Google的 Cloud 控制台堆栈驱动程序跟踪显示调用详细信息的方式,并调试我的应用程序的一些性能问题 . 大多数请求都与memcache set / get操作有很大关系,我在这里遇到了一些问题,但我不明白为什么调用之间存在很长时间的差距 . 我上传了2个截图 . 所以,正如你所看到的,@ 1025ms的呼叫耗时2ms,但它和urlfetch呼叫@ 5235ms之间的... -
4 votesanswersviews
Google Cloud Stackdriver监控计算引擎磁盘使用情况
我最近已经启动并运行了Google计算引擎实例 . 我已经探索了Google Cloud stackdriver来监控CPU使用率等 . 我已将Stackdriver代理程序安装到其中一个Compute Engine实例上进行测试 . 我已经探索了在仪表板上创建新图表,尝试了各种指标 . 但我找不到任何可以显示我的实例 disk usage 的指标 . 是的,Stackdriver代理支持的插件列... -
4 votesanswersviews
Stackdriver监控,未授权完全访问范围
部署具有完整API访问权限并安装Stackdriver代理的全新Google Compute Engine实例后,Monitoring不显示代理的任何指标 . 根据Install Agent手册,不需要进一步设置(如手动配置API密钥) . 代理服务状态还显示以下错误: $ systemctl status stackdriver-agent Jul 13 10:14:00 host stackd... -
5 votesanswersviews
如何将Google容器引擎中的自定义指标记录到Stackdriver?
我目前正在探索越来越多的Google Cloud Platform,并尝试评估如何更改默认堆栈 . 我喜欢使用所有内置工具而不必去各种Saas产品的想法 . 其中一个更开放的问题是如何使用Stackdriver Monitoring . 据我所知,内置监控功能将Heapster与Google Cloud Sink配合使用 . 但是,如何将自己的自定义指标公开给Stackdriver以供使用?我不是... -
1 votesanswersviews
GCP Stackdriver中每个受监视资源都需要单独的代理吗?
GCP中每个受监视资源都需要单独的代理吗?例如,如果我对cpu,磁盘,内存,jvm等指标感兴趣,我是否在我的GCE实例中安装单个代理或多个代理来处理使用Stackdriver时监视代理程序提供的其他指标? -
2 votesanswersviews
如何使用Google监控堆栈驱动程序代理监控http指标(例如响应时间或http状态代码)?
我想我有一个非常简单的用例: a spring boot java application 通过 endpoints (localhost:8002 / metrics)和JMX公开指标 a google compute engine machine that hosts that application (或Google容器引擎中的窗格) 我希望在 monitoring dash... -
0 votesanswersviews
如何在谷歌计算引擎中为RAM使用设置stackdriver?
我已经在计算引擎上创建了一个实例,现在我想知道如何设置堆栈驱动程序来检查RAM使用率,CPU利用率和与实例交互的用户数量 -
1 votesanswersviews
有没有办法通过telegraf手动将记录插入InfluxDB并使用自定义时间戳?
https://github.com/influxdata/telegraf/pull/1557 显然有些人一直在要求这个,而这个Github PR是我能找到的最接近解决方案的东西,但它最终被否定了(我想?) . 基本上,我有一个JSON对象,我从Stackdriver获得,其中包含ISO8601中的时间戳,我将其转换为Unix时间 . 我可以将整个JSON响应插入Influx中,但Stackdr... -
1 votesanswersviews
当Stackdriver提醒我时,如何生成API运行?
我正在关注这个文档 . 我知道 Cloud 函数向您的函数发出HTTP请求,运行以下命令 . https://cloud.google.com/functions/docs/ 我想在可能触发Stackdriver警报时运行预先创建的API . 我已经在GCP中定义了简单的基于自定义日志的指标 . 例如,我创建了一个检测意外错误GAE日志的Stackdriver Alert . 如果能提醒我,我希... -
3 votesanswersviews
Stackdriver日志记录并不总是应该在Google Cloud 端控制台上运行
我在Kubernetes / Google Container Engine下运行了相对大量的服务,并通过Google Cloud Console UI创建了一个群集 . 在容器中,我有以JSON格式登录的Java服务 . 大部分时间这都可行,但最近越来越多的日志在一个看似随机的时间点“停止”,最新的条目(在任何日志级别)都是几小时或几天前 . 我没有改变任何参数,也无法找出导致这种情况的原因 .... -
2 votesanswersviews
堆栈驱动程序仪表板 - 无法使用基于自定义日志的指标保存仪表板
我为数据流作业生成的一些日志消息创建了基于日志的度量标准 . 此度量标准所基于的过滤器表现正常(使用此过滤器时,预期数据显示在日志查看器中) . 我正在尝试使用此用户定义的基于日志的指标创建仪表板,遵循此处描述的过程https://cloud.google.com/logging/docs/view/logs_based_metrics#creating_a_chart 但是,从“度量标准”下拉列... -
1 votesanswersviews
StackDriver是否支持Syslog协议?
StackDriver是否支持Syslog协议?若然,有人可以分享一个例子吗? 对于上下文,我查看了文档,但没有办法这样做 . 所以,关闭方法似乎是使用StackDriver代理 . 但是,我想利用API网关,例如Apigee,它通过Message Logging Policy支持Syslog协议 . 我知道可以利用REST API发送这些条目 . 但是,我正在尝试避免创建其他HTTP层 . 任何... -
0 votesanswersviews
Google Stackdriver基于日志的度量标准:如何使用日志行中的正则表达式提取值
我在Google Cloud 端控制台中有以下表单的日志行: 更新了有关123个爪牙的黑名单信息 . max_blacklist_per_minion = 20,median_blacklist_per_minion = 8,blacklist_free_minions = 31 我正在尝试设置一些基于日志的指标来获得 Value 的长期概览(即它们如何变化?是低于还是高于昨天等等) . 但... -
0 votesanswersviews
基于每20分钟写入的日志条目中的值进行警报
我需要创建一个看似非常简单的警报,但我很难搞清楚警报触发所需的阈值和持续时间 . 我们有一个每20分钟将值写入日志的进程 . 该条目包含一个“count”值,如果我们在一行中得到两个计数值为零的条目,那么我们需要触发一个警报 . 我的第一次尝试是20分钟以上的“超过1”的门槛,但是没有开火 . 所以现在我正在尝试“超过0”的“最近的 Value ” . 或者它可能介于两者之间...... 在此先感... -
0 votesanswersviews
尽管指标处于正常范围内,仍会触发堆栈驱动程序警报
我们项目中的Stackdriver警报存在一个奇怪的问题 . 我们已设置一个警报,如果日志指标低于阈值,则会触发警报,并且最近它已触发警报,尽管日志正常 . 警报页面中的图表显示正在测量2个指标(应该只有1个),其中一个指标下降到0,然后一个具有相同名称的新指标“接管” . 似乎第一个警报被触发,但是由于第二个警报正常进行,第一个警报从未解决 . 屏幕截图显示了图中的'transition' .... -
0 votesanswersviews
通过Monitoring v3 API创建Stackdriver警报策略
使用Stackdriver v3监控api,我可以创建监控组,正常运行时间检查,根据创建的监控组,警报策略和正常运行时间检查警报策略包括正常运行时间检查 . 策略按预期触发,我收到配置的通知(通过控制台UI手动配置通知) . 我正在使用API Explorer的REST方法和脚本化的gcloud命令的组合 . 警报策略是使用JSON文件创建的 . 一切都很顺利,除了从Stackdriver控制台查... -
1 votesanswersviews
基于日志的用户定义指标似乎在Stackdriver中相互更改
我在Google Stackdriver中有许多用户定义的指标 . 然后,我使用“编辑指标”编辑其中一个,编辑过滤器,然后单击“保存” . 当我通过“编辑指标”查看不同的用户定义指标时,我之前的更改似乎也出现在此处 . 跆拳道?!? 还有其他人有这个问题吗?我做错了什么吗? -
6 votesanswersviews
Google Stackdriver日志记录中的日志级别
已配置的Google Stackdriver登录其中一个GCE VM,一切正常,但日志级别除外 . 在文件中使用了参数log_level /etc/google-fluentd/config.d/tomcat.conf 按照_1343685中的规定提供,但即使这样,在Console Log Viewer中也无法查看不同级别的日志 . 有没有特定的方法为Google Cloud配置流畅的代理? -
0 votesanswersviews
什么是Stackdriver监控全局资源限制?
我试图了解Stackdriver Monitoring是否适合物联网监控,并将"global"资源和设备ID的自定义指标概念作为标签 . 根据https://cloud.google.com/stackdriver/pricing#stackdriver_monitoring_services 限制是每个可收费资源500个时间序列,每个项目250个度量标准类型 . 标签的每个不... -
1 votesanswersviews
Google Dataflow自定义指标未显示在Stackdriver上
我试图通过使用 Metrics.counter & Metrics.gauge 测量部分数据来更深入地查看我的数据流作业,但我无法在Stackdriver上找到它们 . 我有一个优质的Stackdriver帐户,我可以在Dataflow UI的自定义计数器部分下看到这些计数器 . 我可以在Stackdriver that seems to be created via Metrics.counte... -
0 votesanswersviews
用于Nodejs事件循环延迟的StackDriver自定义度量标准
我正在尝试为Google StackDriver构建一个自定义指标,我可以用它来跟踪nodejs事件循环延迟 . 所有应用程序都在Google AppEngine中运行,所以我只能使用受监控的资源 global (至少据我所知) . 通过nodejs @google/monitoring 客户端,我创建了一个如下所示的度量标准描述符: { name: client.projectPath(p... -
4 votesanswersviews
计算指定时间内GCP日志条目的数量
是否可以从GCP Stackdriver日志记录计算特定时间段内特定日志消息的出现次数?回答“在这段时间内发生了多少次此事件”的问题 . 基本上我想要下图中曲线的积分 . 它不一定是一个移动窗口,这次它更像是一次性任务 . 如果可用,高级日志查询中的计数聚合器或类似物也将起作用 . 查询如下所示: (resource.type="container" logName=&quo... -
1 votesanswersviews
GKE集群不受StackDriver监控
尽管启用了 Cloud 监控,但我的GKE集群不受Stackdriver监控 . 特别是https://app.google.stackdriver.com/gke只报告"You do not have any resources of this type being monitored by Stackdriver" . 集群运行Kubernetes 1.2.4,于201... -
0 votesanswersviews
自定义计数器来自Stackdriver监视中的数据流
如何查看我的数据流作业中定义的自定义计数器到stackdriver监视 . 正如谷歌文档所说,数据流中定义的任何自定义计数器将被报告为stackdriver中的自定义指标 . 但是当我在“查找资源类型和指标”框中过滤它时,我无法在Stackdriver Metrics Explorer页面中看到任何自定义指标 . 谢谢,