Rancher Logging 集成
现在,Rancher 的日志管理由 Logging operator 提供支持,它取代了以前的内部解决方案。
启用 Logging
你可以转到应用页面并安装 Logging 应用程序,从而为 Rancher 管理的集群启用 Logging:
- Rancher v2.6.5+
- Rancher before v2.6.5
- 转到要安装 Logging 的集群,然后单击 Apps。
- 点击 Logging 应用。
- 滚动到 Helm Chart README 的底部,然后单击安装。
- 转到要安装 Logging 的集群,然后单击 Apps & Marketplace。
- 点击 Logging 应用。
- 滚动到 Helm Chart README 的底部,然后单击安装。
卸载 Logging
- Rancher v2.6.5+
- Rancher before v2.6.5
- 转到要安装 Logging 的集群,然后单击 Apps。
- 点击已安装的应用。
- 转到
cattle-logging-system
命名空间并选中rancher-logging
和rancher-logging-crd
框。 - 单击删除。
- 确认删除。
- 转到要安装 Logging 的集群,然后单击 Apps & Marketplace。
- 点击已安装的应用。
- 转到
cattle-logging-system
命名空间并选中rancher-logging
和rancher-logging-crd
框。 - 单击删除。
- 确认删除。
结果:已卸载 rancher-logging
。
架构
有关 Logging 应用程序工作原理的更多信息,请参阅本节。
RBAC
Rancher Logging 有两个角色,分别是 logging-admin
和 logging-view
。有关如何以及何时使用这些角色的更多信息,请参阅此页面。
配置 Logging 自定义资源
要管理 Flows
、ClusterFlows
、Outputs
和 ClusterOutputs
:
- 在左上角,单击 ☰ > 集群管理。
- 在集群页面上,转到要配置 Logging 自定义资源的集群,然后单击 Explore。
- 在左侧导航栏中,单击 Logging。
Flows 和 ClusterFlows
有关配置 Flows
和 ClusterFlows
的帮助,请参阅此页面。
Outputs 和 ClusterOutputs
有关配置 Outputs
和 ClusterOutputs
的帮助,请参阅此页面。
配置 Logging Helm Chart
有关在安装或升级 Logging 应用程序时可配置的选项,请参阅此页面。
Windows 支持
你可以从 Windows 节点启用 Logging。
使用自定义 Docker 根目录
有关使用自定义 Docker 根目录的详细信息,请参阅本节。
处理污点和容忍度
有关如何在 Logging 应用程序中使用污点和容忍度的信息,请参阅此页面。
在 SELinux 上使用 Logging V2
有关在启用了 SELinux 的节点上使用 Logging 应用程序的信息,请参阅本节。
其他日志来源
默认情况下,Rancher 会收集所有类型集群的 controlplane 组件和节点组件的日志。在某些情况下,也会收集其他日志。有关详细信息,请参阅本节。
故障排除
日志缓冲区导致 Pod 过载
根据你的配置,默认缓冲区大小可能太大并导致 Pod 故障。减少负载的一种方法是降低记录器的刷新间隔。这可以防止日志溢出缓冲区。你还可以添加更多刷新线程来处理大量日志试图同时填充缓冲区的情况。
有关如何配置日志缓冲区来满足企业需求的更完整说明,请参阅缓冲区和 Fluentd 配置的官方 Logging Operator 文档。
cattle-logging
命名空间正在重新创建
如果你的集群之前在旧版 Rancher UI 的全局视图中部署了 Logging,cattle-logging
命名空间可能会不断被重新创建。
要解决这个问题,你可以将所有 clusterloggings.management.cattle.io
和 projectloggings.management.cattle.io
自定义资源从管理集群中针对该集群的命名空间中删除。
这些自定义资源会导致 Rancher 在下游集群中创建 cattle-logging
命名空间(如果不存在)。
集群命名空间与集群 ID 匹配,因此我们需要找到每个集群的集群 ID。
- 在左上角,单击 ☰ > 集群管理。
- 在集群页面上,转到要获取 ID 的集群,然后单击 Explore。
- 从以下其中一个 URL 中复制
<cluster-id>
的内容。<cluster-id>
是集群命名空间名称。
# Cluster Management UI
https://<your-url>/c/<cluster-id>/
# Cluster Dashboard
https://<your-url>/dashboard/c/<cluster-id>/
现在我们有了 <cluster-id>
命名空间,我们可以删除导致 cattle-logging
不断重新创建的自定义资源。
警告:请确保当前未使用 Logging (从旧版 Rancher UI 全局视图中安装的版本)。
kubectl delete crd clusterloggings.management.cattle.io -n <cluster-id>
kubectl delete crd projectloggings.management.cattle.io -n <cluster-id>