解决 Kubernetes 中 Kubelet 组件报 failed to get cgroup Failed to get system container stats 错误

Failed to get system container stats for “/system.slice/docker.service”: failed to get cgroup stats for “/system.slice/docker.service”: failed to get container info for “/system.slice/docker.service”: unknown container “/system.slice/docker.service”

系统环境:

Kubernetes 版本:1.18.1
操作系统版本:CentOS 7.8
一、问题描述
最近查看 Kubelet 日志,发现日志中一堆错误信息,内容如下:

-n:指定获取最后指定行数的日志信息。

$ journalctl -u kubelet -n 10

19 02:40:17 k8s-node-2-14 kubelet[1291]: E0419 02:40:17.749145 1291 summary_sys_containers.go:47] Failed to get system container stats for “/system.slice/docker.service”: failed to get cgroup stats for "/system.slice/docker.service
19 02:40:27 k8s-node-2-14 kubelet[1291]: E0419 02:40:27.772168 1291 summary_sys_containers.go:47] Failed to get system container stats for “/system.slice/docker.service”: failed to get cgroup stats for "/system.slice/docker.service
19 02:40:32 k8s-node-2-14 kubelet[1291]: E0419 02:40:32.377548 1291 summary_sys_containers.go:82] Failed to get system container stats for “/system.slice/docker.service”: failed to get cgroup stats for "/system.slice/docker.service
19 02:40:37 k8s-node-2-14 kubelet[1291]: E0419 02:40:37.800210 1291 summary_sys_containers.go:47] Failed to get system container stats for “/system.slice/docker.service”: failed to get cgroup stats for "/system.slice/docker.service
BASH
可以观察到提示 failed to get cgroup stats for “/system.slice/docker.service” 错误,下面是分析与解决该问题的过程。

二、问题分析
首先呢,参考几个 Kubernetes Github 上的 issue:

https://github.com/kubernetes/kubernetes/issues/56850
https://github.com/kubermatic/machine-controller/pull/476
https://github.com/kubernetes/kubernetes/issues/56850#issuecomment-406241077
从上面各个 issue 中,本人综合其中的问题探讨猜测,该问题只会发生在 CentOS 系统上,而引起上面的问题的原因是 kubelet 启动时,会执行节点资源统计,需要 systemd 中开启对应的选项,如下:

CPUAccounting:是否开启该 unit 的 CPU 使用统计,bool 类型,可配置 true 或者 false。
MemoryAccounting:是否开启该 unit 的 Memory 使用统计,bool 类型,可配置 true 或者 false。
如果不设置这两项,kubelet 是无法执行该统计命令,导致 kubelet 一直报上面的错误信息。

三、解决问题
解决上面问题也很简单,直接编辑 systemd 中的 kubelet 服务配置文件中,添加 CPU 和 Memory 配置,可以按下面操作进行更改。

1、编辑配置文件并添加对应配置项
编辑 /usr/lib/systemd/system/kubelet.service.d/10-kubeadm.conf 文件,并添加下面配置:

CPUAccounting=true
MemoryAccounting=true
BASH
具体操作如下:

$ vi /usr/lib/systemd/system/kubelet.service.d/10-kubeadm.conf
[Service]
CPUAccounting=true              ## 添加 CPUAccounting=true 选项,开启 systemd CPU 统计功能
MemoryAccounting=true           ## 添加 MemoryAccounting=true 选项,开启 systemd Memory 统计功能
Environment="KUBELET_KUBECONFIG_ARGS=--bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.conf --kubeconfig=/etc/kubernetes/kubelet.conf"
Environment="KUBELET_CONFIG_ARGS=--config=/var/lib/kubelet/config.yaml"
EnvironmentFile=-/var/lib/kubelet/kubeadm-flags.env
EnvironmentFile=-/etc/sysconfig/kubelet
ExecStart=
ExecStart=/usr/bin/kubelet $KUBELET_KUBECONFIG_ARGS $KUBELET_CONFIG_ARGS $KUBELET_KUBEADM_ARGS $KUBELET_EXTRA_ARGS
```BASH
2、重启 Kubelet 服务
重启 kubelet 服务,让 kubelet 重新加载配置。

$ systemctl daemon-reload
$ systemctl restart kubelet
BASH
3、观察 kubelet 日志
重启完 kubelet 后等一段时间,再次观察 kubelet 日志信息:

```bash
$ journalctl -u kubelet -n 10

19 02:48:11 k8s-node-2-14 kubelet[1308]: I0419 02:48:11.875632    1308 clientconn.go:933] ClientConn switching balancer to "pick_first"
19 02:48:11 k8s-node-2-14 kubelet[1308]: I0419 02:48:11.875655    1308 clientconn.go:882] blockingPicker: the picked transport is not ready, loop back to repick
19 02:48:12 k8s-node-2-14 kubelet[1308]: I0419 02:48:12.361764    1308 topology_manager.go:219] [topologymanager] RemoveContainer - Container ID: a2a3780a36a823317821f27871dc2572f5236be1ae7244b91c29f4fd0dfd7c25
19 02:48:12 k8s-node-2-14 kubelet[1308]: I0419 02:48:12.365887    1308 kubelet_resources.go:45] allocatable: map[cpu:{{8 0} {<nil>} 8 DecimalSI} ephemeral-storage:{{45389555637 0} {<nil>} 45389555637 DecimalSI} hugepages-1Gi:{{0 0} {<
19 02:48:12 k8s-node-2-14 kubelet[1308]: I0419 02:48:12.365963    1308 kubelet_resources.go:45] allocatable: map[cpu:{{8 0} {<nil>} 8 DecimalSI} ephemeral-storage:{{45389555637 0} {<nil>} 45389555637 DecimalSI} hugepages-1Gi:{{0 0} {<
19 02:48:12 k8s-node-2-14 kubelet[1308]: I0419 02:48:12.365995    1308 kubelet_resources.go:45] allocatable: map[cpu:{{8 0} {<nil>} 8 DecimalSI} ephemeral-storage:{{45389555637 0} {<nil>} 45389555637 DecimalSI} hugepages-1Gi:{{0 0} {<
19 02:48:12 k8s-node-2-14 kubelet[1308]: I0419 02:48:12.366018    1308 kubelet_resources.go:45] allocatable: map[cpu:{{8 0} {<nil>} 8 DecimalSI} ephemeral-storage:{{45389555637 0} {<nil>} 45389555637 DecimalSI} hugepages-1Gi:{{0 0} {<

可以看到系统已经没有之前的错误日志信息了。

### 深度相机与彩色相机对齐方法 (D2C) #### 理论基础 为了实现深度相机与彩色相机之间的有效对齐,需要考虑两者的几何关系和时间同步。校准过程主要包括内外参数估计、畸变矫正以及最终的空间变换矩阵求解[^1]。 #### 实现步骤 ##### 数据收集 获取一组由同一场景下的深度图像和对应的RGB图像组成的配对样本集。这些样本应尽可能覆盖整个视场范围,并包含不同距离和平面角度的对象实例。 ##### 内外参标定 利用标准棋盘格或其他已知模式作为参照物来执行单独的内部参数(焦距f_x,f_y; 主点坐标c_x,c_y)和外部旋转平移向量(R,t) 的估算工作。这一步骤可以借助OpenCV库中的`cv::calibrateCamera()`函数完成[^3]。 ```cpp // C++ code snippet using OpenCV for camera calibration std::vector<std::vector<cv::Point3f>> objectPoints; std::vector<std::vector<cv::Point2f>> imagePoints; bool success = cv::calibrateCamera(objectPoints, imagePoints, imageSize, K, distCoeffs, rvecs, tvecs); if (!success){ std::cerr << "Calibration failed." << std::endl; } ``` ##### 畸变修正 根据上一步得到的结果调整原始图片以消除镜头引起的失真效应。具体来说就是应用反向映射算法将理想位置上的像素值重新分配给实际观测到的位置。 ##### 变换矩阵计算 当两个摄像机都经过充分校正之后,则可通过共同观察某些特征点的方式建立两者间的刚体转换模型——即寻找能够使一对对应点之间误差最小化的R|t组合。该操作同样可以在OpenCV框架下轻松达成: ```python import numpy as np import cv2 # Assuming we have matched points from both cameras stored in pts_depth and pts_rgb lists. E, mask = cv2.findEssentialMat(pts_depth, pts_rgb, focal=K[0][0], pp=(K[0][2], K[1][2])) _, R, t, _ = cv2.recoverPose(E, pts_depth, pts_rgb, focal=K[0][0], pp=(K[0][2], K[1][2])) transformation_matrix = np.hstack((R, t)) print(f"Transformation matrix:\n{transformation_matrix}") ``` 上述代码片段展示了如何使用Python版本的OpenCV来进行本质矩阵E及其分解后的旋转矩阵R和平移矢量t的计算。最后构建了一个4×4大小的整体变换阵列用于后续处理阶段。 #### 应用案例 一旦完成了以上所有准备工作,在实际部署过程中就可以依靠预先训练好的神经网络或者其他机器学习工具辅助完成更复杂的任务,比如三维重建或是增强现实效果渲染等[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
OSZAR »