Intro
개발 서버가 자꾸 종료된다. 전원 문제도 없고, 램이나 디스크도 잘 장착이 되어있다. 그런데 서버를 켜고 부하가 있는 작업을 수행하면 서버가 종료된다. 그럴 땐 CPU 온도 체크해보기!
lm-sensors
lm-sensors 란
- lm 은 linux monitoring 의 약자
- sensors 는 말 그대로 각종 센서 값을 읽어온다는 것
주요 기능
- CPU 온도: 프로세서의 현재 온도를 확인하여 과열 여부를 파악할 수 있다.
- 전압 (Voltage): 메인보드의 여러 부분에 공급되는 전압이 안정적인지 확인할 수 있다.
- 팬 속도 (Fan Speed): 냉각 팬이 얼마나 빠르게 돌고 있는지 RPM(분당 회전수) 단위로 보여준다. 이를 통해 냉각 시스템이 정상적으로 작동하는지 알 수 있다.
설치
1
2
3
4
5
# ubuntu
apt install lm-sensors
# rocky
dnf install lm_sensors
사용법
센서 찾기
- 장치에 어떤 센서들이 있는지 감지하고, 이를 패키지에서 인식하도록 한다.
- 명령어를 실행시키면 특정 센서를 찾아볼거냐는 질문이 나오는데, 대부분 yes를 하면 된다.
1
sensors-detect
센서 값 확인
- 하드웨어의 여러 센서의 현재 측정값을 볼 수 있다.
1
sensors
센서 값 해석
1
2
3
4
5
# 수냉 쿨러 (펌프 속도가 있는 경우 보통 수냉 쿨러)
x53-hid-3-2
Adapter: HID adapter
Pump speed: 1094 RPM # 펌프 속도
Coolant temp: +32.7°C # 냉각수 온도
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
# CPU 온도 (coretemp: 인텔의 코어별 온도 확인 드라이버)
coretemp-isa-0000
Adapter: ISA adapter
Package id 0: +85.0°C (high = +80.0°C, crit = +100.0°C) # CPU 전체 패키지 온도 (과열)
Core 0: +46.0°C (high = +80.0°C, crit = +100.0°C)
Core 4: +58.0°C (high = +80.0°C, crit = +100.0°C)
Core 8: +42.0°C (high = +80.0°C, crit = +100.0°C)
Core 12: +85.0°C (high = +80.0°C, crit = +100.0°C) # 12번 코어 과열
Core 16: +41.0°C (high = +80.0°C, crit = +100.0°C)
Core 20: +52.0°C (high = +80.0°C, crit = +100.0°C)
Core 24: +42.0°C (high = +80.0°C, crit = +100.0°C)
Core 28: +43.0°C (high = +80.0°C, crit = +100.0°C)
Core 32: +42.0°C (high = +80.0°C, crit = +100.0°C)
Core 33: +42.0°C (high = +80.0°C, crit = +100.0°C)
Core 34: +42.0°C (high = +80.0°C, crit = +100.0°C)
Core 35: +42.0°C (high = +80.0°C, crit = +100.0°C)
Core 36: +43.0°C (high = +80.0°C, crit = +100.0°C)
Core 37: +43.0°C (high = +80.0°C, crit = +100.0°C)
Core 38: +43.0°C (high = +80.0°C, crit = +100.0°C)
Core 39: +43.0°C (high = +80.0°C, crit = +100.0°C)
Core 40: +42.0°C (high = +80.0°C, crit = +100.0°C)
Core 41: +42.0°C (high = +80.0°C, crit = +100.0°C)
Core 42: +42.0°C (high = +80.0°C, crit = +100.0°C)
Core 43: +41.0°C (high = +80.0°C, crit = +100.0°C)
Core 44: +43.0°C (high = +80.0°C, crit = +100.0°C)
Core 45: +43.0°C (high = +80.0°C, crit = +100.0°C)
Core 46: +43.0°C (high = +80.0°C, crit = +100.0°C)
Core 47: +43.0°C (high = +80.0°C, crit = +100.0°C)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
# 램 온도 (spd: Serial Presence Detect / spd는 보통 RAM일 경우가 많음)
spd5118-i2c-3-52
Adapter: SMBus I801 adapter at efa0
temp1: +33.5°C (low = +0.0°C, high = +55.0°C)
(crit low = +0.0°C, crit = +85.0°C)
spd5118-i2c-3-50
Adapter: SMBus I801 adapter at efa0
temp1: +34.0°C (low = +0.0°C, high = +55.0°C)
(crit low = +0.0°C, crit = +85.0°C)
spd5118-i2c-3-53
Adapter: SMBus I801 adapter at efa0
temp1: +32.0°C (low = +0.0°C, high = +55.0°C)
(crit low = +0.0°C, crit = +85.0°C)
spd5118-i2c-3-51
Adapter: SMBus I801 adapter at efa0
temp1: +34.0°C (low = +0.0°C, high = +55.0°C)
(crit low = +0.0°C, crit = +85.0°C)
1
2
3
4
5
6
7
# NVMe SSD
nvme-pci-0200
Adapter: PCI adapter
Composite: +46.9°C (low = -0.1°C, high = +85.8°C)
(crit = +86.8°C)
Sensor 1: +40.9°C (low = -273.1°C, high = +65261.8°C)
Sensor 2: +44.9°C (low = -273.1°C, high = +65261.8°C)
1
2
3
4
# 메인보드 (ACPI = 전원 관리 및 메인보드의 각종 센서를 제어하는 표준 규격)
acpitz-acpi-0
Adapter: ACPI interface
temp1: +27.8°C
Comments