Intro

개발 서버가 자꾸 종료된다. 전원 문제도 없고, 램이나 디스크도 잘 장착이 되어있다. 그런데 서버를 켜고 부하가 있는 작업을 수행하면 서버가 종료된다. 그럴 땐 CPU 온도 체크해보기!

lm-sensors

lm-sensors 란

  • lm 은 linux monitoring 의 약자
  • sensors 는 말 그대로 각종 센서 값을 읽어온다는 것

주요 기능

  • CPU 온도: 프로세서의 현재 온도를 확인하여 과열 여부를 파악할 수 있다.
  • 전압 (Voltage): 메인보드의 여러 부분에 공급되는 전압이 안정적인지 확인할 수 있다.
  • 팬 속도 (Fan Speed): 냉각 팬이 얼마나 빠르게 돌고 있는지 RPM(분당 회전수) 단위로 보여준다. 이를 통해 냉각 시스템이 정상적으로 작동하는지 알 수 있다.

설치

1
2
3
4
5
# ubuntu
apt install lm-sensors

# rocky
dnf install lm_sensors

사용법

센서 찾기

  • 장치에 어떤 센서들이 있는지 감지하고, 이를 패키지에서 인식하도록 한다.
  • 명령어를 실행시키면 특정 센서를 찾아볼거냐는 질문이 나오는데, 대부분 yes를 하면 된다.
1
sensors-detect

센서 값 확인

  • 하드웨어의 여러 센서의 현재 측정값을 볼 수 있다.
1
sensors

센서 값 해석

1
2
3
4
5
# 수냉 쿨러 (펌프 속도가 있는 경우 보통 수냉 쿨러)
x53-hid-3-2
Adapter: HID adapter
Pump speed:   1094 RPM  # 펌프 속도
Coolant temp:  +32.7°C  # 냉각수 온도
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
# CPU 온도 (coretemp: 인텔의 코어별 온도 확인 드라이버)
coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +85.0°C  (high = +80.0°C, crit = +100.0°C)   # CPU 전체 패키지 온도 (과열)
Core 0:        +46.0°C  (high = +80.0°C, crit = +100.0°C)
Core 4:        +58.0°C  (high = +80.0°C, crit = +100.0°C)
Core 8:        +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 12:       +85.0°C  (high = +80.0°C, crit = +100.0°C)   # 12번 코어 과열
Core 16:       +41.0°C  (high = +80.0°C, crit = +100.0°C)
Core 20:       +52.0°C  (high = +80.0°C, crit = +100.0°C)
Core 24:       +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 28:       +43.0°C  (high = +80.0°C, crit = +100.0°C)
Core 32:       +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 33:       +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 34:       +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 35:       +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 36:       +43.0°C  (high = +80.0°C, crit = +100.0°C)
Core 37:       +43.0°C  (high = +80.0°C, crit = +100.0°C)
Core 38:       +43.0°C  (high = +80.0°C, crit = +100.0°C)
Core 39:       +43.0°C  (high = +80.0°C, crit = +100.0°C)
Core 40:       +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 41:       +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 42:       +42.0°C  (high = +80.0°C, crit = +100.0°C)
Core 43:       +41.0°C  (high = +80.0°C, crit = +100.0°C)
Core 44:       +43.0°C  (high = +80.0°C, crit = +100.0°C)
Core 45:       +43.0°C  (high = +80.0°C, crit = +100.0°C)
Core 46:       +43.0°C  (high = +80.0°C, crit = +100.0°C)
Core 47:       +43.0°C  (high = +80.0°C, crit = +100.0°C)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
# 램 온도 (spd: Serial Presence Detect / spd는 보통 RAM일 경우가 많음)
spd5118-i2c-3-52
Adapter: SMBus I801 adapter at efa0
temp1:        +33.5°C  (low  =  +0.0°C, high = +55.0°C)
                       (crit low =  +0.0°C, crit = +85.0°C)

spd5118-i2c-3-50
Adapter: SMBus I801 adapter at efa0
temp1:        +34.0°C  (low  =  +0.0°C, high = +55.0°C)
                       (crit low =  +0.0°C, crit = +85.0°C)

spd5118-i2c-3-53
Adapter: SMBus I801 adapter at efa0
temp1:        +32.0°C  (low  =  +0.0°C, high = +55.0°C)
                       (crit low =  +0.0°C, crit = +85.0°C)

spd5118-i2c-3-51
Adapter: SMBus I801 adapter at efa0
temp1:        +34.0°C  (low  =  +0.0°C, high = +55.0°C)
                       (crit low =  +0.0°C, crit = +85.0°C)
1
2
3
4
5
6
7
# NVMe SSD
nvme-pci-0200
Adapter: PCI adapter
Composite:    +46.9°C  (low  =  -0.1°C, high = +85.8°C)
                       (crit = +86.8°C)
Sensor 1:     +40.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +44.9°C  (low  = -273.1°C, high = +65261.8°C)
1
2
3
4
# 메인보드 (ACPI = 전원 관리 및 메인보드의 각종 센서를 제어하는 표준 규격)
acpitz-acpi-0
Adapter: ACPI interface
temp1:        +27.8°C

Reference

https://ko.wikipedia.org/wiki/ACPI

Comments