centos 메모리 오류 로그 발경 시 메모리 에러 카운트 확인
로그에서 다음과 같은 메세지를 확인 될 때가 있다. 내용에 보여지듯 메모리에 문제가 있는것으로 보이며 에러 카운트를 확인해 보자
dmidecode -t memory |grep -A10 'Locator: ' | grep Serial.Number | grep -v NO.DIMM
Serial Number: 398E12A7
Serial Number: 398E519A
Serial Number: 398E159A
Serial Number: 398E3004
현재 장착된 메모리의 시리얼 번호를 확인할 수 있는 명령어입니다.
dmidecode -t memory |grep -A10 'Locator: ' | grep Serial.Number | grep -v NO.DIMM | wc -l
4
현재 장착된 메모리 수를 확인 할 수 있는 명령어입니다.
만약 두가지를 확인하였을 때 알고있는 메모리 수와 다르다면 고장으로 인해 인식이 안되는 것 입니다.
ls -l /sys/devices/system/edac/mc/mc*/csrow*/*ce_count
-r--r--r--. 1 root root 4096 10월 14 08:54 /sys/devices/system/edac/mc/mc0/csrow0/ce_count
-r--r--r--. 1 root root 4096 10월 14 08:54 /sys/devices/system/edac/mc/mc0/csrow0/ch0_ce_count
-r--r--r--. 1 root root 4096 10월 14 08:54 /sys/devices/system/edac/mc/mc0/csrow0/ch1_ce_count
-r--r--r--. 1 root root 4096 10월 14 08:54 /sys/devices/system/edac/mc/mc2/csrow0/ce_count
-r--r--r--. 1 root root 4096 10월 14 08:54 /sys/devices/system/edac/mc/mc2/csrow0/ch0_ce_count
-r--r--r--. 1 root root 4096 10월 14 08:54 /sys/devices/system/edac/mc/mc2/csrow0/ch1_ce_count
메모리 에러 관련된 파일 리스트입니다.
grep "[0-9]" /sys/devices/system/edac/mc/mc*/csrow*/*_ce_count
/sys/devices/system/edac/mc/mc0/csrow0/ch0_ce_count:0
/sys/devices/system/edac/mc/mc0/csrow0/ch1_ce_count:0
/sys/devices/system/edac/mc/mc2/csrow0/ch0_ce_count:0
/sys/devices/system/edac/mc/mc2/csrow0/ch1_ce_count:0
메모리 에러 카운트 수를 확인 할 수 있는 명령어이며, 문제가 있다면 수치가 0보다 높게 표시됩니다.