본문 바로가기
IT Information

로그(기록)을 통해 서비스 장애에 대응하다 - SYSLOG 서버

by FiveFlow 2024. 4. 24.


로그(기록)을 수집 및 관리하고 장애 대응에 필요한 정보를 보유한 것은?

    - 로그(기록) 수집 · 관리에 필요한 "SYSLOG 서버"에 대해서 알아보겠습니다.


Syslog 서버는 서버나 네트워크 기기의 로그를 수집합니다.

   - 정보화 서비스에 장애가 발생했을 때는 가장 먼저 서버나 네트워크 기기의 로그(기록) 정보를 확인해야 합니다. 언제, 어디서, 어떤 기기에 어떤 현상이 있었는지를 얼마나 잘 정리할 수 있는가에 따라 장애 원인을 신속하게 찾을 수 있고 문제점에 대한 다양한 해결 방안을 마련할 수 있습니다.

- 즉, 서비스에 장애가 발생한다면, 서버나 네트워크 기기의 로그(기록)을 확인함으로써 언제 어떤 기기에 어떤 현상이 발생했는지를 정리할 수 있습니다.

- 이런 중요 로그(기록)를 수집하는 서버가 “Syslog 서버입니다. 서버 장비나 네트워크 기기 등은 Syslog 프로토콜을 통해 로그를 정보를 전송하고 Syslog 서버는 이 로그 정보들을 수집합니다. Syslog 서버를 구축하면 그러한 로그를 수집하여 일원화하여 관리할 수 있습니다.

- Syslog 서비스를 제공하는 서버 소프트웨어에는 다양한 종류가 있습니다. 대표적으로 UNIX 계열 서버 OS에서 작동하는 “syslog-ng” “rsyslog” Windows 계열 서버 OS에서 작동하는 “Kiwi Syslog Server” 가 있습니다.


Syslog 서버는 다양한 로그들을 정리하여 관리합니다.

- Syslog 서버에서 다양한 로그들을 정리할 때 사용하는 항목들은 Syslog 메시지에 들어있는 “Facility”“Severity”입니다. “Facility”는 로그의 종류를 나타냅니다.

- “Facility”에는 OS 커널의 로그를 나타내는 “kern”이나 데몬의 로그를 나타내는 “daemon” 등 전부 24종류가 있습니다.

- “Severity”는 로그의 종류에 따라 긴급도 및 중요도를 나타냅니다. “Severity”에는 긴급도가 높은 것부터 순서대로 “Emergency(긴급 사태)”, “Alert(위험한 상태)”, “Critical(치명적인 오류)”, “Error(일반적인 오류)”, “Warning(경고)”, “Notice(중요한 통지)”, “Information(일반적인 정보)”, “Debug(디버그 정보)”가 있습니다.


Syslog 서버는 로그를 필터링하여 관리 할 수 있습니다.

- Syslog 서버를 운영해보면 주로 장애가 발생했을 때만 많은 양의 Syslog 메시지가 수집되어서 중요한 로그들을 간과할 수 있습니다.

- 아무리 많은 로그를 수집한다고 하더라도 중요한 때에 도움이 안된다면, 수집된 정보도 활용하지 못하게 됩니다.

- 로그 메시지는 종류와 긴급도로 정리할 수 있으므로 “Severity”, “Facility” 메시지에 포함된 문자열 등을 활용하여 Syslog 메시지를 필터링 후 중요한 로그를 놓치지 않도록 잘활용해야 할 것입니다.

- Syslog를 수집 및 관리하다 보면 파일이 너무 커져서 스토리지 영역을 많이 차지하게 됩니다. 오래된 로그들은 삭제하여 관리하는 것도 필요합니다.


< 요약 정리 >

• Syslog 서버는 서버나 네트워크 기기의 로그를 수집하여 장애 원인을 신속하게 찾고 문제점에 대한 해결 방안을 마련하는 데 도움이 됩니다. 

• Syslog 서버는 다양한 종류의 로그를 정리하여 관리하며, "Facility"와 "Severity" 항목을 사용하여 로그를 필터링할 수 있습니다. 

• Syslog 서버를 운영하면 중요한 로그를 놓치지 않도록 필터링하고 오래된 로그를 삭제하여 스토리지 영역을 관리해야 합니다.