DR 서버란? (Active-Standby)

DR 서버란?

DR(Disaster Recovery) 서버는 운영 중인 서버에 문제가 생겼을 때 이를 대체하여 서비스를 문제없이 수행하기 위해 대기하는 서버입니다. 보험으로 구성해 놓고 유사시 사용하기 위함입니다. 사용자 규모가 어느 정도 큰 곳들은 대부분 DR 서버를 갖추어 놓습니다.

 

Active-Standby 이중화 구성을 떠올리면 이해가 쉽습니다. 평소엔 서비스되지 않고 대기하다가 Active 서버가 작동하지 않을 때 서비스되는 Standby 서버가 일종의 DR 서버입니다.

 

장애 발생 시 기존의 운영 서버와 동일하게 서비스되기 위해서는 평소 Active 서버와 데이터를 동기화해야 합니다. 이를 위해 DR 서버는 운영 서버로부터 실시간 또는 주기적으로 데이터를 복제받아 최신 상태를 유지합니다.

 

DR 서버

 

서비스 복구 수준

운영 서버가 죽었을 때 서비스를 복구하는 상황에서는 얼마나 빠르게, 얼마나 그대로 복구하느냐가 중요합니다. 이러한 복구 수준을 RTO와 RPO라는 지표로 구분합니다.

 

1. RTO(Recovery Time Objective)

복구 시간 목표가 기준입니다. 시스템 장애 발생 후 서비스를 복구하는데 필요한 최대 시간을 의미합니다. 예를 들어 RTO가 1시간이면 시스템 장애 발생 후 1시간 이내에 서비스를 복구해야 합니다.

 

2. RPO(Recovery Point Objective)

복구 지점 목표가 기준입니다. 데이터 손실을 허용하는 최대 시간을 의미합니다. 예를 들어, RPO가 30분이면 장애 발생 후 30분 동안의 데이터 손실은 허용되지만 그 이상의 손실은 있어선 안 됩니다.

 

사이트마다 필요한 장애 대응 수준이 조금씩 다를 겁니다. RTO와 RPO가 짧은 순서대로 미러 사이트 (Mirror Site), 핫 사이트 (Hot Site), 웜 사이트 (Warm Site), 콜드 사이트 (Cold Site)로 부르고 있습니다.

반응형

댓글

Designed by JB FACTORY