การทำ DR site เหมือนกับการทำ Business Continuity Planning (BCP) หรือไม่

ในการทำธุรกิจเราจะเผชิญกับสิ่งที่ไม่คาดคิดตลอดเวลา การวางแผนรับมือกับสิ่งที่กำลังจะเกิดขึ้นนั้นเป็นสิ่งที่จะช่วยให้ลดความเสียหายที่จะเกิดขึ้น ที่จะกระทบกับชีวิต ทรัพย์สิน สังคม สิ่งแวดล้อม ชื่อเสียงขององค์กร ดังนั้นผู้ดำเนินธุรกิจจำเป็นที่จะต้องรู้จักกับ Business Continuity Planning (BCP) 

Business Continuity planning (BCP) คืออะไร

กระบวนการวางแผนความต่อเนื่องของธุรกิจ หรือ Business Continuity Planning (BCP) คือกระบวนการในการเตรียมความพร้อมสำหรับรับมือเมื่อเกิดเหตุการณ์ภัยพิบัติต่างๆ หรือจากภาวะคุกคามต่าง ๆ ที่ส่งผลกระทบต่อธุรกิจทำให้ธุรกิจหยุดชะงัก สามารถที่จะกลับมาสู่สภาวะปกติหรือใกล้เคียงกับสภาวะปกติมากที่สุด ซึ่งแต่ละบริษัทจะมีกระบวนการที่แตกต่างกัน แต่จะมีหลักในการสร้าง BCP ที่มีประสิทธิภาพ ดังต่อไปนี้

Business Impact Analysis คือการทำการประเมินความเสียหายเมื่อเกิดเหตุเหล่านั้นขึ้นว่า สามารถที่จะทำให้การดำเนินกิจการมีการหยุดชะงัก เสียค่าปรับ ค่าชดเชย จนกระทั่งสูญเสียฐานลูกค้า ทั้งนี้จะต้องมีการประเมินว่าความเสียหายเหล่านั้น มีความคุ้มค่าที่จะต้องลงทุนในการจัดหาเครื่องมือและทรัพยากรต่าง ๆ ที่พร้อมเมื่อเกิดเหตุการณ์เหล่านั้นเกิดขึ้น

Recovery คือการกู้คืนความเสียหายที่เกิดขึ้น โดยสามารถที่จะระบุถึงปัญหาได้รวดเร็ว และมีกระบวนการกู้คืนเป็น ลำดับขั้นตอนที่ชัดเจน โดยมีการทำ Checklists และใช้เครื่องมือต่าง ๆ ที่จำเป็นในการตรวจสอบปัญหาได้อย่างรวดเร็ว

Root Cause Analysis (RCA) จะเป็นกระบวนการที่คล้ายกับ Business Impact Analysis แต่จะเกิดขึ้นหลังจากที่เกิดเหตุการณ์ ที่ทำให้เกิดความเสี่ยง

Organization คือการสร้างทีมงานที่จะทำหน้าที่สำหรับการรับมือกับเหตุการณ์ที่ทำให้เกิดผลกระทบต่อธุรกิจในด้านต่าง ๆ ไม่ว่าจะเป็นในด้าน ระบบ IT Infrastructure, ด้าน Customer Relationship, ด้านทรัพยากรบุคคล

Training คือต้องมีการฝึกซ้อมอยู่เป็นประจำเพื่อให้ทีมสามารถที่จะพัฒนาแผนให้มีประสิทธิภาพมากขึ้นและลดความผิดพลาดระหว่างการกู้คืน

หลักการด้านบนที่กล่าวมานี้ เป็นหลักการคร่าว ๆ ที่จะนำไปพิจารณาและสร้างให้เกิด Life Cycle เพื่อที่จะประมาณความเสี่ยงที่อาจจะเกิดขึ้นอยู่ตลอดเวลา และรอบด้าน

การทำ DR site คืออะไร

DR Site เป็นหนึ่ง Solution ในการเพิ่ม Availability ของระบบ IT Infrastructure ในองค์กรเมื่อเกิดเหตุการณ์ที่ ทำให้ระบบ IT Infrastructure หลักไม่สามารถใช้งานได้ โดยจะเป็นการสร้าง Environment ที่มีความคล้ายคลึงกันกับ Environment หลักที่ใช้งานอยู่ แต่จะถูกนำไปวางในที่ ๆ อยู่ห่างออกไป โดยที่มีโรงไฟฟ้า หรือสายเคเบิล หรืออุปกรณ์ Network ที่ใช้งานแยกออกจากกันโดยสมบูรณ์ จาก Environment หลัก เพื่อลดโอกาสที่ทั้ง 2 Sites จะล้มไปพร้อมกัน ทั้งนี้การทำ DR Site จะมี Indicators ด้วยกันหลัก ๆ อยู่ 2 Indicators คือ

  • Recovery Time Objective (RTO) คือเวลาที่คาดหวังเมื่อ ระบบหลักเกิด Incident ไม่สามารถใช้งานได้ จนสามารถ Recovery ระบบให้กลับมาใช้งานได้
  • Recovery Point Objective (RPO) คือระยะเวลาสูงสุดที่จะกู้ข้อมูลได้หลังจากระบบเกิด Incident

 ซึ่งสามารถทำได้ในหลายระดับ ดังนี้

  1. Hot Site เป็น Site ที่มี Environment ที่เหมือนกับ Environment หลักที่ใช้งานอยู่ มีลักษณะ Active และ Backup อยู่ตลอดเวลา พร้อมที่จะสามารถทำงานแทน Environment หลัก ได้ทันที หรือเรียกได้ว่าเป็น Active/Active

คุณสมบัติของ Hot Site

  • Near Zero Downtime 
  • Near Zero Data Loss
  • เหมาะสำหรับ Business Critical Services
  • มีค่าใช้จ่ายที่สูง
  • RPO/RTO Near Zero
  1. Warm Site เป็น Site ที่ Balance ระหว่าง Hot Site และ Cold Site แต่ซึ่งมีการ Backup ที่ช้ากว่า มีการ Active Workload บางอย่าง เช่น Database แต่จะ Down หรือ Standby ไว้บางส่วนสำหรับ Workload ที่เป็น Stateless เช่น Web Application ต่าง ๆ และเมื่อเกิด Incident ถึงจะ Scale Up ขึ้นมาซึ่งใช้เวลาพอสมควร

คุณสมบัติของ Warm Site

  • มี Downtime ในระดับ Minutes
  • มีโอกาส Data Loss อยู่บ้าง หรือ Near Zero Data Loss
  • มีค่าใช้จ่ายระดับกลาง ๆ
  • Small RPO/RTO
  1. Cold Site เป็น Site ที่จะเน้น Backup ในส่วนของ Data เป็นหลักซึ่งเหมาะกับ Service ที่ไม่ได้สำคัญมาก

คุณสมบัติของ Cold Site

  • มี Downtime ในระดับ Hours
  • มีโอกาส Data Loss สูงกว่าแบบ Warm หรือ Hot
  • มีค่าใช้จ่ายที่ถูก
  • High RPO/RTO

ทั้งนี้เราได้สรุปเป็นภาพรวมได้ดังนี้

สรุปแล้ว Business Continuity planning และ DR Site แล้วเหมือนกันหรือไม่

BCP จะเป็นการสร้างกระบวนการในการรับมือกับเหตุการณ์ที่จะทำให้องค์กรไปสู่ความเสี่ยงที่จะไม่สามารดำเนินกิจการได้  ไม่ใช่แค่ส่วนของ Hardware ที่เกิด Incident ขึ้นใน Data Center แต่อาจจะรวมไปถึง ความเสี่ยงด้านความปลอดภัย การโจรกรรมข้อมูล และอีกหลาย ๆ อย่างที่ไม่ได้กล่าวถึงในที่นี้

ทั้งนี้การพิจารณาทำ DR site ก็เป็นส่วนหนึ่งของ BCP ที่จะต้องประเมินความเสี่ยง ความเสียหายที่จะเกิดขึ้น และทำอย่างเหมาะสมกับมูลค่าของ Business นั้น ๆ หากองค์กรของคุณสนใจที่จะเสริมความแข็งแกร่งให้กับธุรกิจเพื่อรับมือกับความเสี่ยงและรักษาความต่อเนื่องทางธุรกิจ Cloud HM พร้อมช่วยซัพพอร์ตองค์กรของคุณในการสร้างและจัดการ Disaster Recovery Site ซึ่งเป็นส่วนสำคัญของ Business Continuity Planning (BCP) ซึ่ง Cloud HM เราพร้อมให้บริการและคำปรึกษาอย่างครบวงจร

Ref:

https://www.investopedia.com/terms/b/business-continuity-planning.asp

https://en.wikipedia.org/wiki/IT_disaster_recovery

https://docs.aws.amazon.com/whitepapers/latest/disaster-recovery-workloads-on-aws/disaster-recovery-options-in-the-cloud.htm