1. Vì sao phải tách kịch bản DR cho website và hệ thống nghiệp vụ?
Trong cùng một tổ chức:
Website (truyền thông, cổng dịch vụ, tra cứu)
Hệ thống nghiệp vụ (HIS, EMR, ERP, webapp nội bộ)
có:
Giá trị khác nhau
RPO/RTO khác nhau
Mức độ chấp nhận rủi ro khác nhau
Không thể dùng một kịch bản DR cho tất cả.
📌 DR đúng bắt đầu từ phân loại hệ thống theo giá trị nghiệp vụ.
2. Phân loại hệ thống trong DR
2.1. Website
Đặc điểm:
Chủ yếu phục vụ truy cập bên ngoài
Có thể chấp nhận mất dữ liệu nhỏ (log, cache)
Ưu tiên khôi phục nhanh khả năng truy cập
Ví dụ:
Website bệnh viện
Cổng thông tin
Trang tra cứu
2.2. Hệ thống nghiệp vụ
Đặc điểm:
Dữ liệu là tài sản sống còn
Không chấp nhận mất dữ liệu
Phục hồi phải chính xác
Ví dụ:
HIS / EMR
Webapp nội bộ
Hệ thống tài chính, nhân sự
📌 Website ưu tiên RTO, hệ thống nghiệp vụ ưu tiên RPO.
3. Xác định RPO / RTO cho từng nhóm
| Hệ thống | RPO | RTO | Ưu tiên |
|---|---|---|---|
| Website | Vài giờ – 1 ngày | Nhanh | Truy cập |
| Nghiệp vụ | Phút – giờ | Chậm hơn | Dữ liệu |
📌 RPO/RTO phải được lãnh đạo nghiệp vụ phê duyệt, không do IT tự đặt.
4. Kịch bản DR cho website
4.1. Mục tiêu DR website
Website lên lại nhanh
Nội dung cơ bản truy cập được
Không cần đầy đủ 100% chức năng nâng cao
4.2. Thành phần cần phục hồi
Code website
File upload (nếu có)
Database nội dung
Web server
Reverse proxy
DNS / TLS
4.3. Trình tự DR website (tóm tắt)
Chuẩn bị server DR
Restore database
Restore file upload
Restore code
Dựng web server
Dựng reverse proxy
Mở truy cập Internet
📌 Website có thể chạy tạm với cấu hình tối giản.
5. Kịch bản DR cho hệ thống nghiệp vụ
5.1. Mục tiêu DR hệ thống nghiệp vụ
Dữ liệu chính xác
Không mất giao dịch
Phục hồi có kiểm soát
📌 Chậm nhưng đúng còn hơn nhanh nhưng sai.
5.2. Thành phần cần phục hồi
Database (ưu tiên số 1)
File dữ liệu nghiệp vụ
Application backend
Authentication / phân quyền
Webapp nội bộ
Tích hợp liên hệ thống
5.3. Trình tự DR hệ thống nghiệp vụ (tóm tắt)
Chuẩn bị hạ tầng DR
Restore database (logic)
Kiểm tra dữ liệu nghiệp vụ
Restore file dữ liệu
Restore ứng dụng
Test nghiệp vụ
Mở truy cập nội bộ
Mở truy cập bên ngoài (nếu có)
📌 Không mở cho người dùng khi chưa xác nhận nghiệp vụ.
6. DR cho hệ thống có cả website và nghiệp vụ
Trong nhiều tổ chức:
Website và nghiệp vụ dùng chung DB hoặc hạ tầng
Nguyên tắc:
Phục hồi nghiệp vụ trước
Website có thể chạy ở chế độ:
Thông báo
Read-only
Giới hạn chức năng
📌 Website không được gây rủi ro cho dữ liệu nghiệp vụ.
7. Kịch bản DR theo mức độ thảm họa
7.1. Mất 1 server
Chuyển sang server khác
Restore cục bộ
7.2. Mất cả site
Kích hoạt DR site
Restore off-site backup
7.3. Ransomware
Cô lập hệ thống
Restore từ backup sạch
Không dùng replication
📌 Mỗi mức độ có kịch bản khác nhau, không dùng chung.
8. Vai trò con người trong DR
Trong DR cần rõ:
Ai quyết định kích hoạt DR
Ai xác nhận dữ liệu
Ai thông báo người dùng
Ai chịu trách nhiệm cuối
📌 DR không có owner = DR thất bại.
9. Diễn tập DR cho website và nghiệp vụ
Diễn tập cần:
Theo đúng kịch bản
Có thời gian đo RTO
Có đánh giá dữ liệu
📌 Không diễn tập = không có DR.
10. Sai lầm phổ biến khi xây dựng kịch bản DR
Dùng một kịch bản cho mọi hệ thống
Ưu tiên website hơn dữ liệu nghiệp vụ
Không hỏi nghiệp vụ
Không diễn tập
11. Checklist kịch bản DR
Phân loại hệ thống
Xác định RPO/RTO
Có trình tự phục hồi
Có người quyết định
Có diễn tập định kỳ
Disaster Recovery không phải là phục hồi hệ thống,
mà là phục hồi khả năng vận hành của tổ chức.
Website cần lên nhanh để giao tiếp.
Hệ thống nghiệp vụ cần đúng tuyệt đối để vận hành.
Một kịch bản DR đúng:
Phân biệt rõ hai nhóm
Phục hồi theo giá trị nghiệp vụ
Giúp tổ chức bình tĩnh và kiểm soát được thảm họa.
- Đăng nhập để gửi ý kiến