1. Vì sao backup thất bại dù có đủ công cụ và SOP?
Một thực tế rất phổ biến:
Có công cụ
Có SOP
Có lịch backup
Nhưng khi sự cố xảy ra:
Không ai dám restore
Không ai chịu trách nhiệm
Mỗi người nghĩ người khác phụ trách
Backup không thất bại vì thiếu kỹ thuật,
mà vì thiếu phân công và kiểm soát trách nhiệm.
2. Backup là bài toán quản trị rủi ro, không chỉ là CNTT
Backup liên quan đến:
Dữ liệu
Con người
Quy trình
Quyết định
📌 Vì vậy, backup cần được đặt trong khung quản trị rủi ro của tổ chức.
3. Nguyên tắc phân công trách nhiệm trong backup
3.1. Phân tách vai trò (Separation of Duties)
Nguyên tắc cốt lõi:
Người backup ≠ người restore
Người vận hành ≠ người phê duyệt
Người kỹ thuật ≠ người xác nhận nghiệp vụ
📌 Phân tách vai trò giúp:
Giảm rủi ro nội bộ
Tăng minh bạch
Dễ audit
3.2. Mỗi vai trò phải có người thay thế
Không có “người không thể thay thế”
Có phân công dự phòng
📌 Backup phụ thuộc một người = rủi ro cao.
4. Các vai trò chính trong quản trị backup
4.1. Chủ sở hữu dữ liệu (Data Owner)
Đại diện nghiệp vụ
Quyết định:
RPO/RTO
Retention
Mức độ chấp nhận rủi ro
📌 Không phải CNTT.
4.2. Đơn vị vận hành CNTT
Triển khai kỹ thuật
Vận hành backup
Giám sát và báo cáo
📌 Không tự ý quyết định restore.
4.3. Người phê duyệt restore
Thường là lãnh đạo đơn vị
Chịu trách nhiệm quyết định phục hồi
📌 Restore là quyết định quản trị, không chỉ kỹ thuật.
4.4. Người kiểm tra / audit nội bộ
Kiểm tra tuân thủ SOP
Kiểm tra log, báo cáo
5. Kiểm soát rủi ro trong quá trình backup
5.1. Rủi ro kỹ thuật
Backup lỗi
Mất key
Lỗi script
Giải pháp:
Giám sát
Test restore
SOP rõ ràng
5.2. Rủi ro con người
Sai thao tác
Lạm quyền
Phụ thuộc cá nhân
Giải pháp:
Phân quyền
Phê duyệt
Log truy vết
5.3. Rủi ro tổ chức
Thay đổi nhân sự
Thay đổi hệ thống
Thiếu cập nhật SOP
Giải pháp:
Đào tạo
Kiểm tra định kỳ
Quản trị thay đổi
6. Restore – điểm rủi ro cao nhất
Restore là lúc:
Có áp lực
Có rủi ro sai quyết định
Có khả năng làm mất dữ liệu còn lại
📌 Restore bắt buộc phải có kiểm soát.
7. Cơ chế phê duyệt restore
Một cơ chế tối thiểu:
Yêu cầu restore bằng văn bản / hệ thống
Phê duyệt của Data Owner
Ghi log đầy đủ
📌 Không restore “vì tiện”.
8. Báo cáo và minh bạch
Cần có:
Báo cáo backup định kỳ
Báo cáo restore (nếu có)
Báo cáo sự cố
📌 Minh bạch giúp giảm tranh chấp trách nhiệm.
9. Kiểm tra và đánh giá rủi ro định kỳ
Đánh giá lại RPO/RTO
Đánh giá lại retention
Đánh giá lại phân công
📌 Rủi ro thay đổi theo thời gian, backup cũng phải thay đổi theo.
10. Sai lầm phổ biến
Giao toàn quyền cho CNTT
Không phân biệt backup và restore
Không có người chịu trách nhiệm cuối
Không có audit nội bộ
11. Checklist phân công và kiểm soát rủi ro
Xác định Data Owner
Phân tách vai trò
Có người thay thế
Cơ chế phê duyệt restore
Log và báo cáo
Đánh giá định kỳ
Backup không phải là việc của một người,
mà là trách nhiệm được chia sẻ và kiểm soát.
Một hệ thống backup trưởng thành:
Có phân công rõ ràng
Có kiểm soát rủi ro
Có minh bạch và trách nhiệm
Và quan trọng nhất:
Giúp tổ chức ra quyết định đúng khi sự cố xảy ra,
thay vì tranh cãi khi đã quá muộn.
- Đăng nhập để gửi ý kiến