1. Mục tiêu của việc phân loại dữ liệu
Trong một hệ thống nhiều lớp như CMC – Bệnh viện – Desktop backup, không phải dữ liệu nào cũng cần backup giống nhau.
Phân loại dữ liệu nhằm:
Xác định cái gì bắt buộc phải backup
Xác định backup ở đâu, bao lâu
Tránh backup tràn lan gây:
Tốn dung lượng
Khó khôi phục
Rủi ro ransomware lan rộng
Nguyên tắc cốt lõi:
Backup phải dựa trên giá trị dữ liệu, không dựa trên vị trí lưu trữ.
2. Phân loại dữ liệu theo bản chất
Toàn bộ dữ liệu trong hệ thống được chia thành 05 nhóm chính.
Nhóm 1. Dữ liệu nghiệp vụ (Business Data)
Mô tả:
Là dữ liệu tạo ra từ hoạt động khám chữa bệnh, quản lý, vận hành
Thường nằm trong database
Ví dụ:
Hồ sơ người bệnh
Dữ liệu webform, khảo sát
Dữ liệu quản lý nội bộ
Log nghiệp vụ có giá trị pháp lý
Đặc điểm:
Giá trị cao nhất
Không thể tái tạo
Mất là mất vĩnh viễn
Yêu cầu backup:
Bắt buộc backup
Backup nhiều bản
Có bản off-site (Desktop)
Nhóm 2. Code và ứng dụng (Application Code)
Mô tả:
Mã nguồn website, webapp, script nghiệp vụ
Ví dụ:
Code Drupal
Custom module
Script xử lý nghiệp vụ
Đặc điểm:
Có thể tái triển khai
Nhưng mất sẽ làm gián đoạn dịch vụ
Yêu cầu backup:
Backup định kỳ
Không cần retention quá dài
Phải đi kèm đúng version database
Nhóm 3. Cấu hình hệ thống (System Configuration)
Mô tả:
Các file cấu hình quyết định hệ thống có chạy hay không
Ví dụ:
Web server config
Reverse proxy routing
SSL/TLS certificate
Cron job
Firewall rules
Đặc điểm:
Dung lượng nhỏ
Giá trị phục hồi rất cao
Khó nhớ chính xác nếu làm lại bằng tay
Yêu cầu backup:
Backup mỗi khi thay đổi
Backup cả trước và sau khi chỉnh sửa
Luôn có bản off-site
Nhóm 4. Dữ liệu file dung lượng lớn (Large Files / Assets)
Mô tả:
File upload, media, file đính kèm
Ví dụ:
File người dùng tải lên
Tài liệu scan
Media nội bộ
Đặc điểm:
Dung lượng lớn
Tăng nhanh theo thời gian
Không phải file nào cũng có giá trị ngang nhau
Yêu cầu backup:
Không backup full indiscriminately
Ưu tiên:
HA (BV1 → BV2)
Snapshot chọn lọc
Off-site chỉ giữ phần quan trọng
Nhóm 5. Dữ liệu tạm, dữ liệu sinh ra tự động
Mô tả:
Dữ liệu phục vụ vận hành tạm thời
Ví dụ:
Cache
Session
Temp file
Log hệ thống thông thường
Đặc điểm:
Có thể tái tạo
Không có giá trị phục hồi
Yêu cầu backup:
KHÔNG backup
3. Phân loại dữ liệu theo vị trí hệ thống
3.1. Cụm CMC (dịch vụ người bệnh)
| Loại dữ liệu | Backup | Ghi chú |
|---|---|---|
| Database | Có | Dump từ CMC1C |
| Code | Có | Backup ngắn hạn |
| Cấu hình | Có | Rất quan trọng |
| File lớn | Hạn chế | Chỉ khi cần |
| Cache/log | Không |
3.2. Hệ thống bệnh viện (BV1 – BV2 – PRX)
| Vị trí | Dữ liệu | Backup |
|---|---|---|
| PRX | Config, SSL | Có |
| BV1 | DB, code, files | Có |
| BV2 | Replica | Không (HA) |
3.3. Desktop Windows + WSL
| Dữ liệu | Vai trò |
|---|---|
| DB | Bản sao an toàn |
| Config | Phục hồi nhanh |
| Code | Khôi phục dịch vụ |
| Files chọn lọc | Thảm họa |
4. Phân loại theo mức độ ưu tiên phục hồi
Mức A – Phải khôi phục ngay
Database
Cấu hình hệ thống
SSL/TLS
Mức B – Khôi phục sớm
Code
Script nghiệp vụ
Mức C – Khôi phục khi cần
Files lớn
Media
Mức D – Không khôi phục
Cache
Temp
Log thường
5. Liên hệ với chiến lược backup tổng thể
Việc phân loại dữ liệu là cơ sở để:
Thiết kế timeline backup
Áp dụng retention hợp lý
Viết script backup chính xác
Đánh giá RAG đúng trọng tâm
Nếu không phân loại:
Backup sẽ nặng
Restore sẽ chậm
Rủi ro sẽ cao
6. Kết luận
Một hệ thống backup tốt không bắt đầu từ script, mà bắt đầu từ:
Hiểu rõ dữ liệu nào thực sự cần được bảo vệ.
Phân loại đúng giúp:
Giảm chi phí
Tăng độ an toàn
Dễ vận hành lâu dài
- Đăng nhập để gửi ý kiến