Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "CNTT" các nội dung bạn quan tâm.

Bài 1.1. Phân loại dữ liệu cần backup

ICT

1. Mục tiêu của việc phân loại dữ liệu

Trong một hệ thống nhiều lớp như CMC – Bệnh viện – Desktop backup, không phải dữ liệu nào cũng cần backup giống nhau.

Phân loại dữ liệu nhằm:

  • Xác định cái gì bắt buộc phải backup

  • Xác định backup ở đâu, bao lâu

  • Tránh backup tràn lan gây:

    • Tốn dung lượng

    • Khó khôi phục

    • Rủi ro ransomware lan rộng

Nguyên tắc cốt lõi:

Backup phải dựa trên giá trị dữ liệu, không dựa trên vị trí lưu trữ.


2. Phân loại dữ liệu theo bản chất

Toàn bộ dữ liệu trong hệ thống được chia thành 05 nhóm chính.

Nhóm 1. Dữ liệu nghiệp vụ (Business Data)

Mô tả:

  • Là dữ liệu tạo ra từ hoạt động khám chữa bệnh, quản lý, vận hành

  • Thường nằm trong database

Ví dụ:

  • Hồ sơ người bệnh

  • Dữ liệu webform, khảo sát

  • Dữ liệu quản lý nội bộ

  • Log nghiệp vụ có giá trị pháp lý

Đặc điểm:

  • Giá trị cao nhất

  • Không thể tái tạo

  • Mất là mất vĩnh viễn

Yêu cầu backup:

  • Bắt buộc backup

  • Backup nhiều bản

  • Có bản off-site (Desktop)


Nhóm 2. Code và ứng dụng (Application Code)

Mô tả:

  • Mã nguồn website, webapp, script nghiệp vụ

Ví dụ:

  • Code Drupal

  • Custom module

  • Script xử lý nghiệp vụ

Đặc điểm:

  • Có thể tái triển khai

  • Nhưng mất sẽ làm gián đoạn dịch vụ

Yêu cầu backup:

  • Backup định kỳ

  • Không cần retention quá dài

  • Phải đi kèm đúng version database


Nhóm 3. Cấu hình hệ thống (System Configuration)

Mô tả:

  • Các file cấu hình quyết định hệ thống có chạy hay không

Ví dụ:

  • Web server config

  • Reverse proxy routing

  • SSL/TLS certificate

  • Cron job

  • Firewall rules

Đặc điểm:

  • Dung lượng nhỏ

  • Giá trị phục hồi rất cao

  • Khó nhớ chính xác nếu làm lại bằng tay

Yêu cầu backup:

  • Backup mỗi khi thay đổi

  • Backup cả trước và sau khi chỉnh sửa

  • Luôn có bản off-site


Nhóm 4. Dữ liệu file dung lượng lớn (Large Files / Assets)

Mô tả:

  • File upload, media, file đính kèm

Ví dụ:

  • File người dùng tải lên

  • Tài liệu scan

  • Media nội bộ

Đặc điểm:

  • Dung lượng lớn

  • Tăng nhanh theo thời gian

  • Không phải file nào cũng có giá trị ngang nhau

Yêu cầu backup:

  • Không backup full indiscriminately

  • Ưu tiên:

    • HA (BV1 → BV2)

    • Snapshot chọn lọc

  • Off-site chỉ giữ phần quan trọng


Nhóm 5. Dữ liệu tạm, dữ liệu sinh ra tự động

Mô tả:

  • Dữ liệu phục vụ vận hành tạm thời

Ví dụ:

  • Cache

  • Session

  • Temp file

  • Log hệ thống thông thường

Đặc điểm:

  • Có thể tái tạo

  • Không có giá trị phục hồi

Yêu cầu backup:

  • KHÔNG backup


3. Phân loại dữ liệu theo vị trí hệ thống

3.1. Cụm CMC (dịch vụ người bệnh)

Loại dữ liệuBackupGhi chú
DatabaseDump từ CMC1C
CodeBackup ngắn hạn
Cấu hìnhRất quan trọng
File lớnHạn chếChỉ khi cần
Cache/logKhông 

3.2. Hệ thống bệnh viện (BV1 – BV2 – PRX)

Vị tríDữ liệuBackup
PRXConfig, SSL
BV1DB, code, files
BV2ReplicaKhông (HA)

3.3. Desktop Windows + WSL

Dữ liệuVai trò
DBBản sao an toàn
ConfigPhục hồi nhanh
CodeKhôi phục dịch vụ
Files chọn lọcThảm họa

4. Phân loại theo mức độ ưu tiên phục hồi

Mức A – Phải khôi phục ngay

  • Database

  • Cấu hình hệ thống

  • SSL/TLS


Mức B – Khôi phục sớm

  • Code

  • Script nghiệp vụ


Mức C – Khôi phục khi cần

  • Files lớn

  • Media


Mức D – Không khôi phục

  • Cache

  • Temp

  • Log thường


5. Liên hệ với chiến lược backup tổng thể

Việc phân loại dữ liệu là cơ sở để:

  • Thiết kế timeline backup

  • Áp dụng retention hợp lý

  • Viết script backup chính xác

  • Đánh giá RAG đúng trọng tâm

Nếu không phân loại:

  • Backup sẽ nặng

  • Restore sẽ chậm

  • Rủi ro sẽ cao


6. Kết luận

Một hệ thống backup tốt không bắt đầu từ script, mà bắt đầu từ:

Hiểu rõ dữ liệu nào thực sự cần được bảo vệ.

Phân loại đúng giúp:

  • Giảm chi phí

  • Tăng độ an toàn

  • Dễ vận hành lâu dài