Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "CNTT" các nội dung bạn quan tâm.

Bài 1.3. Chiến lược backup cho dữ liệu đã “đóng năm” - dữ liệu archive

ICT

1. Khái niệm “đóng năm” trong hệ thống CNTT bệnh viện

“Đóng năm” trong CNTT không chỉ là nghiệp vụ, mà còn là trạng thái kỹ thuật của dữ liệu.

Một hệ thống được xem là đã “đóng năm” khi:

  • Không còn ghi dữ liệu mới

  • Database ở trạng thái read-only

  • Website/app chỉ dùng để tra cứu

  • Không tham gia luồng vận hành hàng ngày

Ví dụ thực tế:

  • kshl2025 → chỉ tra cứu

  • kshl2026 → hệ thống live mới


2. Mục tiêu của backup dữ liệu archive

Backup dữ liệu archive không nhằm phục hồi nhanh, mà nhằm:

  • Bảo toàn dữ liệu lịch sử

  • Đảm bảo tính toàn vẹn lâu dài

  • Phục vụ kiểm toán, đối soát, tra cứu

Nguyên tắc cốt lõi:

Archive ưu tiên “chắc chắn” hơn “nhanh chóng”.


3. Đặc điểm kỹ thuật của dữ liệu archive

Đặc điểmÝ nghĩa
Không thay đổiDễ đảm bảo nhất quán
Ít truy cậpPhù hợp lưu trữ lạnh
Dung lượng lớnCần tối ưu chi phí
Giá trị pháp lý caoPhải bảo vệ lâu dài

4. Nguyên tắc thiết kế chiến lược backup archive

4.1. Tách biệt tuyệt đối khỏi hệ thống live

  • Không đặt archive trong:

    • Cron backup live

    • Replication HA

  • Không để script live:

    • Ghi

    • Xóa

    • Đồng bộ


4.2. Ít bản nhưng chất lượng cao

  • Không cần daily backup

  • Không cần hourly

  • Chỉ cần:

    • 1–2 bản full chuẩn


4.3. Ưu tiên tính toàn vẹn hơn tần suất

  • Có checksum

  • Có verify

  • Có test restore (ít nhất 1 lần)


5. Thành phần cần backup khi “đóng năm”

Một hệ thống archive phải được backup trọn gói:

5.1. Database

  • Dump full

  • Không incremental

  • Lưu kèm:

    • Version DB

    • Charset/collation


5.2. Code & webapp

  • Backup code đúng version đang chạy

  • Không cần history

  • Không cần git repo đầy đủ


5.3. Cấu hình hệ thống

  • Web server config

  • Virtual host

  • SSL (nếu còn bật tra cứu qua HTTPS)


5.4. Files dữ liệu

  • File upload

  • Tài liệu đính kèm

  • Media liên quan


6. Thời điểm và cách thực hiện backup archive

6.1. Thời điểm lý tưởng

  • Ngay sau khi:

    • Đóng năm

    • Khóa ghi DB

    • Kiểm tra dữ liệu lần cuối


6.2. Cách thực hiện

  • Dừng toàn bộ cron backup live

  • Thực hiện:

    • 1 bản full backup

  • Kiểm tra:

    • Checksum

    • Dung lượng

  • Gắn nhãn:

    • ARCHIVE_2025


7. Vị trí lưu trữ dữ liệu archive

7.1. Lưu trữ off-site (bắt buộc)

  • Desktop Windows + WSL

  • Cloud storage (OneDrive, Google Drive)

  • HDD rời lưu két


7.2. Không lưu lâu trên server live

  • Chỉ giữ bản tạm để chuyển đi

  • Sau đó xóa khỏi:

    • CMC

    • BV


8. Retention cho dữ liệu archive

LoạiThời gian giữ
Archive năm5–10 năm
Báo cáo pháp lýTheo quy định
File lớnTheo nhu cầu tra cứu

Không áp dụng retention tự động xóa như live.


9. Bảo vệ dữ liệu archive khỏi rủi ro

9.1. Chống ransomware

  • Lưu read-only

  • Không mount ngược

  • Không cho script live truy cập


9.2. Chống nhầm lẫn vận hành

  • Thư mục riêng

  • Tên rõ ràng

  • Không trộn với live


10. Test restore dữ liệu archive

  • Không cần test thường xuyên

  • Nhưng:

    • Phải test ít nhất 1 lần sau khi tạo archive

  • Test:

    • Restore DB

    • Mở website tra cứu


11. Liên hệ với mô hình thực tế đang triển khai

Trong mô hình của mình:

  • kshl2025:

    • Archive

    • Backup 1–2 bản full

    • Lưu Desktop + Cloud

Sự tách biệt này:

  • Giảm tải backup live

  • Tăng an toàn archive


 

Chiến lược backup cho dữ liệu archive không cần phức tạp, nhưng phải kỷ luật.

Dữ liệu đã “đóng năm” cần được đối xử như hồ sơ lưu trữ – không phải hệ thống đang chạy.