Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "CNTT" các nội dung bạn quan tâm.

Bài 3.2. Danh sách dữ liệu và phương án backup

ICT

1. Mục tiêu của bài này

Bài này nhằm:

  • Liệt kê đầy đủ các loại dữ liệu đang tồn tại

  • Xác định dữ liệu nằm ở đâu

  • Quy định phương án backup phù hợp cho từng loại

  • Tránh nhầm lẫn giữa:

    • Live ↔ Backup

    • HA ↔ Backup

    • Archive ↔ Live

Nguyên tắc xuyên suốt:

Mỗi loại dữ liệu chỉ nên có một chiến lược backup “đúng vai trò”, không chồng chéo.


2. Cụm 2 máy chủ CMC (cmc1c – cmc2d)

2.1. Kiến trúc và đặc điểm

  • cmc1c

    • Chạy code, dịch vụ public cho người bệnh

    • ổ HDD RAID 2TB gắn tại /mnt/backup

    • Không lưu trữ dài hạn

  • cmc2d

    • Chỉ chạy database, yêu cầu ổn định tối đa

    • Ổ cứng nhỏ, dung lượng hạn chế

    • Không backup trực tiếp trên máy này

Dữ liệu tại CMC gồm cả live và archive.


2.2. Danh sách dữ liệu tại CMC

Loại dữ liệuTrạng tháiVị trí
Database dịch vụ người bệnhLivecmc2d
Database archive (năm cũ)Archivecmc2d
Code website/webappLivecmc1c
Code archiveArchivecmc1c
Cấu hình hệ thốngLivecmc1c/cmc2d
File tạm, cacheLivecmc1c

2.3. Phương án backup tại CMC

 
TTDữ liệuPhương án7 Daily4 Weekly12 Monthly5 Yearly
1

Database live

cmc2d SSD 1T

Dump từ cmc2d → cmc1c /mnt/backup

 

 

1/3. On-site cmc1c: /mnt/backup 2T HDD raid 1

 

1/3. On-site cmc1c: /mnt/backup 2T HDD raid 1

2/3. Off-site Desktop: 2T HDD bak1 none-raid

2/3. Off-site Desktop: 2T HDD bak2 none-raid

3/3. Off-site Cloud Google Drive

2/3. Off-site Desktop: 2T HDD bak2 none-raid

3/3. Off-site Cloud Google Drive

4/3. Off-site Cloud OneDrive

2

Code & config live

cmc1c SSD 1.5T

Backup ngắn hạn tại cmc1c → /mnt/backup
3Database archiveDump full

1/3. Off-site Desktop: 2T HDD bak2 none-raid

2/3. Off-site Cloud Google Drive

3/3. Off-site Cloud OneDrive

4Code Archive & config archivetar full

📌 Lưu ý quan trọng

  • cmc2d không được coi là nơi backup

  • /mnt/backup chỉ là vùng đệm tạm, không phải nơi an toàn cuối cùng: bản backup 1/3 (on site)


3. Máy chủ AI (Live chính + dữ liệu lớn)

3.1. Kiến trúc và vai trò

  • SSD NVMe 2TB (không RAID)

    • Chạy OS

    • Code

    • Database

    • Model AI

    • FAISS data

  • HDD 12TB × 2 RAID1

    • Backup từ các nơi khác cho các dự án ngắn hạn, không backup theo trục chính hệ thống.

    • Live cho website có files tài liệu lớn

    • Chứa:

      • Website live

      • Website archive

Máy chủ AI là máy chủ live chính, tải nặng, dữ liệu đa dạng.


3.2. Danh sách dữ liệu trên máy chủ AI và phương án backup

TTLoại dữ liệuVị tríTrạng tháiNơi backup
1Code AI, service; Database AI; Model AI; FAISS dataNVME 2TLive

Chỉ backup 1 bản hàng tuần do dữ liệu có thể tái tạo. Hoặc backup trước khi có sự thay đổi lớn.

1/3. On-site: AI /mnt/data/bak-ai

2/3. Off-site: Desktop

2Code Website đang chạyLiveNhư 2.3
3Database Website đang chạy
4Code Website năm cũ ArchiveArchive
5Database Website năm cũ Archive
6Files tài liệu lớn/mnt/data 
7Backup từ server khác: các dự án ngắn hạn, không nằm trong trục chínhBackupNA

📌 Nguyên tắc quan trọng

  • RAID1 không được coi là backup (/mnt/data là 2 ổ 12T HDD raid1)

  • HDD RAID1 chủ yếu để:

    • Chống lỗi ổ đĩa

    • Giảm downtime

  • Off-site vẫn bắt buộc


4. Máy chủ QMS (dự phòng + mở rộng)

4.1. Kiến trúc và vai trò

  • SSD 1TB × 2 RAID1

    • OS

    • Code

    • Database QMS

  • HDD 12TB × 1 (không RAID)

    • Backup từ các nơi

    • Live cho website nhiều file

  • Vai trò:

    • Dự phòng khi máy AI lỗi

    • Có thể mở rộng chạy thêm web khi cần


4.2. Danh sách dữ liệu trên máy QMS và phương án backup

TTDữ liệuVị tríTrạng tháiNơi backup
1Database QMS1T SSD raid 1LiveNhư 2.3
2Code QMSLive
3Code Website năm cũ ArchiveArchive
4Database Website năm cũ Archive 
5Website nhiều file, file lớn/mnt/data 
6Backup từ server khác: các dự án ngắn hạn, không nằm trong trục chínhBackupNA

📌 Máy QMS không phải là backup, mà là node dự phòng có thể nâng vai trò.


5. Desktop Windows + WSL (backup độc lập)

5.1. Kiến trúc và vai trò

  • Desktop Windows

  • WSL chạy cron backup

  • 2 ổ HDD 2TB

    • Ổ bak1: backup weekly, monthly

    • Ổ bak2: backup monthly, yearly, archive

  • 1 ổ SSD

    • OS

    • Dữ liệu crawl

  • Đặt khác vị trí với server


5.2. Dữ liệu trên Desktop

Dữ liệuVai trò
Database từ CMCBackup
Database từ AI/QMSBackup
Code & configBackup
Website archiveBackup dài hạn
Dữ liệu crawlNghiệp vụ riêng

5.3. Phương án backup tại Desktop

Đặc điểmQuy định
Hướng backupDesktop pull, không push
QuyềnRead-only từ server
Retention

Không có 7 - 4-12-5.

Backup từ weekly, monthly, yaerly và archive

Vai tròBản “1” Offsite trong 3-2-1

📌 Desktop là nguồn khôi phục cuối cùng.


6. Cloud storage: OneDrive & Google Drive

6.1. Bối cảnh sử dụng

  • OneDrive 1TB (Office)

  • Google Drive 5TB

  • Duy trì cả hai vì:

    • Gắn với hệ sinh thái Microsoft

    • Gắn với hệ sinh thái Google

    • Không thể bỏ một bên


6.2. Vai trò trong chiến lược backup

Dữ liệuLưu cloud
File pháp lý
Backup bắt đầu từ monthly, rearly, archive 
Backup daily, weeklyKhông
Dữ liệu tạmKhông

📌 Cloud:

  • Không thay thế backup local - xem như là bản thứ 4/3 trong mô hình 3-2-1

  • Chỉ dùng cho:

    • Archive

    • Thảm họa

    • Tra cứu


7. Tổng hợp nhanh: dữ liệu – nơi lưu – chiến lược

NơiLiveArchiveBackup
CMC-On-site
AI-On-site
QMS-On-site
Desktop-Off-site
Cloud-Off-site

8. Kết luận

Chiến lược backup hiệu quả không nằm ở số lượng ổ cứng, mà nằm ở:

  • Phân loại đúng dữ liệu

  • Giao đúng vai trò cho từng máy

  • Không nhầm:

    • RAID = backup

    • HA = backup

    • Cloud = backup duy nhất

Mỗi loại dữ liệu có một “nhà” phù hợp – và chỉ cần một chiến lược đúng.