1. Mục tiêu của bài này
Bài này nhằm:
Liệt kê đầy đủ các loại dữ liệu đang tồn tại
Xác định dữ liệu nằm ở đâu
Quy định phương án backup phù hợp cho từng loại
Tránh nhầm lẫn giữa:
Live ↔ Backup
HA ↔ Backup
Archive ↔ Live
Nguyên tắc xuyên suốt:
Mỗi loại dữ liệu chỉ nên có một chiến lược backup “đúng vai trò”, không chồng chéo.
2. Cụm 2 máy chủ CMC (cmc1c – cmc2d)
2.1. Kiến trúc và đặc điểm
cmc1c
Chạy code, dịch vụ public cho người bệnh
Có ổ HDD RAID 2TB gắn tại
/mnt/backupKhông lưu trữ dài hạn
cmc2d
Chỉ chạy database, yêu cầu ổn định tối đa
Ổ cứng nhỏ, dung lượng hạn chế
Không backup trực tiếp trên máy này
Dữ liệu tại CMC gồm cả live và archive.
2.2. Danh sách dữ liệu tại CMC
| Loại dữ liệu | Trạng thái | Vị trí |
|---|---|---|
| Database dịch vụ người bệnh | Live | cmc2d |
| Database archive (năm cũ) | Archive | cmc2d |
| Code website/webapp | Live | cmc1c |
| Code archive | Archive | cmc1c |
| Cấu hình hệ thống | Live | cmc1c/cmc2d |
| File tạm, cache | Live | cmc1c |
2.3. Phương án backup tại CMC
| TT | Dữ liệu | Phương án | 7 Daily | 4 Weekly | 12 Monthly | 5 Yearly |
|---|---|---|---|---|---|---|
| 1 | Database live cmc2d SSD 1T | Dump từ cmc2d → cmc1c /mnt/backup |
1/3. On-site cmc1c: /mnt/backup 2T HDD raid 1 |
1/3. On-site cmc1c: /mnt/backup 2T HDD raid 1 2/3. Off-site Desktop: 2T HDD bak1 none-raid | 2/3. Off-site Desktop: 2T HDD bak2 none-raid 3/3. Off-site Cloud Google Drive | 2/3. Off-site Desktop: 2T HDD bak2 none-raid 3/3. Off-site Cloud Google Drive 4/3. Off-site Cloud OneDrive |
| 2 | Code & config live cmc1c SSD 1.5T | Backup ngắn hạn tại cmc1c → /mnt/backup | ||||
| 3 | Database archive | Dump full | 1/3. Off-site Desktop: 2T HDD bak2 none-raid 2/3. Off-site Cloud Google Drive 3/3. Off-site Cloud OneDrive | |||
| 4 | Code Archive & config archive | tar full | ||||
📌 Lưu ý quan trọng
cmc2d không được coi là nơi backup
Ổ
/mnt/backupchỉ là vùng đệm tạm, không phải nơi an toàn cuối cùng: bản backup 1/3 (on site)
3. Máy chủ AI (Live chính + dữ liệu lớn)
3.1. Kiến trúc và vai trò
SSD NVMe 2TB (không RAID)
Chạy OS
Code
Database
Model AI
FAISS data
HDD 12TB × 2 RAID1
Backup từ các nơi khác cho các dự án ngắn hạn, không backup theo trục chính hệ thống.
Live cho website có files tài liệu lớn
Chứa:
Website live
Website archive
Máy chủ AI là máy chủ live chính, tải nặng, dữ liệu đa dạng.
3.2. Danh sách dữ liệu trên máy chủ AI và phương án backup
| TT | Loại dữ liệu | Vị trí | Trạng thái | Nơi backup |
|---|---|---|---|---|
| 1 | Code AI, service; Database AI; Model AI; FAISS data | NVME 2T | Live | Chỉ backup 1 bản hàng tuần do dữ liệu có thể tái tạo. Hoặc backup trước khi có sự thay đổi lớn. 1/3. On-site: AI /mnt/data/bak-ai 2/3. Off-site: Desktop |
| 2 | Code Website đang chạy | Live | Như 2.3 | |
| 3 | Database Website đang chạy | |||
| 4 | Code Website năm cũ Archive | Archive | ||
| 5 | Database Website năm cũ Archive | |||
| 6 | Files tài liệu lớn | /mnt/data | ||
| 7 | Backup từ server khác: các dự án ngắn hạn, không nằm trong trục chính | Backup | NA |
📌 Nguyên tắc quan trọng
RAID1 không được coi là backup (/mnt/data là 2 ổ 12T HDD raid1)
HDD RAID1 chủ yếu để:
Chống lỗi ổ đĩa
Giảm downtime
Off-site vẫn bắt buộc
4. Máy chủ QMS (dự phòng + mở rộng)
4.1. Kiến trúc và vai trò
SSD 1TB × 2 RAID1
OS
Code
Database QMS
HDD 12TB × 1 (không RAID)
Backup từ các nơi
Live cho website nhiều file
Vai trò:
Dự phòng khi máy AI lỗi
Có thể mở rộng chạy thêm web khi cần
4.2. Danh sách dữ liệu trên máy QMS và phương án backup
| TT | Dữ liệu | Vị trí | Trạng thái | Nơi backup |
|---|---|---|---|---|
| 1 | Database QMS | 1T SSD raid 1 | Live | Như 2.3 |
| 2 | Code QMS | Live | ||
| 3 | Code Website năm cũ Archive | Archive | ||
| 4 | Database Website năm cũ Archive | |||
| 5 | Website nhiều file, file lớn | /mnt/data | ||
| 6 | Backup từ server khác: các dự án ngắn hạn, không nằm trong trục chính | Backup | NA |
📌 Máy QMS không phải là backup, mà là node dự phòng có thể nâng vai trò.
5. Desktop Windows + WSL (backup độc lập)
5.1. Kiến trúc và vai trò
Desktop Windows
WSL chạy cron backup
2 ổ HDD 2TB
Ổ bak1: backup weekly, monthly
Ổ bak2: backup monthly, yearly, archive
1 ổ SSD
OS
Dữ liệu crawl
Đặt khác vị trí với server
5.2. Dữ liệu trên Desktop
| Dữ liệu | Vai trò |
|---|---|
| Database từ CMC | Backup |
| Database từ AI/QMS | Backup |
| Code & config | Backup |
| Website archive | Backup dài hạn |
| Dữ liệu crawl | Nghiệp vụ riêng |
5.3. Phương án backup tại Desktop
| Đặc điểm | Quy định |
|---|---|
| Hướng backup | Desktop pull, không push |
| Quyền | Read-only từ server |
| Retention | Không có 7 - 4-12-5. Backup từ weekly, monthly, yaerly và archive |
| Vai trò | Bản “1” Offsite trong 3-2-1 |
📌 Desktop là nguồn khôi phục cuối cùng.
6. Cloud storage: OneDrive & Google Drive
6.1. Bối cảnh sử dụng
OneDrive 1TB (Office)
Google Drive 5TB
Duy trì cả hai vì:
Gắn với hệ sinh thái Microsoft
Gắn với hệ sinh thái Google
Không thể bỏ một bên
6.2. Vai trò trong chiến lược backup
| Dữ liệu | Lưu cloud |
|---|---|
| File pháp lý | Có |
| Backup bắt đầu từ monthly, rearly, archive | |
| Backup daily, weekly | Không |
| Dữ liệu tạm | Không |
📌 Cloud:
Không thay thế backup local - xem như là bản thứ 4/3 trong mô hình 3-2-1
Chỉ dùng cho:
Archive
Thảm họa
Tra cứu
7. Tổng hợp nhanh: dữ liệu – nơi lưu – chiến lược
| Nơi | Live | Archive | Backup |
|---|---|---|---|
| CMC | ✔ | - | On-site |
| AI | ✔ | - | On-site |
| QMS | ✔ | - | On-site |
| Desktop | - | ✔ | Off-site |
| Cloud | - | ✔ | Off-site |
8. Kết luận
Chiến lược backup hiệu quả không nằm ở số lượng ổ cứng, mà nằm ở:
Phân loại đúng dữ liệu
Giao đúng vai trò cho từng máy
Không nhầm:
RAID = backup
HA = backup
Cloud = backup duy nhất
Mỗi loại dữ liệu có một “nhà” phù hợp – và chỉ cần một chiến lược đúng.
- Đăng nhập để gửi ý kiến