I. Kiểm tra ổ cứng vật lý (Physical Disk)
1. Liệt kê ổ đĩa & phân vùng
👉 Dùng để:
Xác định số lượng ổ
Phân biệt HDD / SSD / NVMe
Kiểm tra mountpoint
2. Kiểm tra SMART (sức khỏe ổ cứng) – rất quan trọng
Cài nếu chưa có:
Thông tin tổng quát
Kiểm tra sức khỏe nhanh
Xem chi tiết các chỉ số hao mòn / lỗi
Các chỉ số cần chú ý:
Reallocated_Sector_CtCurrent_Pending_SectorOffline_UncorrectableWear_Leveling_Count(SSD)Media_Wearout_Indicator(SSD Intel)Total_LBAs_Written
Test nhanh / dài
3. Xác định loại ổ (HDD / SSD)
ROTA = 1→ HDDROTA = 0→ SSD / NVMe
4. Xem thông tin NVMe
II. Kiểm tra RAID Software (mdadm)
1. Trạng thái RAID tổng quát
👉 Xem:
RAID level
Trạng thái
[UU]hay[U_]Có đang rebuild hay không
2. Chi tiết từng RAID
Thông tin quan trọng:
Raid Level
State
Active Devices
Failed Devices
Bitmap
Rebuild status
3. Kiểm tra ổ thành viên RAID
4. Theo dõi rebuild RAID realtime
III. RAID Hardware (LSI / Dell PERC / HBA)
1. Kiểm tra controller PCI
2. Với LSI / MegaRAID
Cài:
Kiểm tra tổng quan
Xem logical drive
Xem physical disk
3. Với Dell PERC
IV. Kiểm tra filesystem & dung lượng
1. Dung lượng & mount
2. Kiểm tra inode
3. Kiểm tra lỗi filesystem (offline)
⚠ Chỉ chạy khi unmount
V. Kiểm tra hiệu năng I/O
1. Tốc độ đọc thô
2. Kiểm tra I/O realtime
(cài sysstat)
VI. Log & lỗi ổ đĩa
1. Kernel log
2. Journal
VII. Checklist nhanh cho server QMS
| Hạng mục | Lệnh |
|---|---|
| Tổng quan ổ | lsblk |
| RAID sống/chết | cat /proc/mdstat |
| Chi tiết RAID | mdadm --detail |
| Tuổi SSD | smartctl -A |
| Lỗi kernel | dmesg |
| Dung lượng | df -h |
| IO realtime | iostat -x |
- Đăng nhập để gửi ý kiến