Chủ Nhật, 16 tháng 7, 2017

S&T: Quá Nhiều Hồ Sơ Trùng Lặp! - RAIDing and Cleaning Up.


Thân chào các Bê (*),
Hôm nay xin hầu các Bê một bài tuy là đơn giản nhưng cũng kể là S&T vì ứng dụng của nó khá lớn nếu Bê, như mọi người, xài máy điện thoại thông minh (smartphone) hoăc máy hình điện tử mà chụp hình hoặc "quay cờ lip" (video clips). 
Hình nhiều, clip nhiều thì thường là phải chuyển qua máy tính bàn (desktop computer) vì dung lượng của ổ cứng (hard drive; HDD) trong desktop computer thường là lớn hơn dung lượng chỗ chứa trên điện thoại cầm tay.

Dạ, dạ Đệ xin vào đề...
Trong bài này xin chỉ đề cập tới hai vấn đề căn bản:
  1. Tạo chỗ chứa với bảo quản an toàn: không mất hồ sơ vì HDD bị hư (failed hard drive)
  2. Dọn dẹp chỗ chứa để tránh chứa cùng một file, một hình ở nhiều folders trong một HDD hoặc nhiều HDDs khác nhau.

A. Tạo Chỗ Chứa với Bảo Quản An Toàn

Tuy là hiện nay có khá nhiều cách để bảo đảm là hồ sơ điện tử (digital files) không bị mất hoặc hư hại, sau khi đã chứa vào HDD hoặc thẻ nhớ (USB/MicroSD stick), nhưng có lẽ cách đơn giản và hữu hiệu nhất là tạo ra chỗ chứa dữ liệu gọi là Storage array với thiết lập RAID (RAIDing a Storage Array). 

  • Bài này xin không đề cập tới chỗ chứa ở các trung tâm dữ liệu (Cloud Data Center) mà thường là Bê phải tốn tiền thuê chỗ hoăc mất tính riêng tư (losing your privacy).
  • Ngắn gọn thì Bê cần hai hoặc ba cái HDD (IDE, SATA, USB đều được). Mặc dầu là không nhất thiết là HDD phải cùng hãng sản xuất hoặc cùng loại nhưng Đệ góp ý là nên dùng cùng loại, cùng dung lượng (same storage size) để đơn giản vấn đề. 
  • Nếu Bê dùng các HDDs có sẵn trong nhà thì cũng tốt. Còn nếu mua mới thì mua dư một HDD để dành, i.e. nếu RAID 1 thì tối thiểu cần 2 HDDs nên mua ba HDDs (hai dùng cho RAID 1; một để dành khi HDD bị hư sau này). 

Về chi tiết, xin Bê xem qua phụ chú B nếu muốn biết thêm về các loại RAID khác nhau. Ngắn gọn thì nếu có điều kiện thì dùng RAID 5 hoặc RAID 10 còn không thì RAID 1 cũng là tốt hơn là không có RAID. 

  • RAID 1 cần tối thiểu 2 HDDs. RAID 1 dùng kỹ thuật "mirroring" (một hồ sơ được chứa trong cả hai HDDs). Nếu một HDD bị hư hỏng thì phải thay ngay trước khi HDD thứ hai bị hư; nếu không thì mất dữ kiện. RAID 1 cho dung lượng chứa bằng dung lượng của một HDD, e.g. dùng hai HDDs có dung lượng 1TB thì RAID 1 cho dung lượng tổng cộng là 1TB.
  • RAID 5 hoặc 10 cần tối thiểu 3 HDDs. RAID 5 dùng kỹ thuật "striping with parity across drives" nên nếu một HDD bị hư hoại thì HDD này có thể được thay thế bằng một HDD mới mà không mất dữ kiện.
  • RAID 10 (RAID 0 and 1) cần tối thiểu 3 HDDs. RAID 10 dùng kỹ thuật "mirroring and striping" nên nếu một HDD bị hư hoại thì HDD này có thể được thay thế bằng một HDD mới mà không mất dữ kiện. RAID 10 khác với RAID 5 ở chỗ là khi một HDD bị hư thì sự thay thế HDD và tái tạo (rebuilding) RAID khá nhanh so với RAID 5. Nhưng cũng vì vậy mà dung lượng của RAID 10 giảm còn khoảng một nửa so với RAID 5.
Xin xem phụ chú C để biết cách làm RAID 5 trong Windows ấn bản 8.1 hoặc ấn bản 10 (1). Nếu Bê nào rành về máy tính bàn và biết cách vào BIOS của máy mà thiết lập RAID (hard RAIDing) thì việc bảo quản an toàn xảy ra ở mức "hardware" nên nhanh hơn là để hệ điều hành như Windows làm chuyện này.
Phụ chú D là video nói về cách làm RAID với USB memory sticks. Cũng là thú vị để xem. Bê có thể hiển thị phụ đề tiếng Việt (đã viết trong bài  S&T: Quantum Computing - Máy Tính Lượng Tử).

B. Dọn Dẹp Chỗ Chứa

Làm sao để dọn dẹp chỗ chứa trong ổ cứng để tránh chứa cùng một hồ sơ (file), một hình ảnh (digital pictures, video clips) ở nhiều folders trong một HDD hoặc nhiều HDDs khác nhau? Nếu phải làm bằng tay (manually done) thì quá là mất thì giờ và có thể gây lỗi lầm mà xóa hình, xóa video clip do xóa luôn bản cuối cùng (và sau khi dọn dẹp "trash can"/"cycle bin folder").

May là có những ứng dụng điện tử trong máy tính miễn phí làm chuyện dọn dẹp một cách hiệu quả và an toàn. Xin Bê xem qua phụ chú E để chọn một ứng dụng dùng để tìm ra những hồ sơ được sao chép nhiều lần vào trong các phòng chứa (folder/directory)
khác nhau trong cùng HDD hoặc trong nhiều HDDs khác nhau. Đệ thì dùng Scooter Software's Beyond Compare nhưng ấn bản 3 hoặc 4 thì phải mua. Đệ đề nghị là Bê dùng thử ấn bản 2 (cũ nhưng chạy tốt) trước khi muốn mua ấn bản mới hơn còn không thì cứ dùng ấn bản 2 cũng là được việc.

Chúc các Bê một cuối tuần vui vẻ bên gia đình và người thân.
Thân,

Chú thích:
(*) Bê là Bê 60: Từ chữ tắt B60 (Beyond 60 years young) để chỉ các bác trên 60 tuổi trẻ. Trí nhớ ngày càng kém mà không có hình không có video thì làm sao nhớ?
(1) Đệ lướt mạng (surfing the Internet) thì thấy khá nhiều bài viết bằng tiếng Việt về RAID array; nhưng tùy Bê, có một số bài viết khá lủng cũng, một số bài sao chép từ tài liệu nước ngoài nên có lẽ là điểm tốt cho các Bê yếu về Anh ngữ nhưng cũng xin Bê trân trọng khi đọc các bài này mà đừng cả tin.

Phụ chú:
A. Blogs Đã Viết--Theo Đề Tài
B. Standard RAID levels
C. How To Create Software RAID 5 in Windows 8.1 and 10
D. Use a bunch of USB Flash drives in a RAID array.
EFind and Remove Duplicate Files on Windows

Không có nhận xét nào: