Định dạng nén file nào tốt nhất?

Đã đến lúc nén một số tệp tin, vậy bạn sử dụng định dạng nào? Zip, RAR, 7z, hay cái gì khác? Bài viết này đã thử nghiệm một số bài kiểm tra để xác định định dạng nào cho phép nén tối đa.

Tất nhiên, tỷ lệ nén không phải là yếu tố duy nhất. Một số định dạng này dễ sử dụng hơn vì chúng được tích hợp vào các hệ điều hành máy tính để bàn, trong khi một số định dạng lại yêu cầu phần mềm của bên thứ ba.

Những định dạng nén file phổ biến

Có nhiều định dạng nén khác nhau, nhưng nhiều định dạng có thể không được nhiều người biết đến. Hãy xem xét một số định dạng trong số này để có thể đưa ra quyết định sáng suốt khi tạo các bản lưu trữ của mình.

001 là một phần mở rộng cho biết rằng file lưu trữ đang sử dụng định dạng ARJ để nén. Bạn cũng có thể thấy các file như vậy với phần mở rộng là .arj. Được sử dụng trên MS-DOS, mặc dù các nền tảng khác có các công cụ sẽ giải nén những file 001 và ARJ.

7Z là một định dạng mới được tạo để sử dụng với 7-Zip, một trình lưu trữ mã nguồn mở dựa trên Windows.

Các file ARJ đã được thảo luận trước đây, với 001.

BIN chỉ dành cho macOS và là viết tắt của MacBinary, nén rất ít và tạo file nhị phân thay vì file văn bản. Giữ nguyên vẹn dữ liệu dành riêng cho Mac và do đó giữ nguyên "resource fork" cùng với "data fork". Vì cả hai nhánh được giữ cùng nhau. Ví dụ, một file được giải nén sẽ vẫn hiển thị biểu tượng thực của nó, thay vì biểu tượng file chung. Vì đó là định dạng nhị phân, bạn chỉ cần chuyển các file .bin qua FTP sau khi đặt chương trình FTP của bạn thành "nhị phân".

BZIPBZIP2 sử dụng "thuật toán nén văn bản sắp xếp khối Burrows-Wheeler". Nó được sử dụng trên Linux và các hệ thống giống Unix khác. Những file sử dụng phương pháp này kết thúc bằng ".bz2."

CAB là một file cabinet của Microsoft, được sử dụng để phân phối các chương trình phần mềm.

CPIO là một lệnh Unix được sử dụng để sao chép file vào và ra khỏi kho lưu trữ. Nó không được nhìn thấy nhiều nữa, vì phần lớn đã được thay thế bởi TAR và GZIP.

DEB được sử dụng bởi bản phân phối Debian của Linux để đóng gói các file cài đặt phần mềm. RPM là một công cụ tương tự cho các bản phân phối khác nhau của Linux.

EAR, dành cho Enterprise ARchive, được sử dụng với các ứng dụng Java 2 Enterprise Edition (J2EE) yêu cầu nhiều file JAR và WAR, sẽ được thảo luận ở phần sau. EAR, giống như JAR và WAR, sử dụng cùng một phương pháp nén như ZIP.

GZ là phiên bản GNU của ZIP. Nó thường được sử dụng trên các hệ thống Linux.

HQX là một file BinHex. Chuyển đổi văn bản và file nhị phân thành văn bản ASCII; cụ thể là 7 bit mà hầu hết các hệ thống Unix sử dụng. Kết quả là các file có dung lượng lớn hơn .bin; tuy nhiên, sẽ an toàn hơn khi di chuyển trên Internet qua email vì thực tế là nó sử dụng văn bản ASCII, cho phép chuyển các chương trình nhị phân qua những giao thức truyền không nhị phân như UUCP và sendmail. Khi sử dụng FTP, không thành vấn đề cho bạn dù bạn lựa chọn "binary" hay "ASCII7". Theo cách nào đó, nếu bạn đang sử dụng .hqx, mọi thứ sẽ ổn.

JAR là viết tắt của Java ARchive, và được sử dụng với các kho lưu trữ chứa phần mềm được viết bằng và cho ngôn ngữ lập trình Java. JAR, giống như EAR và WAR, sử dụng cùng một phương pháp nén như ZIP.

LHA là một định dạng nén của Nhật Bản có từ những năm 1980. Nó đã được chứng minh là có ảnh hưởng, vì mã nguồn được tạo ra bởi Tiến sĩ Haruyasu Yoshizaki. Đây là một trong số ít các trình lưu trữ được sử dụng trên máy tính chạy hệ điều hành Amiga.

RAR là một định dạng độc quyền được phát triển bởi Eugene Roshal. Giấy phép cho phép giải mã miễn phí các kho lưu trữ RAR, nhưng việc mã hóa chỉ được phép thực hiện bởi công ty của Eugene Roshal.

RPM là viết tắt của "Red Hat Package Manager." Được phát minh bởi Red Hat, nó được sử dụng để xây dựng và cài đặt các gói phần mềm riêng lẻ. Vì RPM hầu như được sử dụng hoàn toàn như một công cụ để cài đặt phần mềm Linux, rất hiếm khi tìm thấy nó được sử dụng để nén các file dữ liệu thông thường hoặc tìm thấy nó trên những máy tính Windows hoặc Mac OS X.

SEA là viết tắt của Self-Expanding Archive, và nó đi cùng với SIT, sẽ được thảo luận trong phần tiếp theo.

SIT được sử dụng với chương trình Mac StuffIt, cũng giữ nguyên dữ liệu dành riêng cho Mac, giống như .bin. Định dạng nén này là độc quyền của Alladin Systems, nhưng chương trình "Expander" được tải xuống miễn phí cho cả Mac và Windows, thực hiện khá tốt trong việc nén các file.

Các file TAR không thực sự được nén. Thay vào đó, chúng dính liền với nhau để tạo thành một file lớn. Nói cách khác, nếu bạn có 100 file, mỗi file 3kb và bạn kết hợp chúng lại với nhau, bạn sẽ có một file 300kb. Tại thời điểm này, hầu hết các file tar được nén bằng một chương trình khác, thường là gzip, dẫn đến một file có phần mở rộng là ".tar.gz" hoặc "tgz". Định dạng này hầu như không bao giờ thấy trên Windows hoặc Mac OS X, và cực kỳ phổ biến trên máy tính Linux.

Các file WAR có liên quan đến kho lưu trữ JAR. WAR, viết tắt của Web ARchive, tập hợp tất cả các file mà ứng dụng web dựa trên Java cần - file lưu trữ Java, trang HTML, file XML, v.v... - để ứng dụng có thể chạy dễ dàng trên web server. Giống như JAR và EAR, WAR sử dụng cùng một phương pháp nén như ZIP.

ZIP hoạt động trên nhiều nền tảng máy tính, bao gồm Unix và Linux, VMS, OS/2, MS-DOS, Windows và Macintosh. Lý do cho tính phổ biến của định dạng này có thể là do Phil Katz, nhà phát triển thuật toán nén ZIP ban đầu, người đã tạo ra định dạng file ZIP, định dạng nén và phần mở rộng tên file .zip.

Trong những định dạng này, nổi bật nhất là .zip, .rar, .7z. Vì vậy, hãy cùng tiến hành so sánh chi tiết về chúng trong phần tiếp theo.

So sánh các tiêu chuẩn nén file

Điều này có vẻ phức tạp hơn nhiều người nghĩ. Mức độ nén không chỉ phụ thuộc vào kiểu lưu trữ mà còn phụ thuộc vào ứng dụng sử dụng và cài đặt.

Trong bài này sẽ không thử nghiệm trên một số loại tệp thông thường như tài liệu Word DOCX và ảnh JPG mà thực hiện nén một số trò chơi PC đã cài đặt. Trò chơi kết hợp đồ họa, âm nhạc, các tệp văn bản, tệp thực thi và nhiều loại tệp khác nhau, vì vậy chúng là một bộ dữ liệu thực tế tốt chứa nhiều loại tệp khác nhau.

Trước tiên, chúng ta cài đặt Bastion và nén thư mục đó - khoảng 863MB gồm các tệp âm nhạc, đồ hoạ, các file thực thi và các loại tài liệu khác nhau:

  • Zip (Windows 8.1): 746 MB (86,4% so với kích thước ban đầu)
  • Zip (WinZip): 745 MB (86,3% so với kích thước ban đầu)
  • RAR (WinRAR): 746 MB (86,4% so với kích thước ban đầu)
  • 7z (7-Zip): 734 MB (85% so với kích thước ban đầu)

Tiếp theo, chúng ta nén Hotline Miami, với 654MB dữ liệu:

  • Zip (Windows 8.1): 316 MB (48,3% so với kích thước ban đầu)
  • Zip (WinZip): 314 MB (48% so với kích thước ban đầu)
  • RAR (WinRAR): 307 MB (46,9% so với kích thước ban đầu)
  • 7z (7-Zip): 301 MB (46% so với kích thước ban đầu)

Nén file Bastion với định dạng 7z

Và người chiến thắng là…

Người chiến thắng trong việc nén thuần túy là 7z. Điều này chắc không gây ngạc nhiên cho nhiều người vì 7z luôn nằm trong top tiêu chuẩn nén tập tin. Nếu muốn nén một cái gì đó để tiết kiệm không gian nhiều nhất có thể, chắc chắn bạn nên sử dụng 7z. Bạn thậm chí có thể thay đổi thiết lập nén để tiết kiệm không gian nhiều hơn, mặc dù nó sẽ mất nhiều thời gian để nén và giải nén.

Nhìn chung, Zip và RAR gần giống nhau. WinZip cũng không thể đánh bại những hỗ trợ tích hợp sẵn của Windows. Tóm lại, bạn nên:

  • Với mục đích nén tối đa: Tạo file lưu trữ 7z với 7-Zip.
  • Với mục đích dễ sử dụng và tương thích tối đa: Tạo các tệp Zip với tính năng được tích hợp trong hệ điều hành. Ví dụ: trên Windows, chọn một số tệp trong Windows Explorer hoặc File Explorer, nhấp chuột phải vào chúng, trỏ đến Send to và chọn Compressed (zipped) folder.

Chọn Compressed (zipped) folder

Hỗ trợ hệ điều hành

Nếu chỉ muốn nén các tệp tin để sử dụng với mục đích cá nhân, bạn có thể sử dụng bất kỳ định dạng tệp nào. Tuy nhiên, một số định dạng lưu trữ có khả năng tương tác và hoạt động trên các hệ điều hành khác mà không cần cài đặt phần mềm của bên thứ ba. Nếu gửi một tệp lưu trữ cho người khác hoặc đăng trực tuyến, bạn có thể muốn sử dụng định dạng mà người nhận có thể truy cập với ít phiền phức nhất.

Dưới đây là các định dạng được tích hợp vào các hệ điều hành phổ biến:

  • Windows: Zip. Tính năng này đã được bổ sung lại trong Windows XP, vì vậy hầu như mọi người dùng Windows đều có thể tạo và trích xuất các tệp zip.
  • Mac OS X: Đã được hỗ trợ Zip và các loại lưu trữ khác như ..tar.gz và .tar.bz2. Các loại lưu trữ .7z và .rar sẽ yêu cầu phần mềm của bên thứ ba.
  • Linux: Zip. Các tệp 7z và RAR sẽ hoạt động trong các chương trình chuẩn như File Roller, nhưng bạn sẽ phải cài đặt các tiện ích dòng lệnh thích hợp từ trình quản lý gói trước tiên. Các định dạng Tar như .tar.gz và .tar.bz2 cũng được hỗ trợ trên Linux.
  • Chrome OS: Zip và RAR đều được hỗ trợ. Tar.gz và tar.bz2 cũng có thể được mở trong ứng dụng Files và trích xuất nội dung.

Windows chỉ hỗ trợ các tệp Zip, do đó, Zip là định dạng phổ biến nhất. Nếu sử dụng Mac hoặc Linux, bạn có thể sử dụng định dạng .tar. Định dạng 7z được hỗ trợ ít nhất vì nó không được tích hợp vào bất kỳ hệ điều hành nào, vì vậy người dùng cần phải cài đặt một ứng dụng để mở các tệp lưu trữ .7z. Tuy nhiên nếu bạn muốn tỷ lệ nén tốt nhất thì 7z là sự lựa chọn đúng đắn.

Nếu định gửi file nén cho ai đó mà không chắc họ có cài phần mềm giải nén file không thì bạn nên chọn định dạng .zip.

File Bastion.zip

Xem thêm:

Thứ Sáu, 04/05/2018 10:25
4,510 👨 33.347
0 Bình luận
Sắp xếp theo