700MB의 데이터를 약 30-50MB로 압축하는 것과 같이 고도로 압축 된 파일을 보았습니다.
그러나 그러한 압축 파일을 어떻게 얻을 수 있습니까? WinRAR 및 7Zip과 같은 소프트웨어를 사용해 보았지만 이렇게 높은 압축률을 얻지 못했습니다.
파일을 잘 압축 할 수있는 기술/소프트웨어는 무엇입니까?
(추신. Windows XP를 사용하고 있습니다.)
데이터를 압축하는 데 걸리는 시간이 문제가되지 않는 경우 여러 도구를 함께 사용하여 압축 크기를 최적화 할 수 있습니다.
7Zip, winrar (Zip 용) 및 bjwflate와 같은 다른 도구를 사용하여 데이터를 여러 번 압축합니다.
(이것은 Zip 파일을 계속해서 압축하는 것이 아니라 다른 도구를 사용하여 여러 개의 대체 Zip 파일을 만드는 것을 의미합니다.)
다음으로 각 아카이브에서 deflopt 를 실행하여 각 아카이브를 조금 더 줄입니다.
마지막으로 아카이브 컬렉션에서 zipmix 를 실행합니다. 다른 Zip 도구가 다른 파일에서 더 좋기 때문에 zipmix는 각 아카이브에서 각 파일의 최상의 압축 버전을 선택하고 Zip 도구가 개별적으로 생성 할 수있는 것보다 작은 출력을 생성합니다.
그러나 이것이 파일에서 어떤 종류의 마법도 작동한다고 보장되지는 않습니다. JPEG 및 MP3와 같은 특정 유형의 데이터는 단순히 잘 압축되지 않습니다. 이러한 파일은 이미 내부적으로 압축되어 있습니다.
이는 전적으로 압축되는 데이터에 따라 다릅니다.
텍스트는 잘 압축되고 바이너리 형식은 잘 안되며 압축 된 데이터 (mp3, jpg, mpeg)는 전혀 압축되지 않습니다.
다음은 wikipedia의 좋은 압축 비교 테이블 입니다.
이전 답변은 매우 잘못되었습니다!
내가 개인적으로 경험 한 최고의 압축 알고리즘은 paq8o10t ( zpaq 페이지 및 PDF 참조) .
힌트 : files_or_folders를 압축하는 명령은 다음과 같습니다.
paq8o10t -5 archive files_or_folders
GitHub 에서 소스 코드의 미러 본을 찾을 수 있습니다.
약간 더 나은 압축 알고리즘과 Hutter Prize 의 우승자는 decomp8입니다 (상금 페이지의 링크 참조). 그러나 실제로 사용할 수있는 압축기 프로그램은 없습니다.
really 대용량 파일의 경우 lrzip 단순히 comical 인 압축 비율을 얻을 수 있습니다.
README.benchmarks의 예 :
Linux-2.6.31에서 linux-2.6.36으로 한 버전 씩 다른 6 개의 커널 트리를 가져와 보겠습니다. 많은 중복 정보가 표시되지만 수백 메가 바이트가 떨어져서 lrzip이 압축에 매우 적합합니다. 단순함을 위해 7z 만 비교 될 것입니다. 현재로서는 최고의 범용 압축기이기 때문입니다.
이는 lrzip v0.5.1을 사용하여 4GB 램이있는 2.53Ghz 듀얼 코어 Intel Core2에서 수행 된 벤치 마크입니다. 32 비트 사용자 공간으로 실행되었으므로 2GB 주소 지정 만 가능했습니다. 그러나 벤치 마크는 -U 옵션으로 실행되어 전체 파일을 하나의 큰 압축 창으로 처리 할 수 있습니다.
6 개의 연속 된 커널 트리의 Tarball.
Compression Size Percentage Compress Decompress
None 2373713920 100 [n/a] [n/a]
7z 344088002 14.5 17m26s 1m22s
lrzip 104874109 4.4 11m37s 56s
lrzip -l 223130711 9.4 05m21s 1m01s
lrzip -U 73356070 3.1 08m53s 43s
lrzip -Ul 158851141 6.7 04m31s 35s
lrzip -Uz 62614573 2.6 24m42s 25m30s
Squeezechart.com 다양한 압축률 비교가 포함되어 있습니다. Nifle의 답변에서 언급했듯이 바이너리 형식에 대해 높은 압축률을 얻을 가능성은 거의 없습니다.
전체 압축 벤치 마크를 구성하는 최상의 압축 목록 이있는 다중 파일 압축 벤치 마크 테스트 요약 을 확인하십시오.
이 테스트에서 최고 성능 (압축 기준)은 PAQ8 및 WinRK (PWCM)입니다. 300 + Mb 테스트 세트를 62Mb 미만으로 압축 할 수 있지만 (크기 80 % 감소) 테스트를 완료하는 데 최소 8.5 시간이 걸립니다. 1 위 프로그램 (PAQ8P)은 테스트를 완료하는 데 거의 12 시간이 걸리고 4 위 (PAQAR)는 17 시간이 걸립니다. 2 위 압축률 (79.7 %)의 프로그램 인 WinRK는 약 8.5 시간이 걸립니다. 당연히 언급 된 모든 프로그램은 압축을 위해 PAQ (유사) 엔진을 사용합니다. 이미지가 포함 된 파일 (예 : Word DOC 파일)을 사용하는 경우 PAQ8을 사용하면 해당 파일을 인식하고 별도로 압축하여 압축률이 크게 향상됩니다. WinRK 제외) 언급 된 모든 프로그램 (WinRK 제외)은 무료입니다.
대부분의 압축 도구에는 더 느린 압축/압축 풀기 시간과 더 많은 RAM 사용량의 절충안에서 더 높은 압축률을 달성 할 수있는 설정이 있습니다.
7-Zip의 경우 기본 제공 도움말에서 "아카이브에 추가 대화 상자"를 검색하여 자세한 내용을 확인하십시오.
다음 울트라 설정으로 7Zip을 시도 할 수 있습니다.
7z a -t7z -m0=lzma -mx=9 -mfb=64 -md=32m -ms=on big_file.mysql.7z big_file.mysql
Nanozip FreeArc와 함께 압축률이 가장 높은 것으로 보입니다. 그러나 아직 최종 버전이 아닙니다. Nanozip 압축이 얼마나 좋은지 가 있습니다. 압축률이 매우 높고 시간이 너무 많이 걸리지 않습니다. 다중 파일 압축 벤치 마크 테스트 요약 확인하지만 FreeArc가 더 빠릅니다.
여기서 가장 좋은 방법은 시행 착오 인 것 같습니다. 각 파일에 대해 사용 가능한 모든 압축 기술을 시도하고 웹 사이트에 가장 적합한 것을 선택하십시오. 운 좋게도 컴퓨터는 이런 종류의 일을 매우 빠르게 수행하고 지루하지 않습니다. 프로세스를 자동화하는 간단한 스크립트를 작성하면 "상대적으로 고통스럽지"않습니다.
기적을 기대하지 마십시오. 700MB에서 30MB까지 그렇게 자주 발생하지 않습니다. 위에서 언급 한 로그 파일-예. "평범한 파일"-절대 안돼.