Att kunna komprimera våra filer så att det är lättare att dela och / eller transportera dem kan göra vår elektroniska liv är mycket enklare, men ibland kan vi se udda eller oväntade limningsresultat efter att vi komprimerar dem. Varför är det så? Dagens SuperUser Q & A-inlägg har svar på en förvirrad läsares frågor.
Dagens Frågor och svar sessions kommer till vår del med SuperUser-en indelning av Stack Exchange, en community-driven gruppering av Q & A-webbplatser.
Foto med tillstånd av Jean-Etienne Minh-Duy Poirrier (Flickr).
SuperUser-läsaren sixtyfootersdude vill veta varför zip kan komprimera enkla filer bättre än flera filer med samma typ av innehåll:
Antag att jag har 10.000 XML-filer och vill skicka dem till en vän.
Metod 1: Komprimera inte dem
Resultat:
Metod 2: Zip varje fil separat och skicka honom 10 000 zip-XML-filer
Kommando:
Resultat:
Metod 3: Skapa en enkel zip-fil som innehåller alla 10 000 XML-filer
Kommando:
Resultat:
Metod 4: Sammanfoga filerna till en enda fil och zip den
Kommando:
Resultat:
Frågor
- Varför får jag så dramatiskt bättre resultat när jag bara sipprar en enda fil?
- Jag väntade mig att få drastiskt bättre resultat med metod 3 snarare än metod 2, men jag låt bli. Varför är detta?
- Är detta beteende specifikt för zip? Om jag försökte använda Gzip, skulle jag få olika resultat?
Ytterligare info
Meta Data
En av de givna svaren föreslår att skillnaden är systemmets metadata som lagras i zip-filen. Jag tror inte att detta kan vara fallet. För att testa det gjorde jag följande:
Den resulterande zip-filen är 1,4 MB. Det betyder att det fortfarande finns ungefär tio MB oförklarligt utrymme.
Varför kan zip komprimera enkla filer bättre än flera filer med samma typ av innehåll?
SuperUser-bidragsgivare Alan Shutko och Aganju har svaret för oss. Först upp, Alan Shutko:
Zip-komprimering bygger på repetitiva mönster i de data som ska komprimeras, och komprimeringen blir bättre ju längre filen är, eftersom fler och längre mönster kan hittas och användas.
Förenklat, Om du komprimerar en fil, innehåller ordlistan som kartlägger (korta) koder till (längre) mönster nödvändigtvis i varje resulterande zip-fil; Om du sluter en lång fil, är ordlistan "återanvänd" och blir ännu effektivare över allt innehåll.
Om dina filer är till och med lite likartade (som text alltid är) blir återanvändning av "ordboken" mycket effektiv och Resultatet är en mycket mindre total zip-fil.
Följd av svaret från Aganju:
I zip, komprimeras varje fil separat. Det motsatta är solid komprimering , dvs filer komprimeras tillsammans. 7-zip och Rar använder som standard komprimering som standard. Gzip och Bzip2 kan inte komprimera flera filer, så Tar används först och har samma effekt som fast komprimering.
Eftersom xml-filer har liknande struktur (och förmodligen liknande innehåll), om filerna komprimeras tillsammans kommer komprimeringen att vara högre .
Om en fil innehåller strängen "
" och kompressorn redan har hittat den strängen i en annan fil, ersätter den den med en liten pekare till föregående match. Om kompressorn inte använder solid kompression spelas den första förekomsten av strängen i filen in som en bokstavlig , som är större.
Har något att lägga till förklaringen? Ljud av i kommentarerna. Vill du läsa mer svar från andra tech-savvy Stack Exchange-användare? Kolla in den fullständiga diskussionsgängan här.
Hur man inaktiverar snabb laddning på Samsung Galaxy-enheter (och varför du kanske vill)
Alla tycker om att deras enheter laddas snabbt, eller hur? Det är därför lämpligt namngivna snabbladdningstekniken är så populär-nästan varje chip maker har sin egen version av det vid denna tidpunkt. Det är dock tillfällen då snabb laddning kanske inte är den bästa lösningen. Samsung realiserar lyckligtvis behovet av att inaktivera den här funktionen, och det finns ett sätt att göra det på Galaxy-enheter som kör Marshmallow, som S7 / Edge, S6 Edge +, S6 och Note 5.
Hur man gör OS Xs Finder-taggar fungerar för dig
Om du nyligen har använt OS X har du kanske märkt att taggar nu har en tydlig närvaro i Finder. Kanske tänker du, va? taggar? "(det är ett rättvist svar), men faktiskt är taggar ett utmärkt sätt att kategorisera, sortera och hitta dina viktiga saker direkt. Taggar är exakt vad de låter som de är. Du väljer i princip bara filer och lägger till etiketter.