Почему мой файл tar больше, чем сохраненный каталог

Удалите свою установку в масштабе всей системы зернышка:

sudo apt-get purge python-pip

Затем установите новую копию зернышка:

curl  https://bootstrap.pypa.io/get-pip.py | sudo python

Протестированный на человечности 10.04 i686

Я предлагаю, чтобы Вы использовали virtualenv. Для получения дальнейшей информации см. Официальную документацию зернышка

4
13.04.2017, 15:36
4 ответа

Ваш сжатый файл tar меньше, чем его содержание.

ls размеры файла печати в байтах по умолчанию.
du -k размеры файла печати в килобайтах.

0610944B ≈ 14131456KB < 77063332KB

Сделать ls распечатайте размеры файла в килобайтах, используйте -k флаг.

14
27.01.2020, 20:46
  • 1
    я предполагаю, что мог жаловаться на Linux, не используя "k" символ единицы или быть рад, что у меня есть ответ - так или иначе, Вы корректны. Финал tard размер файла, с помощью ls -k oldOutput.tar.zip 32703224 - меньше чем половина оригинала. –  Jeff 02.07.2013, 23:51
  • 2
    Можно использовать -h флаг с обоими du и ls получить человекочитаемые размеры. Если Вы хотели бы, чтобы это было Вашим значением по умолчанию, добавьте несколько псевдонимов к своей интерактивной конфигурации оболочки (.bashrc, .zshrc, и т.д.): alias du='du -h' и alias ls='ls -h'. –   03.07.2013, 00:24

Помните, сжимаете ли Вы основные ДВОИЧНЫЕ ДАННЫЕ (т.е. *.gz, *.zip) возможно/вероятно, что Вы получите выходной файл, который является FAR, БОЛЬШЕ, чем исходное агрегирование. Таким образом, я проиграл бы,-z включают tar, который Вы пробуете.

1
27.01.2020, 20:46
  • 1
    OP сжимает текст, не двоичные данные. Текст, оказывается, числа, но это - все еще текст: "Файлы, которых я создаю резервную копию, являются всеми огромными текстовыми файлами, заполненными числами". –  terdon♦ 02.07.2013, 06:27
  • 2
    Посмотрите команду: tar -cvzf ../oldOutput.tar.zip *, это сжимается через tar -z уже заархивированный и сжатый файл, который в той точке ЯВЛЯЕТСЯ двоичными данными! –  mdpc 02.07.2013, 19:00
  • 3
    mdpc: разъяснитесь. Что делает Вы подразумеваете, что я уже сжимаю заархивированные файлы. Мне кажется, что исходный комментарий @terdon корректен. –  Jeff 02.07.2013, 23:47
  • 4
    @Jeff Вы совершенно правы, я неправильно читал команду, когда я согласился с @mdpc. Ваша команда правильно создает oldOutput.tar.zip из (по-видимому), несжатых файлов. –  terdon♦ 02.07.2013, 23:55
  • 5
    tar -cvf созданный намного больший файл, чем tar -cvzf - но это работало быстрее. –  Jeff 06.07.2013, 23:49

Текстовые файлы не сжимаются лучше просто, потому что они маркировали "txt" расширением. Текстовые файлы часто сжимаются лучше, потому что имеет тенденцию быть большой дополнительный "пробел" и дублированное использование буквы.

Я постулирую, что Ваш файл CSV имеет мало ни к какому "пробелу" для чистки и на самом деле эмулирует файл двухуровневого или графического изображения вместо этого.

1
27.01.2020, 20:46
  • 1
    Нет никакого пробела вообще в моих файлах CSV, если новые строки не считают пробелом - вероятно, не - в этом случае, каждый файл имеет точно 10 000 пробельных символов. –  Jeff 02.07.2013, 23:49

Возможно, Вы копируете редкие файлы без опции tar --sparse?

Можно легко узнать путем извлечения архива после того, как он был закончен и сравнение исходного каталога с извлеченным каталогом.

0
27.01.2020, 20:46

Теги

Похожие вопросы