Следующее должно работать:
$ sed 's/\(.\)/\1\n/g' text.txt | sort | uniq -c
Во-первых, мы вставляем новую строку после каждого символа, помещая каждый символ на его собственную строку. Затем мы сортируем его. Затем мы используем команду uniq для удаления дубликатов, снабжая префиксом каждую строку количество случаев того символа.
Для сортировки списка по частоте передайте это все по каналу в sort -nr
.
Вы, вероятно, испытываете дисковое повреждение. Начальная загрузка отдельному пользователю или режиму восстановления и выполненный fsck
на затронутом разделе (разделах).
Ваш раздел на 160 ГБ на 94,78% полон, и его файловая система использует значение по умолчанию для зарезервированного блока (5%).
У Вас есть затем только 0,22% Вашего диска, доступного (~40 МБ). Нет никакого большого количества точки, пытающейся понять почему крошечная причина файла диск, полный такого небольшого доступного пространства.
Вы система могла бы одновременно создавать журнал или временные файлы, которые заполняют это пространство. Журналирование могло бы также играть роль здесь. т.е. Ваш крошечный файл не записан непосредственно, но через посредническое местоположение, которое могло бы потребовать дополнительного пространства.
Проверьте количество inodes, доступного с
df -i /FILESYSTEM-IN-QUESTION
Если у Вас заканчивается inodes, необходимо найти запутанные из извилистых и маленьких файлов, которые заполняют inode таблицу и консолидируют их
Если бы, например, у Вас было 9 миллионов файлов в/tmp, то это могло бы вызвать проблему.