Просмотрите /var/log/dpkg.log
в своей любимой программе просмотра текста.
Попробуйте это:
grep -o '\w*' doc.txt | sort | uniq -c | sort -nr
-o
Печатать каждое совпадение вместо совпадающих строк \w*
Совпадение символов слова sort
сортируйте спички перед отправкой в uniq
. uniq -c
вывести уникальные строки и количество вхождений-c
sort -nr
Обратная сортировка по количеству вхождений. Выход:
2 word
1 third
1 second
1 really
Альтернатива:
Используйте awk
для точного вывода:
$ grep -o '\w*' doc.txt \
| awk '{seen[$0]++} END{for(s in seen){print s,seen[s]}}' \
| sort -k2r
word 2
really 1
second 1
third 1
perl -lnE '
$count{$_}++ for /[[:alpha:]]+/g;
END {
say "@$_" for
sort {$b->[1] <=> $a->[1] || $a->[0] cmp $b->[0]}
map {[$_, $count{$_}]}
keys %count
}
' doc.txt
Это потребует гораздо больше памяти, чем первоначальное решение pLumo.