Эта функция перечисляет частоту каждого слова, встречающегося в представленном файле, в порядке возрастания:
function wordfrequency() {
awk '
BEGIN { FS="[^a-zA-Z]+" } {
for (i=1; i<=NF; i++) {
word = tolower($i)
words[word]++
}
}
END {
for (w in words)
printf("%3d %s\n", words[w], w)
} ' | sort -rn
}
В вашем файле это можно назвать так:
$ cat your_file.txt | wordfrequency
и для верхних 10 слов:
$ cat your_file.txt | wordfrequency | head -10
Источник: AWK-ward Ruby