В пакете GNU troff / groff есть файл eign
, содержащий 133 очень распространенных английских слова. На моем ноутбуке Arch linux это: /usr/share/groff/1.22.3/eign
В зависимости от вашего языка выполните поиск существующих национальных корпораций - многие предоставляют такие списки, часто без каких-либо лицензионных ограничений.
Чтобы получить частотный список английских слов, попробуйте это короткое из Британского национального корпуса или более длинные из Корпуса современного американского английского .