Это похоже на Unicode (UTF-8) данные, отображенные как ISO-8859-2. Существует по существу две возможности:
Ваш терминал использует ISO-8859-2 в качестве выходного набора символов. Затем сами данные, вероятно, закодированы правильно, но отображены неправильно: То, что Вы видите, является результатом, который ожидается, когда Вы отобразите данные UTF-8, как будто это был ISO-8859-2. Попробуйте терминал и/или редактора, который способен к работе с UTF-8. (Я не уверен в нано, но энергия может работать с UTF-8, если Вы используете set encoding=utf-8
.)
Ваш терминал использует UTF-8 в качестве выходного набора символов. Затем сами данные кодируются неправильно: это - данные, которые были "преобразованы" от ISO-8859-2 до UTF-8 даже при том, что это уже были данные UTF-8. Можно использовать iconv
или recode
переводить UTF-8 назад в ISO-8859-2 (или скорее "вдвойне закодировал UTF-8" назад к надлежащему UTF-8), например, iconv -f UTF8 -t ISO_8859-2 yourinputfile
.
Какую терминальную программу делают Вы используете и что является выводом echo $LC_CTYPE
?