Как мне удалить спецификацию из файла UTF-8?

Question

Как мне удалить спецификацию из файла UTF-8?

Можно зарегистрироваться для получения уведомления, когда использование памяти контрольной группой превышает пороговое значение. В принципе, установка порога в подходящую точку ниже фактического лимита позволит вам послать сигнал или предпринять другие действия.

См .:

https://www.kernel.org/doc/Documentation/cgroup-v1/memory.txt

113

command-line files unicode

Michael Homer 23.07.2017, 13:06

Ссылка

6 ответов

Можно удалить спецификацию из файла с помощью команды tail:

tail -c +4 withBOM.txt > withoutBOM.txt

Имейте в виду, что при этом удаляются первые 4 байта из файла, поэтому перед запуском tailубедитесь, что файл действительно содержит спецификацию.

32

m13r 20.08.2021, 11:35

Ссылка

Спецификация не имеет смысла в UTF -8. Они обычно добавляются по ошибке фиктивным программным обеспечением в ОС Microsoft.

dos2unixудалит его, а также позаботится о других особенностях текстовых файлов Windows.

dos2unix test.xml

103

Stéphane Chazelas 20.08.2021, 11:35

Ссылка

Недавно я нашел эту крошечную команду -линейный инструмент, который добавляет или удаляет спецификацию в произвольных файлах UTF -8 закодированных файлов:UTF BOM Utils(новая ссылка на github)

Небольшой недостаток: вы можете скачать только простой исходный код C++. Вы должны создать make-файл (с помощью CMake , например )и скомпилировать его самостоятельно, двоичные файлы на этой странице не представлены.

0

Wernfried Domscheit 20.08.2021, 11:35

Ссылка

Для этого я использую лайнер vim one -на обычном:

vim --clean -c 'se nobomb|wq' filename

vim --clean -c 'bufdo se nobomb|wqa' filename1 filename2...

7

Robyn Murdock 20.08.2021, 11:35

Ссылка

Я знаю, что это было давно, но поскольку у меня была немного другая проблема, я пишу, чтобы другие могли получить пользу.

В моем текстовом файле случайным образом преследовали символы \fe\ff, к счастью для меня, они появились в начале строк, а набор допустимых символов ограничен буквенно-цифровыми.

Приведенная ниже команда в vimвырезает первый не -буквенно-цифровой символ, но используйте ее с осторожностью, так как набор разрешенных символов может различаться.

:%s/^[^a-zA-Z0-9]//g

0

Smirk 10.11.2021, 09:54

Ссылка

Как мне удалить спецификацию из файла UTF-8?

Теги

Похожие вопросы