Если речь идет о данных json, (известно, что пакет python json
сообщает об ошибке ), вы можете определить, какая строка json содержит управляющие символы, с помощью:
perl -Mcharnames=:full -C -l -0777 -ne '
while (/"(?:\\.|[^"])*"/g) {
my $offset = $-[0];
my $string = $&;
@ctrl = map {charnames::viacode(ord($_))} $string =~ /\p{PosixCntrl}/g;
if (@ctrl) {
print "Offset: $offset, String: $string, Ctrl: ". join "+", @ctrl
}
}' file.json
На примере файла file.json
здесь:
$ python -c 'import json; import os; print(json.load(file("file.json")))'
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/usr/lib/python2.7/json/__init__.py", line 291, in load
**kw)
File "/usr/lib/python2.7/json/__init__.py", line 339, in loads
return _default_decoder.decode(s)
File "/usr/lib/python2.7/json/decoder.py", line 364, in decode
obj, end = self.raw_decode(s, idx=_w(s, 0).end())
File "/usr/lib/python2.7/json/decoder.py", line 380, in raw_decode
obj, end = self.scan_once(s, idx)
ValueError: Invalid control character at: line 1 column 22 (char 21)
А приведенный выше код perl
возвращает:
Offset: 19, String: "a b
c", Ctrl: CHARACTER TABULATION+LINE FEED
Вы можете видеть, что управляющий символ, на который жалуется python, — это TAB один, через 2 символа после начала этой строки "..."
. Обратите внимание, что perl
сообщает об удалении в количестве символов, тогда как python сообщает о них в количестве байтов.