Тип MacOS псевдонимов для файла

Если речь идет о данных json, (известно, что пакет python jsonсообщает об ошибке ), вы можете определить, какая строка json содержит управляющие символы, с помощью:

perl -Mcharnames=:full -C -l -0777 -ne '
  while (/"(?:\\.|[^"])*"/g) {
    my $offset = $-[0];
    my $string = $&;
    @ctrl = map {charnames::viacode(ord($_))} $string =~ /\p{PosixCntrl}/g;
    if (@ctrl) {
       print "Offset: $offset, String: $string, Ctrl: ". join "+", @ctrl
    }
  }' file.json

На примере файла file.jsonздесь:

$ python -c 'import json; import os; print(json.load(file("file.json")))'
Traceback (most recent call last):
  File "<string>", line 1, in <module>
  File "/usr/lib/python2.7/json/__init__.py", line 291, in load
    **kw)
  File "/usr/lib/python2.7/json/__init__.py", line 339, in loads
    return _default_decoder.decode(s)
  File "/usr/lib/python2.7/json/decoder.py", line 364, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/usr/lib/python2.7/json/decoder.py", line 380, in raw_decode
    obj, end = self.scan_once(s, idx)
ValueError: Invalid control character at: line 1 column 22 (char 21)

А приведенный выше код perlвозвращает:

Offset: 19, String: "a  b
c", Ctrl: CHARACTER TABULATION+LINE FEED

Вы можете видеть, что управляющий символ, на который жалуется python, — это TAB один, через 2 символа после начала этой строки "...". Обратите внимание, что perlсообщает об удалении в количестве символов, тогда как python сообщает о них в количестве байтов.

-1
06.07.2021, 16:00
0 ответов

Теги

Похожие вопросы