Прокомментируйте (автоматически) ЛАТЕКСНЫЙ исходный файл для создания этого более читаемым

Question

Прокомментируйте (автоматически) ЛАТЕКСНЫЙ исходный файл для создания этого более читаемым

Удостоверьтесь свои работы команды из командной строки сначала

/usr/bin/python /home/MyName/WeatherProject/HOURLY/windDirExtract.py

Затем попробуйте то же в crontab

*/10 * * * * /usr/bin/python /home/MyName/WeatherProject/HOURLY/windDirExtract.py

3

bela83 26.03.2014, 19:39

Ссылка

3 ответа

Относительно сложная часть состоит в том, что вам нужно буферизовать закомментированную строку, чтобы увидеть, его нужно обновить, если следующая строка является индикатором раздела. Было бы проще, если бы эти данные находились в той же или следующей строке.

Следующее должно вам помочь. Его можно вызвать как python script.py input output или вы можете оставить вывод, и он будет записывать в стандартный вывод. Не выполняйте `python script.py xx.tex xx.tex ', а запишите во временный файл и скопируйте его обратно в исходный.

Это обновляет существующие строки формы % x.y.z остальная часть комментария , оставляя остальную часть комментария нетронутой. Если такого комментария еще нет, вставьте его. Специальные комментарии должны начинаться в начале строки, как и команды разделения.

import sys class ProcessLaTeX: def __init__(self, ifp, ofp): self.ofp = ofp self.prev_comment = None self.level = [] for line in ifp: self.process(line) # emit last line if comment if self.prev_comment: self.ofp.write(self.prev_comment) def output(self, line): pass def process(self, line): if line[0] == '%': # store comment line, emitting any previously stored line if self.prev_comment: self.ofp.write(self.prev_comment) self.prev_comment = line return lvl = self.check_level(line) if lvl > -1: self.output_level_comment(lvl) if self.prev_comment: self.ofp.write(self.prev_comment) self.prev_comment = None self.ofp.write(line) def output_level_comment(self, lvl): if self.prev_comment: # check if we overwrite an old one # do not use the starting '%' and final newline words = self.prev_comment[1:-1].split(' ', 1) for c in words[0]: if c not in '01234567890.': self.ofp.write(self.prev_comment) self.prev_comment = None break self.level.append(0) # in case this is a deeper level self.level[lvl] += 1 self.level = self.level[:lvl+1] # cut of excess levels lvls = '%' + '.'.join([str(l) for l in self.level]) if self.prev_comment: # overwrite the previous words[1] words[0] = lvls outs = ' '.join(words) if not outs[-1] == '\n': outs += '\n' self.prev_comment = None else: outs = lvls + '\n' self.ofp.write(outs) def check_level(self, line): if line and not line[0] == '\\': return -1 cmd = line[1:].split('{', 1)[0] try: res = ['section', 'subsection', 'subsubsection', 'paragraph', 'subparagraph'].index(cmd) except ValueError: return -1 return res out = sys.stdout if len(sys.argv) < 3 else open(sys.argv[2], 'w') pl = ProcessLaTeX(open(sys.argv[1]), out)

1

27.01.2020, 21:20
Ссылка

Как мне кажется, вы ищете параметр nl разделителя разделов . Из информация nl :

nl разбивает свой ввод на (логические) страницы; по умолчанию номер строки сбрасывается на 1 в верхней части каждой логической страницы. nl обрабатывает все входные файлы как единый документ; он не сбрасывает номера строк или логических страниц между файлами.

Логическая страница состоит из трех разделов: заголовок , основной текст и нижний колонтитул . Любой из разделов может быть пустым. Каждую из них можно пронумеровать по стилю, отличному от других.

Начало разделов логических страниц указывается во входном файле строкой, содержащей ровно одну из этих строк-разделителей:

\: \: \: - начало заголовка;

\: \: - начало тела;

\: - начало нижнего колонтитула.

Вы можете установить nl elimiter логической страницы -d в командной строке, например:

nl -dCC <infile

... где CC представляют любые два символа для замены \: , как указано в документации. Учитывая ваш ввод, я не думаю, что это необходимо - мы можем просто вставить значения по умолчанию, где это применимо, с небольшой фильтрацией ввода. Вот nl и sed , объединенные в функцию оболочки, которую я написал, предназначенную для рекурсивной фильтрации:

sd() { n=' '; nl -bp"^\\\\$1section" -w1 -s"$n\:\:\:$n" | sed '/./!d;/^[0-9]/!s/^[[:blank:]]*//;/^%[0-9.]*$/h;t s/./%&/;x;/%/G;s//./2;/\n.*/h;s///;x;s/\n//;N s/$\(.*$$\n$\)$\(.*$$..$\)/\4\3\1\5/' }

Я отправил ей что-то вроде данных из вашего примера и отправил ее вывод обратно в несколько раз:

sd <<\IN |sd sub | sd subsub | sd subsubsub \begin{document} \section{} some ordinary lines \subsection{} whatever \subsubsection{} \subsection{} \subsubsection{} \subsubsubsection{} \section{} \subsection{} \end{document} IN

Выполнить, как указано выше, он напечатает:

\begin{document} %1 \section{} some ordinary lines %1.1 \subsection{} whatever %1.1.1 \subsubsection{} %1.2 \subsection{} %1.2.1 \subsubsection{} \:\:\: %1.2.1.1 \:\: \subsubsubsection{} %2 \section{} %2.1 \subsection{} \end{document}

Как видите, задание фильтрации не полностью завершено, но, похоже, оно выполняет свою работу. nl нумерует -b код своего ввода на основе -bp'attern ', который он загружается - и начинает свой счет заново для каждой логической страницы - как ограничено строкой, состоящей из только разделителя заголовка логической страницы \: \: \: .

Итак ... sed фильтрует свой вывод, который уже включает разделитель, установленный в nl s -s eparator arg и в основном sed просто немного переставляет его так, чтобы nl на следующем проходе нашел свой разделитель раздела там, где он должен быть. sed также сохраняет копию последней ^% [0-9.] * $ строки в своем старом пространстве h - и если удерживаемое пространство не является пустым, когда он встречает строку, начинающуюся с номера, он добавляет эту строку к содержимому своего удерживаемого пространства после . . И это действительно мясо с картошкой.

И все же - как я уже сказал, это еще не сделано. На последнем проходе в выводе остались разделители разделов и пустые строки. Итак, чтобы очистить это:

sd <<\IN |sd sub | sd subsub | sd subsubsub | grep -v '^\\:\|^$' \begin{document} \section{} some ordinary lines \subsection{} whatever \subsubsection{} \subsection{} \subsubsection{} \subsubsubsection{} \subsubsection{} \subsubsubsection{} \section{} \subsection{} \end{document} IN

ВЫХОД:

\begin{document} %1 \section{} some ordinary lines %1.1 \subsection{} whatever %1.1.1 \subsubsection{} %1.2 \subsection{} %1.2.1 \subsubsection{} %1.2.1.1 \subsubsubsection{} %1.2.2 \subsubsection{} %1.2.2.1 \subsubsubsection{} %2 \section{} %2.1 \subsection{} \end{document}

1

27.01.2020, 21:20
Ссылка

Теги

Похожие вопросы

1
Я могу вызвать установку пакета, удаляют из конфетки repo? 12.11.2014
У меня есть некоторые рецепты шеф-повара, ссылающиеся на пакет php53u. Кажется, что в то время, когда рецепты были записаны, пакет был доступен в ius repo, но теперь кажется, что пакет php устанавливает версию 5....

2
Как смонтировать локальный каталог без root 10.08.2020
Скажем, у меня есть папка, полностью доступная для чтения моим пользователем. Я хочу, чтобы он был смонтирован в мою домашнюю папку. Я не могу использовать символическую ссылку, потому что я хочу, чтобы файлы были доступны по адресу ~/ и я хочу, чтобы дру

2
Как мне прочитать файл свойств с помощью моего скрипта? 10.03.2017
Я использую оболочку bash. Я пытаюсь написать сценарий, который будет читать файл свойств, а затем выполнять некоторые замены в другом файле на основе пар ключ-значение, которые он читает в файле. Итак, у меня #! / Bin / ...

11
Как я преобразовываю .pages 'файл во что-то unix-y? 02.05.2011
У меня есть файл с расширением .pages ´. Я думаю, что iWork средств, но я не уверен. Так или иначе поиск "преобразовывает страницы Linux", производит ярмарку немногие ложные отрицательные стороны! Делает любой, оказывается, знает...

18
Рок-стабильная файловая система для больших файлов (резервные копии) для Linux 31.08.2010
Какая файловая система была бы лучшей для резервных копий? Я заинтересован основной в устойчивости (особенно uncorruptability файлов во время "жестких" перезагрузок и т.д.), но как эффективно она обрабатывает большой (> 5 ГБ), файлы также...

0
Есть ли в ядре Linux 5.0.9 утечка памяти? 16.06.2019
вероятно, похоже на то, что в Linux использование памяти выше, чем сумма процессов, за исключением того, что я наблюдал, как используемая память становится как ниже, так и выше суммы RSS процессов в ГБ. uname -sr Linux 5.0.9-... cat /...

2
Сила для использования определенного поставщика DNS в сети 11.04.2012
OpenDNS предлагает довольно простой путь к фильтрации интернет-контента категориями. Конечно, кто мог добраться, корректный IP-адрес может легко обойти фильтр, но это было бы достаточно для моих ожиданий...

8
Получение неожиданного цветного вывода на нескольких командах 19.08.2013
Я просто добавил это к своему .bashrc для получения цветного вывода с меньше: # Colorize меньше страниц справочника. экспортируйте $ LESS_TERMCAP_md= '\e [01; 34 м' экспортируют $ LESS_TERMCAP_us= '\e [01; 33 м' экспортируют $ LESS_TERMCAP_so= '\e [01; 44

3
Список доступных опций команды? 11.04.2012
Я в настоящее время настраиваю свой первый веб-сервер без панели управления, и до сих пор дела идут довольно хорошие! Я просто задавался вопросом, мог ли кто-либо направить меня к где-нибудь, который объясняет весь из...

6
Изменение перезагрузки имени хоста возвращается назад к оригиналу 04.05.2015
Так, Что я пытаюсь сделать, просто изменить имя хоста постоянно. Я могу обновить имя хоста, но когда перезагрузка выпущена, исходное имя хоста используется! Я знаю, что существует расположенное имя хоста файла...

score 2 · Answer 1 · 27.01.2020, 21:20

[112408]У меня есть быстрое решение, которое полезно много раз. Обратите внимание, что оно предназначено только для личного пользования(1); его можно доработать, добавить редактирование на месте, контроль ошибок, что угодно. Но я думаю, что оно тоже полезно. Идея заключается в использовании самой нумерации LaTeX.

Итак, во-первых, вам нужно добавить метки к вашему документу (что, тем не менее, хорошо):

Далее запустите латекс, как всегда, допустим, он называется [112709]walla.tex[112710]. Теперь вы запускаете этот маленький питоновый скрипт:

Вызовите его [112711]find_tex_labels[112712], сделайте его исполняемым, и запустите его как [112713]find_tex_labels walla > walla_annotated.tex[112714] (обратите внимание, в аргументах нет расширений).

На выходе у вас будет аннотированный LaTeX-файл:

...это сработает для всех меток. Я нахожу это довольно полезным для перекрестных ссылочных уравнений и т.д., когда я редактирую на устройстве, в котором нет LaTeX. Теперь вы можете заменить оригинальный walla.tex на новый.

Это ваша обязанность - синхронизировать все вещи... и нигде не использовать комментарии "%%% label".

Сноски:

(1) Я обещаю доработать его много раз. Затем, учитывая, что я единственный, кто его использует, я исправляю ошибки, если и когда они появляются... и никогда не нахожу времени, чтобы их почистить. [112428]

score 1 · Answer 2 · 27.01.2020, 21:20

Относительно сложная часть состоит в том, что вам нужно буферизовать закомментированную строку, чтобы увидеть, его нужно обновить, если следующая строка является индикатором раздела. Было бы проще, если бы эти данные находились в той же или следующей строке.

Следующее должно вам помочь. Его можно вызвать как python script.py input output или вы можете оставить вывод, и он будет записывать в стандартный вывод. Не выполняйте `python script.py xx.tex xx.tex ', а запишите во временный файл и скопируйте его обратно в исходный.

Это обновляет существующие строки формы % x.y.z остальная часть комментария , оставляя остальную часть комментария нетронутой. Если такого комментария еще нет, вставьте его. Специальные комментарии должны начинаться в начале строки, как и команды разделения.

import sys

class ProcessLaTeX:
    def __init__(self, ifp, ofp):
        self.ofp = ofp
        self.prev_comment = None
        self.level = []
        for line in ifp:
            self.process(line)
        # emit last line if comment
        if self.prev_comment:
            self.ofp.write(self.prev_comment)

    def output(self, line):
        pass

    def process(self, line):
        if line[0] == '%':
            # store comment line, emitting any previously stored line
            if self.prev_comment:
                self.ofp.write(self.prev_comment)
            self.prev_comment = line
            return
        lvl = self.check_level(line)
        if lvl > -1:
            self.output_level_comment(lvl)
        if self.prev_comment:
            self.ofp.write(self.prev_comment)
            self.prev_comment = None
        self.ofp.write(line)

    def output_level_comment(self, lvl):
        if self.prev_comment: # check if we overwrite an old one
            # do not use the starting '%' and final newline
            words = self.prev_comment[1:-1].split(' ', 1)
            for c in words[0]:
                if c not in '01234567890.':
                    self.ofp.write(self.prev_comment)
                    self.prev_comment = None
                    break
        self.level.append(0) # in case this is a deeper level
        self.level[lvl] += 1
        self.level = self.level[:lvl+1] # cut of excess levels
        lvls = '%' + '.'.join([str(l) for l in self.level])
        if self.prev_comment: # overwrite the previous words[1]
            words[0] = lvls
            outs = ' '.join(words)
            if not outs[-1] == '\n':
                outs += '\n'
            self.prev_comment = None
        else:
            outs = lvls + '\n'
        self.ofp.write(outs)

    def check_level(self, line):
        if line and not line[0] == '\\':
            return -1
        cmd = line[1:].split('{', 1)[0]
        try:
            res = ['section', 'subsection', 'subsubsection',
                     'paragraph', 'subparagraph'].index(cmd)
        except ValueError:
            return -1
        return res

out = sys.stdout if len(sys.argv) < 3 else open(sys.argv[2], 'w')
pl = ProcessLaTeX(open(sys.argv[1]), out)

score 1 · Answer 3 · 27.01.2020, 21:20

Как мне кажется, вы ищете параметр nl разделителя разделов . Из информация nl :

nl разбивает свой ввод на (логические) страницы; по умолчанию номер строки сбрасывается на 1 в верхней части каждой логической страницы. nl обрабатывает все входные файлы как единый документ; он не сбрасывает номера строк или логических страниц между файлами.
Логическая страница состоит из трех разделов: заголовок , основной текст и нижний колонтитул . Любой из разделов может быть пустым. Каждую из них можно пронумеровать по стилю, отличному от других.
Начало разделов логических страниц указывается во входном файле строкой, содержащей ровно одну из этих строк-разделителей:
- \: \: \: - начало заголовка;
- \: \: - начало тела;
- \: - начало нижнего колонтитула.

Вы можете установить nl elimiter логической страницы -d в командной строке, например:

nl -dCC <infile

... где CC представляют любые два символа для замены \: , как указано в документации. Учитывая ваш ввод, я не думаю, что это необходимо - мы можем просто вставить значения по умолчанию, где это применимо, с небольшой фильтрацией ввода. Вот nl и sed , объединенные в функцию оболочки, которую я написал, предназначенную для рекурсивной фильтрации:

sd() { n='
';     nl -bp"^\\\\$1section" -w1 -s"$n\:\:\:$n" |
       sed '/./!d;/^[0-9]/!s/^[[:blank:]]*//;/^%[0-9.]*$/h;t
            s/./%&/;x;/%/G;s//./2;/\n.*/h;s///;x;s/\n//;N
            s/\(\(.*\)\(\n\)\)\(\(.*\)\(..\)\)/\4\3\1\5/'
}

Я отправил ей что-то вроде данных из вашего примера и отправил ее вывод обратно в несколько раз:

sd <<\IN |sd sub | sd subsub | sd subsubsub
\begin{document}
\section{}
some ordinary lines
\subsection{}
whatever
\subsubsection{}
\subsection{}
\subsubsection{}
\subsubsubsection{}
\section{}
\subsection{}
\end{document}
IN

Выполнить, как указано выше, он напечатает:

\begin{document}
%1
\section{}
some ordinary lines
%1.1
\subsection{}
whatever
%1.1.1
\subsubsection{}
%1.2
\subsection{}
%1.2.1
\subsubsection{}

\:\:\:
%1.2.1.1
\:\:
\subsubsubsection{}
%2
\section{}
%2.1
\subsection{}
\end{document}

Как видите, задание фильтрации не полностью завершено, но, похоже, оно выполняет свою работу. nl нумерует -b код своего ввода на основе -bp'attern ', который он загружается - и начинает свой счет заново для каждой логической страницы - как ограничено строкой, состоящей из только разделителя заголовка логической страницы \: \: \: .

Итак ... sed фильтрует свой вывод, который уже включает разделитель, установленный в nl s -s eparator arg и в основном sed просто немного переставляет его так, чтобы nl на следующем проходе нашел свой разделитель раздела там, где он должен быть. sed также сохраняет копию последней ^% [0-9.] * $ строки в своем старом пространстве h - и если удерживаемое пространство не является пустым, когда он встречает строку, начинающуюся с номера, он добавляет эту строку к содержимому своего удерживаемого пространства после . . И это действительно мясо с картошкой.

И все же - как я уже сказал, это еще не сделано. На последнем проходе в выводе остались разделители разделов и пустые строки. Итак, чтобы очистить это:

sd <<\IN |sd sub | sd subsub | sd subsubsub | grep -v '^\\:\|^$'
\begin{document}
\section{}
some ordinary lines
\subsection{}
whatever
\subsubsection{}
\subsection{}
\subsubsection{}
\subsubsubsection{}
\subsubsection{}
\subsubsubsection{}
\section{}
\subsection{}
\end{document}
IN

ВЫХОД:

\begin{document}
%1
\section{}
some ordinary lines
%1.1
\subsection{}
whatever
%1.1.1
\subsubsection{}
%1.2
\subsection{}
%1.2.1
\subsubsection{}
%1.2.1.1
\subsubsubsection{}
%1.2.2
\subsubsection{}
%1.2.2.1
\subsubsubsection{}
%2
\section{}
%2.1
\subsection{}
\end{document}