How to Merge All File in Other Folder into One File and add newline

Question

How to Merge All File in Other Folder into One File and add newline

Другой способ извлечь нужный путь - использовать команду read после того, как вы закончите выполнение du и sort-ed ] их, а затем переходите к while / read

du.. sort.. | while read x d; do echo "$d"; done

1

countermode 01.10.2016, 03:13

Ссылка

2 ответа

Решение в TXR :

Во-первых, давайте рассмотрим это как задачу обработки текста, предполагая, что у нас есть пример списка имен путей a входной файл с именем paths . Мы преобразовываем пути в команды оболочки, которые объединяют группы файлов и создают требуемые выходные файлы:

@(do
   (defstruct file-info nil
     full-name
     root-name
     date-key
     (:method equal (self) self.date-key)))
@(collect :vars (files))
@  (all)
@dd-@mm-@yyyy/@*{name}_@yyyy@mm@dd.TXT
@  (and)
@path
@  (end)
@  (bind files @(new file-info full-name path root-name name
                     date-key ^(,yyyy ,mm ,dd)))
@(end)
@(do
   (let ((h (group-by (usl root-name) files :equal-based)))
     [hash-update h sort]
     (dohash (name flist h)
       (let ((start (find-min flist))
             (end (find-max flist))
             (paths (mapcar (usl full-name) flist)))
         (put-line `cat @{paths " "} >\ \
                    @{start.root-name}_@{start.date-key ""}- \
                    @{end.date-key ""}.TXT`)))))

Выполнить:

$ txr catfiles.txr paths
cat 26-09-2016/CHANGELOG_20160926.TXT 27-09-2016/CHANGELOG_20160927.TXT > CHANGELOG_20160926-20160927.TXT
cat 26-09-2016/FILE_CHANGELOG_20160926.TXT 27-09-2016/FILE_CHANGELOG_20160927.TXT > FILE_CHANGELOG_20160926-20160927.TXT

Для работы с реальными путями и выполнения ] cat требует простых изменений:

@(do
   (defstruct file-info nil
     full-name
     root-name
     date-key
     (:method equal (self) self.date-key)))
@(next :list (glob "*/*.TXT"))
@(collect :vars (files))
@  (all)
@dd-@mm-@yyyy/@*{name}_@yyyy@mm@dd.TXT
@  (and)
@path
@  (end)
@  (bind files @(new file-info full-name path root-name name
                     date-key ^(,yyyy ,mm ,dd)))
@(end)
@(do
   (let ((h (group-by (usl root-name) files :equal-based)))
     [hash-update h sort]
     (dohash (name flist h)
       (let ((start (find-min flist))
             (end (find-max flist))
             (paths (mapcar (usl full-name) flist)))
         (sh `cat @{paths " "} >\ \
              @{start.root-name}_@{start.date-key ""}- \
              @{end.date-key ""}.TXT`)))))

Единственное изменение - добавление @ (next: list (glob "* / *. TXT")) для перенаправления сканирования ввода по список общих путей из файловой системы и переключение с put-string на sh для выполнения команд cat .

Если списки файлов могут быть очень большими, мы столкнемся с ограничениями передачи команды / argv ОС: мы не сможем перехватить их с помощью одной команды.

Возможное решение - изменить последнюю часть кода на:

@(do
   (let ((h (group-by (usl root-name) files :equal-based)))
     (hash-update h (op sort))
     (dohash (name flist h)
       (let* ((start (find-min flist))
              (end (find-max flist))
              (paths (mapcar (usl full-name) flist))
              (target `@{start.root-name}_@{start.date-key ""}- \
                       @{end.date-key ""}.TXT`))
         (sh `> @target`)
         (each ((group-of-ten (tuples 10 paths)))
           (sh `cat @{group-of-ten " "} >> @target`))))))

Т.е.для каждого файла используйте > file , чтобы убедиться, что он существует и обрезается до нуля. Затем используйте cat ... >> file , чтобы добавить к нему журналы группами по десять.

0

Kaz 27.01.2020, 23:47

Ссылка

Похожие вопросы

John WH Smith · Accepted Answer · 27.01.2020, 23:47

Поскольку вы не указали никаких требований к языку, вот возможность использования Python 3.

#/usr/bin/env python3

from glob import glob
from os.path import basename
import re

for prefix in ('CHANGELOG', 'FILE_CHANGELOG'):
    files = dict((int(re.split('[_.]', basename(f))[-2]), f)
                 for f in glob('*-*-*/%s_*.TXT' % prefix))
    out_file = '%s_%d-%d.TXT' % (prefix, min(files.keys()), max(files.keys()))

    with open(out_file, 'w') as f_out:
        for date in sorted(files.keys()):
            with open(files[date]) as f_in:
                for line in f_in:
                    f_out.write(line)
            f_out.write("\n")

Он в основном использует glob и basename для перечисления и анализа имен файлов с сортировкой по дате. Значения min / max используются для построения имени выходного файла, и все файлы записываются туда по порядку. Не забудьте настроить шаблоны в соответствии с вашей реальной структурой каталогов, если это необходимо. Затем просто chmod и запустите:

$ chmod +x script.py
$ ./script.py

How to Merge All File in Other Folder into One File and add newline

Теги

Похожие вопросы