Какой тип данных содержит входной файл?

Question

Какой тип данных содержит входной файл?

Невозможно атомарно заменить каталог другим каталогом. Вы можете переместить старый каталог, а затем создать новый:

mv statistics backup-xx
mkdir statistics

Но это оставляет небольшой промежуток времени, в течение которого статистики не существует. Это проблема, если какой-то процесс может удалить файлы в каталоге в любое время.

Для эффективной атомарной замены каталога вам необходимо использовать символические ссылки. Создайте каталог, имя которого включает период времени с самого начала:

mkdir "statistics-$(date +%Y%m%d)"

(или любое другое соглашение об именовании каталогов, которое вы хотите выбрать). Создайте символическую ссылку с фиксированным именем на текущее местоположение:

ln -s … statistics

Чтобы заменить каталог, сначала создайте новый каталог и новую символическую ссылку, а затем переместите ее, чтобы перезаписать старую символическую ссылку. Обратите внимание, что ни простой mv в символической ссылке, ни простой ln -s этого не сделают: они создадут запись внутри целевого каталога. GNU coreutils ln -snf также не подходит, потому что он удаляет существующую символическую ссылку перед созданием новой, что оставляет небольшое временное окно, в течение которого путь не существует. Вы можете использовать GNU coreutils mv -T для новой символической ссылки.

new_dir="statistics-$(date +%Y%m%d)"
mkdir "$new_dir"
ln -s statistics.new
mv -Tf statistics.new statistics

1

command-line perl text-processing

biobudhan 16.11.2016, 10:34

Ссылка

2 ответа

Использованиеawk:

for name in folder/*; do
    # skip this name if it's not the name of a file
    [ ! -f "$name" ] && continue

    awk 'NR == 1 && !/^>/ {
             printf("Not a fasta file: %s\n", FILENAME)
             skip=1; exit
         }
         !/^>/ && /[LMFWKQESPVIYHRD]/ {
             printf("Protein fasta file: %s\n", FILENAME)
             skip=1; exit
         }
         END {
             if (!skip) printf("Probably a DNA fasta file: %s\n", FILENAME)
         }' "$name"
done

Это просматривает все имена в каталоге с именем folder. Он пропускает имена подкаталогов (не -файлов )и применяет сценарий awkк найденным файлам.

Тогда

Проверяет, что файл является файлом fasta, проверяя >в начале первой строки. Если в начале первой строки нет >, он сообщает об ошибке в файле и завершает работу.
Для каждой строки, не начинающейся с >, проверяется, есть ли в строке символ белка. Если есть, он сообщает о файле как о файле белкового быстрого доступа и завершает работу.
В конце концов, если мы туда доберемся, это возможно, файл фаста ДНК, и код сообщает об этом. Обратите внимание, что даже если это маловероятно, это все же может быть белковый файл fasta, поскольку символы ДНК-аминокислот также являются частью набора символов белка.

Переменная skipустанавливается в 1, когда мы выходим из-за того, что определили, что файл не является fasta-файлом или является белковым fasta-файлом. Проверяя эту переменную в блоке END, мы узнаем, прибыли ли мы туда из-за раннего exitили из-за нехватки данных (, и в этом случае, вероятно, это файл fasta ДНК ).

0

Kusalananda 28.01.2020, 02:12

Ссылка

Какой тип данных содержит входной файл?

Теги

Похожие вопросы