Как объединить gunzipped fastq файлы?

hostnslookup) утилиты явно запрашивают серверы DNS и не консультируются /etc/hosts файл в конфигурации системы по умолчанию. Если Вы были к traceroute или ping тот адрес, Вы видели бы, что он правильно решает.

Вы не хотите изменяться localhost для отображения на что-либо кроме 127.0.0.1 это может иметь странные и тонкие эффекты на многие вещи. Я думаю это /etc/hosts анализируется в порядке, в котором это записано, и так как Вы имеете:

192.168.10.10   localhost
127.0.0.1       localhost

.. вторая запись может переопределять первое.

2
04.10.2014, 01:53
3 ответа

Попробуйте:

tar -cvzf fastq.tar.gz /path/to/all/fastqs/*.gz

Или вы пытаетесь пропустить tar?

0
27.01.2020, 22:00

Вместо этого сделайте следующее:

#!/bin/bash
gzip -d $1 && gzip -d $2
1A=`sed 's/.gz//g`
2A=`sed 's/.gz//g`
cat $2A >> $1A
gzip -c $1A > $1A.gz

Вызов:

$> bash yourNewScriptIMadeForYou file1.gz file2.gz

Объяснение

  • Строка 1 объявляет среду как Bash.
  • Строка 2 вызывает GZIP [-d] для извлечения архива, оператор «&&» означает «СДЕЛАЙТЕ ЭТО, а ЗАТЕМ ДЕЛАЙТЕ ЭТО, если ЭТО РАБОТАЕТ».
  • Строка 3-4: потоковая обработка текста для удаления поста «.gz» -исправление со входов $ 1 и $ 2.
  • Строка 5: Объединить содержимое $ 2A с концом тела $ 1A
  • Строка 6: Создать новый файл GZIP с таким же именем, как у первого входного файла, или, если вы хотите включить оба имени. ..

    gzip -c $ 1A> $ 1A $ 2A.gz

Если вы покажете мне свою структуру каталогов и опишете, как вам нужно комбинировать файлы fastq, я могу создать лучший сценарий, который идеально подходит для вашего требование.

0
27.01.2020, 22:00

Чтобы объединить (объединить) два файла, используйте cat :

$ cat file1 file2 >file3

Это также работает с файлами, сжатыми с помощью gzip , bzip2 и xz (и, возможно, другие) из-за способа структурирования этих форматов сжатия.

Например, скажем, у меня есть два сжатых файла Fasta (или любые два сжатых файла, которые я хотел бы объединить):

$ gzcat file1.fa.gz
>seq1
ACTACTACTACTACTACTACTACTACT

$ gzcat file2.fa.gz
>seq1
GATAGATAGATAGATAGATAGATAGATAAAAAAAA

Я объединяю их без какого-либо распаковки или повторного сжатия:

$ cat file1.fa.gz file2.fa.gz >file3.fa.gz

Результат объединенный и сжатый файл:

$ gzcat file3.fa.gz
>seq1
ACTACTACTACTACTACTACTACTACT
>seq1
GATAGATAGATAGATAGATAGATAGATAAAAAAAA

Обратите внимание, что если это дает вам данные, которые по какой-то причине неверны, то ошибка, вероятно, также присутствует в одном (или обоих) ваших исходных файлах.

4
27.01.2020, 22:00

Теги

Похожие вопросы