Обработка четвертого столбца как списка строк, разделенных символом ;
или :
, и замена всего столбца строкой Gene
и следующей за ней (именем гена )путем предварительного разделения этого поля. а затем найти нужный бит:
$ awk -vOFS='\t' '{ split($4,a,"[;:]"); for (i in a) if (a[i]=="Gene") { $4 = a[i] ":" a[i+1]; break } } 1' file
7 128550681 128550681 Gene:KCP 1 1 0 0
1 17718672 17718672 Gene:PADI6 1 1 0 0
1 17718672 17718672 Gene:PADI6 1 1 0 0
4 86035 86035 Gene:ZNF595 1 1 0 0
3 12942851 12942851 Gene:IQSEC1 1 1 0 0
Проведя небольшое исследование по этому вопросу, оказалось, что загрузка файлов main.cvd и daily.cvd вручную с clamav.net и использование freshclam сделали свое дело. Я больше не получаю ошибку. Вот что я сделал:
mechalinuxzilla@zorin-vb:~$ sudo wget http://database.clamav.net/main.cvd
2020-07-31 14:01:50-- http://database.clamav.net/main.cvd
Resolving database.clamav.net (database.clamav.net)... 104.16.219.84, 104.16.218.84, 2606:4700::6810:da54,...
Connecting to database.clamav.net (database.clamav.net)|104.16.219.84|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 117859675 (112M) [application/octet-stream]
Saving to: ‘main.cvd’
main.cvd 100%[=======================>] 112.40M 10.1MB/s in 13s
2020-07-31 14:02:03 (8.73 MB/s) - ‘main.cvd’ saved [117859675/117859675]
mechalinuxzilla@zorin-vb:~$ sudo wget http://database.clamav.net/daily.cvd
2020-07-31 14:02:38-- http://database.clamav.net/daily.cvd
Resolving database.clamav.net (database.clamav.net)... 104.16.218.84, 104.16.219.84, 2606:4700::6810:da54,...
Connecting to database.clamav.net (database.clamav.net)|104.16.218.84|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 97507181 (93M) [application/octet-stream]
Saving to: ‘daily.cvd’
daily.cvd 100%[=======================>] 92.99M 9.17MB/s in 11s
2020-07-31 14:02:49 (8.47 MB/s) - ‘daily.cvd’ saved [97507181/97507181]
mechalinuxzilla@zorin-vb:~$ sudo freshclam
Fri Jul 31 14:02:55 2020 -> ClamAV update process started at Fri Jul 31 14:02:55 2020
Fri Jul 31 14:02:55 2020 -> daily.cvd database is up to date (version: 25890, sigs: 3729086, f-level: 63, builder: raynman)
Fri Jul 31 14:02:55 2020 -> main.cvd database is up to date (version: 59, sigs: 4564902, f-level: 60, builder: sigmgr)
Fri Jul 31 14:02:55 2020 -> bytecode database available for download (remote version: 331)
Time: 0.1s, ETA: 0.0s [=============================>] 289.44KiB/289.44KiB
Fri Jul 31 14:02:55 2020 -> Testing database: '/var/lib/clamav/tmp.a3a04/clamav-7bed49e12b32dadbc775f183c02205c5.tmp-bytecode.cvd'...
Fri Jul 31 14:02:55 2020 -> Database test passed.
Fri Jul 31 14:02:55 2020 -> bytecode.cvd updated (version: 331, sigs: 94, f-level: 63, builder: anvilleg)