Как использовать rsync или scp для эффективного копирования файлов с machineB и машин к machineA?

Question

Как использовать rsync или scp для эффективного копирования файлов с machineB и машин к machineA?

[116645]Linux (и без поддержки acl):


                    
                        2
                        
                    
                    
                        linux bash shell ubuntu rsync                    
                    
                    
                        arsenal
                        21.03.2014, 20:13 
                    

                    Ссылка


            3 ответа


        
                    
        

            

            
                
                                    
            

            
                
                    
                        
                            
                                 Основная проблема с вашим скриптом заключается в том, что вы открываете отдельное соединение  scp  для каждого файла, которое добавляет  лот  ненужных накладных расходов. Вместо этого вы можете попробовать что-нибудь вроде этого: 

#!/usr/bin/env bash

readonly PRIMARY=/export/home/david/dist/primary
readonly SECONDARY=/export/home/david/dist/secondary
readonly FILERS_LOCATION=(machineB machineC)
readonly MEMORY_MAPPED_LOCATION=/data/pe_t1_snapshot

PRIMARY_PARTITION=(0 548 272 4 544 276 8 556 280 12 552 284 16 256 564 20 260 560 24 264 572)
SECONDARY_PARTITION=(1101 1374 1641 1371 1647 1098 1635 1365 1095 1638 1089 1362 1659 1359)

dir1=$(ssh -o "StrictHostKeyChecking no" david@${FILERS_LOCATION[0]} ls -dt1 "$MEMORY_MAPPED_LOCATION"/[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9] | head -n1)
dir2=$(ssh -o "StrictHostKeyChecking no" david@${FILERS_LOCATION[1]} ls -dt1 "$MEMORY_MAPPED_LOCATION"/[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9] | head -n1)

## Build your list of filenames before the loop. 
for n in "${PRIMARY_PARTITION[@]}"
do
    primary_files="$primary_files :$dir1"/t1_weekly_1680_"$n"_200003_5.data
done

## Repeat for $SECONDARY_PARTITION
for n in "${SECONDARY_PARTITION[@]}"
do
    secondary_files="$secondary_files :$dir2"/t1_weekly_1680_"$n"_200003_5.data
done

if [ "$dir1" = "$dir2" ]
then
    ## I am using find largely because the * 
    ## in rm -rf "$PRIMARY"/* screws up the syntax 
    ## highlighting on the site and it is a good habit to
    ## get into anyway. Feel free to use rm -rf in your script.
    find "$PRIMARY" -mindepth 1 -delete
    find "$SECONDARY" -mindepth 1 -delete

    ## rsync can be run with this format:
    ##   rsync user@dest:/target/path1 :/target/path2 :/target/pathN /dest/path
    #
    ## which is why I added the : in the loop above. So, these commands will 
    ## open only 2 conections per file list. First you will try to copy all $primary_partition
    ## files from machineA, then all $primary_partition files from machineB. 
    ## rsync will complain about files not found (which is why I'm redirecting standard
    ## error to /dev/null) but will continue. You then repeat the process for machineC.
    rsync -avz david@${FILERS_LOCATION[0]}"${primary_files}" $PRIMARY/ 2>/dev/null
    rsync -avz david@${FILERS_LOCATION[1]}"${primary_files}" $PRIMARY/ 2>/dev/null

    ## Do the same for $secondary_partition files
    rsync -avz david@${FILERS_LOCATION[0]}"${secondary_files}" $SECONDARY/ 2>/dev/null
    rsync -avz david@${FILERS_LOCATION[1]}"${secondary_files}" $SECONDARY/ 2>/dev/null
fi
                            
                            

                                1
                                
                            
                            
                            
                                
                                27.01.2020, 22:22 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                    
                        
                            
                                

                                                                    
                            
                        
                    
                    
                
                    
                        
                            
                                readonly TGT=/export/home/david/dist
readonly TGT1=${TGT}/primary
readonly TGT2=${TGT}/secondary
readonly MMAP_LOC=/data/pe_t1_snapshot
readonly PART1='t1_weekly_1680_[03579]_200003_5.data' # shell globbing does 
readonly PART2='t1_weekly_1680_[12468]_200003_5.data' # the bulk of the work
readonly F_LOC=BC
readonly SSH="david@machine"
#hoping the = works - I don't know 
SSH1='ssh -o "StrictHostKeyChecking=no" '"${SSH}${F_LOC%?}"
SSH2="${SSH1%?}${F_LOC#?}"  
DIR="${MMAP_LOC}/"'[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]'
DIR1="$($SSH1 'cd ${d='"$DIR"'} && echo $d')" #shell glob
DIR2="$($SSH2 'cd ${d='"$DIR"'} && echo $d')" #shell glob
${DIR1:?FAIL} [ -n "${DIR1#"$DIR2"}" ] && exit 1 #tests if d1=d2 or dies
F1="$($SSH1 'printf "%s\n" '"${DIR1}/${PART1}")" #prefers primary
F1="${F1}$(echo ; $SSH1 'for f in '"${DIR2}/${PART1}"'\ #shell glob in
        do { case "'"$F1"'" in "${f#'"$DIR2"'}") continue ;;\ # favor
                *) printf "%s\n" "$f" ;;\ #of files found in primary
        esac ; } ; done')" #with secondary as backup
F2="$($SSH2 'printf "%s\n" '"${DIR2}/${PART2}")" #secondary
rsync -avzt -e "${SSH1}:/" "${TGT1}"/. \ #if it works, based on your
    --exclude=* $(printf --include=%s\\n $F1) #file sizes, should
rsync -avzt -e "${SSH2}:/" "${TGT2}"/. \  #dramatically decrease
    --exclude=* $(printf --include=%s\\n $F2) #transfer times


 Это работает? 
                            
                            

                                0
                                
                            
                            
                            
                                
                                27.01.2020, 22:22 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                
                
                    
                        
                            
                                [12323]rsync[118888] позаботится: копирует только изменённые файлы, игнорируя файлы, которые вы не хотите копировать (переключатель [118889]-C[118890], например, который исключит те же файлы, которые CVS исключил бы в своих репозиториях, хотя вы можете указать что угодно), рекурсивно копирует всю структуру каталогов (конечно, только нужные изменения, не всё). В качестве опции можно сжимать поток, что ускоряет передачу. Это также быстрее, потому что он делает полное копирование в одном соединении.[12324]Так как вы копируете только один файл, большинство из этих возможностей не используются. Вы бы использовали[12325]-что в точности то же самое, что [118891]scp[118892], за исключением флагов (a - архив хранит разрешения и временные метки, v - для глаголов и z - для сжатия).[12326]Однако, вы могли бы с тем же успехом использовать сжатие со scp:[12327]-Думаю, это самое простое решение здесь. Просто добавьте одиночный флаг и все.[118228]                            
                            

                                0
                                
                            
                            
                            
                                
                                27.01.2020, 22:22 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                        
                Теги
                
                    linux bash shell ubuntu rsync                

                Похожие вопросы
                
                    
                                                    
                                2 
                                 ls-d */работает в некоторых папках, а не в других  14.08.2018 
                                 я нахожусь на удаленном сервере, который является LTS Ubuntu 16.04.1, и я должен перечислить только каталоги в этой папке под названием "NewsData"
Я нашел, что ls-d */является хорошей командой для списка папок, однако он работает в... 
                            

                                                        
                                0 
                                вывод в iptables 27.03.2015 
                                Я добавил правило к iptables файлу, однако команда не показывает его. $ sudo меньше/etc/sysconfig/iptables, Сгенерированный iptables-сохранением v1.4.7 в пятницу 24 октября 13:28:48 2014 *фильтр: ВХОД...
                            

                                                        
                                1 
                                 Как включить chrooted-доступ SFTP к файлу в RHEL 6.5?  21.07.2017 
                                 Я пытаюсь настроить chrooted-доступ SFTP к серверу RHEL 6.5. Я выполнил стандартные шаги по редактированию файла sshd_config, чтобы он соответствовал любым пользователям в группе, и chroot их следующим образом: ... 
                            

                                                        
                                4 
                                 Почему foo = bar отличается от foo = bar? [дубликат]  16.08.2017 
                                 Как интерпретируется пробел в этой команде foo = bar? Почему foo = bar и foo = bar интерпретируются по-разному. Пример (Ubuntu bash) developer @ 1604: ~ $ foo = bar
developer @ 1604: ~ $ foo = ... 
                            

                                                        
                                0 
                                счетчик уникальных строк в реальном времени 12.05.2020 
                                У меня есть команда, которая постоянно выводит несколько разных строк (поток), мне нужна оперативная сводка о том, сколько раз появлялась каждая строка (с задержкой в несколько секунд). быть приемлемым) для ...
                            

                                                        
                                1 
                                записывает файлы в подкаталог в csv файл и сохраняет их в родительский каталог в командной строке linux 17.01.2019 
                                У меня есть каталог, называемый 'dir', и в нем есть подкаталог, называемый 'subdir'. В Subdir много файлов. Я хочу написать список этих файлов в CSV-файле и сохранить его в 'dir' ... 
                            

                                                        
                                37 
                                Bash имеет подобные функции, такие как самовнушение и выделение Рыбы? 15.01.2014 
                                Я недавно заметил 2 функции у Рыбы и задавался вопросом, знал ли кто-либо, были ли они также доступны в Bash? Специфические особенности подсветки синтаксиса: Вы быстро заметите, что рыба выполняет синтаксис...

score 1 · Accepted Answer · 27.01.2020, 22:22

Основная проблема с вашим скриптом заключается в том, что вы открываете отдельное соединение scp для каждого файла, которое добавляет лот ненужных накладных расходов. Вместо этого вы можете попробовать что-нибудь вроде этого:

#!/usr/bin/env bash

readonly PRIMARY=/export/home/david/dist/primary
readonly SECONDARY=/export/home/david/dist/secondary
readonly FILERS_LOCATION=(machineB machineC)
readonly MEMORY_MAPPED_LOCATION=/data/pe_t1_snapshot

PRIMARY_PARTITION=(0 548 272 4 544 276 8 556 280 12 552 284 16 256 564 20 260 560 24 264 572)
SECONDARY_PARTITION=(1101 1374 1641 1371 1647 1098 1635 1365 1095 1638 1089 1362 1659 1359)

dir1=$(ssh -o "StrictHostKeyChecking no" david@${FILERS_LOCATION[0]} ls -dt1 "$MEMORY_MAPPED_LOCATION"/[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9] | head -n1)
dir2=$(ssh -o "StrictHostKeyChecking no" david@${FILERS_LOCATION[1]} ls -dt1 "$MEMORY_MAPPED_LOCATION"/[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9] | head -n1)

## Build your list of filenames before the loop. 
for n in "${PRIMARY_PARTITION[@]}"
do
    primary_files="$primary_files :$dir1"/t1_weekly_1680_"$n"_200003_5.data
done

## Repeat for $SECONDARY_PARTITION
for n in "${SECONDARY_PARTITION[@]}"
do
    secondary_files="$secondary_files :$dir2"/t1_weekly_1680_"$n"_200003_5.data
done

if [ "$dir1" = "$dir2" ]
then
    ## I am using find largely because the * 
    ## in rm -rf "$PRIMARY"/* screws up the syntax 
    ## highlighting on the site and it is a good habit to
    ## get into anyway. Feel free to use rm -rf in your script.
    find "$PRIMARY" -mindepth 1 -delete
    find "$SECONDARY" -mindepth 1 -delete

    ## rsync can be run with this format:
    ##   rsync user@dest:/target/path1 :/target/path2 :/target/pathN /dest/path
    #
    ## which is why I added the : in the loop above. So, these commands will 
    ## open only 2 conections per file list. First you will try to copy all $primary_partition
    ## files from machineA, then all $primary_partition files from machineB. 
    ## rsync will complain about files not found (which is why I'm redirecting standard
    ## error to /dev/null) but will continue. You then repeat the process for machineC.
    rsync -avz david@${FILERS_LOCATION[0]}"${primary_files}" $PRIMARY/ 2>/dev/null
    rsync -avz david@${FILERS_LOCATION[1]}"${primary_files}" $PRIMARY/ 2>/dev/null

    ## Do the same for $secondary_partition files
    rsync -avz david@${FILERS_LOCATION[0]}"${secondary_files}" $SECONDARY/ 2>/dev/null
    rsync -avz david@${FILERS_LOCATION[1]}"${secondary_files}" $SECONDARY/ 2>/dev/null
fi