исправьте использование параллели xargs

Question

исправьте использование параллели xargs

Это стало дополнением к ответу Vítor Souza.

В Xfce Quantal (Xubuntu 12.10, Монетный двор 14 Xfce) не мог решить это методами, уже упомянутыми (см. ниже). То, что работало, устанавливало ibus пакет и его зависимости.

(Источник - более точно здесь.)

Более старое решение не сделало работавший для меня: в Ubuntu 12.10, файле gtk.immodules имеет другое расположение:

/usr/lib/x86_64-linux-gnu/gtk-2.0/2.10.0/gtk.immodules

или

/usr/lib/i386-linux-gnu/gtk-2.0/2.10.0/gtk.immodules

(Мой источник для этого здесь.)

9

terdon 19.04.2015, 14:38

Ссылка

3 ответа



                
                
                    
                        
                            
                                 Проверьте наличие /etc/debian _ версии . 

 Или можно использовать  lsb _ release -a . 
-121--82137-  Именно это делает  розничная торговля  .  retail  - это хвост с регулярными выражениями, инструмент, который я написал именно для того случая использования, который у вас есть. В вашем случае вы бы использовали: 

retail -f -r ddddddddddddddd -u hhhhhhhhhhhhhhh logfile > log.tmp


 -f  является стандартной опцией  tail -f .  -r  использует регулярное выражение для запуска диапазона включаемых строк, а  -u  - регулярное выражение для продолжения до. Он начинается с  последнего  вхождения шаблона  -r  и выходит после печати  первого  вхождения шаблона  -u  после этого. 

 Если требуется начать с первого экземпляра образца, можно использовать  -b  в сочетании с  -r . Оба регулярных выражения являются  ER , без неявной привязки, но для привязки соответствия можно использовать  ^  и  $ . 



 Вы можете получить и построить  retail  с помощью: 

git clone https://github.com/mwh/retail.git
cd retail
./configure
make
make install


 Он устанавливается в  ~/.local/bin  по умолчанию, но вы можете изменить это или просто скопировать исполняемый файл в нужное место. 



 retail  полностью  POSIX-совместим с , хотя я не рекомендую использовать его в вашей системе  tail . 
-121--87696-  Итак, во-первых, рассмотрим ограничения: 

 Каковы ограничения для каждого задания? Если это ввод-вывод, вы можете , вероятно,  избавиться от нескольких заданий на ядро ЦП до тех пор, пока вы не достигнете предела ввода-вывода, но если он интенсивно использует ЦП, он будет хуже, чем бессмысленное выполнение большего количества заданий одновременно, чем ядра ЦП. 

 Я понимаю, что  GNU Parallel  даст вам лучший контроль над очередью заданий и т.д. 

 См.  GNU parallel vs & (I mean background) vs xargs -P  для более подробного объяснения того, как они отличаются друг от друга. 
                            
                            

                                1
                                
                            
                            
                            
                                
                                27.01.2020, 20:07 
                            
                            Ссылка
                        
                                                
                            
                                

                                                                    
                            
                        
                    
                

                                        
                Теги
                
                                    

                Похожие вопросы
                
                    
                                                    
                                1 
                                Как объединить несколько условных команд sed в bash?  30.09.2021 
                                У меня есть диалоговая форма bash, которая генерирует четыре переменные. Каждая отдельная переменная -, если она не пуста -, приведет к выполнению команды sed в том же файле. Диалоговый скрипт Bash, который генерирует четыре переменные var1, var2, var3, v
                            

                                                        
                                2 
                                Почему свободное место в моем уменьшении $HOME? 01.07.2013 
                                Моей ОС является Ubuntu 12.04. Поскольку Системный монитор показывает, "свободный" за мой $HOME 1.6 ГиБ, но "Доступный" 222,7 мебибайт и продолжают медленно уменьшаться приблизительно с 750 мебибайт вчера. Я не знаю, что я...
                            

                                                        
                                4 
                                 i3-wm продолжайте изменять размер моей виртуальной машины  21.03.2017 
                                 На manjaro 17 с virtualbox 5.1.6 или 5.1.8, как только я установлю гостевой дополнительный драйвер на мою виртуальную машину Windows 7 i3 начать автоматически изменять размер окон виртуальной машины до минимума, что делает ее непригодной для использовани
                            

                                                        
                                0 
                                 Как обновить базу данных mysql из linux с помощью скрипта awk/sed/linux-shell?  05.10.2018 
                                 У меня есть файл данных с именем «частота.txt» в двух столбцах, столбец 1 — «частота», это число, показывающее повторение соответствующего столбца 2, который имеет идентификаторы. Пример: - Частота данных, идентификатор 32 ... 
                            

                                                        
                                -1 
                                 Ubuntu не загружается - существует pxe rom, нет загрузочного устройства  09.10.2018 
                                 Я хочу установить Ubuntu на мой Acer Aspire R3-131T.
Когда я загружаю устройство с USB-накопителя, я получаю черный экран с инструкциями, которые говорят:
Существующее ПЗУ PXE
Нет загрузочного устройства - вставьте диск и... 
                            

                                                        
                                13 
                                Имейте псевдоним использования xargs вместо двоичного файла 09.07.2014 
                                Bash 4.2 на CentOS 6.5: В моем ~/.bash_profile у меня есть набор псевдонимов, включая: исказите grep ='grep-n - color=always' так, чтобы я мог получить цветное выделение и распечатать номера строки автоматически...
                            

                                                        
                                1 
                                Начальная загрузка приложения от rc.local в rhel6.4 04.02.2015 
                                Я использую RHEL6.4. Я хочу, запускает мое основанное на тритоне приложение от rc.local так, чтобы это работало как единственное одно приложение. Но это не работает. Как я могу запустить это приложение для выполнения перед входом в систему...
                            

                                                        
                                0 
                                Как установить пакет на «стандартный префикс»?  04.05.2020 
                                ОС :Linux Mint 18.3 В настоящее время я пытаюсь установить последнюю стабильную версию cryptsetup. Он установлен, но, как обычно, версия Synaptic очень старая (1.6.6 по сравнению с 2.3.2 ). Бег./... 
                            

                                                        
                                3 
                                Смонтировать жесткий диск под другим именем? 13.07.2013 
                                Когда я включаю внешний жесткий диск в своего Rasberry Pi (запускающий Raspbian), он автоматически монтирует как/media/2ad496774-3eb8-47bb-2bf5e-788f8eb89e54, где папка под ним затем доступна путем движения/...
                            

                                                        
                                6 
                                Я хочу свою Ubuntu 9.04/9.10 назад, есть ли какой-либо текущий подобный дистрибутив? 03.09.2016 
                                Я переключался на Linux в оптимальное время вокруг Ubuntu 9.04/9.10. Я - программист, таким образом, я не хочу быть "гуру Linux", вот почему Ubuntu идеально подходила для меня - до Unity/Gnome3. В последнем...

score 4 · Answer 1 · 27.01.2020, 20:07

Я был бы готов поспорить, что ваша проблема Python . Вы не сказали, какую обработку делается на каждом файле, но при условии, что вы просто занимаетесь обработкой в памяти данных, время работы будет доминировать на старте 30 миллионов виртуальных машин Python (переводчики).

Если вы можете реструктурировать свою программу Python, чтобы взять список файлов, а не только один, вы получите огромное улучшение производительности. Затем вы можете использовать Xargs для дальнейшего повышения производительности. Например, 40 процессов, каждая обработка 1000 файлов:

find ./data -name "*.json" -print0 |
  xargs -0 -L1000 -P 40 python Convert.py

Это не значит, что Python - плохой / медленный язык; Это просто не оптимизировано для времени запуска. Вы увидите это с помощью любых виртуальных машин или интерпретируемых языков. Java, например, даже хуже. Если ваша программа была написана в C, все равно будет стоить отдельного процесса операционной системы для обработки каждого файла, но это было бы намного меньше.

Оттуда вы можете скриться с -P , чтобы увидеть, сможете выжать немного больше скорости, возможно, путем увеличения количества процессов, чтобы воспользоваться преимуществами простых процессоров, когда данные прочитаны / письменно.

score 0 · Answer 2 · 27.01.2020, 20:07

Как сказано, что другие, проверьте, есть ли вы / вывод. Кроме того, страница человека Xargs предлагает использовать -N -N -P -P , вы не упоминаете количество Convert.py процессов, которые вы видите, работаете параллельно.



 В качестве предложения, если вы включите, вы можете попробовать использовать блочное устройство SSD или попробуйте выполнить обработку в TMPFS (конечно, в этом случае вы должны проверить достаточно памяти, избегая свопа  Из-за давления TMPFS (я думаю), а накладные расходы на копирование данных к нему в первую очередь).

score 1 · Answer 3 · 27.01.2020, 20:07

Проверьте наличие /etc/debian _ версии .

Или можно использовать lsb _ release -a .

-121--82137-

Именно это делает розничная торговля . retail - это хвост с регулярными выражениями, инструмент, который я написал именно для того случая использования, который у вас есть. В вашем случае вы бы использовали:

retail -f -r ddddddddddddddd -u hhhhhhhhhhhhhhh logfile > log.tmp

-f является стандартной опцией tail -f . -r использует регулярное выражение для запуска диапазона включаемых строк, а -u - регулярное выражение для продолжения до. Он начинается с последнего вхождения шаблона -r и выходит после печати первого вхождения шаблона -u после этого.

Если требуется начать с первого экземпляра образца, можно использовать -b в сочетании с -r . Оба регулярных выражения являются ER , без неявной привязки, но для привязки соответствия можно использовать ^ и $ .

Вы можете получить и построить retail с помощью:

git clone https://github.com/mwh/retail.git
cd retail
./configure
make
make install

Он устанавливается в ~/.local/bin по умолчанию, но вы можете изменить это или просто скопировать исполняемый файл в нужное место.

retail полностью POSIX-совместим с , хотя я не рекомендую использовать его в вашей системе tail .

-121--87696-

Итак, во-первых, рассмотрим ограничения:

Каковы ограничения для каждого задания? Если это ввод-вывод, вы можете , вероятно, избавиться от нескольких заданий на ядро ЦП до тех пор, пока вы не достигнете предела ввода-вывода, но если он интенсивно использует ЦП, он будет хуже, чем бессмысленное выполнение большего количества заданий одновременно, чем ядра ЦП.

Я понимаю, что GNU Parallel даст вам лучший контроль над очередью заданий и т.д.

См. GNU parallel vs & (I mean background) vs xargs -P для более подробного объяснения того, как они отличаются друг от друга.