Мне нужно выполнить большой объем вычислений на чем-то похожем на кластер, оборудование и ОС идентичны (ОС - ubuntu), но не установлено программное обеспечение центрального управления или механизм сетки. Поиск в Интернете приводит в основном к устаревшему или проприетарному программному обеспечению.
Надеюсь, мой вопрос не слишком общий, но каковы варианты управления кластером и планирования заданий для Debian и его производных?
Для общего управления кластером я использую cssh, но этот подход не очень эффективен, когда он доходит до планирования работы и мониторинга. У меня есть опыт использования почтенного Sun grid engine RIP.
Спасибо, что прочитали это!
Если вы говорите о вещах, которые в настоящее время доступны в репозиториях Debian/Ubuntu, я знаю как минимум два варианта навскидку.
Существует активный бесплатный форк SGE,Сын Гриденгина . Пакеты, в настоящее время находящиеся в Debian/Ubuntu, основаны на этом форке. См. пакеты gridengine-master
и gridengine-exec
.
ШРУС . См. пакет slurm-wlm
.