Проект

Общее

Профиль

Действия

Manual queue » История » Редакция 1

Редакция 1/6 | Следующее »
Владимир Кихтенко, 16.03.2012 17:31


Система очередей

Для доступа к ресурсам кластера используется система очередей TORQUE.

Использование

Постановка задачи в очередь

$ qsub start.sh
start.sh - скрипт запуска задачи. Примеры скриптов для MPI и CUDA в соответствующих статьях. Подробнее про скрипты запуска написано ниже.
При успешной постановке в очередь будет показан id присвоенный задаче.

Просмотр состояния очереди

$ qstat

Просмотр состояния задачи

$ qstat -f <job_id>

Запуск параллельной задачи

$ qsub -l nodes=8 start.sh            # Запрос 8 процессоров (возможно на разных узлах)
$ qsub -l nodes=1:ppn=6 start.sh      # Запрос 6 процессоров на одном узле
$ qsub -l nodes=3:ppn=4 start.sh      # Запрос 3 узлов по 4 процессора (процессоры могут быть "упакованы" на меньшее число узлов)
$ qsub -l nodes=2:bl465 start.sh      # Запрос 2 процессоров, обязательно на узлах типа bl465
$ qsub -l nodes=4,pmem=300mb start.sh # Запрос 4 процессоров и 300mb памяти на каждый
$ qsub -l nodes=2 -l walltime=8:00:00 # Запрос 2 процессоров на 8 часов

В качестве типа узлов можно указывать o280 (старый кластер) или bl465 (блейд узлы). Кроме того есть несколько серверов без явного типа.
Примечание: явное указание типа узлов потенциально увеличивает время нахождения задачи в очереди.

Запуск CUDA задачи

Для CUDA задач используется отдельная очередь.

$ qsub -q cuda start.sh

Скрипты запуска задачи

Обновлено Владимир Кихтенко около 12 лет назад · 1 изменени(я, ий)