Bonjour,
Il y a 4 ans et demi, pour configurer une grappe de serveurs de calculs parallèles (pour de la CFD avec OpenFoam et OpenMPI) je n’avais aucune expérience dans ces domaines et pour le système de batch j’ai choisi torque (un peu au hasard et j’avais vu une dépendance libtorque2 dans libopenmpi1.3.
Le problème est que torque n’est plus dans Debian 8 et donc je suis coincé avec wheezy. D’autre part, la version Debian était déjà en retard et ne proposait qu’un ordonnanceur rudimentaire (FIFO).
Sur le serveur torque :
fp2x@halc9:~$ lsb_release -a
No LSB modules are available.
Distributor ID: Debian
Description: Debian GNU/Linux 7.10 (wheezy)
Release: 7.10
Codename: wheezy
fp2x@halc9:~$ aptitude search torque
v libtorque-dev -
i A libtorque2 - shared library for Torque client and serve
p libtorque2-dev - header files for libtorque2
p slurm-llnl-torque - Torque compatibility wrappers for SLURM
i A torque-client - command line interface to Torque server
p torque-client-x11 - GUI for torque clients
i A torque-common - Torque Queueing System shared files
p torque-mom - job execution engine for Torque batch syst
p torque-pam - PAM module for PBS MOM nodes
i torque-scheduler - scheduler part of Torque
i torque-server - PBS-derived batch processing server
fp2x@halc9:~$ uptime
18:09:30 up 197 days, 21:36, 1 user, load average: 0,00, 0,01, 0,05
fp2x@halc9:~$
De plus cette machine est d’architecture powerpc et sans vrai support LTS.
configuration partie calcul : 6 noeuds Proliant 2x12 coeurs/32G + 1 noeud 2x8 coeurs 16G (en wheezy)
1 vieux Proliant 4x4 coeurs 64G (pas dans la grappe actuelle) en Jessie
Je recherche donc un retour d’expérience dans l’utilisation d’un gestionnaire de ressources tel que slurm.
Cordialement,
Regards,
Mit freundlichen Grüssen,
مع تحياتي الخالصة
F. Petitjean
« On ne perd pas son temps en aiguisant ses outils. »
Proverbe français
Moi, lorsque je n’ai rien à dire, je veux qu’on le sache. (R. Devos)