Az első Projekt
Az első lépések
Tervezés: Határozza meg a projekt célját és a szükséges számítási feladatokat.
Szükséges erőforrások összeszedése korábbi futtatások alapján (pl. processzor magok, memória, tárhely stb.) és a szükséges futtatási idő becslése.
Projekt beregisztrálása
A HPC Portálon szükséges felvenni a projekthez tartozó információkat:
Projekt neve, Erőforrás igény
Még több információ érhető el a HPC Portál Felhasználói kézikönyv menüpontja alatt:
- Projekt elbírálása
Szükség esetén technikai támogatást nyújt a HPC Kompetencia Központ a projektigényléssel kapcsolatban, például kiegészítés kérése.
Környezet elkészítése: megfelelő partíció kiválasztása
Elérhető Partíciók:
CPU
GPU
AI
BigData
Még több információ a Elérhető partíciók fejezetben
Projekt előkészítése: Hozzon létre egy projekt mappát a login node-on, ahol tárolhatja az összes szükséges fájlt és forráskódot.
Gondoskodjon róla, hogy a projekt mappa megfelelő engedélyekkel rendelkezzen.
Programkód írása: Írjon vagy készítsen elő egy programot, amelyet a HPC Komondor rendszeren szeretne futtatni.
Ez lehet valamilyen tudományos szimuláció, adatelemzés vagy bármilyen más HPC feladat.
SLURM script elkészítése: Hozzon létre egy SLURM scriptet (.sbatch fájl), vagy egy futtatható (.sh) filet amelyben definiálja a feladatot.
Határozza meg az erőforrásigényeket, a futási időt, a kimeneti fájlok nevét stb. Ezt a scriptet használja majd a feladat beküldéséhez a SLURM rendszerbe.
#!/bin/bash
#SBATCH -A <projectname>
#SBATCH --partition=cpu
#SBATCH --job-name=<jobname>
#SBATCH --time=01:30:00
#SBATCH --mem-per-cpu=3000
#SBATCH --mail-type=ALL
#SBATCH --mail-user=<emailaddress>
<command>
További példák: .. code-block:: bash
#SBATCH -c 8 #SBATCH -n 16 #SBATCH –ntasks-per-node 8
Feladat beküldése: Küldje be a SLURM scriptet a SLURM rendszerbe a sbatch parancs segítségével.
Például:
sbatch script_neve.sbatch
Ez elindítja a feladatot a HPC rendszerben az elvárt erőforrásokkal.
Feladat ellenőrzése és kimenet vizsgálata:
squeue vagy a sacct paranccsal a feladat állapotát tudja ellenőrizni. Például:
sacct --format=jobid,elapsed,ncpus,ntasks,state
Az ütemezővel kapcsolatos fogalmakat itt gyűjtöttük össze: