diff --git a/README.md b/README.md index 5241c8b..9d2b668 100644 --- a/README.md +++ b/README.md @@ -1,3 +1,6 @@ # Пользовательская документация кластера ВолгГТУ -В приведённом документе рассматривается состав кластера ВолгГТУ а также основные методы работы пользователей. \ No newline at end of file +В приведённом документе рассматривается состав кластера ВолгГТУ а также основные методы работы пользователей. + +## [Состав вычислительного кластера](./clusterNodes/nodelist.md) + diff --git a/clusterNodes/nodelist.md b/clusterNodes/nodelist.md new file mode 100644 index 0000000..21469a7 --- /dev/null +++ b/clusterNodes/nodelist.md @@ -0,0 +1,181 @@ +# Узлы вычислительного кластера + +Вычислительные узлы кластера ВолгГТУ работают на базе операционной системы `Rocky 8` версий `8.8` и `8.10` (эта информация будет обновлена после полного перехода на `Rocky 8.10`) + +## Головной узел + +Точкой входа вычислительного кластера является головной узел `headnode` расположенный по адресу `79.170.167.30` или `cluster.vstu.ru`, он является также хранилищем домашнего раздела `/home` и раздела с програмным обеспечением `/opt` которые подключенны ко всем узлам. + +__Аппаратное обеспечение:__ + +CPU: `2xAMD Opteron Processor 6272` + +RAM: `64 Гб DDR3` + +Дисковая подсистема: + +`/`: `512 Гб SSD` + +`/home` и `/opt`: `4x4Tb HDD RAID5 (12 Тб)` + +Сопроцессоры: нет + +`RAID5` используется с целью исключения потери данных при отказе одного из дисков. + +Головной узел не является вычислительным, пусть и имеет достаточно мощный (когда-то) процессор. + +## Основные вычислительные узлы + +Вычислительные узлы являются неоднородными (гетерогенными) так как покупались в различное время и собирались в единый кластер по мере поступления. Потому они поделены на различные группы, которые будут расписаны далее. + +Группы узлов определены сопоставимой процессорной производительностью. + +
+ +Пояснение для пользователей slurm: + +Если вы видите узлы сведённые в группу `intelv3` то чтобы поставить на них задачу, требуется обратиться к `intelv3-batch` + +
+ +---------- + +### intelv3 + +Узлы `intelv3` имеют следующие адреса внутри сети + +``` +node40 (находится в монопольном использовании) +node41 +node42 +node43 +node44 +node45 +node46 +node47 +node48 +node49 (временно не работает) +node50 +``` + +__Аппаратное обеспечение:__ + +CPU: `2xIntel Xeon CPU E5-2650 v3 @ 2.30GHz` 20 ядер, 24 потоков + +RAM: `128 Гб DDR4` + +Дисковая подсистема: + +`/`: `512 Гб SSD` + +Сопроцессоры: + +`RTX 3060 (12 Гб)` для узлов 41-49 + +`Nvidia P100 (12 Гб)` для узла 50 + +---------- + +### intelv4 + +Узлы `intelv4` имеют следующие адреса внутри сети + +``` +node51 +node52 +node53 +``` + +__Аппаратное обеспечение:__ + +CPU: `2xIntel Xeon CPU E5-2650 v4 @ 2.20GHz` 24 ядра, 24 потока + +RAM: `256 Гб DDR4` + +Дисковая подсистема: + +`/`: `512 Гб SSD` + +Сопроцессоры: нет + +---------- + +### knl + +Узлы `knl` имеют следующие адреса внутри сети + +``` +node32 +node33 +node34 +node35 +node36 +node37 +node38 +node39 +``` + +__Аппаратное обеспечение:__ + +CPU: `Intel Xeon Phi CPU 7210 @ 1.30GHz` 64 ядра, 256 потоков + +RAM: `192 Гб DDR4 + 16 Гб GDDR5` + +Дисковая подсистема: + +`/`: `192 Гб SSD` + +Сопроцессоры: нет + +---------- + +### special + +Узлы `special` имеют следующие адреса внутри сети + +``` +node30 +node31 +``` + +__Аппаратное обеспечение:__ + +CPU: `Intel Xeon CPU E5-2660 0 @ 2.20GHz` 16 ядер, 16 потоков + +RAM: `128 Гб DDR3` + +Дисковая подсистема: + +`/`: `512 Гб SSD` + +Сопроцессоры: `3x RTX 3060` + +Узлы с наибольшей производительностью для GPU интенсивных задач с одинарной точностью. + +---------- + +### gold + +Узел `gold` имеют следующий адрес внутри сети + +``` +node54 +``` + +__Аппаратное обеспечение:__ + +CPU: `Intel Xeon Gold 6130 CPU @ 2.10GHz` 32 ядра, 32 потока + +RAM: `256 Гб DDR4` + +Дисковая подсистема: + +`/`: `380 Гб SSD NVMe` + +`/storage`: `4x4Tb HDD RAID5 (12 Тб)` + +`/data`: `4x4Tb HDD RAID5 (12 Тб)` + +Сопроцессоры: `2x Nvidia V100 (16 Гб)` + +Узел с наибольшей производительностью для GPU интенсивных задач с двойной точностью. \ No newline at end of file