add: состав кластера

This commit is contained in:
Дмитрий Абдрахманов 2024-06-11 17:30:16 +03:00
parent b39e5cf464
commit 80c2686005
2 changed files with 185 additions and 1 deletions

View File

@ -1,3 +1,6 @@
# Пользовательская документация кластера ВолгГТУ
В приведённом документе рассматривается состав кластера ВолгГТУ а также основные методы работы пользователей.
В приведённом документе рассматривается состав кластера ВолгГТУ а также основные методы работы пользователей.
## [Состав вычислительного кластера](./clusterNodes/nodelist.md)

181
clusterNodes/nodelist.md Normal file
View File

@ -0,0 +1,181 @@
# Узлы вычислительного кластера
Вычислительные узлы кластера ВолгГТУ работают на базе операционной системы `Rocky 8` версий `8.8` и `8.10` (эта информация будет обновлена после полного перехода на `Rocky 8.10`)
## Головной узел
Точкой входа вычислительного кластера является головной узел `headnode` расположенный по адресу `79.170.167.30` или `cluster.vstu.ru`, он является также хранилищем домашнего раздела `/home` и раздела с програмным обеспечением `/opt` которые подключенны ко всем узлам.
__Аппаратное обеспечение:__
CPU: `2xAMD Opteron Processor 6272`
RAM: `64 Гб DDR3`
Дисковая подсистема:
`/`: `512 Гб SSD`
`/home` и `/opt`: `4x4Tb HDD RAID5 (12 Тб)`
Сопроцессоры: нет
`RAID5` используется с целью исключения потери данных при отказе одного из дисков.
Головной узел не является вычислительным, пусть и имеет достаточно мощный (когда-то) процессор.
## Основные вычислительные узлы
Вычислительные узлы являются неоднородными (гетерогенными) так как покупались в различное время и собирались в единый кластер по мере поступления. Потому они поделены на различные группы, которые будут расписаны далее.
Группы узлов определены сопоставимой процессорной производительностью.
<blockquote>
Пояснение для пользователей slurm:
Если вы видите узлы сведённые в группу `intelv3` то чтобы поставить на них задачу, требуется обратиться к `intelv3-batch`
</blockquote>
----------
### intelv3
Узлы `intelv3` имеют следующие адреса внутри сети
```
node40 (находится в монопольном использовании)
node41
node42
node43
node44
node45
node46
node47
node48
node49 (временно не работает)
node50
```
__Аппаратное обеспечение:__
CPU: `2xIntel Xeon CPU E5-2650 v3 @ 2.30GHz` 20 ядер, 24 потоков
RAM: `128 Гб DDR4`
Дисковая подсистема:
`/`: `512 Гб SSD`
Сопроцессоры:
`RTX 3060 (12 Гб)` для узлов 41-49
`Nvidia P100 (12 Гб)` для узла 50
----------
### intelv4
Узлы `intelv4` имеют следующие адреса внутри сети
```
node51
node52
node53
```
__Аппаратное обеспечение:__
CPU: `2xIntel Xeon CPU E5-2650 v4 @ 2.20GHz` 24 ядра, 24 потока
RAM: `256 Гб DDR4`
Дисковая подсистема:
`/`: `512 Гб SSD`
Сопроцессоры: нет
----------
### knl
Узлы `knl` имеют следующие адреса внутри сети
```
node32
node33
node34
node35
node36
node37
node38
node39
```
__Аппаратное обеспечение:__
CPU: `Intel Xeon Phi CPU 7210 @ 1.30GHz` 64 ядра, 256 потоков
RAM: `192 Гб DDR4 + 16 Гб GDDR5`
Дисковая подсистема:
`/`: `192 Гб SSD`
Сопроцессоры: нет
----------
### special
Узлы `special` имеют следующие адреса внутри сети
```
node30
node31
```
__Аппаратное обеспечение:__
CPU: `Intel Xeon CPU E5-2660 0 @ 2.20GHz` 16 ядер, 16 потоков
RAM: `128 Гб DDR3`
Дисковая подсистема:
`/`: `512 Гб SSD`
Сопроцессоры: `3x RTX 3060`
Узлы с наибольшей производительностью для GPU интенсивных задач с одинарной точностью.
----------
### gold
Узел `gold` имеют следующий адрес внутри сети
```
node54
```
__Аппаратное обеспечение:__
CPU: `Intel Xeon Gold 6130 CPU @ 2.10GHz` 32 ядра, 32 потока
RAM: `256 Гб DDR4`
Дисковая подсистема:
`/`: `380 Гб SSD NVMe`
`/storage`: `4x4Tb HDD RAID5 (12 Тб)`
`/data`: `4x4Tb HDD RAID5 (12 Тб)`
Сопроцессоры: `2x Nvidia V100 (16 Гб)`
Узел с наибольшей производительностью для GPU интенсивных задач с двойной точностью.