RAID LINUX : questions

Là, je ne t’ai pas compris. J’évoquais 2 disques en RAID 1 + 3 en RAID 5, donc un total de 5 disques, alors que j’en ai trois. Parlais tu juste de la partie RAID 5 ?

Donc, il est tout à fait normal de voir deux fois la racine quand je fais un df, bien que celle ci soit montée dans un md ?

Non, du RAID 1 et du RAID 5.
Le RAID logiciel de Linux utilise habituellement des partitions et non des disques entiers. Tu peux donc partitionner tes trois disques en deux partitions chacun, une pour le RAID 1 et une pour le RAID 5. L’ensemble RAID 1 aura une robustesse accrue puisqu’il sera sur basé sur trois disques au lieu de deux.

Oui, c’est inhérent à la procédure de démarrage avec initramfs et n’a rien à voir avec le RAID.

Ok, donc si je comprends bien, je fais :
une partition “swap” sur mes trois disques pour du RAID 1 (c’est un choix, mais je ne crois pas que cela soit nécessaire)
une partition “/” sur mes trois disques pour du RAID 1, pour le système
des partitions selon mes besoins en données ("/home", “/var”, “/ce_que_je_veux”). Sur les trois disques, mais ce coup ci pour les utiliser en RAID 5.

Quid de la tolérance aux pannes ?

  • J’ai un disque qui lâche (probabilité faible), je peux toujours démarrer mon système ? (je crois que oui)
  • J’ai deux disques qui lâchent (probabilité très très faible), c’est la cata ?

Note : Tu peux utiliser LVM ou du RAID partitionné sur chaque type de RAID pour éviter de créer une grappe RAID distincte pour chaque volume et simplifier la maintenance. Tu peux aussi mettre le swap en RAID5. L’important est qu’il soit en RAID comme le reste.

La tolérance aux pannes est celle de chaque niveau de RAID. Avec trois disques, le RAID 1 tolère la perte de deux disques, le RAID 5 tolère la perte d’un disque.

Avec un disque en panne, les deux RAID sont fonctionnels donc le système est pleinement opérationnel et les données sont disponibles.
Avec deux disques en panne, le RAID 1 reste fonctionnel mais pas le RAID 5 donc seul le système de base est opérationnel (avec ou sans swap selon où tu l’as mis). Les données en RAID 5 ne sont pas disponibles.

(Après remplacement du disque partitionné de façon appropriée, il faudra lancer la reconstruction de tous les ensembles RAID.)

Dans tous les cas, pour démarrer avec n’importe quel disque en panne il faut que le chargeur d’amorçage ait été installé sur tous les disques. Avec grub-pc :

Sélectionner tous les disques.

Encore désolé, mais je n’ai pas compris ce point. Supposons donc que je n’utiliserais pas LVM, qu’entends tu par “ou du RAID partitionné sur chaque type de RAID pour éviter de créer une grappe RAID distincte”

EDIT : je crois avoir compris. Tu proposes de créer sur chaque disque :
1 partition pour le RAID 1
1 partition pour le RAID 5

Puis, je crée des volumes raid en conséquence.

Puis, je crée des groupes LVM, ainsi que les volumes, pour chacune de mes partitions. Correct ?

Si oui, c’est ce que j’ai fait. Toutefois, je n’ai pas de spare. Est-ce utile ?

Et par ailleurs, supposons que je reste en l’état (mes trois disques). J’en ai ai dans le placard, en cas de secours. Si un de mes disques est HS, et que je le remplace en branchant directement le nouveau HDD, sans aucune préparation, est-ce que les volumes RAID vont se reconstruire tout seuls ?

Si tu veux créer plusieurs volumes avec le même niveau de RAID sur le même jeu de disques, tu as trois possibilités :

  1. Créer un ensemble RAID distinct, donc une partition RAID distincte sur chaque disque, pour chaque volume final. Ensuite tu formates et tu montes chaque volume RAID (/dev/md0, /dev/md1…) directement.

  2. Créer un seul ensemble RAID partitionnable, donc une seule partition RAID sur chaque disque. Créer des partitions dans le volume RAID comme tu le ferais avec un disque dur, puis formater et monter les partition du volume RAID (qui auront des noms de type /dev/md0p1, /dev/md0p2…).

  3. Créer un seul ensemble RAID, donc une seule partition RAID sur chaque disque. Initialiser le volume RAID comme un volume physique (PV) LVM et l’intégrer dans un groupe LVM (VG). Créer les volumes logiques LVM (LV) dans le groupe LVM. Formater et monter les volumes logiques.

Avantage des solutions 2 et 3 : un seul ensemble RAID, ce qui facilite les manipulations à effectuer pour la reconstruction après remplacement d’un disque défaillant.
Avantage supplémentaire de la solution 3 : la souplesse qu’apporte LVM pour agrandir les volumes à chaud ou en créer de nouveaux. A contrario modifier les partitions d’un disque à chaud est souvent problématique.

Un disque de spare permet de démarrer la reconstruction automatiquement et immédiatement dès la détection d’un disque défaillant, sans attendre l’intervention de l’administrateur.

Attention néanmoins : les ensembles RAID sont gérés indépendamment, même s’ils utilisent les mêmes disques. Si le disque défaillant contient plusieurs partitions RAID, il se peut que toutes n’aient pas été marquées défaillantes (par exemple : présence de secteurs illisibles sur une partition seulement). Il sera donc souhaitable de marquer toutes les partitions RAID du disque défaillant comme défaillantes avec [mono]mdadm[/mono], de préférance avant le retrait du disque.

[quote=“will7991”]Si un de mes disques est HS, et que je le remplace en branchant directement le nouveau HDD, sans aucune préparation, est-ce que les volumes RAID vont se reconstruire tout seuls ?
[/quote]
Non, malheureusement. C’est un inconvénient du RAID logiciel de Linux. Il y a plusieurs opérations à réaliser. Un disque de remplacement doit être préparé comme un disque actif ou de spare.

  • Comme écrit ci-dessus, marquer les partitions RAID du disque comme défaillantes. Je pense que ce n’est pas indispensable mais préférable.
  • Remplacer le disque.
  • Créer les partitions RAID sur le nouveau disque à l’image de l’ancien.
  • Ajouter chaque partition RAID du nouveau disque à l’ensemble RAID correspondant avec [mono]mdadm[/mono]. La reconstruction de chaque ensemble RAID ne commencera qu’à ce moment. On comprend que moins il y a de partitions RAID, moins il y a de travail, d’où l’intérêt du RAID partitionné ou de LVM. Néanmoins les actions logicielles peuvent être automatisées dans un script préécrit auquel on n’a besoin d’indiquer que le nom du nouveau disque.
  • Dernière étape, si besoin : rendre le nouveau disque amorçable.

Re-

Alors, compte tenu de tes conseils, je suis parti ainsi.

Rappel, j’ai 3 disques de 2to.

J’ai fait sur chaque disque 3 partitions de type RAID. J’ai créé mes volume RAID ainsi :
md0 = RAID 1 sur les 3 disques
md1 = RAID 1 sur les 3 disques
md2 = RAID 5 sur les 3 disques

Ensuite, j’ai créé des groupes de volumes pour chaque volume RAID :
md0 --> systeme
md1 --> samba_user_data (mon serveur sera un samba 4 AD DC)
md2 --> data

Chaque VG est découpé en LV selon mes besoins :
systeme --> swap, racine, home, var
samba_user_data --> samba_user_data
data --> [plusieurs volumes]

Et ensuite j’ai créé mes systèmes de fichiers correspondants (swap, /, /home etc…)

J’ai fait cela pour :

  • Avoir de la redondance sur des données “hyper critiques” (système + données utilisateurs de Samba)
  • Sécuriser les données en optimisant la taille disponible via le RAID 5 pour les “autres données” (stockées dans data)

Avec ce que j’ai mis en place :

  • Si 1/3 disques est HS, aucun souci
  • Si 2/3 disques sont HS, mon système et mes données utilisateurs sont toujours up, le temps de reconstruire le reste

Qu’en penses tu ? je me demande si je ne fais pas une erreur dans mon hypothèses de 2 disques HS. Est-ce que le système et les données de samba seront toujours up grâce au RAID 1 ?
Si non, ne devrai-je pas faire plus simple, et faire simplement du RAID 5 pour le tout ?

J’ai donné des conseils, moi ? Il me semblait m’être limité à proposer des options en expliquant leurs avantages et inconvénients.

Oui. Le RAID 1 peut fonctionner sur un seul disque.
Mais est-il utile de séparer système et samba sur deux ensembles RAID 1 et deux VG distincts ? Il serait plus simple de n’en créer qu’un seul contenant tous les LV système et samba.

Ok, effectivement :slightly_smiling:

[quote=“PascalHambourg”]
Mais est-il utile de séparer système et samba sur deux ensembles RAID 1 et deux VG distincts ? Il serait plus simple de n’en créer qu’un seul contenant tous les LV système et samba.[/quote]
Ce n’était que pour mieux distinguer mes VG, mais effectivement cela ne semble apporter aucun intérêt… Mais à l’inverse, créer un VG alors que c’est inutile, cela peut-il impliquer des défauts ou des baisses de performances ?

Au final, je possède maintenant 4 disques.
De quoi faire dans le classique, avec du RAID 5 à 3 disques + 1 spare.
Avantages = capacité optimisée de 4 to et une sécurisation assez élevée.

Ou une configuration plus exotique, comme évoquée, toujours avec 1 spare, mais des volumes RAID 1 et RAID 5 comme expliqué précédemment.
Avantages = sécurisation très élevée pour les systèmes de fichiers placés dans le RAID 1.
Inconvénient = légère perte de capacité par rapport à l’unique RAID 5. Mais la capacité que j’en tire est largement suffisante.

Choix cornélien :think:

[quote=“will7991”][quote=“PascalHambourg”]
J’ai donné des conseils, moi ? Il me semblait m’être limité à proposer des options en expliquant leurs avantages et inconvénients.
[/quote]
Ok, effectivement :slightly_smiling:

[quote=“PascalHambourg”]
Mais est-il utile de séparer système et samba sur deux ensembles RAID 1 et deux VG distincts ? Il serait plus simple de n’en créer qu’un seul contenant tous les LV système et samba.[/quote]
Ce n’était que pour mieux distinguer mes VG, mais effectivement cela ne semble apporter aucun intérêt… Mais à l’inverse, créer un VG alors que c’est inutile, cela peut-il impliquer des défauts ou des baisses de performances ?

Au final, je possède maintenant 4 disques.
De quoi faire dans le classique, avec du RAID 5 à 3 disques + 1 spare.
Avantages = capacité optimisée de 4 to et une sécurisation assez élevée.

Ou une configuration plus exotique, comme évoquée, toujours avec 1 spare, mais des volumes RAID 1 et RAID 5 comme expliqué précédemment.
Avantages = sécurisation très élevée pour les systèmes de fichiers placés dans le RAID 1.
Inconvénient = légère perte de capacité par rapport à l’unique RAID 5. Mais la capacité que j’en tire est largement suffisante.

Choix cornélien :think:[/quote]

Si la perte de disque te chiffonne et que tu es sûr que tes 4 disques ne sont pas d’une série identique, la solution de RAID 10 restera plus performante pour l’écriture qu’un raid5, maintenant un RAID5 de 3 disques avec un de spare c’est assez ‘safe’ (sans pour autant pouvoir négliger le backup qui est il faut le rappeler indispensable pour de la donnée sensible).

possédant deux hôte xen :

système en raid1 (deux disques)
data en raid5 (6disques dont un de spare)

Sur le NAS c’est du ZFS en raidz6 et en générale je suis pas regardant sur les performances d’écriture pour du perso, mais au travail la très grande majorité des machines est en raid10 du moment que l’on dépasse les 4 disques sur des architectures physiques.

Je pense que les performances du RAID 5 me suffisent, compte tenu de mon contexte.

En fait, je me posais la question sur la pertinence de la config que j’ai évoquée, c’est à dire :
1 disque spare (bon, là c’est un choix, je ne parle pas de lui)
3 disques, fragmentés en 2 types de RAID : RAID 1 et RAID 5. Ces derniers étant découpés par LVM, avec un VG par type de RAID.
Sur le papier, ça a l’air pas mal. Mais est-ce qu’il y aurait des défauts qui m’auraient échappé ? (coté disques, volumes RAID ou LVM)

Les seuls que j’ai identifiés sont :
Les perfs : mais je m’en contente
La perte de capacité : mais si ça permet un gain de sécurisation, c’est bon pour moi.

Je pense que les performances du RAID 5 me suffisent, compte tenu de mon contexte.

En fait, je me posais la question sur la pertinence de la config que j’ai évoquée, c’est à dire :
1 disque spare (bon, là c’est un choix, je ne parle pas de lui)
3 disques, fragmentés en 2 types de RAID : RAID 1 et RAID 5. Ces derniers étant découpés par LVM, avec un VG par type de RAID.
Sur le papier, ça a l’air pas mal. Mais est-ce qu’il y aurait des défauts qui m’auraient échappé ? (coté disques, volumes RAID ou LVM)

Les seuls que j’ai identifiés sont :
Les perfs : mais je m’en contente
La perte de capacité : mais si ça permet un gain de sécurisation, c’est bon pour moi.[/quote]

Je me serais même contenter dans un cas comme ça ou la perte de performance en écriture est acceptable de n’utiliser qu’un seul RAID 5.
Parfois il faut rester 'KISS
Attention toute fois au travail nous avons perdu une machine en RAID10 avec 6 disques, trois disques ont lâché successivement des resynchronisation, après vérifications nous avons constaté que 4 des 6 disques portés des numéros successifs.
Pour finir par ne plus avoir de disque sain sur une des grappes … Le RAID ne remplacera jamais une sauvegarde saine.

Ha ha ! Je ne connaissais pas ce truc. Et effectivement, je suis un peu borderline, là :smiley: