Récupérer un système d'un RAID1 dont un des 2 disques serait

Forum dédié à la distribution du même nom et que vous pourrez télécharger sur http://www.contribs.org. La nouvelle version de cette distribution se nomme SME Server

Modérateur: modos Ixus

Si un disk est mort Raid1

Messagepar igor98 » 15 Sep 2007 14:43

Bonjour,

Je lis qu'il est assez simple de récupérer un système d'un RAID1 dont un des 2 disques serait mort.

Quelle est/serait cette procédure avec 2 disques en IDE/RAID1 ?

1°) Le serveur me prévient qu'un disque est défaillant
2°) Qu'est-ce que je fais ?
Est-il possible simplement d'arrêter le serveur le temps de faire un échange du disque défaillant, le RAID se reconstruirait tout seul après redémarrage ???
3°) Faut-il 'jouer' avec lilo ?????
4°) Il me semble qu'on peut changer un disque dur SATA à chaud et pas IDE, est-ce vrai ?

Enfin, vous l'aurez compris, je cherche en fait une procédure la plus simple possible en cas de crash d'un des 2 disques en RAID1.

Merci d'avance.
igor98
Enseigne de vaisseau
Enseigne de vaisseau
 
Messages: 168
Inscrit le: 02 Avr 2007 09:46

Messagepar Yvan » 20 Sep 2007 10:54

Bonjour,

Il est tres simple de reconstituer ton raid1, tu change ton disque dur HS par un disque dur au moins aussi gros et le RAID1 va se reconstituer tout seul.

Pour verifier l'etat de ton RAID1:

cat /proc/mdstat

Pour ceux qui est du changment d'un disque SATA en marche, je ne sais pas, pour ce qui est de l'ide il faut éteindre le poste.
Avatar de l’utilisateur
Yvan
Capitaine de vaisseau
Capitaine de vaisseau
 
Messages: 270
Inscrit le: 09 Jan 2003 01:00

Assurance

Messagepar igor98 » 20 Sep 2007 13:05

Merci pour ta réponse, mais au risque d'enfoncer le clou.. et je suis dur de la feuille, mais j'ai tellement lu un peu partout sur le RAID1 et 5, et en fait je n'ai pas trouvé de réponse FERME et définitive qui soit confirmée par la majorité, à chaque fois, y'avait un "oui mais".... donc :

Exemple:
J'ai un des 2 disques (donc RAID1 Logiciel SME) hs (peu importe lequel n'est-ce pas), au niveau des nappes IDE (en master ou slave et sur n'importe laquelle des nappes..ok?)
Je reçois donc l'avis de madm qu'un disque est défectueux par email.
J'arrête le serveur proprement, je remplace le défectueux par un nouveau (d'au moins la mm capacité),
je redémarre, le raid se reconstruit ????

Et ceci, quelque soit le disque qui 'plante' ?!

On peut donc démarrer *** indépendamment *** sur n'importe lequel des 2 disque dur en RAID1 ????
Est-ce que le LVM à quelque chose a voir avec ceci ?

Y'a pas à mettre les mains dans le camboui et toucher au Lilo ou autre fichier de conf ????

Et au final peut-on démarrer sur 1 seul des 2 disques (le temps d'aller en chercher un 2ème) ?

Voilà, si au moins quelques pros pouvaient confirmer ceci... sans .... oui mais !!!!!! J'ose espérer que c'est possible.

Merci d'avance.
igor98
Enseigne de vaisseau
Enseigne de vaisseau
 
Messages: 168
Inscrit le: 02 Avr 2007 09:46

Messagepar fraedhrim » 20 Sep 2007 13:43

Salut,

Je suis comme toi un peu en attente de cette confirmation. Ce que moi je ne vois pas bien c'est si je prends un disque sur une SME de test en RAID 1 et que je m'en sers pour remplacer le disque HS sur ma SME de prod en RAID 1 alors lequel gagne ? Il me reconstruit mon test ou il me reconstruit mon prod ? Bon j'imagine qu'il vaut mieux crao le nouveau disque avant mais bon quand bien même : comment le système sait sur lequel booter ?
Genre je dois remplacement mon disque en primary master, je prends un disque, je le nettoie à part, je le fourre dans le gourbi, il tente le boot sur le primary master, ça coince. Il passe sur l'autre et trouve ma SME ?

Bref je suis moi aussi perturbé par toutes ces discussions sur la difficulté de récupérer des données sur un disque en RAID avec LVM. Pourquoi ces opérations si la reconstruction est si facile ?

A+
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Re: Assurance

Messagepar Gaston » 21 Sep 2007 00:03

Bonsoir,
avant tout il est normal de ne pas toujours être affirmatif dans les diagnostics de panne sur RAID dans un forum : nous n'avons qu'une vision réduite de la situation et des évènements qui ont conduit au problème.
Néanmoins, les techniques de RAID permettent une importante fiabilisation de l'accès aux données, et les implémentation logicielles telle que celle utilisée sur Linux, ne sont pas des plus mauvaises.
Bon, maintenant on attaque :
igor98 a écrit:Exemple:
J'ai un des 2 disques (donc RAID1 Logiciel SME) hs (peu importe lequel n'est-ce pas), au niveau des nappes IDE (en master ou slave et sur n'importe laquelle des nappes..ok?)
Je reçois donc l'avis de madm qu'un disque est défectueux par email.
J'arrête le serveur proprement, je remplace le défectueux par un nouveau (d'au moins la mm capacité),
je redémarre, le raid se reconstruit ????

non pas dans le cas d'un raid logiciel sous Linux
1) Il est nécessaire que la structure physique qui doit être jointe au périphérique RAID soit préparée de façon identique à celle des autres disques du périphérique RAID.
2) le mécanisme de RAID logiciel sous Linux considère, à juste titre, qu'il ne peut décider de lui-même que tel ou tel espace de stockage puisse/doive être joint au raid existant.
Il sera donc nécessaire de :
- préparer la structure logique : création des partitions
- joindre manuellement le nouveau disque au RAID

Et ceci, quelque soit le disque qui 'plante' ?!
Il n'existe, à ma connaissance aucune différenciation de rôle entre un ou un autre des éléments d'un périphérique RAID.

On peut donc démarrer *** indépendamment *** sur n'importe lequel des 2 disque dur en RAID1 ????

Oui, SI la configuration initiale a correctement été faite, mais ceci est indépendant du RAID.
Le démarrage du système va se faire à partir d'une partie du disque qui ne fait pas partie du device RAID, qui n'est donc pas dupliqué/maintenu par les mécanismes du RAID. Il est nécessaire que le MBR, puisque c'est de lui que je parle, soit correctement renseigné avec les paramètres requis pour l'initialisation du système.

Est-ce que le LVM à quelque chose a voir avec ceci ?

#-o ça n'a aucun rapport ... Il n'empêche que plus l'on apporte de fonctionnalités à un système plus on risque d'augmenter l'adhérence de l'une par rapport à l'autre, et complexifier les processus de diagnostiques et de réparation de problèmes. Il existe une dépendance non nulle entre les structure d'organisation logique des données et les structures d'organisation physique du disque.
Dans le cas de SME, avec le RAID1 logiciel et sans LVM, on a ajouté une interface entre les structures logiques (FS) et les structures physiques (partitions), mais cette interface se confonds de façon quasi parfaite à la structure physique, au point que l'on puisse l'oublier (ce dont de nombreux utilisateurs n'ont pas manqué de faire ;) ).
L'introduction de LVM abouti à l'ajout d'une deuxième interface dont le but est d'être totalement indépendante que ce soit de la couche logique des données (FS), que de la structure physique sur lequel elle a été bâtie, mais PAS de la façon dont celle-ci lui est présenté. Et cette structure en l'occurrence c'est la structure présenté par le périphérique RAID, pas les partitions des disques. Ceci explique pourquoi la solution LVM d'une SME ne peut fonctionner si la structure du RAID n'est pas correctement visible (RAID démarré, qu'il soit dégradé ou non - se référer aux problèmes soulevés dans des fils récents). Si le raid n'est pas démarré, on présente une partition "brute" au sous système LVM qui ne comporte pas les identifiants de PV - physical volume - requis. fin de la parenthèse

Y'a pas à mettre les mains dans le camboui et toucher au Lilo ou autre fichier de conf ????
c'est pas mettre les mains dans le cambouis que réaliser correctement et de façon ordonnée, les étapes nécessaires à la mise en place d'un sytème RAID fonctionnel. Par contre il peut être nécessaire de s'assurer que tout s'est bien passé après une opération de maintenance (ça peut s'appeler principe de précaution ;) ).

Et au final peut-on démarrer sur 1 seul des 2 disques (le temps d'aller en chercher un 2ème) ?
toutafé (pour reprendre une expression de Grand'Pa ;)

Parlant d'un serveur SME et de RAID1 (j'ai pas eu l'occasion de fouiller le problème pour un autre niveau) le MBR est initialisé correctement à l'installation. On peut donc démarrer un serveur SME sur un disque ou sur l'autre indifféremment.
Le script utilisé pour l'ajout (remplacement) d'un disque via le server manager prends en compte le partitionnement du disque et la mise à jour du MBR.

fraedhrim a écrit:Ce que moi je ne vois pas bien c'est si je prends un disque sur une SME de test en RAID 1 et que je m'en sers pour remplacer le disque HS sur ma SME de prod en RAID 1 alors lequel gagne ? Il me reconstruit mon test ou il me reconstruit mon prod ? Bon j'imagine qu'il vaut mieux crao le nouveau disque avant mais bon quand bien même : comment le système sait sur lequel booter ?

Le système Linux, utilise un disque virtuel initial en RAM pour démarrer, la définition et le contenu de ce disque se trouve dans le fichier "initrd". En particulier, s'y trouve la liste de services à démarrer et leur ordre de démarrage. Dans cette liste on trouve les instructions de démarrage d'un périphérique RAID. Ce périphérique est repéré par un identifiant l'UID . Cet identification est unique à un système RAID construit sur une machine à un instant donné. Le périphérique RAID qui sera démarré est donc celui référencé dans l'initrd.
Considérant qu'aucun autre périphérique RAID ne sera démarré automatiquement (de façon non controlé par l'administrateur) en dehors de cette phase ...

Bref je suis moi aussi perturbé par toutes ces discussions sur la difficulté de récupérer des données sur un disque en RAID avec LVM. Pourquoi ces opérations si la reconstruction est si facile ?

Tu n'es pas le seul ... je pense que ces discussions viennent du fait que l'on touche là à des mécanismes sensibles, relativement complexes - de par les techniques misent en œuvres - pour lesquels une bonne analyse de ce que l'on a fait ou va faire est requise. Ceci n'est malheureusement pas simple pour des personnes qui se retrouvent en état de stress (c'est pas péjoratif, c'est normal quand c'est la vie de ses données qui est en jeu) face à des techniques qu'ils ne maîtrisent pas.
Je reste néanmoins persuadé qu'une configuration RAID1 logicielle n'est pas plus complexe à maintenir en LVM que sans. Je ne me prononcerai pas aujourd'hui sur un niveau de RAID différent.

G.
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Messagepar fraedhrim » 21 Sep 2007 11:57

Conclusion :

1 - Je me fais enfin une compil des howto et des posts d'ici et j'en sors une procédure adaptée à ma config
2 - Je sauvegarde mon serveur
3 - Je teste ma procédure en virant un disque et en mettant celui que je garde en spare
4 - Banzaï, je foire tout
5 - J'ajuste ma procédure
6 - Je reprends mon disque enlevé au départ en tremblant et je le mets à la place de celui que j'ai tout foiré
7 - Banzaï, je m'en sors (il est 3h38 du matin)
8 - J'ajuste ma procédure
5 - I am the king of the world (ou alors je suis mort égorgé par ma femme qui aura perdu ses données)

Bon... Je vais poser un RTT et je me planifie ça. :lol:
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Messagepar jibe » 21 Sep 2007 21:02

Salut,

Bravo et merci Gaston pour ces explications claires et précises :D

Tu devrais faire une compil de tes posts et en faire un joli "Raid sur SME Howto" :wink: (avant que fraedhrim le fasse à ta place... et dépose un brevet logiciel :lol: :wink: )
"Le monde ne sera pas détruit par ceux qui font le mal, mais par ceux qui les regardent sans rien faire" (Albert Einstein)

Autrefois, l'Etat défendait des valeurs. Maintenant, il défend des profits... (Anne Haunnime)
Avatar de l’utilisateur
jibe
Amiral
Amiral
 
Messages: 4366
Inscrit le: 17 Oct 2003 00:00
Localisation: Haute Savoie

Messagepar Gaston » 22 Sep 2007 00:39

Bsoir,
avant de te lancer sur ton serveur, une bonne façon d'apréhender les étapes à suivre et à peu de frais :
- 10 GB de disque disponible
- VMWare version libre
- image iso de SME, de disque rescue ...
En moins d'une heure, tu peux créer un serveur virtuel avec presque autant de disques que tu veux (il faut créer des disques de 2 GB minimum pour la version de Linux qui nous intéresse). Tu les mets à l'install, après l'install, tu les retires (pas à chaud, ou si c'est possible, je suis preneur de la solution - en fait j'ai pas pris le temps de lire la doc - ), tu les abimes (tu peux utiliser les mêmes disques avec plusieurs machines - préciser : disk.locking = "FALSE" - dans le .vmx - je te laisse imaginer le résultat d'écritures concurrentes :oops: )
De quoi s'amuser pour pas cher dans son fauteuil pendant que madame regarde le feuilleton ;)

G.
PS Jibe tu es le deuxième à me réclamer un écrit, je vais y repenser, promis. Mais je ne revendique aucun droit sur mes propos ...
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Messagepar fraedhrim » 22 Sep 2007 11:55

On voit le gars qui est déjà passé à deux doigts de l'éviscération à la fourchette !

Pas bête. Je n'ai pas encore le réflexe virutalisation. Ca peut être une première étape avant le field test sur ma machine de réserve.

Je pose un RTT et ....


++
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes


Retour vers E-Smith / SME Server

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit et 1 invité

cron