Crash disque dur Maitre sur SME6.0.1 en RAID1

Forum dédié à la distribution du même nom et que vous pourrez télécharger sur http://www.contribs.org. La nouvelle version de cette distribution se nomme SME Server

Modérateur: modos Ixus

Crash disque dur Maitre sur SME6.0.1 en RAID1

Messagepar pascal_lucas » 16 Août 2006 21:32

Bonsoir,

Voici ma configuration :
SME6.0.1, deux disques durs de 80 Gigas placés sur la même nappe (un maitre, un esclave).

Le disque maitre vient de tomber en panne, je le débranche, SME passe en mode dégradé sur le disque esclave, j'accéde sans problème aux données (fichiers, mail, etc...), le serveur fonctionne correctement.

Je désire remplacer le disque défectueux par un disque identique. Suffit-il de placer tout simplement le nouveau disque sur la nappe (en maitre), ou doit-on suivre une certaine procédure pour cette opération pour repasser en RAID1, les copies de fichiers se faisant alors au boot ?

Je vais évidemment sauvegarder sur un autre support les données.....

Merci pour les renseignements.

Pascal
Avatar de l’utilisateur
pascal_lucas
Aspirant
Aspirant
 
Messages: 110
Inscrit le: 28 Nov 2003 01:00
Localisation: carvin

Messagepar Gaston » 16 Août 2006 21:43

Salut,
sur un SME 6 le raid n'était pas encore géré sous mdam, mais avec les raidtools.
Récupère les docs de Darrel May raid-monitor-howto.html et raid-recovery-howto.html.
Le monitor c'est un peu tard, mais tu y trouveras comment générer le fichier hda.out pour recréer lles
partitions.

En gros :

- arrêt propre du serveur (je te conseille d'avoir récupéré tes infos de partions avant ...)
- tu branches ton nouveau disque
- redémarrage
- recréation de la structure logique des partitions
- synchro des partitions (l'une après l'autre)
- install de raidmonitor ;)

C'est passé plusieurs fois sans pb pour moi, j'espère qu'il en sera de mêm pour toi.

donnes nous des nouvelles.
G.
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Crash disque dur Maitre sur SME6.0.1 en RAID1

Messagepar pascal_lucas » 16 Août 2006 22:02

Merci pour cette réponse,

Si je comprend bien, je place le nouveau disque en maitre mais je boot sur l'esclave (qui est l'image avant le crash), la copie se fera automatiquement.

Je redémarre le serveur en bootant sur le disque maitre.


Pascal
Avatar de l’utilisateur
pascal_lucas
Aspirant
Aspirant
 
Messages: 110
Inscrit le: 28 Nov 2003 01:00
Localisation: carvin

Messagepar micheldp » 17 Août 2006 00:15

Salut,
pas exactement, Gaston t'a répondu de regarder sur le site" les docs de Darrel May"
et la tu vois :
[url]http://distro.ibiblio.org/pub/linux/distributions/smeserver/contribs/dmay/smeserver/5.x/contrib/raidmonitor/raid-recovery-howto.html

Personellement, je n'ai jamais eu besoin et donc pas utilisé.
Bonne chance

Michel
Avatar de l’utilisateur
micheldp
Contre-Amiral
Contre-Amiral
 
Messages: 485
Inscrit le: 28 Mai 2003 00:00

Re: Crash disque dur Maitre sur SME6.0.1 en RAID1

Messagepar Gaston » 17 Août 2006 19:30

Bonsoir,
pascal_lucas a écrit: la copie se fera automatiquement.

NON, il serait peut-être bon de :

1) lire les réponses que l'on te donne
Gaston a écrit: - recréation de la structure logique des partitions
- synchro des partitions (l'une après l'autre)
(y pas marqué que cela se faisait tout seul !!)
2) suivre les URLs et lire les documentations citées.

- tu dois booter sur le disque qui te reste (qu'il soit maitre ou esclave, c'est un pb de BIOS pour le boot, et
je te déconseille de swapper maitre et esclave : la conf raid serait un peu plus complexe a remettre à
jour ...)
- créer à la main les partitions, la doc t'indique d'utiliser sfdisk avec un fichier de paramètrage, si tu l'as
pas ou que tu ne le comprends pas, tu peux refaire cela à la main sans pb.
- lancer la resynchro - raidhotadd /dev/mdx /dev/hdbx - (je sait plus si il ya besoin d'autre chose, le raid
démarre tout seul en mode dégradé donc pas de raidstart ni de raidcreate, je crois pas, mais ça doit
être dans la doc ...) à la main. Je te conseille de d'abord lancer la synchro de la petite partition, ensuite
celle de la grosse. Sur des disques IDE de 40GB, je l'ai plusieurs fois fait en environ une heure.

l'interret de raidmonitor une fois réparré ? ben ça te crée les fichiers de reconstruction en plus de t'avertir
par mail en cas de problème. C'est toujours bon à prendre ...

G. :twisted:
m'enfin :!:
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Crash disque dur Maitre sur SME6.0.1 en RAID1

Messagepar pascal_lucas » 18 Août 2006 07:26

Merci pour l'intérêt porté à mon problème,

Je termine les sauvegardes complètes du serveur (problème de place sur une unité de sauvegarde), j'attend le nouveau disque (de même capacité) et je me lance, tel indiqué dans le how-to proposé.

A bientôt

Pascal
Avatar de l’utilisateur
pascal_lucas
Aspirant
Aspirant
 
Messages: 110
Inscrit le: 28 Nov 2003 01:00
Localisation: carvin

Crash disque dur Maitre sur SME6.0.1 en RAID1

Messagepar pascal_lucas » 18 Août 2006 16:07

Après avoir recréé les partitions je bloque sur la "copie" des partitions à l'aide de la commande /sbin/raidhitadd /dev/mdx /dev/hddx.

Comment trouver le mdx en fonction de la partition (ex md0 ---- hdd1 ?)

Mes deux disques présentes trois partions hdc1, hdc2, hdc3 (la plus grosse hdc2 semble contenir les données, grâce à un CD knoppix j'ai pu m'en apercevoir). hdd lui aussi à 3 partitions hdd1 hdd2 hdd3.


Merci pour la réponse et toute l'aide

Pascal
Avatar de l’utilisateur
pascal_lucas
Aspirant
Aspirant
 
Messages: 110
Inscrit le: 28 Nov 2003 01:00
Localisation: carvin

Messagepar Gaston » 18 Août 2006 21:56

Bonsoir,
ça ne se devine pas, tu peux reconstituer avec les infos suivantes :
(je supposerai que ton disque sain est /dev/hdb et que ton nouveau disque est /dev/hda)

- 1ere méthode ($%#&! et couteau)
Code: Tout sélectionner
[root@srv75 raidmonitor]# cat /proc/mdstat
Personalities : [raid1]
md0 : active raid1 hdb1[0]
      102208 blocks [2/1] [U]

md2 : active raid1 hdb2[1]
      35977472 blocks [2/1] [U]

md1 : active raid1 hdb3[1]
      104320 blocks [2/1] [U]

unused devices: <none>
[root@srv75 raidmonitor]# fdisk -l /dev/hdb
Disque /dev/hdb: 41.1 Go, 41110142976 octets
16 têtes, 63 secteurs/piste, 79656 cylindres
Unités = cylindres de 1008 * 512 = 516096 octets

Périphérique Boot      Start         End      Blocks   Id  System
/dev/hdb1   *           1         203      102280+  fd  Linux raid autodetect
/dev/hdb2             204       79135    39781728   fd  Linux raid autodetect
/dev/hdb3           79136       79655      262080   fd  Linux raid autodetect

une comparaison des tailles et tu retrouves tout de suite quelle partition va avec quel md


- 2 eme méthode (la mémoire du système)
Code: Tout sélectionner
[root@srv75 raidmonitor]# grep RAID /root/anaconda-ks.cfg
#raid /boot --fstype ext3 --level=RAID1 raid.00 raid.01
#raid / --fstype ext3 --level=RAID1 raid.10 raid.11
#raid swap --fstype swap --level=RAID1 raid.20 raid.21

miracle !!! il y a tout là

- 3 eme méthode
Code: Tout sélectionner
[root@srv34 root]# cat /etc/raidtab
raiddev             /dev/md1
raid-level                  1
nr-raid-disks               2
chunk-size                  64k
persistent-superblock       1
nr-spare-disks              0
    device          /dev/hda3
    raid-disk     0
    device          /dev/hdb3
    raid-disk     1
[ ...]


deuxième miracle !!

Bon ben maintenant au boulot, dans le cas présent, les commandes seraient
Code: Tout sélectionner
raidhotadd /dev/md0 /dev/hda1
raidhotadd /dev/md2 /dev/hda3
raidhotadd /dev/md1 /dev/hda2


G.
PS :Les valeurs ci dessus sont de la pure invention (donc peut-etre un peu fausse), passe moi par MP tes infos réelles, je mettrai des valeurs réelles, pour la postérité ;)
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Crash disque dur Maitre sur SME6.0.1 en RAID1

Messagepar pascal_lucas » 19 Août 2006 21:32

Merci pour les informations.

La commande cat /proc/mdstat m'a permis de synchroniser correctement les partitions, avec du temps (plus de 4 heures pour celle contenant les données, 70 Gigas environ mais seulement 6 gigas occupés !!!)

J'ai toutefois un problème avec la restauration sur le disque défecteux du MBR, ceci avec la commande :
/sbin/lilo -C /root/raidmonitor/lilo.conf -b /dev/hdd (hdd disque défectueux)
J'ai le message m'indiquant que /dev/hdd n'est pas le premier disque, et lilo ne semble pas être recopié. Lorsque je redémarre le serveur en supprimant le disque maitre, le PC attendant le système d'exploitation.

J'ai vérifié avec un Cd knoppix le contenu des différentes partitions, les 6 (2 * 3) semblent identiques d'un point de vue Données, une création d'un fichier texte sur le serveur seretrouve bien sur la partition du disque esclave.

Auriez-vous une idée, après une panne du disque maitre par exemple, le disque esclave doit-il être déplacé en maitre ?

Merci pour tous les conseils donnés,

Pascal
Avatar de l’utilisateur
pascal_lucas
Aspirant
Aspirant
 
Messages: 110
Inscrit le: 28 Nov 2003 01:00
Localisation: carvin

Messagepar Gaston » 20 Août 2006 11:41

Bonjour,
j'ai pas rencontré ce pb :-k
si tu vois ton disque avec un live cd, tu peux essayer cela (!!aucune garantie sur l'etat du disque après!!)
essaie de recréer le mbr :
boot en live cd ,
monte le nouveau disque,
chroot dessus,
/sbin/lilo ...
[-o<

Gaston
PS cette manip est donnée dans le contexte de sauvegardes connues de ce post !!
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Crash disque dur Maitre sur SME6.0.1 en RAID1

Messagepar pascal_lucas » 20 Août 2006 15:26

Merci encore pour cette indication, c'est ce que je pensais faire.

J'ai il me semble un autre problème avec ce raid, ce matin en redémarrant le serveur une nouvelle sysnchronisation des deux disques a été lancée, sans intervention de ma part.
J'avais bien lancé la commande raimonitor -iv pour sauvegarder cette configuration.
De plus il me semble que cette sysnchro est très longue, 5 heures pour 77 gigas.

Pascal
Avatar de l’utilisateur
pascal_lucas
Aspirant
Aspirant
 
Messages: 110
Inscrit le: 28 Nov 2003 01:00
Localisation: carvin

Messagepar Gaston » 20 Août 2006 17:13

Salut,
raidmonitor ne relance pas les synchro, il fait juste une comparaison entre la conf qu'il a trouvé lorsqu'
il a été initialisé et celle en cours (résultat de la commande mdstat dans les 2 cas je suppose).
Si tu as initialisé le raid monitor alors que la synchro initiale n'était pas terminée, il n'a pas de bonne
référence et reportera une erreur dans le raid.
De même si tu as arrété le serveur en cours de route ...

Pour le temps de resynchro, oui c'est long mais ça ne m'inquiète pas plus que ça sans avoir le contexte.
Tout cela dépends de l'état des disques de la performance de ceux- ci et de la machine (IO, Mémoire,
CPU). Pas d'influence de la capacité utilisée ...

Pour un 40GB IDE, je mettais habituellement une heure, lorsque c'est passé à plus de 6 heures, je me suis
inquiété et j'ai tout changé (beaucoup d'erreur de raid depuis plus d'un mois - ça faisiat beacoup d'alarmes
au rouge), voir les infos SMART peut-etre ...
Si un de tes 2 disques est en mauvaise forme, tu passes ton temps dans les CRC

Bon courage
G.
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Crash disque dur Maitre sur SME6.0.1 en RAID1

Messagepar pascal_lucas » 22 Août 2006 08:08

Merci pour les réponses,

Mon crash disque est terminé, je posterai un message avec l'entête résolu dés que possible.

Dernière question : j'ai lu que le logiciel SMART permettait de tester l'état des disques. Après quelques recherches je n'ai pu mettre la main sur ce soft.

Ou puis-je le trouver ? Quelles sont les options possibles ?

Merci d'avance

Pascal
Avatar de l’utilisateur
pascal_lucas
Aspirant
Aspirant
 
Messages: 110
Inscrit le: 28 Nov 2003 01:00
Localisation: carvin

Messagepar Gaston » 22 Août 2006 17:08

bonjour,
le support SMART est inclus dans le noyau de la SME
Dernière question : j'ai lu que le logiciel SMART permettait de tester l'état des disques. Après quelques recherches je n'ai pu mettre la main sur ce soft.


:arrow: google
:arrow: man smartctl

G.
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR


Retour vers E-Smith / SME Server

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit et 0 invité(s)

cron