Encore un Raid HS...

Forum dédié à la distribution du même nom et que vous pourrez télécharger sur http://www.contribs.org. La nouvelle version de cette distribution se nomme SME Server

Modérateur: modos Ixus

Encore un Raid HS...

Messagepar echelon75 » 24 Juil 2007 00:20

Bonjour a tous,

Voila mon petit SME7.1.3 avec les derniers updrage (affichage de SME7.1.2 bizarre) du jour a son RAID qui a peter :-(
J'utilise 2 disques de 80Go sur hda et hdc en LVM.
si je comprends bien mon disque hdc a un coup dans l'aile!

apres un fdisk -l voici l'etat de ma config:
---------------------------------------------------
Disk /dev/hda: 80.0 GB, 80026361856 bytes
255 heads, 63 sectors/track, 9729 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System
/dev/hda1 * 1 13 104391 fd Linux raid autodetect
/dev/hda2 14 9729 78043770 fd Linux raid autodetect

Disk /dev/hdb: 203.9 GB, 203928109056 bytes
255 heads, 63 sectors/track, 24792 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Disk /dev/hdb doesn't contain a valid partition table

Disk /dev/hdc: 80.0 GB, 80026361856 bytes
255 heads, 63 sectors/track, 9729 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System
/dev/hdc1 * 1 13 104384+ fd Linux raid autodetect
Partition 1 does not end on cylinder boundary.
/dev/hdc2 13 9729 78043807 fd Linux raid autodetect

Disk /dev/md2: 79.9 GB, 79916695552 bytes
2 heads, 4 sectors/track, 19510912 cylinders
Units = cylinders of 8 * 512 = 4096 bytes

Disk /dev/md2 doesn't contain a valid partition table

Disk /dev/md1: 106 MB, 106823680 bytes
2 heads, 4 sectors/track, 26080 cylinders
Units = cylinders of 8 * 512 = 4096 bytes

Disk /dev/md1 doesn't contain a valid partition table
-------------------------------------------------------------
Le hdb est un 200go qui me sert a faire du backup et ne m'interesse pas dans ce post. (sauf si vous avez des commentaires :-) )


après un cat /proc/mdstat:
-------------------------------------------
Personalities : [raid1]
md1 : active raid1 hda1[0]
104320 blocks [2/1] [U_]

md2 : active raid1 hda2[0]
78043648 blocks [2/1] [U_]

unused devices: <none>
-------------------------------------------

Je peux en conclure que mon RAID n'est pas operationnel et que mon hdc est la cause de mon probleme.
J'utilise donc un nouveaux disque 80Go dont les anciennes partitions sont supprimées avec partition magic et je remplace mon hdc par ce nouveaux disque.
Je redemarre mon serveur,il charge et apres quelques secondes il m'affiche :
Give root password for maintenance (or type Control-D to continue)
Control-D je reboot
password > je rentre mon password et je fais quoi? je commence la reconstruction de mon Raid avec les commandes qui suivent?

Sur une SME6 d'apres mes souvenirs le hda arrivait quand meme a booter mais la rien sauf a taper de la ligne de commande!

Après lecture de ce poste :
http://forums.ixus.fr/viewtopic.php?t=3 ... light=raid
Je suppose que je devrais faire un :
[root@ixus ~]# sfdisk -d /dev/hda > sfdisk_hda.out
[root@ixus ~]# sfdisk /dev/hdc < sfdisk_hda.out
Question au passage, je dois utiliser sfdisk ou fdisk ?et quels est la difference?

ensuite:
[root@ixus ~]# mdadm -a /dev/md1 /dev/hdc1
mdadm: hot added /dev/hdc1
[root@ixus ~]# mdadm -a /dev/md2 /dev/hdc2
mdadm: hot added /dev/hdc2

et la le Raid doit se reconstruire :-)
j'hesite vraiment a faire la manip puisque si je remplace hdc par un disque vierge ou si je l'enleve ma SME ne boot plus et je tombe sur le CONTROL-D donc j'hesite vraiment a faire la manip de peur de planter le serveur!

Autre question je possede des backups mais si je veux faire un ghost je pense que cela ne marche pas en LVM donc il reste mondo archive ou avez vous des solutions style ghost?

Merci d'avance pour vos reponses

Richard

PS: pour ceux qui liront ce post un autre link incontournable:
http://wiki.contribs.org/Raid#Hard_Driv ... 80.93_Raid
---------------------------------------------------
Petit proliant 1600 192Mo 9Go en ligne
ADSL 512Ko sur magic.fr et bientot sur Freu
---------------------------------------------------
Je cherche de la RAM pour mon Proliant????
Avatar de l’utilisateur
echelon75
Major
Major
 
Messages: 84
Inscrit le: 15 Mars 2004 01:00

Messagepar Gaston » 24 Juil 2007 01:07

Bonjour,
le comportement de ton serveur est bizarre ...
Un SME7 avec les kernels SME fonctionne avec le mode dégradé (pas les kernels Centos), à vériferi, quitte à booter sur les kernels d'avant la mise à jour pour l'opération.
Si ça boot comme ça alors via l'interface d'admin tu dois pouvoir gérer le raid, (je sait pas faire par là, désolé). La méthode que je donne est la même que celle de l'interface, juste moi j'aime taper sur le clavier ...
Mais tant que tu n'as pas réussi à démarrer le système c'est pas glop, enfin peut tre qu'en mettant le deuxième disque, ça commence à bosser ...

avant de tout perdre, utilises ton 3eme disque pour récupérer tout ce que tu peux, et DEBRANCHE le , mieux vaut ne pas le casser par inadvertance, ou visite de Murphy.

Essaye de redémarrer le raid avec l'ancien hdc en recréant les partitons (la partie sfdisk) de toute façon tu n'a rien à y perdre.
La différence entre l'usage de fdsik et de sfdisk est que ce dernier peut appliquer des définitions de partition à partir d'un fichier (que l'on génère à partir d'un dump de l'autre disque, par exemple), les deux disques sont alors découpés identiquement.

Pour le clone via ghost, je sait pas, imagemagic, non, sauf à suivre la proc décrite dans le forum (pas testée) -> rechercher un post d'il y a une 10aine de jours.
Mondorescue, j'ai eu testé en 7.0 mais c'est trop vieux pour que je puisse être d'un grand secours..

En résumé, je pense que tu es sur de mauvais kernel, reboot sur les kernels originaux avec un seul disque. Si c'est bon retrouve les infos concernant la gestion du raid via l'interface d'admin (ou suis la proc manuelle, c'est pareil)
Sinon pas glop, essaie de refaire les partitions, de reconstruire le raid, ...

Si tu es intéressé (et que ce qui est au dessus n'a rien donné), tu peux essayer d'arrêter le raid et voir si ça boot ...
Code: Tout sélectionner
mdadm --stop /dev/md1
mdadm --stop /dev/md2
après, ben tu reconstruit le raid (mdadm -a) et roolez ...


Bon courage,
G.
[/code]
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Messagepar echelon75 » 24 Juil 2007 20:07

Bonjour

Merci pour la reponse ,c'est super dans ce forum il y a toujours quelqu'un d'astreinte pour repondre :-)
desole pour la version SME mais j'etais bien en 7.1.3 puis apres upgrade passage en 7.2 .

>Si ça boot comme ça alors via l'interface d'admin tu dois pouvoir gérer le raid, (je sait pas faire par là, >désolé). La méthode que je donne est la même que celle de l'interface, juste moi j'aime taper sur le >clavier ...
Effectivement je peux booter avec les 2 anciens HD et dans l'interface il affiche Hda used 94% mais rien de plus.Si je boot avec un HD vierge en hdc et bien je tombe sur le CONTROL-D or root password.
donc j'hesite beaucoup a toucher la config.

Merci encore

Richard
---------------------------------------------------
Petit proliant 1600 192Mo 9Go en ligne
ADSL 512Ko sur magic.fr et bientot sur Freu
---------------------------------------------------
Je cherche de la RAM pour mon Proliant????
Avatar de l’utilisateur
echelon75
Major
Major
 
Messages: 84
Inscrit le: 15 Mars 2004 01:00

Messagepar Gaston » 25 Juil 2007 13:26

bonjour
echelon75 a écrit:Effectivement je peux booter avec les 2 anciens HD et dans l'interface il affiche Hda used 94%

cela me semble un peu contradictoire avec
Code: Tout sélectionner
-------------------------------------------
Personalities : [raid1]
md1 : active raid1 hda1[0]
104320 blocks [2/1] [U_]

md2 : active raid1 hda2[0]
78043648 blocks [2/1] [U_]

unused devices: <none>

mais bon ...

Dans l'état de ta config, je dirai (en supposant que tu as des sauvegards à jours, que hda et hdc sont test deux disques pour le RAID)
- supprimer le deuxieme disque de la conf raid (bien qu'il ne semble plus en faire partie, les commandes risquent même de ne pas fonctionner)
Code: Tout sélectionner
# mdadm /dev/md1 -f /dev/hdc1 -r /dev/hdc1
# mdadm /dev/md2 -f /dev/hdc2 -r /dev/hdc2

Essayer de le remettre dans la config raid
Code: Tout sélectionner
#### recup de la géométrie des partitions
###et application à hdc
# sfdisk /dev/hda > sfdisk_hda.out
# sfdik /dev/hdc < sfdisk_hda.out
# mdadm -a /dev/md1 /dev/hdc1
# mdadm -a /dev/md2 /dev/hdc2


la reconstruction devrait aller plus loin que les 94%.
Sinon pour le coup du panic avec n disque vierge, je vois pas trop, peut-etre essayer : boot en mode maintenance, application de la géométrie des partition (sfdisk ) sur le nouveau disque, ...
APrès ben j'ai plus beaucoup d'idées

G.
PS pour les dubitatifs, vous commenciez à me mettre le doute, avec vos histoire de RAID, alors j'ai testé pour vous sur une SME 7.0 avec toutes les mises à jour avant la sortie de la 7.2
- extraction d'un disque à chaud ==> OK
- reboot sur le seul disque restant ==> OK
- rebranchement disque ==> reconstruction OK
(ce sont des hotplug scsi).
ma conclusion : c'est une solution fonctionnelle ...
[edit]corrections erreurs de frappe dans les devices[/edit]
Dernière édition par Gaston le 04 Nov 2007 11:41, édité 1 fois au total.
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Messagepar echelon75 » 25 Juil 2007 14:17

Merci pour votre reponse je vais tester des que j'aurais fais les backups

A+

Richard
---------------------------------------------------
Petit proliant 1600 192Mo 9Go en ligne
ADSL 512Ko sur magic.fr et bientot sur Freu
---------------------------------------------------
Je cherche de la RAM pour mon Proliant????
Avatar de l’utilisateur
echelon75
Major
Major
 
Messages: 84
Inscrit le: 15 Mars 2004 01:00

Messagepar Pabze » 02 Août 2007 10:17

Bonjour,

Y'a t'il une commande particuliére pour savoir quels device sont utilisés dans la construction du raid lvm ?

Je m'explique,

Aprés la mise à jour en 7.2, mon serveur n'a pas redémarré.
En mode maintenance, celui-ci m'indique que le raid fonctionne en mode dégradé.
Je n'ai qu'un disque, donc, encore un plantage au niveau lvm ?
De plus pour mes backup, j'utilisais un disque usb reconnu en /dev/sdc avant casse du lvm, celui-ci est passé en /dev/sdb aprés.
Donc changement au niveau fstab pour ce point de montage, et modif du e2label pour ce même disque usb.

un cat /proc/mdstat me raméne :
Code: Tout sélectionner
[root@nosferatu ~]# cat /proc/mdstat
Personalities : [raid1]
md2 : active raid1 sda3[0]
      979840 blocks [2/1] [U_]

md3 : active raid1 sda2[0]
      77063680 blocks [2/1] [U_]

md1 : active raid1 sda1[0]
      104320 blocks [2/1] [U_]

unused devices: <none>


Le serveur boot à nouveau, mais que dois-je faire pour réparer ce LVM ?

Pour ce qui est du sfdisk -l celui-ci me raméne :
Code: Tout sélectionner
[root@nosferatu ~]# sfdisk -l

Disque /dev/sda: 9729 cylindres, 255 têtes, 63 secteurs/piste
Unités= cylindres de 8225280 octets, blocs de 1024 octets, décompte à partir de 0

   Périph Amor Début     Fin   #cyls    #blocs    Id  Système
/dev/sda1   *      0+     12      13-    104391   fd  Linux raid autodetect
/dev/sda2         13    9606    9594   77063805   fd  Linux raid autodetect
/dev/sda3       9607    9728     122     979965   fd  Linux raid autodetect
/dev/sda4          0       -       0          0    0  Vide

Disque /dev/md1: 26080 cylindres, 2 têtes, 4 secteurs/piste

sfdisk: ERREUR: secteur 0 n'a pas un signature MS-DOS
/dev/md1: une partition non reconnue
Aucune partition repérée

Disque /dev/md3: 19265920 cylindres, 2 têtes, 4 secteurs/piste

sfdisk: ERREUR: secteur 0 n'a pas un signature MS-DOS
/dev/md3: une partition non reconnue
Aucune partition repérée

Disque /dev/md2: 244960 cylindres, 2 têtes, 4 secteurs/piste

sfdisk: ERREUR: secteur 0 n'a pas un signature MS-DOS
/dev/md2: une partition non reconnue
Aucune partition repérée


Comment casser le mode LVM sans perte de données et passer sur un mode "standard" ? Correction pour Gaston par Pabze
Merci Pabze :wink:
Dernière édition par Pabze le 05 Août 2007 17:29, édité 1 fois au total.
Avatar de l’utilisateur
Pabze
Amiral
Amiral
 
Messages: 1263
Inscrit le: 25 Août 2003 00:00
Localisation: Lille

Messagepar Gaston » 02 Août 2007 20:55

Bonsoir,
je pense que tu mélanges les infos : si ton serveur a été installé en raid+lvm, tu ne peux redémarrer qu'en raid+lvm
Si tu as ton serveur up , tu n'as aucun plantage de LVM. Tu ne dis pas quel genre d'erreur tu as eu au reboot et ce qui as fait que tu es passé en mode maintenance ...
De plus il est difficile de se faire une idée de ta conf avant/après à partir de ce que tu dis.

avant : combien de disques avais-tu ? 2 ou 3 ?
maintenant : combien de disques as-tu ? 2 ou 3 ?

fait attention si tu as un sdc qui est devenu un sdb et que ce sdb faisait partie d'un raid valide , ça sent la noyade à plus ou moins long terme (prochain reboot ?) :-/

Mais plus probablement je suis prêt à m'avancer sur le fait que tu n'as qu'un disque (hors ton disque usb), que tu as toujours eu un raid en mode dégradé (config normal pour SME 7.x avec un seul disque), et que les messages d'erreurs n'en sont pas (là je m'avance pas j'en suis sur) et que ton problème de non redémarrage n'est pas lié à tes structures disques, mais à un autre élément que tu n'as pas pris en compte en te focalisant sur LVM ;) (pas du genre à booter sur un noyau smp pour une machine mono-proc quand même :shock: ?)
mais comme tu ne dis pas comment tu as redémarré le serveur, tout scénario est imaginable ;)

sinon pour répondre à ta question
Comment casser le mode LVM sans perte de données et passer sur un mode "standard" ?

c'est pas possible facilement, il est nécessaire de taper sur un "mirroir" au niveau FS (un rsync ), de casser la structure LVM du premier disque, de recréer une structure adéquate et de remirrorer (au niveau FS toujours)
Mais bon, je peux me méprendre sur ton problème, et dans ce cas là il nous faut plus de billes ...

G.
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Messagepar Pabze » 05 Août 2007 17:27

Lu,

Gaston, merci de ta réponse !
Le rouge était il nécessaire en me citant ? :) ... Mais merci pour la correction !

Je me suis un peu emporté sur la casse lvm, il est vrai que s'il était "cassé" le serveur n'aurait pas redémarré ! Logique, le lecteur :)
Le serveur fonctionne bien en mode dégradé au niveau raid.

Pour ce qui est du disque usb passé de sdc à sdb je laisse le doute sur un éventuelle branchement sur un port usb différent. Moi ou un autre, et toutes mes excuses.
Pour ce qui est du no-reboot, mon disque anciennement sdc passant en sdb et elabelisé et déclaré dans le fstab a faussé mon jugement !

Mille excuses.
Pabze :wink:

PS : Sortir d'un mode lvm sur la partition / à froid est possible ?
Avatar de l’utilisateur
Pabze
Amiral
Amiral
 
Messages: 1263
Inscrit le: 25 Août 2003 00:00
Localisation: Lille

Messagepar Gaston » 05 Août 2007 20:23

Bsoir,
PS : Sortir d'un mode lvm sur la partition / à froid est possible ?
Non.
Un des principes de LVM est de présenter une interface indépendante (et modulaire) des structures physiques réellement mises en oeuvres : les volumes logiques (LV), organisés au sein de groupes de volumes (VG), sur des partitions physiques (PP).
Cette organisation, permet par exemple d'agir sur les caractéristiques de chacun des éléments (modification de tailles des VG, LV, de localisation des VG , ...) sans que les applications (au sens large, l'OS en fait partie) n'aient à connaître les détails de ces modifications.
Le FS a été créé en utilisant cette interface, la supprimer, implique que le FS soit suffisament intelligent pour gérer ce changement, ce qu'il n'est pas, à ma connaissance.

G.
:-# Désolé pour la citation un peu appuyée, mouvement d'humeur, c'est toi qui a pris pour tous les autres :oops:
Merci pour la correction du post :biz:
Une idée de la structure LVM
Avatar de l’utilisateur
Gaston
Amiral
Amiral
 
Messages: 1367
Inscrit le: 06 Oct 2003 00:00
Localisation: Saint Maur, 94 FR

Messagepar Pabze » 06 Août 2007 10:26

Lu,

Re Gaston,

Je reviens juste pour à nouveau m'excuser...
Je pensais que mon spare était similaire (logique quand on parle de spare) à ma SME de prod qui me faisait des siennes au boot...
Hé bien non... sur mon spare lorsque je faisais un lvscan je voyais bien mes volumes, alors que sur la prod non. Il s'avére que la prod a était installé avec l'option "no lvm"
C'est en relisant mes notes que je m'en suis aperçu...

Encore merci de tes remarques, et je posterai à l'avenir sans être sur les nerfs... :)

PS : Pour ce qui est de mon souci de montage du disque usb pour backuppc au démarrage, je l'ai supprimé du fstab, et inclu dans le init du backuppc au start et un umount au stop pour plus de clarté !

Un autre lien pour le lvm : Documentation Française
Il faudrait qu'il pousse un peu l'apprentissage du LVM lors des certifications RHCE ou Comptia ! :)

@+ Gaston :)
Pabze :wink:
Avatar de l’utilisateur
Pabze
Amiral
Amiral
 
Messages: 1263
Inscrit le: 25 Août 2003 00:00
Localisation: Lille


Retour vers E-Smith / SME Server

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit et 1 invité

cron