4ae1ff8f5a0e456431c4964aff97f387a95095b1
[bootmanager.git] / source / steps / ValidateNodeInstall.py
1 #!/usr/bin/python
2 #
3 # Copyright (c) 2003 Intel Corporation
4 # All rights reserved.
5 #
6 # Copyright (c) 2004-2006 The Trustees of Princeton University
7 # All rights reserved.
8
9 import os
10
11 from Exceptions import *
12 import utils
13 import systeminfo
14 import ModelOptions
15
16
17 def Run( vars, log ):
18     """
19     See if a node installation is valid. More checks should certainly be
20     done in the future, but for now, make sure that the sym links kernel-boot
21     exist in /boot
22     
23     Expect the following variables to be set:
24     SYSIMG_PATH              the path where the system image will be mounted
25                              (always starts with TEMP_PATH)
26     ROOT_MOUNTED             the node root file system is mounted
27     NODE_ID                  The db node_id for this machine
28     PLCONF_DIR               The directory to store the configuration file in
29     
30     Set the following variables upon successfully running:
31     ROOT_MOUNTED             the node root file system is mounted
32     """
33
34     log.write( "\n\nStep: Validating node installation.\n" )
35
36     # make sure we have the variables we need
37     try:
38         SYSIMG_PATH= vars["SYSIMG_PATH"]
39         if SYSIMG_PATH == "":
40             raise ValueError, "SYSIMG_PATH"
41
42         NODE_ID= vars["NODE_ID"]
43         if NODE_ID == "":
44             raise ValueError, "NODE_ID"
45
46         PLCONF_DIR= vars["PLCONF_DIR"]
47         if PLCONF_DIR == "":
48             raise ValueError, "PLCONF_DIR"
49         
50         NODE_MODEL_OPTIONS= vars["NODE_MODEL_OPTIONS"]
51
52         PARTITIONS= vars["PARTITIONS"]
53         if PARTITIONS == None:
54             raise ValueError, "PARTITIONS"
55
56     except KeyError, var:
57         raise BootManagerException, "Missing variable in vars: %s\n" % var
58     except ValueError, var:
59         raise BootManagerException, "Variable in vars, shouldn't be: %s\n" % var
60
61
62     ROOT_MOUNTED= 0
63     if vars.has_key('ROOT_MOUNTED'):
64         ROOT_MOUNTED= vars['ROOT_MOUNTED']
65
66     # mount the root system image if we haven't already.
67     # capture BootManagerExceptions during the vgscan/change and mount
68     # calls, so we can return 0 instead
69     if ROOT_MOUNTED == 0:
70             
71         # simply creating an instance of this class and listing the system
72         # block devices will make them show up so vgscan can find the planetlab
73         # volume group
74         systeminfo.get_block_device_list(vars, log)
75
76         try:
77             utils.sysexec( "vgscan", log )
78             utils.sysexec( "vgchange -ay planetlab", log )
79         except BootManagerException, e:
80             log.write( "BootManagerException during vgscan/vgchange: %s\n" %
81                        str(e) )
82             return 0
83             
84         utils.makedirs( SYSIMG_PATH )
85
86         # xxx - TODO - need to fsck the btrfs partition
87         if vars['virt'] == 'vs':
88             filesystems_tocheck = ['root', 'vservers']
89         else:
90             filesystems_tocheck = ['root']
91
92         for filesystem in filesystems_tocheck:
93             try:
94                 # first run fsck to prevent fs corruption from hanging mount...
95                 log.write( "fsck %s file system\n" % filesystem )
96                 utils.sysexec("e2fsck -v -p %s" % (PARTITIONS[filesystem]), log, fsck=True)
97             except BootManagerException, e:
98                 log.write( "BootManagerException during fsck of %s (%s) filesystem : %s\n" %
99                            (filesystem, PARTITIONS[filesystem], str(e)) )
100                 try:
101                     log.write( "Trying to recover filesystem errors on %s\n" % filesystem )
102                     utils.sysexec("e2fsck -v -y %s" % (PARTITIONS[filesystem]),log, fsck=True)
103                 except BootManagerException, e:
104                     log.write( "BootManagerException during trying to recover filesystem errors on %s (%s) filesystem : %s\n" %
105                            (filesystem, PARTITIONS[filesystem], str(e)) )
106                     return -1
107             else:
108                 # disable time/count based filesystems checks
109                 utils.sysexec_noerr( "tune2fs -c -1 -i 0 %s" % PARTITIONS[filesystem], log)
110
111         try:
112             # then attempt to mount them
113             log.write( "mounting root file system\n" )
114             utils.sysexec("mount -t ext3 %s %s" % (PARTITIONS["root"],SYSIMG_PATH),log)
115         except BootManagerException, e:
116             log.write( "BootManagerException during mount of /root: %s\n" % str(e) )
117             return -2
118             
119         try:
120             PROC_PATH = "%s/proc" % SYSIMG_PATH
121             utils.makedirs(PROC_PATH)
122             log.write( "mounting /proc\n" )
123             utils.sysexec( "mount -t proc none %s" % PROC_PATH, log )
124         except BootManagerException, e:
125             log.write( "BootManagerException during mount of /proc: %s\n" % str(e) )
126             return -2
127
128
129         one_partition = vars['ONE_PARTITION']=='1'
130
131         if (not one_partition):
132             try:
133                 VSERVERS_PATH = "%s/vservers" % SYSIMG_PATH
134                 utils.makedirs(VSERVERS_PATH)
135                 log.write( "mounting vservers partition in root file system\n" )
136                 if vars['virt']=='vs':
137                     utils.sysexec("mount -t ext3 %s %s" % (PARTITIONS["vservers"], VSERVERS_PATH), log)
138                 else:
139                     utils.sysexec("mount -t btrfs %s %s" % (PARTITIONS["vservers"], VSERVERS_PATH), log)
140             except BootManagerException, e:
141                 log.write( "BootManagerException during mount of /vservers: %s\n" % str(e) )
142                 return -2
143
144         ROOT_MOUNTED= 1
145         vars['ROOT_MOUNTED']= 1
146         
147     # check if the base kernel is installed 
148     # these 2 links are created by our kernel's post-install scriplet
149     log.write("Checking for a custom kernel\n")
150     try:
151         if vars['virt'] == 'vs':
152             os.stat("%s/boot/kernel-boot" % SYSIMG_PATH)
153         else:
154             try:
155                 kversion = os.popen("chroot %s rpm -qa kernel | tail -1 | cut -c 8-" % SYSIMG_PATH).read().rstrip()
156                 os.stat("%s/boot/vmlinuz-%s" % (SYSIMG_PATH,kversion))
157                 major_version = int(kversion[0]) # Check if the string looks like a kernel version
158             except:
159                 kversion = os.popen("ls -lrt %s/lib/modules | tail -1 | awk '{print $9;}'"%SYSIMG_PATH).read().rstrip()
160     except OSError, e:            
161         log.write( "Couldn't locate base kernel (you might be using the stock kernel).\n")
162         return -3
163
164     # check if the model specified kernel is installed
165     option = ''
166     if NODE_MODEL_OPTIONS & ModelOptions.SMP:
167         option = 'smp'
168         try:
169             os.stat("%s/boot/kernel-boot%s" % (SYSIMG_PATH,option))
170         except OSError, e:
171             # smp kernel is not there; remove option from modeloptions
172             # such that the rest of the code base thinks we are just
173             # using the base kernel.
174             NODE_MODEL_OPTIONS = NODE_MODEL_OPTIONS & ~ModelOptions.SMP
175             vars["NODE_MODEL_OPTIONS"] = NODE_MODEL_OPTIONS
176             log.write( "WARNING: Couldn't locate smp kernel.\n")
177             
178     # write out the node id to /etc/planetlab/node_id. if this fails, return
179     # 0, indicating the node isn't a valid install.
180     try:
181         node_id_file_path= "%s/%s/node_id" % (SYSIMG_PATH,PLCONF_DIR)
182         node_id_file= file( node_id_file_path, "w" )
183         node_id_file.write( str(NODE_ID) )
184         node_id_file.close()
185         node_id_file= None
186         log.write( "Updated /etc/planetlab/node_id\n" )
187     except IOError, e:
188         log.write( "Unable to write out /etc/planetlab/node_id\n" )
189         return 0
190
191     log.write( "Node installation appears to be ok\n" )
192     
193     return 1