bugfixes for the location of kernel and initrd as observed on recent f23
[bootmanager.git] / source / steps / ValidateNodeInstall.py
1 #!/usr/bin/python
2 #
3 # Copyright (c) 2003 Intel Corporation
4 # All rights reserved.
5 #
6 # Copyright (c) 2004-2006 The Trustees of Princeton University
7 # All rights reserved.
8
9 import os
10
11 from Exceptions import *
12 import utils
13 import systeminfo
14 import ModelOptions
15
16
17 def Run(vars, log):
18     """
19     See if a node installation is valid. More checks should certainly be
20     done in the future, but for now, make sure that the sym links kernel-boot
21     exist in /boot
22     
23     Expect the following variables to be set:
24     SYSIMG_PATH              the path where the system image will be mounted
25                              (always starts with TEMP_PATH)
26     ROOT_MOUNTED             the node root file system is mounted
27     NODE_ID                  The db node_id for this machine
28     PLCONF_DIR               The directory to store the configuration file in
29     
30     Set the following variables upon successfully running:
31     ROOT_MOUNTED             the node root file system is mounted
32     """
33
34     log.write("\n\nStep: Validating node installation.\n")
35
36     # make sure we have the variables we need
37     try:
38         SYSIMG_PATH = vars["SYSIMG_PATH"]
39         if SYSIMG_PATH == "":
40             raise ValueError("SYSIMG_PATH")
41
42         NODE_ID = vars["NODE_ID"]
43         if NODE_ID == "":
44             raise ValueError("NODE_ID")
45
46         PLCONF_DIR = vars["PLCONF_DIR"]
47         if PLCONF_DIR == "":
48             raise ValueError("PLCONF_DIR")
49         
50         NODE_MODEL_OPTIONS = vars["NODE_MODEL_OPTIONS"]
51
52         PARTITIONS = vars["PARTITIONS"]
53         if PARTITIONS == None:
54             raise ValueError("PARTITIONS")
55
56     except KeyError as var:
57         raise BootManagerException("Missing variable in vars: {}\n".format(var))
58     except ValueError as var:
59         raise BootManagerException("Variable in vars, shouldn't be: {}\n".format(var))
60
61
62     ROOT_MOUNTED = 0
63     if vars.has_key('ROOT_MOUNTED'):
64         ROOT_MOUNTED = vars['ROOT_MOUNTED']
65
66     # mount the root system image if we haven't already.
67     # capture BootManagerExceptions during the vgscan/change and mount
68     # calls, so we can return 0 instead
69     if ROOT_MOUNTED == 0:
70             
71         # simply creating an instance of this class and listing the system
72         # block devices will make them show up so vgscan can find the planetlab
73         # volume group
74         systeminfo.get_block_devices_dict(vars, log)
75
76         try:
77             utils.sysexec("vgscan", log)
78             utils.sysexec("vgchange -ay planetlab", log)
79         except BootManagerException as e:
80             log.write("BootManagerException during vgscan/vgchange: {}\n".format(e))
81             return 0
82             
83         utils.makedirs(SYSIMG_PATH)
84
85         # xxx - TODO - need to fsck the btrfs partition
86         if vars['virt'] == 'vs':
87             filesystems_tocheck = ['root', 'vservers']
88         else:
89             filesystems_tocheck = ['root']
90
91         for filesystem in filesystems_tocheck:
92             try:
93                 # first run fsck to prevent fs corruption from hanging mount...
94                 log.write("fsck {} file system\n".format(filesystem))
95                 utils.sysexec("e2fsck -v -p {}".format(PARTITIONS[filesystem]), log, fsck=True)
96             except BootManagerException as e:
97                 log.write("BootManagerException during fsck of {} ({}) filesystem : {}\n"\
98                           .format(filesystem, PARTITIONS[filesystem], str(e)))
99                 try:
100                     log.write("Trying to recover filesystem errors on {}\n".format(filesystem))
101                     utils.sysexec("e2fsck -v -y {}".format(PARTITIONS[filesystem]), log, fsck=True)
102                 except BootManagerException as e:
103                     log.write("BootManagerException while trying to recover"
104                               "filesystem errors on {} ({}) filesystem : {}\n"
105                               .format(filesystem, PARTITIONS[filesystem], str(e)))
106                     return -1
107             else:
108                 # disable time/count based filesystems checks
109                 utils.sysexec_noerr("tune2fs -c -1 -i 0 {}".format(PARTITIONS[filesystem]), log)
110
111         try:
112             # then attempt to mount them
113             log.write("mounting root file system\n")
114             utils.sysexec("mount -t ext3 {} {}".format(PARTITIONS["root"], SYSIMG_PATH),log)
115         except BootManagerException as e:
116             log.write("BootManagerException during mount of /root: {}\n".format(str(e)))
117             return -2
118             
119         try:
120             PROC_PATH = "{}/proc".format(SYSIMG_PATH)
121             utils.makedirs(PROC_PATH)
122             log.write("mounting /proc\n")
123             utils.sysexec("mount -t proc none {}".format(PROC_PATH), log)
124         except BootManagerException as e:
125             log.write("BootManagerException during mount of /proc: {}\n".format(str(e)))
126             return -2
127
128
129         one_partition = vars['ONE_PARTITION']=='1'
130
131         if (not one_partition):
132             try:
133                 VSERVERS_PATH = "{}/vservers".format(SYSIMG_PATH)
134                 utils.makedirs(VSERVERS_PATH)
135                 log.write("mounting vservers partition in root file system\n")
136                 if vars['virt'] == 'vs':
137                     utils.sysexec("mount -t ext3 {} {}".format(PARTITIONS["vservers"], VSERVERS_PATH), log)
138                 else:
139                     utils.sysexec("mount -t btrfs {} {}".format(PARTITIONS["vservers"], VSERVERS_PATH), log)
140             except BootManagerException as e:
141                 log.write("BootManagerException while mounting /vservers: {}\n".format(str(e)))
142                 return -2
143
144         ROOT_MOUNTED = 1
145         vars['ROOT_MOUNTED'] = 1
146         
147     # check if the base kernel is installed 
148     # these 2 links are created by our kernel's post-install scriplet
149     log.write("Checking for a custom kernel\n")
150     try:
151         if vars['virt'] == 'vs':
152             os.stat("{}/boot/kernel-boot".format(SYSIMG_PATH))
153         else:
154             try:
155                 kversion = os.popen("chroot {} rpm -qa kernel | tail -1 | cut -c 8-"\
156                                     .format(SYSIMG_PATH)).read().rstrip()
157                 os.stat("{}/boot/vmlinuz-{}".format(SYSIMG_PATH, kversion))
158                 major_version = int(kversion[0]) # Check if the string looks like a kernel version
159             except:
160                 kversion = os.popen("ls -lrt {}/lib/modules | tail -1 | awk '{{print $9;}}'"\
161                                     .format(SYSIMG_PATH)).read().rstrip()
162     except OSError as e:            
163         log.write("Couldn't locate base kernel (you might be using the stock kernel).\n")
164         return -3
165
166     # check if the model specified kernel is installed
167     option = ''
168     if NODE_MODEL_OPTIONS & ModelOptions.SMP:
169         option = 'smp'
170         try:
171             os.stat("{}/boot/kernel-boot{}".format(SYSIMG_PATH, option))
172         except OSError as e:
173             # smp kernel is not there; remove option from modeloptions
174             # such that the rest of the code base thinks we are just
175             # using the base kernel.
176             NODE_MODEL_OPTIONS = NODE_MODEL_OPTIONS & ~ModelOptions.SMP
177             vars["NODE_MODEL_OPTIONS"] = NODE_MODEL_OPTIONS
178             log.write("WARNING: Couldn't locate smp kernel.\n")
179             
180     # write out the node id to /etc/planetlab/node_id. if this fails, return
181     # 0, indicating the node isn't a valid install.
182     try:
183         node_id_file_path = "{}/{}/node_id".format(SYSIMG_PATH, PLCONF_DIR)
184         node_id_file = file(node_id_file_path, "w")
185         node_id_file.write(str(NODE_ID))
186         node_id_file.close()
187         node_id_file = None
188         log.write("Updated /etc/planetlab/node_id\n")
189     except IOError as e:
190         log.write("Unable to write out /etc/planetlab/node_id\n")
191         return 0
192
193     log.write("Node installation appears to be ok\n")
194     
195     return 1