no real change, just made prettier with a more standard layout - half of steps
[bootmanager.git] / source / steps / InstallPartitionDisks.py
1 #!/usr/bin/python
2 #
3 # Copyright (c) 2003 Intel Corporation
4 # All rights reserved.
5 #
6 # Copyright (c) 2004-2006 The Trustees of Princeton University
7 # All rights reserved.
8 # expected /proc/partitions format
9
10 import os, sys
11 import string
12 import popen2
13 import time
14
15 from Exceptions import *
16 import utils
17 import BootServerRequest
18 import BootAPI
19 import ModelOptions
20
21 def Run(vars, log):
22     """
23     Setup the block devices for install, partition them w/ LVM
24     
25     Expect the following variables from the store:
26     INSTALL_BLOCK_DEVICES    list of block devices to install onto
27     TEMP_PATH                somewhere to store what we need to run
28     ROOT_SIZE                the size of the root logical volume
29     SWAP_SIZE                the size of the swap partition
30     """
31
32     log.write("\n\nStep: Install: partitioning disks.\n")
33         
34     # make sure we have the variables we need
35     try:
36         TEMP_PATH = vars["TEMP_PATH"]
37         if TEMP_PATH == "":
38             raise ValueError("TEMP_PATH")
39
40         INSTALL_BLOCK_DEVICES = vars["INSTALL_BLOCK_DEVICES"]
41         if(len(INSTALL_BLOCK_DEVICES) == 0):
42             raise ValueError("INSTALL_BLOCK_DEVICES is empty")
43
44         # use vs_ROOT_SIZE or lxc_ROOT_SIZE as appropriate
45         varname = vars['virt'] + "_ROOT_SIZE"
46         ROOT_SIZE = vars[varname]
47         if ROOT_SIZE == "" or ROOT_SIZE == 0:
48             raise ValueError("ROOT_SIZE invalid")
49
50         SWAP_SIZE = vars["SWAP_SIZE"]
51         if SWAP_SIZE == "" or SWAP_SIZE == 0:
52             raise ValueError("SWAP_SIZE invalid")
53
54         NODE_MODEL_OPTIONS = vars["NODE_MODEL_OPTIONS"]
55
56         PARTITIONS = vars["PARTITIONS"]
57         if PARTITIONS == None:
58             raise ValueError("PARTITIONS")
59
60         if NODE_MODEL_OPTIONS & ModelOptions.RAWDISK:
61             VSERVERS_SIZE = "-1"
62             if "VSERVERS_SIZE" in vars:
63                 VSERVERS_SIZE = vars["VSERVERS_SIZE"]
64                 if VSERVERS_SIZE == "" or VSERVERS_SIZE == 0:
65                     raise ValueError("VSERVERS_SIZE")
66
67     except KeyError as var:
68         raise BootManagerException("Missing variable in vars: {}\n".format(var))
69     except ValueError as var:
70         raise BootManagerException("Variable in vars, shouldn't be: {}\n".format(var))
71
72     bs_request = BootServerRequest.BootServerRequest(vars)
73
74     
75     # disable swap if its on
76     utils.sysexec_noerr("swapoff {}".format(PARTITIONS["swap"]), log)
77
78     # shutdown and remove any lvm groups/volumes
79     utils.sysexec_noerr("vgscan", log)
80     utils.sysexec_noerr("vgchange -ay", log)        
81     utils.sysexec_noerr("lvremove -f {}".format(PARTITIONS["root"]), log)
82     utils.sysexec_noerr("lvremove -f {}".format(PARTITIONS["swap"]), log)
83     utils.sysexec_noerr("lvremove -f {}".format(PARTITIONS["vservers"]), log)
84     utils.sysexec_noerr("vgchange -an", log)
85     utils.sysexec_noerr("vgremove -f planetlab", log)
86
87     log.write("Running vgscan for devices\n")
88     utils.sysexec_noerr("vgscan", log)
89     
90     used_devices = []
91
92     INSTALL_BLOCK_DEVICES.sort()
93
94     for device in INSTALL_BLOCK_DEVICES:
95         if single_partition_device(device, vars, log):
96             if (len(used_devices) > 0 and
97                 (vars['NODE_MODEL_OPTIONS'] & ModelOptions.RAWDISK)):
98                 log.write("Running in raw disk mode, not using {}.\n".format(device))
99             else:
100                 used_devices.append(device)
101                 log.write("Successfully initialized {}\n".format(device))
102         else:
103             log.write("Unable to partition {], not using it.\n".format(device))
104             continue
105
106     # list of devices to be used with vgcreate
107     vg_device_list = ""
108
109     # get partitions
110     partitions = []
111     for device in used_devices:
112         part_path = get_partition_path_from_device(device, vars, log)
113         partitions.append(part_path)
114    
115     # create raid partition
116     raid_partition = create_raid_partition(partitions, vars, log)
117     if raid_partition != None:
118         partitions = [raid_partition]      
119     log.write("PARTITIONS {}\n".format(str(partitions)))
120     # initialize the physical volumes
121     for part_path in partitions:
122         if not create_lvm_physical_volume(part_path, vars, log):
123             raise BootManagerException("Could not create lvm physical volume "
124                                        "on partition {}".format(part_path))
125         vg_device_list = vg_device_list + " " + part_path
126
127     # create an lvm volume group
128     utils.sysexec("vgcreate -s32M planetlab {}".format(vg_device_list), log)
129
130     # create swap logical volume
131     utils.sysexec("lvcreate -L{} -nswap planetlab".format(SWAP_SIZE), log)
132
133     # check if we want a separate partition for VMs
134     one_partition = vars['ONE_PARTITION']=='1'
135     if (one_partition):
136         remaining_extents = get_remaining_extents_on_vg(vars, log)
137         utils.sysexec("lvcreate -l{} -nroot planetlab".format(remaining_extents), log)
138     else:
139         utils.sysexec("lvcreate -L{} -nroot planetlab".format(ROOT_SIZE), log)
140         if vars['NODE_MODEL_OPTIONS'] & ModelOptions.RAWDISK and VSERVERS_SIZE != "-1":
141             utils.sysexec("lvcreate -L{} -nvservers planetlab".format(VSERVERS_SIZE), log)
142             remaining_extents = get_remaining_extents_on_vg(vars, log)
143             utils.sysexec("lvcreate -l{} -nrawdisk planetlab".format(remaining_extents), log)
144         else:
145             # create vservers logical volume with all remaining space
146             # first, we need to get the number of remaining extents we can use
147             remaining_extents = get_remaining_extents_on_vg(vars, log)
148             utils.sysexec("lvcreate -l{} -nvservers planetlab".format(remaining_extents), log)
149
150     # activate volume group (should already be active)
151     #utils.sysexec(TEMP_PATH + "vgchange -ay planetlab", log)
152
153     # make swap
154     utils.sysexec("mkswap -f {}".format(PARTITIONS["swap"]), log)
155
156     # check if badhd option has been set
157     option = ''
158     txt = ''
159     if NODE_MODEL_OPTIONS & ModelOptions.BADHD:
160         option = '-c'
161         txt = " with bad block search enabled, which may take a while"
162     
163     # filesystems partitions names and their corresponding
164     # reserved-blocks-percentages
165     filesystems = {"root":5,"vservers":0}
166
167     # ROOT filesystem is always with ext2
168     fs = 'root'
169     rbp = filesystems[fs]
170     devname = PARTITIONS[fs]
171     log.write("formatting {} partition ({}){}.\n".format(fs, devname, txt))
172     utils.sysexec("mkfs.ext2 -q {} -m {} -j {}".format(option, rbp, devname), log)
173     # disable time/count based filesystems checks
174     utils.sysexec_noerr("tune2fs -c -1 -i 0 {}".format(devname), log)
175
176     # VSERVER filesystem with btrfs to support snapshoting and stuff
177     fs = 'vservers'
178     rbp = filesystems[fs]
179     devname = PARTITIONS[fs]
180     if vars['virt'] == 'vs':
181         log.write("formatting {} partition ({}){}.\n".format(fs, devname, txt))
182         utils.sysexec("mkfs.ext2 -q {} -m {} -j {}".format(option, rbp, devname)), log)
183         # disable time/count based filesystems checks
184         utils.sysexec_noerr("tune2fs -c -1 -i 0 {}".format(devname), log)
185     elif not one_partition:
186         log.write("formatting {} btrfs partition ({}).\n".format(fs, devname))
187         # early BootCD's seem to come with a version of mkfs.btrfs that does not support -f
188         # let's check for that before invoking it
189         mkfs = "mkfs.btrfs"
190         if os.system("mkfs.btrfs --help 2>&1 | grep force") == 0:
191             mkfs += " -f"
192         mkfs +=" {}".format(devname)
193         utils.sysexec(mkfs, log)
194         # as of 2013/02 it looks like there's not yet an option to set fsck frequency with btrfs
195
196     # save the list of block devices in the log
197     log.write("Block devices used (in lvm): {}\n".format(repr(used_devices)))
198
199     # list of block devices used may be updated
200     vars["INSTALL_BLOCK_DEVICES"] = used_devices
201
202     return 1
203
204
205 import parted
206 def single_partition_device(device, vars, log):
207     """
208     initialize a disk by removing the old partition tables,
209     and creating a new single partition that fills the disk.
210
211     return 1 if sucessful, 0 otherwise
212     """
213
214     # two forms, depending on which version of pyparted we have
215     # v1 does not have a 'version' method
216     # v2 and above does, but to make it worse, 
217     # parted-3.4 on f14 has parted.version broken and raises SystemError
218     try:
219         parted.version()
220         return single_partition_device_2_x (device, vars, log)
221     except AttributeError:
222         # old parted does not have version at all
223         return single_partition_device_1_x (device, vars, log)
224     except SystemError:
225         # let's assume this is >=2
226         return single_partition_device_2_x (device, vars, log)
227     except:
228         raise
229
230 def single_partition_device_1_x (device, vars, log):
231     
232     lvm_flag = parted.partition_flag_get_by_name('lvm')
233     
234     try:
235         log.write("Using pyparted 1.x\n")
236         # wipe the old partition table
237         utils.sysexec("dd if=/dev/zero of={} bs=512 count=1".format(device), log)
238
239         # get the device
240         dev = parted.PedDevice.get(device)
241
242         # create a new partition table
243         disk = dev.disk_new_fresh(parted.disk_type_get("msdos"))
244
245         # create one big partition on each block device
246         constraint = dev.constraint_any()
247
248         new_part = disk.partition_new(
249             parted.PARTITION_PRIMARY,
250             parted.file_system_type_get("ext2"),
251             0, 1)
252
253         # make it an lvm partition
254         new_part.set_flag(lvm_flag,1)
255
256         # actually add the partition to the disk
257         disk.add_partition(new_part, constraint)
258
259         disk.maximize_partition(new_part,constraint)
260
261         disk.commit()
262         del disk
263             
264     except BootManagerException as e:
265         log.write("BootManagerException while running: {}\n".format(str(e)))
266         return 0
267
268     except parted.error as e:
269         log.write("parted exception while running: {}\n".format(str(e)))
270         return 0
271                    
272     return 1
273
274
275
276 def single_partition_device_2_x (device, vars, log):
277     try:
278         log.write("Using pyparted 2.x\n")
279
280         # Thierry june 2012 -- for disks larger than 2TB
281         # calling this with part_type='msdos' would fail at the maximizePartition stage
282         # create a new partition table
283         def partition_table (device, part_type, fs_type):
284             # wipe the old partition table
285             utils.sysexec("dd if=/dev/zero of={} bs=512 count=1".format(device), log)
286             # get the device
287             dev = parted.Device(device)
288             disk = parted.freshDisk(dev, part_type)
289             # create one big partition on each block device
290             constraint = parted.constraint.Constraint (device=dev)
291             geometry = parted.geometry.Geometry (device=dev, start=0, end=1)
292             fs = parted.filesystem.FileSystem (type=fs_type, geometry=geometry)
293             new_part = parted.partition.Partition (disk, type=parted.PARTITION_NORMAL,
294                                                   fs=fs, geometry=geometry)
295             # make it an lvm partition
296             new_part.setFlag(parted.PARTITION_LVM)
297             # actually add the partition to the disk
298             disk.addPartition(new_part, constraint)
299             disk.maximizePartition(new_part, constraint)
300             disk.commit()
301             log.write ("Current disk for {} - partition type {}\n{}\n".format(device, part_type, disk))
302             log.write ("Current dev for {}\n{}\n".format(device, dev))
303             del disk
304
305         try:
306             partition_table (device, 'msdos', 'ext2')
307         except:
308             partition_table (device, 'gpt', 'ext2')
309
310     except Exception as e:
311         log.write("Exception inside single_partition_device_2_x : {}\n".format(str(e)))
312         import traceback
313         traceback.print_exc(file=log)
314         return 0
315                    
316     return 1
317
318
319
320 def create_lvm_physical_volume(part_path, vars, log):
321     """
322     make the specificed partition a lvm physical volume.
323
324     return 1 if successful, 0 otherwise.
325     """
326
327     try:
328         # again, wipe any old data, this time on the partition
329         utils.sysexec("dd if=/dev/zero of={} bs=512 count=1".format(part_path), log)
330         ### patch Thierry Parmentelat, required on some hardware
331         import time
332         time.sleep(1)
333         utils.sysexec("pvcreate -ffy {}".format(part_path), log)
334     except BootManagerException as e:
335         log.write("create_lvm_physical_volume failed.\n")
336         return 0
337
338     return 1
339
340
341 def create_raid_partition(partitions, vars, log):
342     """
343     create raid array using specified partitions.  
344     """ 
345     raid_part = None
346     raid_enabled = False
347     node_tags = BootAPI.call_api_function(vars, "GetNodeTags",
348                                           ({'node_id': vars['NODE_ID']},))
349     for node_tag in node_tags:
350         if node_tag['tagname'] == 'raid_enabled' and \
351            node_tag['value'] == '1':
352             raid_enabled = True
353             break
354     if not raid_enabled:
355         return raid_part
356
357     try:
358         log.write("Software raid enabled.\n")
359         # wipe everything
360         utils.sysexec_noerr("mdadm --stop /dev/md0", log)
361         time.sleep(1)
362         for part_path in partitions:
363             utils.sysexec_noerr("mdadm --zero-superblock {} ".format(part_path), log)
364
365         # assume each partiton is on a separate disk
366         num_parts = len(partitions)
367         if num_parts < 2:
368             log.write("Not enough disks for raid. Found: {}\n".format(partitions))
369             raise BootManagerException("Not enough disks for raid. Found: {}\n".format(partitions))
370         if num_parts == 2:
371             lvl = 1
372         else:
373             lvl = 5
374         
375         # make the array
376         part_list = " ".join(partitions)
377         raid_part = "/dev/md0"
378         cmd = "mdadm --create {raid_part} --chunk=128 --level=raid{lvl} "\
379               "--raid-devices={num_parts} {part_list}".format(**locals())
380         utils.sysexec(cmd, log)
381
382     except BootManagerException as e:
383         log.write("create_raid_partition failed.\n")
384         raid_part = None
385
386     return raid_part  
387
388
389 def get_partition_path_from_device(device, vars, log):
390     """
391     given a device, return the path of the first partition on the device
392     """
393
394     # those who wrote the cciss driver just had to make it difficult
395     cciss_test = "/dev/cciss"
396     if device[:len(cciss_test)] == cciss_test:
397         part_path = device + "p1"
398     else:
399         part_path = device + "1"
400
401     return part_path
402
403
404
405 def get_remaining_extents_on_vg(vars, log):
406     """
407     return the free amount of extents on the planetlab volume group
408     """
409     
410     c_stdout, c_stdin = popen2.popen2("vgdisplay -c planetlab")
411     result = string.strip(c_stdout.readline())
412     c_stdout.close()
413     c_stdin.close()
414     remaining_extents = string.split(result, ":")[15]
415     
416     return remaining_extents