merged from master - support for big disks - should be fine now
[bootmanager.git] / source / steps / InstallPartitionDisks.py
1 #!/usr/bin/python
2 #
3 # Copyright (c) 2003 Intel Corporation
4 # All rights reserved.
5 #
6 # Copyright (c) 2004-2006 The Trustees of Princeton University
7 # All rights reserved.
8 # expected /proc/partitions format
9
10 import os, sys
11 import string
12 import popen2
13 import time
14
15 from Exceptions import *
16 import utils
17 import BootServerRequest
18 import BootAPI
19 import ModelOptions
20
21 def Run( vars, log ):
22     """
23     Setup the block devices for install, partition them w/ LVM
24     
25     Expect the following variables from the store:
26     INSTALL_BLOCK_DEVICES    list of block devices to install onto
27     TEMP_PATH                somewhere to store what we need to run
28     ROOT_SIZE                the size of the root logical volume
29     SWAP_SIZE                the size of the swap partition
30     """
31
32     log.write( "\n\nStep: Install: partitioning disks.\n" )
33         
34     # make sure we have the variables we need
35     try:
36         TEMP_PATH= vars["TEMP_PATH"]
37         if TEMP_PATH == "":
38             raise ValueError, "TEMP_PATH"
39
40         INSTALL_BLOCK_DEVICES= vars["INSTALL_BLOCK_DEVICES"]
41         if( len(INSTALL_BLOCK_DEVICES) == 0 ):
42             raise ValueError, "INSTALL_BLOCK_DEVICES is empty"
43
44         ROOT_SIZE= vars["ROOT_SIZE"]
45         if ROOT_SIZE == "" or ROOT_SIZE == 0:
46             raise ValueError, "ROOT_SIZE invalid"
47
48         SWAP_SIZE= vars["SWAP_SIZE"]
49         if SWAP_SIZE == "" or SWAP_SIZE == 0:
50             raise ValueError, "SWAP_SIZE invalid"
51
52         NODE_MODEL_OPTIONS= vars["NODE_MODEL_OPTIONS"]
53
54         PARTITIONS= vars["PARTITIONS"]
55         if PARTITIONS == None:
56             raise ValueError, "PARTITIONS"
57
58         if NODE_MODEL_OPTIONS & ModelOptions.RAWDISK:
59             VSERVERS_SIZE= "-1"
60             if "VSERVERS_SIZE" in vars:
61                 VSERVERS_SIZE= vars["VSERVERS_SIZE"]
62                 if VSERVERS_SIZE == "" or VSERVERS_SIZE == 0:
63                     raise ValueError, "VSERVERS_SIZE"
64
65     except KeyError, var:
66         raise BootManagerException, "Missing variable in vars: %s\n" % var
67     except ValueError, var:
68         raise BootManagerException, "Variable in vars, shouldn't be: %s\n" % var
69
70     bs_request= BootServerRequest.BootServerRequest(vars)
71
72     
73     # disable swap if its on
74     utils.sysexec_noerr( "swapoff %s" % PARTITIONS["swap"], log )
75
76     # shutdown and remove any lvm groups/volumes
77     utils.sysexec_noerr( "vgscan", log )
78     utils.sysexec_noerr( "vgchange -ay", log )        
79     utils.sysexec_noerr( "lvremove -f %s" % PARTITIONS["root"], log )
80     utils.sysexec_noerr( "lvremove -f %s" % PARTITIONS["swap"], log )
81     utils.sysexec_noerr( "lvremove -f %s" % PARTITIONS["vservers"], log )
82     utils.sysexec_noerr( "vgchange -an", log )
83     utils.sysexec_noerr( "vgremove -f planetlab", log )
84
85     log.write( "Running vgscan for devices\n" )
86     utils.sysexec_noerr( "vgscan", log )
87     
88     used_devices= []
89
90     INSTALL_BLOCK_DEVICES.sort()
91     for device in INSTALL_BLOCK_DEVICES:
92
93         if single_partition_device( device, vars, log ):
94             if (len(used_devices) > 0 and
95                 (vars['NODE_MODEL_OPTIONS'] & ModelOptions.RAWDISK)):
96                 log.write( "Running in raw disk mode, not using %s.\n" % device )
97             else:
98                 used_devices.append( device )
99                 log.write( "Successfully initialized %s\n" % device )
100         else:
101             log.write( "Unable to partition %s, not using it.\n" % device )
102             continue
103
104     # list of devices to be used with vgcreate
105     vg_device_list= ""
106
107     # get partitions
108     partitions = []
109     for device in used_devices:
110         part_path= get_partition_path_from_device( device, vars, log )
111         partitions.append(part_path)
112    
113     # create raid partition
114     raid_partition = create_raid_partition(partitions, vars, log)
115     if raid_partition != None:
116         partitions = [raid_partition]      
117     log.write("PARTITIONS %s\n" %  str(partitions)) 
118     # initialize the physical volumes
119     for part_path in partitions:
120         if not create_lvm_physical_volume( part_path, vars, log ):
121             raise BootManagerException, "Could not create lvm physical volume " \
122                   "on partition %s" % part_path
123         vg_device_list = vg_device_list + " " + part_path
124
125     # create an lvm volume group
126     utils.sysexec( "vgcreate -s32M planetlab %s" % vg_device_list, log)
127
128     # create swap logical volume
129     utils.sysexec( "lvcreate -L%s -nswap planetlab" % SWAP_SIZE, log )
130
131     # create root logical volume
132     utils.sysexec( "lvcreate -L%s -nroot planetlab" % ROOT_SIZE, log )
133
134     if vars['NODE_MODEL_OPTIONS'] & ModelOptions.RAWDISK and VSERVERS_SIZE != "-1":
135         utils.sysexec( "lvcreate -L%s -nvservers planetlab" % VSERVERS_SIZE, log )
136         remaining_extents= get_remaining_extents_on_vg( vars, log )
137         utils.sysexec( "lvcreate -l%s -nrawdisk planetlab" % remaining_extents, log )
138     else:
139         # create vservers logical volume with all remaining space
140         # first, we need to get the number of remaining extents we can use
141         remaining_extents= get_remaining_extents_on_vg( vars, log )
142         
143         utils.sysexec( "lvcreate -l%s -nvservers planetlab" % remaining_extents, log )
144
145     # activate volume group (should already be active)
146     #utils.sysexec( TEMP_PATH + "vgchange -ay planetlab", log )
147
148     # make swap
149     utils.sysexec( "mkswap -f %s" % PARTITIONS["swap"], log )
150
151     # check if badhd option has been set
152     option = ''
153     txt = ''
154     if NODE_MODEL_OPTIONS & ModelOptions.BADHD:
155         option = '-c'
156         txt = " with bad block search enabled, which may take a while"
157     
158     # filesystems partitions names and their corresponding
159     # reserved-blocks-percentages
160     filesystems = {"root":5,"vservers":0}
161     
162     # ROOT filesystem with ext2
163     fs = 'root'
164     rbp = filesystems[fs]
165     devname = PARTITIONS[fs]
166     log.write("formatting %s partition (%s)%s.\n" % (fs,devname,txt))
167     utils.sysexec( "mkfs.ext2 -q %s -m %d -j %s" % (option,rbp,devname), log )
168
169     # VSERVER filesystem with btrfs to support snapshoting and stuff
170     fs = 'vservers'
171     rbp = filesystems[fs]
172     devname = PARTITIONS[fs]
173     log.write("formatting %s partition (%s)%s.\n" % (fs,devname,txt))
174     utils.sysexec( "mkfs.btrfs %s" % (devname), log )
175
176     # disable time/count based filesystems checks
177     for filesystem in ["root"]:
178         utils.sysexec_noerr( "tune2fs -c -1 -i 0 %s" % PARTITIONS[filesystem], log)
179
180     # save the list of block devices in the log
181     log.write( "Block devices used (in lvm): %s\n" % repr(used_devices))
182
183     # list of block devices used may be updated
184     vars["INSTALL_BLOCK_DEVICES"]= used_devices
185
186     return 1
187
188
189 import parted
190 def single_partition_device( device, vars, log ):
191     """
192     initialize a disk by removing the old partition tables,
193     and creating a new single partition that fills the disk.
194
195     return 1 if sucessful, 0 otherwise
196     """
197
198     # two forms, depending on which version of pyparted we have
199     # v1 does not have a 'version' method
200     # v2 and above does, but to make it worse, 
201     # parted-3.4 on f14 has parted.version broken and raises SystemError
202     try:
203         parted.version()
204         return single_partition_device_2_x (device, vars, log)
205     except AttributeError:
206         # old parted does not have version at all
207         return single_partition_device_1_x (device, vars, log)
208     except SystemError:
209         # let's assume this is >=2
210         return single_partition_device_2_x (device, vars, log)
211     except:
212         raise
213
214 def single_partition_device_1_x ( device, vars, log):
215     
216     lvm_flag= parted.partition_flag_get_by_name('lvm')
217     
218     try:
219         log.write("Using pyparted 1.x\n")
220         # wipe the old partition table
221         utils.sysexec( "dd if=/dev/zero of=%s bs=512 count=1" % device, log )
222
223         # get the device
224         dev= parted.PedDevice.get(device)
225
226         # create a new partition table
227         disk= dev.disk_new_fresh(parted.disk_type_get("msdos"))
228
229         # create one big partition on each block device
230         constraint= dev.constraint_any()
231
232         new_part= disk.partition_new(
233             parted.PARTITION_PRIMARY,
234             parted.file_system_type_get("ext2"),
235             0, 1 )
236
237         # make it an lvm partition
238         new_part.set_flag(lvm_flag,1)
239
240         # actually add the partition to the disk
241         disk.add_partition(new_part, constraint)
242
243         disk.maximize_partition(new_part,constraint)
244
245         disk.commit()
246         del disk
247             
248     except BootManagerException, e:
249         log.write( "BootManagerException while running: %s\n" % str(e) )
250         return 0
251
252     except parted.error, e:
253         log.write( "parted exception while running: %s\n" % str(e) )
254         return 0
255                    
256     return 1
257
258
259
260 def single_partition_device_2_x ( device, vars, log):
261     try:
262         log.write("Using pyparted 2.x\n")
263
264         # Thierry june 2012 -- for disks larger than 2TB
265         # calling this with part_type='msdos' would fail at the maximizePartition stage
266         # create a new partition table
267         def partition_table (device, part_type, fs_type):
268             # wipe the old partition table
269             utils.sysexec( "dd if=/dev/zero of=%s bs=512 count=1" % device, log )
270             # get the device
271             dev= parted.Device(device)
272             disk = parted.freshDisk(dev,part_type)
273             # create one big partition on each block device
274             constraint= parted.constraint.Constraint (device=dev)
275             geometry = parted.geometry.Geometry (device=dev, start=0, end=1)
276             fs = parted.filesystem.FileSystem (type=fs_type,geometry=geometry)
277             new_part= parted.partition.Partition (disk, type=parted.PARTITION_NORMAL,
278                                                   fs=fs, geometry=geometry)
279             # make it an lvm partition
280             new_part.setFlag(parted.PARTITION_LVM)
281             # actually add the partition to the disk
282             disk.addPartition(new_part, constraint)
283             disk.maximizePartition(new_part,constraint)
284             disk.commit()
285             log.write ("Current disk for %s - partition type %s\n%s\n"%(device,part_type,disk))
286             log.write ("Current dev for %s\n%s\n"%(device,dev))
287             del disk
288
289         try:
290             partition_table (device, 'msdos', 'ext2')
291         except:
292             partition_table (device, 'gpt', 'ext2')
293
294     except Exception, e:
295         log.write( "Exception inside single_partition_device_2_x : %s\n" % str(e) )
296         import traceback
297         traceback.print_exc(file=log)
298         return 0
299                    
300     return 1
301
302
303
304 def create_lvm_physical_volume( part_path, vars, log ):
305     """
306     make the specificed partition a lvm physical volume.
307
308     return 1 if successful, 0 otherwise.
309     """
310
311     try:
312         # again, wipe any old data, this time on the partition
313         utils.sysexec( "dd if=/dev/zero of=%s bs=512 count=1" % part_path, log )
314         ### patch Thierry Parmentelat, required on some hardware
315         import time
316         time.sleep(1)
317         utils.sysexec( "pvcreate -ffy %s" % part_path, log )
318     except BootManagerException, e:
319         log.write( "create_lvm_physical_volume failed.\n" )
320         return 0
321
322     return 1
323
324
325 def create_raid_partition(partitions, vars, log):
326     """
327     create raid array using specified partitions.  
328     """ 
329     raid_part = None
330     raid_enabled = False
331     node_tags = BootAPI.call_api_function( vars, "GetNodeTags",
332                                         ({'node_id': vars['NODE_ID']},))
333     for node_tag in node_tags:
334         if node_tag['tagname'] == 'raid_enabled' and \
335            node_tag['value'] == '1':
336             raid_enabled = True
337             break
338     if not raid_enabled:
339         return raid_part
340
341     try:
342         log.write( "Software raid enabled.\n" )
343         # wipe everything
344         utils.sysexec_noerr("mdadm --stop /dev/md0", log)
345         time.sleep(1)
346         for part_path in partitions:
347             utils.sysexec_noerr("mdadm --zero-superblock %s " % part_path, log)
348
349         # assume each partiton is on a separate disk
350         num_parts = len(partitions)
351         if num_parts < 2:
352             log.write( "Not enough disks for raid. Found: %s\n" % partitions )
353             raise BootManagerException("Not enough disks for raid. Found: %s\n" % partitions)  
354         if num_parts == 2:
355             lvl = 1
356         else:
357             lvl = 5   
358         
359         # make the array
360         part_list = " ".join(partitions)
361         raid_part = "/dev/md0"
362         cmd = "mdadm --create %(raid_part)s --chunk=128 --level=raid%(lvl)s " % locals() + \
363               "--raid-devices=%(num_parts)s %(part_list)s" % locals()
364         utils.sysexec(cmd, log)        
365
366     except BootManagerException, e:
367         log.write("create_raid_partition failed.\n")
368         raid_part = None
369
370     return raid_part  
371
372
373 def get_partition_path_from_device( device, vars, log ):
374     """
375     given a device, return the path of the first partition on the device
376     """
377
378     # those who wrote the cciss driver just had to make it difficult
379     cciss_test= "/dev/cciss"
380     if device[:len(cciss_test)] == cciss_test:
381         part_path= device + "p1"
382     else:
383         part_path= device + "1"
384
385     return part_path
386
387
388
389 def get_remaining_extents_on_vg( vars, log ):
390     """
391     return the free amount of extents on the planetlab volume group
392     """
393     
394     c_stdout, c_stdin = popen2.popen2("vgdisplay -c planetlab")
395     result= string.strip(c_stdout.readline())
396     c_stdout.close()
397     c_stdin.close()
398     remaining_extents= string.split(result,":")[15]
399     
400     return remaining_extents