provide a bit more info when check-sys-slice fails
[tests.git] / system / TestNode.py
1 # Thierry Parmentelat <thierry.parmentelat@inria.fr>
2 # Copyright (C) 2010 INRIA 
3 #
4 import sys, os, os.path, time, base64
5 import xmlrpclib
6
7 import utils
8 from TestUser import TestUser
9 from TestBoxQemu import TestBoxQemu
10 from TestSsh import TestSsh
11
12 class TestNode:
13
14     def __init__ (self,test_plc,test_site,node_spec):
15         self.test_plc=test_plc
16         self.test_site=test_site
17         self.node_spec=node_spec
18         
19     def name(self):
20         return self.node_spec['node_fields']['hostname']
21     
22     @staticmethod
23     def is_qemu_model (model):
24         return model.find("qemu") >= 0
25     def is_qemu (self):
26         return TestNode.is_qemu_model(self.node_spec['node_fields']['model'])
27
28     @staticmethod
29     def is_real_model (model):
30         return not TestNode.is_qemu_model(model)
31     def is_real (self):
32         return TestNode.is_real_model (self.node_spec['node_fields']['model'])
33
34     def buildname(self):
35         return self.test_plc.options.buildname
36         
37     def nodedir (self):
38         if self.is_qemu():
39             return "qemu-%s"%self.name()
40         else:
41             return "real-%s"%self.name()
42
43     # this returns a hostname
44     def host_box (self):
45         if self.is_real ():
46             return 'localhost'
47         else:
48             try:
49                 return self.node_spec['host_box']
50             except:
51                 utils.header("WARNING : qemu nodes need a host box")
52                 return 'localhost'
53
54     # this returns a TestBoxQemu instance - cached in .test_box_value
55     def test_box (self):
56         try:
57             return self.test_box_value
58         except:
59             self.test_box_value = TestBoxQemu (self.host_box(),self.buildname())
60             return self.test_box_value
61
62     def create_node (self):
63         ownername = self.node_spec['owner']
64         user_spec = self.test_site.locate_user(ownername)
65         test_user = TestUser(self.test_plc,self.test_site,user_spec)
66         userauth = test_user.auth()
67         utils.header("node %s created by user %s"%(self.name(),test_user.name()))
68         rootauth=self.test_plc.auth_root()
69         server = self.test_plc.apiserver
70         node_id=server.AddNode(userauth,
71                                self.test_site.site_spec['site_fields']['login_base'],
72                                self.node_spec['node_fields'])
73         server.SetNodePlainBootstrapfs(userauth,
74                                        self.node_spec['node_fields']['hostname'],
75                                        'YES')
76         # create as reinstall to avoid user confirmation
77         server.UpdateNode(userauth, self.name(), {'boot_state':'reinstall'})
78
79         if not self.test_plc.has_addresses_api():
80 #            print 'USING OLD INTERFACE'
81             # populate network interfaces - primary
82             server.AddInterface(userauth,self.name(),
83                                 self.node_spec['interface_fields'])
84         else:
85 #            print 'USING NEW INTERFACE with separate ip addresses'
86             # this is for setting the 'dns' stuff that now goes with the node
87             server.UpdateNode (userauth, self.name(), self.node_spec['node_fields_nint'])
88             interface_id = server.AddInterface (userauth, self.name(),self.node_spec['interface_fields_nint'])
89             server.AddIpAddress (userauth, interface_id, self.node_spec['ipaddress_fields'])
90             route_fields=self.node_spec['route_fields']
91             route_fields['interface_id']=interface_id
92             server.AddRoute (userauth, node_id, self.node_spec['route_fields'])
93             pass
94         # populate network interfaces - others
95         if self.node_spec.has_key('extra_interfaces'):
96             for interface in self.node_spec['extra_interfaces']:
97                 server.AddInterface(userauth,self.name(), interface['interface_fields'])
98                 if interface.has_key('settings'):
99                     for (attribute,value) in interface['settings'].iteritems():
100                         # locate node network
101                         interface = server.GetInterfaces(userauth,{'ip':interface['interface_fields']['ip']})[0]
102                         interface_id=interface['interface_id']
103                         # locate or create node network attribute type
104                         try:
105                             interface_tagtype = server.GetTagTypes(userauth,{'name':attribute})[0]
106                         except:
107                             interface_tagtype = server.AddTagType(rootauth,{'category':'test',
108                                                                             'tagname':attribute})
109                         # attach value
110                         server.AddInterfaceTag(userauth,interface_id,attribute,value)
111
112     def delete_node (self):
113         # uses the right auth as far as poss.
114         try:
115             ownername = self.node_spec['owner']
116             user_spec = self.test_site.locate_user(ownername)
117             test_user = TestUser(self.test_plc,self.test_site,user_spec)
118             auth = test_user.auth()
119         except:
120             auth=self.test_plc.auth_root()
121         self.test_plc.apiserver.DeleteNode(auth,self.name())
122
123     # Do most of the stuff locally - will be pushed on host_box - *not* the plc - later if needed
124     def qemu_local_init(self):
125         "all nodes : init a clean local directory for holding node-dep stuff like iso image..."
126         utils.system("rm -rf %s"%self.nodedir())
127         utils.system("mkdir %s"%self.nodedir())
128         if not self.is_qemu():
129             return True
130         return utils.system("rsync -v -a --exclude .svn template-qemu/ %s/"%self.nodedir())==0
131
132     def bootcd(self):
133         "all nodes: invoke GetBootMedium and store result locally"
134         utils.header("Calling GetBootMedium for %s"%self.name())
135         options = []
136         if self.is_qemu():
137             options.append('serial')
138             options.append('no-hangcheck')
139         encoded=self.test_plc.apiserver.GetBootMedium(self.test_plc.auth_root(), 
140                                                       self.name(), 'node-iso', '', options)
141         if (encoded == ''):
142             raise Exception, 'GetBootmedium failed'
143
144         filename="%s/%s.iso"%(self.nodedir(),self.name())
145         utils.header('Storing boot medium into %s'%filename)
146         if self.test_plc.options.dry_run:
147             print "Dry_run: skipped writing of iso image"
148             return True
149         else:
150             file(filename,'w').write(base64.b64decode(encoded))
151             return True
152
153     def nodestate_reinstall (self):
154         "all nodes: mark PLCAPI boot_state as reinstall"
155         self.test_plc.apiserver.UpdateNode(self.test_plc.auth_root(),
156                                            self.name(),{'boot_state':'reinstall'})
157         return True
158     
159     def nodestate_safeboot (self):
160         "all nodes: mark PLCAPI boot_state as safeboot"
161         self.test_plc.apiserver.UpdateNode(self.test_plc.auth_root(),
162                                            self.name(),{'boot_state':'safeboot'})
163         return True
164     
165     def nodestate_boot (self):
166         "all nodes: mark PLCAPI boot_state as boot"
167         self.test_plc.apiserver.UpdateNode(self.test_plc.auth_root(),
168                                            self.name(),{'boot_state':'boot'})
169         return True
170
171     def nodestate_show (self):
172         "all nodes: show PLCAPI boot_state"
173         if self.test_plc.options.dry_run:
174             print "Dry_run: skipped getting current node state"
175             return True
176         state=self.test_plc.apiserver.GetNodes(self.test_plc.auth_root(), self.name(), ['boot_state'])[0]['boot_state']
177         print self.name(),':',state
178         return True
179     
180     def qemu_local_config(self):
181         "all nodes: compute qemu config qemu.conf and store it locally"
182         if not self.is_qemu():
183             return
184         mac=self.node_spec['interface_fields']['mac']
185         hostname=self.node_spec['node_fields']['hostname']
186         ip=self.node_spec['interface_fields']['ip']
187         auth=self.test_plc.auth_root()
188         target_arch=self.test_plc.apiserver.GetPlcRelease(auth)['build']['target-arch']
189         conf_filename="%s/qemu.conf"%(self.nodedir())
190         if self.test_plc.options.dry_run:
191             print "dry_run: skipped actual storage of qemu.conf"
192             return True
193         utils.header('Storing qemu config for %s in %s'%(self.name(),conf_filename))
194         file=open(conf_filename,'w')
195         file.write('MACADDR=%s\n'%mac)
196         file.write('NODE_ISO=%s.iso\n'%self.name())
197         file.write('HOSTNAME=%s\n'%hostname)
198         file.write('IP=%s\n'%ip)
199         file.write('TARGET_ARCH=%s\n'%target_arch)
200         file.close()
201         return True
202
203     def qemu_export (self):
204         "all nodes: push local node-dep directory on the qemu box"
205         # if relevant, push the qemu area onto the host box
206         if self.test_box().is_local():
207             return True
208         utils.header ("Cleaning any former sequel of %s on %s"%(self.name(),self.host_box()))
209         self.test_box().run_in_buildname("rm -rf %s"%self.nodedir())
210         utils.header ("Transferring configuration files for node %s onto %s"%(self.name(),self.host_box()))
211         return self.test_box().copy(self.nodedir(),recursive=True)==0
212             
213     def qemu_start (self):
214         "all nodes: start the qemu instance (also runs qemu-bridge-init start)"
215         model=self.node_spec['node_fields']['model']
216         #starting the Qemu nodes before 
217         if self.is_qemu():
218             self.start_qemu()
219         else:
220             utils.header("TestNode.qemu_start : %s model %s taken as real node"%(self.name(),model))
221         return True
222
223     def timestamp_qemu (self):
224         "all nodes: start the qemu instance (also runs qemu-bridge-init start)"
225         test_box = self.test_box()
226         test_box.run_in_buildname("mkdir -p %s"%self.nodedir())
227         now=int(time.time())
228         return test_box.run_in_buildname("echo %d > %s/timestamp"%(now,self.nodedir()))==0
229
230     def start_qemu (self):
231         test_box = self.test_box()
232         utils.header("Starting qemu node %s on %s"%(self.name(),test_box.hostname()))
233
234         test_box.run_in_buildname("%s/qemu-bridge-init start >> %s/log.txt"%(self.nodedir(),self.nodedir()))
235         # kick it off in background, as it would otherwise hang
236         test_box.run_in_buildname("%s/qemu-start-node 2>&1 >> %s/log.txt"%(self.nodedir(),self.nodedir()))
237
238     def list_qemu (self):
239         utils.header("Listing qemu for host %s on box %s"%(self.name(),self.test_box().hostname()))
240         command="%s/qemu-kill-node -l %s"%(self.nodedir(),self.name())
241         self.test_box().run_in_buildname(command)
242         return True
243
244     def kill_qemu (self):
245         #Prepare the log file before killing the nodes
246         test_box = self.test_box()
247         # kill the right processes 
248         utils.header("Stopping qemu for node %s on box %s"%(self.name(),self.test_box().hostname()))
249         command="%s/qemu-kill-node %s"%(self.nodedir(),self.name())
250         self.test_box().run_in_buildname(command)
251         return True
252
253     def gather_qemu_logs (self):
254         if not self.is_qemu():
255             return True
256         remote_log="%s/log.txt"%self.nodedir()
257         local_log="logs/node.qemu.%s.txt"%self.name()
258         self.test_box().test_ssh.fetch(remote_log,local_log)
259
260     def keys_clear_known_hosts (self):
261         "remove test nodes entries from the local known_hosts file"
262         TestSsh(self.name()).clear_known_hosts()
263         return True
264
265     def create_test_ssh(self):
266         # get the plc's keys for entering the node
267         vservername=self.test_plc.vservername
268 ###        # assuming we've run testplc.fetch_keys()
269 ###        key = "keys/%(vservername)s.rsa"%locals()
270         # fetch_keys doesn't grab the root key anymore
271         key = "keys/key1.rsa"
272         return TestSsh(self.name(), buildname=self.buildname(), key=key)
273
274     def check_hooks (self):
275         extensions = [ 'py','pl','sh' ]
276         path='hooks/node'
277         scripts=utils.locate_hooks_scripts ('node '+self.name(), path,extensions)
278         overall = True
279         for script in scripts:
280             if not self.check_hooks_script (script):
281                 overall = False
282         return overall
283
284     def check_hooks_script (self,local_script):
285         # push the script on the node's root context
286         script_name=os.path.basename(local_script)
287         utils.header ("NODE hook %s (%s)"%(script_name,self.name()))
288         test_ssh=self.create_test_ssh()
289         test_ssh.copy_home(local_script)
290         if test_ssh.run("./"+script_name) != 0:
291             utils.header ("WARNING: node hooks check script %s FAILED (ignored)"%script_name)
292             #return False
293             return True
294         else:
295             utils.header ("SUCCESS: node hook %s OK"%script_name)
296             return True
297
298     def has_libvirt (self):
299         test_ssh=self.create_test_ssh()
300         return test_ssh.run ("rpm -q --quiet libvirt-client")==0
301
302     def check_systemslice (self, slicename,dry_run=False):
303         sitename=self.test_plc.plc_spec['PLC_SLICE_PREFIX']
304         vservername="%s_%s"%(sitename,slicename)
305         test_ssh=self.create_test_ssh()
306         if self.has_libvirt():
307             utils.header("Checking system slice %s using virsh"%slicename)
308             return test_ssh.run("virsh --connect lxc:// list | grep -q ' %s '"%vservername,
309                                 dry_run=dry_run)==0
310         else:
311             (retcod,output)=utils.output_of(test_ssh.actual_command("cat /vservers/%s/etc/slicefamily 2> /dev/null")%vservername)
312             # get last line only as ssh pollutes the output
313             slicefamily=output.split("\n")[-1]
314             utils.header("Found slicefamily '%s'for slice %s"%(slicefamily,slicename))
315             if retcod != 0: 
316                 return False
317             utils.header("Checking system slice %s using vserver-stat"%slicename)
318             return test_ssh.run("vserver-stat | grep %s"%vservername,dry_run=dry_run)==0
319         
320