from branch
[nodemanager.git] / sliver_vs.py
1 """VServer slivers.
2
3 There are a couple of tricky things going on here.  First, the kernel
4 needs disk usage information in order to enforce the quota.  However,
5 determining disk usage redundantly strains the disks.  Thus, the
6 Sliver_VS.disk_usage_initialized flag is used to determine whether
7 this initialization has been made.
8
9 Second, it's not currently possible to set the scheduler parameters
10 for a sliver unless that sliver has a running process.  /bin/vsh helps
11 us out by reading the configuration file so that it can set the
12 appropriate limits after entering the sliver context.  Making the
13 syscall that actually sets the parameters gives a harmless error if no
14 process is running.  Thus we keep vm_running on when setting scheduler
15 parameters so that set_sched_params() always makes the syscall, and we
16 don't have to guess if there is a running process or not.
17 """
18
19 import errno
20 import os, os.path
21 import time
22 import commands
23
24 import vserver
25
26 import accounts
27 import logger
28 import tools
29 from threading import BoundedSemaphore
30
31 globalsem = BoundedSemaphore()
32
33 # special constant that tells vserver to keep its existing settings
34 KEEP_LIMIT = vserver.VC_LIM_KEEP
35
36 # populate the sliver/vserver specific default allocations table,
37 # which is used to look for slice attributes
38 DEFAULT_ALLOCATION = {}
39 for rlimit in vserver.RLIMITS.keys():
40     rlim = rlimit.lower()
41     DEFAULT_ALLOCATION["%s_min"%rlim]=KEEP_LIMIT
42     DEFAULT_ALLOCATION["%s_soft"%rlim]=KEEP_LIMIT
43     DEFAULT_ALLOCATION["%s_hard"%rlim]=KEEP_LIMIT
44
45 class Sliver_VS(accounts.Account, vserver.VServer):
46     """This class wraps vserver.VServer to make its interface closer to what we need."""
47
48     SHELL = '/bin/vsh'
49     TYPE = 'sliver.VServer'
50     _init_disk_info_sem = globalsem
51
52     def __init__(self, rec):
53         logger.verbose ('initing Sliver_VS with name=%s'%rec['name'])
54         try:
55             vserver.VServer.__init__(self, rec['name'],logfile='/var/log/nm')
56         except Exception, err:
57             if not isinstance(err, vserver.NoSuchVServer):
58                 # Probably a bad vserver or vserver configuration file
59                 logger.log_exc(self.name)
60                 logger.log('%s: recreating bad vserver' % rec['name'])
61                 self.destroy(rec['name'])
62             self.create(rec['name'], rec['vref'])
63             vserver.VServer.__init__(self, rec['name'],logfile='/var/log/nm')
64
65         self.keys = ''
66         self.rspec = {}
67         self.initscript = ''
68         self.slice_id = rec['slice_id']
69         self.disk_usage_initialized = False
70         self.initscriptchanged = False
71         self.configure(rec)
72
73     _root_context_arch=None
74     @staticmethod 
75     def root_context_arch():
76         if not Sliver_VS._root_context_arch:
77             Sliver_VS._root_context_arch=commands.getoutput("uname -i")
78         return Sliver_VS._root_context_arch
79
80     @staticmethod
81     def personality (arch):
82         personality="linux32"
83         if arch.find("64")>=0:
84             personality="linux64"
85         return personality
86
87     @staticmethod
88     def create(name, vref = None):
89         logger.verbose('Sliver_VS:create - name=%s'%name)
90         if vref is None:
91             vref='default'
92         try:
93             ### locating the right slicefamily
94             # this is a first draft, and more a proof of concept thing
95             # the idea is to parse vref for dash-separated wishes,
96             # and to project these against the defaults
97             # so e.g. if the default slice family (as found in /etc/planetlab/slicefamily)
98             # is planetlab-f8-i386, then here is what we get
99             # vref=x86_64             -> vuseradd -t planetlab-f8-x86_64 
100             # vref=centos5            -> vuseradd -t planetlab-centos5-i386 
101             # vref=centos5-onelab     -> vuseradd -t onelab-centos5-i386 
102             # vref=planetflow         -> vuseradd -t planetflow-f8-i386
103             # vref=x86_64-planetflow  -> vuseradd -t planetflow-f8-x86_64
104
105             # default
106             default=file("/etc/planetlab/slicefamily").read().strip()
107             (pldistro,fcdistro,arch) = default.split("-")
108
109             known_archs = [ 'i386', 'x86_64' ]
110             known_fcdistros = [ 'f8', 'f9', 'centos5' ]
111             # from the slice attribute: cut dashes and try to figure the meaning
112             slice_wishes = vref.split("-")
113             for wish in slice_wishes:
114                 if wish in known_archs:
115                     arch=wish
116                 elif wish in known_fcdistros:
117                     fcdistro=wish
118                 else:
119                     pldistro=wish
120
121             # rejoin the parts
122             refname="-".join( (pldistro,fcdistro,arch) )
123
124             # check the template exists -- there's probably a better way..
125             if os.path.isdir ("/vservers/.vref/%s"% vref): refname = vref
126
127             if not os.path.isdir ("/vservers/.vref/%s"% refname):
128                 logger.log("%s (%s) : vref %s not found, using default %s"%(
129                         name,vref,refname,default))
130                 refname=default
131                 # reset so arch is right
132                 (pldistro,fcdistro,arch) = default.split("-")
133                 # could check again, but as we have /etc/slicefamily 
134                 # there's probably no /vservers/.vref/default
135
136         except IOError:
137             # have not found slicefamily
138             logger.log("%s (%s): legacy node - using fallback vrefname 'default'"%(name,vref))
139             # for legacy nodes
140             refname="default"
141             arch="i386"
142         except:
143             import traceback
144             logger.log("%s (%s) : unexpected error follows - using 'default'"%(name,vref))
145             logger.log(traceback.format_exc())
146             refname="default"
147             arch="i386"
148             
149         logger.log_call('/usr/sbin/vuseradd', '-t', refname, name)
150         # export slicename to the slice in /etc/slicename
151         file('/vservers/%s/etc/slicename' % name, 'w').write(name)
152         # set personality: only if needed (if arch's differ)
153         if Sliver_VS.root_context_arch() != arch:
154             file('/etc/vservers/%s/personality' % name, 'w').write(Sliver_VS.personality(arch))
155             logger.log('%s: set personality to %s'%(name,Sliver_VS.personality(arch)))
156
157     @staticmethod
158     def destroy(name): logger.log_call('/usr/sbin/vuserdel', name)
159
160     def configure(self, rec):
161         new_rspec = rec['_rspec']
162         if new_rspec != self.rspec:
163             self.rspec = new_rspec
164             self.set_resources()
165
166         new_initscript = rec['initscript']
167         if new_initscript != self.initscript:
168             self.initscript = new_initscript
169             self.initscriptchanged = True
170
171         accounts.Account.configure(self, rec)  # install ssh keys
172
173     def start(self, delay=0):
174         if self.rspec['enabled'] > 0:
175             logger.log('%s: starting in %d seconds' % (self.name, delay))
176             time.sleep(delay)
177             # VServer.start calls fork() internally, 
178             # so just close the nonstandard fds and fork once to avoid creating zombies
179             child_pid = os.fork()
180             if child_pid == 0:
181                 if self.initscriptchanged:
182                     logger.log('%s: installing initscript' % self.name)
183                     def install_initscript():
184                         flags = os.O_WRONLY | os.O_CREAT | os.O_TRUNC
185                         fd = os.open('/etc/rc.vinit', flags, 0755)
186                         os.write(fd, self.initscript)
187                         os.close(fd)
188                     try:
189                         self.chroot_call(install_initscript)
190                     except: logger.log_exc(self.name)
191                 tools.close_nonstandard_fds()
192                 vserver.VServer.start(self)
193                 os._exit(0)
194             else: 
195                 os.waitpid(child_pid, 0)
196                 self.initscriptchanged = False
197         else: logger.log('%s: not starting, is not enabled' % self.name)
198
199     def stop(self):
200         logger.log('%s: stopping' % self.name)
201         vserver.VServer.stop(self)
202
203     def is_running(self): 
204         return vserver.VServer.is_running(self)
205
206     def set_resources(self):
207         disk_max = self.rspec['disk_max']
208         logger.log('%s: setting max disk usage to %d KiB' % (self.name, disk_max))
209         try:  # if the sliver is over quota, .set_disk_limit will throw an exception
210             if not self.disk_usage_initialized:
211                 self.vm_running = False
212                 Sliver_VS._init_disk_info_sem.acquire()
213                 logger.log('%s: computing disk usage: beginning' % self.name)
214                 try: self.init_disk_info()
215                 finally: Sliver_VS._init_disk_info_sem.release()
216                 logger.log('%s: computing disk usage: ended' % self.name)
217                 self.disk_usage_initialized = True
218             vserver.VServer.set_disklimit(self, max(disk_max, self.disk_blocks))
219         except:
220             logger.log('%s: failed to set max disk usage' % self.name)
221             logger.log_exc(self.name)
222
223         # get/set the min/soft/hard values for all of the vserver
224         # related RLIMITS.  Note that vserver currently only
225         # implements support for hard limits.
226         for limit in vserver.RLIMITS.keys():
227             type = limit.lower()
228             minimum  = self.rspec['%s_min'%type]
229             soft = self.rspec['%s_soft'%type]
230             hard = self.rspec['%s_hard'%type]
231             update = self.set_rlimit(limit, hard, soft, minimum)
232             if update:
233                 logger.log('%s: setting rlimit %s to (%d, %d, %d)'
234                            % (self.name, type, hard, soft, minimum))
235
236         self.set_capabilities_config(self.rspec['capabilities'])
237         if self.rspec['capabilities']:
238             logger.log('%s: setting capabilities to %s' % (self.name, self.rspec['capabilities']))
239
240         cpu_pct = self.rspec['cpu_pct']
241         cpu_share = self.rspec['cpu_share']
242
243         if self.rspec['enabled'] > 0:
244             if cpu_pct > 0:
245                 logger.log('%s: setting cpu reservation to %d%%' % (self.name, cpu_pct))
246             else:
247                 cpu_pct = 0
248
249             if cpu_share > 0:
250                 logger.log('%s: setting cpu share to %d' % (self.name, cpu_share))
251             else:
252                 cpu_share = 0
253
254             self.set_sched_config(cpu_pct, cpu_share)
255             # if IP address isn't set (even to 0.0.0.0), sliver won't be able to use network
256             if self.rspec['ip_addresses'] != '0.0.0.0':
257                 logger.log('%s: setting IP address(es) to %s' % \
258                 (self.name, self.rspec['ip_addresses']))
259             self.set_ipaddresses_config(self.rspec['ip_addresses'])
260
261             if self.is_running():
262                 logger.log("%s: Setting name to %s" % (self.name, self.slice_id),2)
263                 self.setname(self.slice_id)
264  
265             if False: # Does not work properly yet.
266                 if self.have_limits_changed():
267                     logger.log('%s: limits have changed --- restarting' % self.name)
268                     stopcount = 10
269                     while self.is_running() and stopcount > 0:
270                         self.stop()
271                         delay = 1
272                         time.sleep(delay)
273                         stopcount = stopcount - 1
274                     self.start()
275
276         else:  # tell vsh to disable remote login by setting CPULIMIT to 0
277             logger.log('%s: disabling remote login' % self.name)
278             self.set_sched_config(0, 0)
279             self.stop()