changes for 3.0
[monitor.git] / emailTxt.py
1 #
2 # Copyright (c) 2004  The Trustees of Princeton University (Trustees).
3 #
4 # Faiyaz Ahmed <faiyaza@cs.princeton.edu>
5 #
6 # $Id: emailTxt.py,v 1.10 2007/08/29 17:26:50 soltesz Exp $
7
8
9
10 # This file contains the texts of the automatically generated
11 # emails sent to techs and PIs
12 #
13
14 class mailtxt:
15
16         newdown_one=("""PlanetLab node(s) down: %(loginbase)s""", 
17 """
18 Hello,
19
20 As part of PlanetLab node monitoring, we noticed the following nodes were down at your site:
21
22 %(hostname_list)s 
23 We're writing because we need your help returning them to their regular operation.
24
25 To help, please confirm that a verison 3.0 or greater BootCD is installed in the machine.  Then, after checking that the node is properly networked, power cycle the machine.  Note that rebooting the machine may not fully resolve the problems we are seeing.  Once the machine has come back up, please visit the Comon status page to verify that your node is accessible from the network.  It may take several minutes before Comon registers your node.  Until that time, visiting the link below will return the message 'could not find requested table - probably empty'.
26
27         http://summer.cs.princeton.edu/status/tabulator.cgi?table=nodes/table_%(hostname)s&limit=50
28
29 If the machine has booted successfully, you may check it more quickly by logging in with your site_admin account, and running:
30
31     sudo /usr/sbin/vps ax
32
33 If you have a BootCD older than 3.0, you will need to create a new BootImage on CD or USB.  You can find instructions for this at the Technical Contact's Guide:
34
35     https://www.planet-lab.org/doc/guides/bootcdsetup
36
37 If after following these directions, and either logging in with your site_admin account or seeing the CoMon report of your machine, there is no need to respond to this message.  However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can help resolve the issue.   Including this message in your reply will help us coordinate our records with the actions you've taken.
38
39 Finally, you can track the current status of your machines using this Google Gadget:
40
41     http://fusion.google.com/add?source=atgs&moduleurl=http://monitor.planet-lab.org/monitor/sitemonitor.xml
42
43 Thank you for your help,
44   -- PlanetLab Central (support@planet-lab.org)
45 """)
46
47 #If no one responds, then after a week, we will disable your site's ability to create new slices.  Because this action will directly affect your site's registered PI, we will also CC the PI for help at that time.
48
49         newdown_two=("""PlanetLab node(s) down: %(loginbase)s""", 
50 """
51 Hello,
52
53 As part of PlanetLab node monitoring, we noticed the following nodes were down at your site:
54
55 %(hostname_list)s 
56 We're writing again because our previous correspondence, sent only to the registered Technical Contact, has gone unacknowledged for at least a week, and we need your help returning these machines to their regular operation.  We understand that machine maintenance can take time.  So, while we wait for the machines to return to their regular operation slice creation has been suspended at your site.  No new slices may be created, but the existing slices and services running within them will be unaffected.
57
58 To help, please confirm that a verison 3.0 or greater BootCD is installed in the machine.  Then, after checking that the node is properly networked, power cycle the machine.  Note that rebooting the machine may not fully resolve the problems we are seeing.  Once the machine has come back up, please visit the Comon status page to verify that your node is accessible from the network.  It may take several minutes before Comon registers your node.  Until that time, visiting the link below will return the message 'could not find requested table - probably empty'.
59
60         http://summer.cs.princeton.edu/status/tabulator.cgi?table=nodes/table_%(hostname)s&limit=50
61
62 If the machine has booted successfully, you may check it more quickly by logging in with your site_admin account, and running:
63
64     sudo /usr/sbin/vps ax
65
66 If you have a BootCD older than 3.0, you will need to create a new Boot CD and configuration file.  You can find instructions for this at the Technical Contact's Guide:
67
68     https://www.planet-lab.org/doc/guides/bootcdsetup
69
70 If after following these directions, and either logging in with your site_admin account or seeing the CoMon report of your machine, there is no need to respond to this message.  However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can help resolve the issue.   Including this message in your reply will help us coordinate our records with the actions you've taken.
71
72 Finally, you can track the current status of your machines using this Google Gadget:
73
74     http://fusion.google.com/add?source=atgs&moduleurl=http://monitor.planet-lab.org/monitor/sitemonitor.xml
75
76 After another week, we will disable all slices currently running on PlanetLab.  Because this action will directly affect all users of these slices, these users will also be notified at that time.
77
78 Thank you for your help,
79   -- PlanetLab Central (support@planet-lab.org)
80 """)
81
82         newdown_three=("""PlanetLab node(s) down: %(loginbase)s""", 
83 """
84 Hello,
85
86 As part of PlanetLab node monitoring, we noticed the following nodes were down at your site:
87
88 %(hostname_list)s 
89 We understand that machine maintenance can take time.  We're writing again because our previous correspondences, sent first to the registered Technical Contact then the the Site PI, have gone unacknowledged for at least two weeks, and we need your help returning these machines to their regular operation.  This is the third time attempting to contact someone in regard to these machines at your site.  So, while we wait for the machines to return to their regular operation all current slice activity will be suspended.  Current experiments will be stopped and will not be be able to start again until there is evidence that you have begun to help with the maintenance of these machines.
90
91 To help, please confirm that a verison 3.0 or greater BootCD is installed in the machine.  Then, after checking that the node is properly networked, power cycle the machine.  Note that rebooting the machine may not fully resolve the problems we are seeing.  Once the machine has come back up, please visit the Comon status page to verify that your node is accessible from the network.  It may take several minutes before Comon registers your node.  Until that time, visiting the link below will return the message 'could not find requested table - probably empty'.
92
93         http://summer.cs.princeton.edu/status/tabulator.cgi?table=nodes/table_%(hostname)s&limit=50
94
95 If the machine has booted successfully, you may check it more quickly by logging in with your site_admin account, and running:
96
97     sudo /usr/sbin/vps ax
98
99 If you have a BootCD older than 3.0, you will need to create a new Boot CD and configuration file.  You can find instructions for this at the Technical Contact's Guide:
100
101     https://www.planet-lab.org/doc/guides/bootcdsetup
102
103 Finally, you can track the current status of your machines using this Google Gadget:
104
105     http://fusion.google.com/add?source=atgs&moduleurl=http://monitor.planet-lab.org/monitor/sitemonitor.xml
106
107 If after following these directions, and either logging in with your site_admin account or seeing the CoMon report of your machine, there is no need to respond to this message.  However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can help resolve the issue.   Including this message in your reply will help us coordinate our records with the actions you've taken.
108
109 Thank you for your help,
110   -- PlanetLab Central (support@planet-lab.org)
111 """)
112
113         newbootcd_one=(""" Planetlab nodes need a new BootCD: %(loginbase)s""", # : %(hostname)s""", 
114 """As part of PlanetLab node monitoring, we noticed the following nodes have an out-dated BootCD: 
115
116 %(hostname_list)s  
117 This usually implies that you need to update the BootCD and node configuration file stored on the read-only media (either the all-in-one ISO CD, floppy disk, or write-protected USB stick).
118
119 To check the status of these and any other machines that you manage please visit:
120
121     http://comon.cs.princeton.edu/status
122
123 Instructions to perform the steps necessary for a BootCD upgrade are available in the Technical Contact's Guide.
124
125     https://www.planet-lab.org/doc/guides/bootcdsetup
126
127 If your node returns to normal operation after following these directions, then there's no need to respond to this message.  However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can help resolve the issue.  Including this message in your reply will help us coordinate our records with the actions you've taken.  
128
129 Thank you for your help,
130   -- PlanetLab Central (support@planet-lab.org)
131 """)
132 #After a week, we will disable your site's ability to create new slices.  Because this action will directly affect your site's registered PI, we will also CC the PI for help at that time.
133
134         newbootcd_two=(""" Planetlab nodes need a new BootCD: %(loginbase)s""", # : %(hostname)s""", 
135 """As part of PlanetLab node monitoring, we noticed the following nodes have an out-dated BootCD: 
136
137 %(hostname_list)s  
138 This usually implies that you need to update the BootCD and node configuration file stored on the read-only media (Either the all-in-one ISO CD, floppy disk, or write-protected USB stick).
139
140 We're writing again because our previous correspondence, sent only to the registered Technical Contact, has gone unacknowledged for at least a week, and we need your help returning these machines to their regular operation.  We understand that machine maintenance can take time.  So, while we wait for the machines to return to their regular operation, slice creation has been suspended at your site.  No new slices may be created, but the existing slices and services running within them will be unaffected.
141
142 To check the status of these and any other machines that you manage please visit:
143
144     http://comon.cs.princeton.edu/status
145
146 Instructions to perform the steps necessary for a BootCD upgrade are available in the Technical Contact's Guide.
147
148     https://www.planet-lab.org/doc/guides/bootcdsetup
149
150 If your node returns to normal operation after following these directions, then there's no need to respond to this message.  However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can help resolve the issue.  Including this message in your reply will help us coordinate our records with the actions you've taken.  
151
152 After another week, we will disable all slices currently running on PlanetLab.  Because this action will directly affect all users of these slices, these users will also be notified at that time.
153
154 Thank you for your help,
155   -- PlanetLab Central (support@planet-lab.org)
156 """)
157         newbootcd_three=(""" Planetlab nodes need a new BootCD: %(loginbase)s""", # : %(hostname)s""", 
158 """As part of PlanetLab node monitoring, we noticed the following nodes have an out-dated BootCD: 
159
160 %(hostname_list)s  
161 This usually implies that you need to update the BootCD and node configuration file stored on the read-only media (Either the all-in-one ISO CD, floppy disk, or write-protected USB stick).
162
163 We understand that machine maintenance can take time.  We're writing again because our previous correspondences, sent first to the registered Technical Contact then the the Site PI, have gone unacknowledged for at least two weeks, and we need your help returning these machines to their regular operation.  This is the third time attempting to contact someone in regard to these machines at your site.  So, while we wait for the machines to return to their regular operation all current slice activity will be suspended.  Current experiments will be stopped and will not be be able to start again until there is evidence that you have begun to help with the maintenance of these machines.
164
165 To check the status of these and any other machines that you manage please visit:
166
167     http://comon.cs.princeton.edu/status
168
169 Instructions to perform the steps necessary for a BootCD upgrade are available in the Technical Contact's Guide.
170
171     https://www.planet-lab.org/doc/guides/bootcdsetup
172
173 If your node returns to normal operation after following these directions, then there's no need to respond to this message.  However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can help resolve the issue.  Including this message in your reply will help us coordinate our records with the actions you've taken.  
174
175 Thank you for your help,
176   -- PlanetLab Central (support@planet-lab.org)
177 """)
178         pcuthankyou_one=("""Thank you for correcting your PlanetLab node PCU - %(loginbase)s""",
179         """
180 While monitoring your site, we noticed that the following PCU *improved* their states:
181
182 %(hostname_list)s  
183 Often, system administration is a thankless job, but not today. :-)
184
185 Thank you!
186   -- PlanetLab Central (support@planet-lab.org)
187         """)
188
189         thankyou=("""Thank you for helping maintain your PlanetLab nodes - %(loginbase)s""",
190         """
191 While monitoring your site, we noticed that the following nodes *improved*
192 their states:
193
194 %(hostname_list)s  
195 Often, system administration is a thankless job, but not today. :-)
196
197 Thank you!
198   -- PlanetLab Central (support@planet-lab.org)
199
200 Legend:
201 PROD-      This state is the production state where the node can contact PlanetLab, 
202            and install slices from users.
203 DEBUG-     This state designates a node that could not boot successfully.
204 OLDBOOTCD- This state corresponds to the situation where an oldbootcd prevented 
205            the normal operation of the node.
206 ERROR-     This is an error state, where there is absolutely no contact 
207            with PlanetLab.
208         """)
209
210         nmreset =("""NM Reset at %(loginbase)s""",
211         """
212 Monitor restarted NM on the following machines:
213
214 %(hostname_list)s  
215
216         """)
217         pcudown_one =("""Could not use PCU to reboot %(hostname)s""",
218
219 """As part of PlanetLab node monitoring and maintenance, we tried to use the PCU
220 registered below, but could not for the reasons at the link below:
221
222         https://monitor.planet-lab.org/cgi-bin/printbadpcus.php?id=%(pcu_id)s
223
224 We need your help resolving this issue in a few ways:  
225
226  1. First, we need your help rebooting %(hostname)s.  Because the above PCU does 
227     not appear to work, please manually reboot this machine.  If it turns out that 
228     there is a problem with the PCU configuration, we can help you
229     resolve that independently.
230
231  2. If there is nothing apparently wrong with the PCU, or the mapping between
232     the PCU and the host, then there is likely a problem with our bootstrap
233     software on your machine.  To help us, please make a note of any text on
234     the console and report it to mailto:support@planet-lab.org .  An example
235     might be that the console hangs waiting for a module to unload.  The last
236     reported name or any error messages on the screen would be very helpful.
237
238  3. Alternately, if it is possible, please correcct the above PCU problem, or
239     let us know what steps you are taking.  By enabling us to take administrative 
240     actions automatically from PlanetLab Central without your intervention, you 
241     can trade a small amount of time now for a time savings in the future. 
242
243 If the PCU is up and running, but behind a firewall, please make it accessible
244 from address block 128.112.139.0/24.  You can confirm that this is the address
245 space from which the PlanetLab Central servers run.
246
247 If the above PCU is no longer in service, please delete it by visiting:
248
249     https://www.planet-lab.org/db/sites/pcu.php?id=%(pcu_id)s
250
251 and selecting 'Delete PCU'. You may then register a new PCU for your nodes.
252
253 Thank you very much for your help,
254   -- PlanetLab Central (support@planet-lab.org)
255 """)
256         pcutonodemapping_one =("""PCU to Node mapping is incorrect for %(hostname)s""",
257         """
258     As part of our machine monitoring and maintenance, we tried to use the PCU
259 registered below, and though it appears to succeed, we do not subsequently
260 observe the associated nodes rebooting:
261
262     https://monitor.planet-lab.org/cgi-bin/printbadpcus.php?id=%(pcu_id)s
263
264 %(hostname_list)s
265
266 We need your help resolving this issue in two ways:  
267
268 * First, we need your help rebooting %(hostname)s.  Because the above PCU 
269   does not appear to actually control the above Nodes, we cannot use it to
270   reboot these machines. So, please manually reboot the machine and we can 
271   help you resolve any configuration errors with the PCU independently.
272
273 * Second, please check the configuration of the above PCU.  Check that the 
274   PCU is physically connected to the servers that it should be able to
275   control.  A common mistake is that the PCU is registered for a machine, 
276   but not actually connected physically to the machine. 
277
278 By enabling us to take administrative actions automatically from PlanetLab
279 Central without local intervention, you can trade a small amount of time now
280 for a time savings in the future. 
281     
282 If the above PCU is no longer in service, please delete it by visiting:
283
284     https://www.planet-lab.org/db/sites/pcu.php?id=%(pcu_id)s
285
286 and selecting 'Delete PCU'. You may then register a new PCU for your nodes.
287
288 Alternately, if the machines listed above are no longer in service, please
289 delete them by visiting your sites page at:
290
291     https://www.planet-lab.org/
292
293 Thank you very much for your help,
294   -- PlanetLab Central (support@planet-lab.org)
295 """)
296
297         newalphacd_one=(""" Planetlab nodes need a new BootCD: %(loginbase)s""", 
298 """As part of PlanetLab node monitoring, we noticed that your machines needs a new BootCD to fully support your hardware: 
299
300 %(hostname_list)s  
301
302 To make this process as simple as possible, we have created All-in-One boot images that include the node configuration file.  
303
304 The only step that you need to take is to choose which media you prefer, either CD ISO, or USB image for each host.
305
306 %(url_list)s
307
308 Instructions to burn or copy these All-in-One images to the appropriate media are available in the Technical Contact's Guide.
309
310     https://www.planet-lab.org/doc/guides/bootcdsetup
311
312 If your node returns to normal operation after following these directions, then there's no need to respond to this message.  However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can help resolve the issue.  Including this message in your reply will help us coordinate our records with the actions you've taken.  
313
314 Thank you for your help,
315   -- PlanetLab Central (support@planet-lab.org)
316 """)
317
318         # TODO: need reminder versions for repeats...
319         newdown=[newdown_one, newdown_two, newdown_three]
320         newbootcd=[newbootcd_one, newbootcd_two, newbootcd_three]
321         newalphacd=[newalphacd_one, newalphacd_one, newalphacd_one]
322         newthankyou=[thankyou,thankyou,thankyou]
323         pcuthankyou=[pcuthankyou_one,pcuthankyou_one,pcuthankyou_one]
324         NMReset=[nmreset,nmreset,nmreset]
325         pcutonodemapping=[pcutonodemapping_one, pcutonodemapping_one, pcutonodemapping_one]
326         pcudown=[pcudown_one, pcudown_one, pcudown_one]
327
328         unknownsequence = ("""Unrecognized Error on PlanetLab host %(hostname)s""", 
329                                            """
330 While trying to automatically recover this machine:
331
332     http://www.planet-lab.org/db/nodes/index.php?nodepattern=%(hostname)s
333
334 We encountered an unknown situation.  Please re-code to handle, or manually intervene to repair this host.
335
336 Abbreviated BootManager Sequence:
337
338     %(sequence)s
339
340 BootManager.log output follows:
341 ---------------------------------------------------------
342 %(bmlog)s
343 """       )
344         donation_down_one=("""PlanetLab node donation setup: %(hostname)s""", 
345         """
346 Hello,
347
348 As part of PlanetLab node monitoring, we noticed the following node is registered in the PlanetLab database, but it is not completly setup and running.
349
350 %(hostname_list)s 
351 We are writing because we need your help completing the setup to ensure its full operation.
352
353 You should have received directions for the complete configuration when you contacted the donation program coordinator at PlanetLab.  For review, or if you did not receive them, you can find the latest version here:
354
355     https://svn.planet-lab.org/wiki/DC7800Configuration
356
357 It is essential that the AMT feature be configured to enable PlanetLab staff to remotely manage the machine.  The basic steps are:
358
359     Configure the DC7800 AMT feature  : https://www.planet-lab.org/AMT
360     Add a PCU to your site            : https://www.planet-lab.org/db/sites/pcu.php
361         Associate your node with the PCU  : Follow the 'My Site' link
362         Finally, download the Boot Image  : https://www.planet-lab.org/db/nodes/index.php?nodepattern=%(hostname)s
363         Burn Boot Image to media & Reboot your node
364
365 You can confirm that your machine's PCU is correctly configured by visiting the AMT
366 port using your browser, such as:
367
368     http://%(hostname)s:16992/
369
370 If you need any clarification about the steps mentioned here, please feel free
371 to contact us at PlanetLab Support (support@planet-lab.org).
372
373 Thank you for your help,
374   -- PlanetLab Central (support@planet-lab.org)
375 """)
376
377         donation_nopcu_one=("""PlanetLab node donation, PCU setup: %(hostname)s""", 
378 """
379 Hello,
380
381 As part of PlanetLab node monitoring, we noticed the following node was not completely setup at your site:
382
383 %(hostname_list)s 
384 We are writing because we need your help completing the setup to ensure its full operation.
385
386 The DC7800 comes with a built-in remote management feature.  The PCU functionality on your node is not configured.  The result of this is that we are unable to remotely administer this machine.
387
388 You should have received directions for the complete configuration when you contacted the donation program coordinator at PlanetLab.  For review, or if you did not receive them, you can find the latest version here:
389
390     https://svn.planet-lab.org/wiki/DC7800Configuration
391
392 It is essential that the PCU be configured.  The basic steps are:
393
394     Configure the DC7800 AMT feature  : https://www.planet-lab.org/AMT
395     Add a PCU to your site            : https://www.planet-lab.org/db/sites/pcu.php
396         Associate your node with the PCU  : Follow the 'My Site' link
397
398 You can confirm that your machine is correctly configured by visiting the AMT
399 port using your browser, such as:
400
401     http://%(hostname)s:16992/
402
403 If you need any clarification about the steps mentioned here, please feel free
404 to contact us at PlanetLab Support (support@planet-lab.org).
405
406 Thank you for your help,
407   -- PlanetLab Central (support@planet-lab.org)
408 """)
409
410         donation_nopcu = [ donation_nopcu_one, donation_nopcu_one, donation_nopcu_one ]
411         donation_down = [ donation_down_one, donation_down_one, donation_down_one ]
412
413
414         minimalhardware = ("""Hardware requirements not met on PlanetLab host %(hostname)s""", 
415                                            """
416 While trying to automatically recover this machine:
417
418     http://www.planet-lab.org/db/nodes/index.php?nodepattern=%(hostname)s
419
420 We encountered an failed hardware requirement.  Please look at the log below to determine the exact nature of the failure, either Disk, CPU, Network, or Mimial RAM was not satisfied.
421
422 If your machine does not meet the current hardware specifications for a PlanetLab node (http://www.planet-lab.org/hardware), please upgrade it to meet the current recommended configuration.  
423
424 If you believe this message is an error, please email support@planet-lab.org explaining the problem.  You may need to create an updated Boot Image that includes drivers for your hardware.
425
426 Thank you,
427  - PlanetLab Support
428
429 BootManager.log output follows:
430 ---------------------------------------------------------
431 %(bmlog)s
432 """       )
433
434         baddisk = ("""Bad Disk on PlanetLab node %(hostname)s""", 
435                            """As part of PlanetLab node monitoring, we noticed %(hostname)s has a number of disk or media related I/O errors, that prevent it from either booting or reliably running as a PlanetLab node.
436
437 Please verify the integrity of the disk, and order a replacement if needed.  If you need to schedule downtime for the node, please let us know at support@planet-lab.org. 
438
439 Thanks.
440
441   -- PlanetLab Central (support@planet-lab.org)
442
443 The output of `dmesg` follows:
444 -------------------------------------------------------------------------
445
446 %(log)s
447 """)
448
449         down=("""PlanetLab node %(hostname)s down.""", """As part of PlanetLab node monitoring, we noticed %(hostname)s has been down for %(days)s days.
450
451 Please check the node's connectivity and, if properly networked, power cycle the machine. Note that rebooting the machine may not fully resolve the problems we're seeing. Once the machine has come back up, please visit the Comon status page to verify that your node is accessible from the network.
452
453 http://summer.cs.princeton.edu/status/tabulator.cgi?table=table_nodeviewshort&select='address==%(hostbyteorder)s'
454
455 http://www.planet-lab.org/db/sites/index.php?id=%(site_id)d
456
457 There's no need to respond to this message if CoMon reports that your machine is accessible. However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can resolve the issue. 
458
459 Thanks.
460
461
462   -- PlanetLab Central (support@planet-lab.org)
463 """)
464
465         dbg=("""Planetlab node %(hostname)s requires reboot.""", """As part of PlanetLab node monitoring, we noticed %(hostname)s is in debug mode.  This usually implies the node was rebooted unexpectedly and could not come up cleanly.  
466
467 Please check the node's connectivity and, if properly networked, power cycle the machine. Note that rebooting the machine may not fully resolve the problems we're seeing. Once the machine has come back up, please visit the Comon status page to verify that your node is accessible from the network.
468
469 http://summer.cs.princeton.edu/status/tabulator.cgi?table=table_nodeviewshort&select='address==%(hostbyteorder)s'
470
471 There's no need to respond to this message if CoMon reports that your machine is accessible. However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can resolve the issue. 
472
473 Thank you for your help,
474   -- PlanetLab Central (support@planet-lab.org)
475 """)
476
477         plnode_cfg=(""" Please Verify Network Configuration for PlanetLab node %(hostname)s""", 
478 """Hello,
479
480 As part of PlanetLab node monitoring, we noticed that %(hostname)s has a network configuration error related to DNS or hostname lookups.  Often this can happen either due local configuraiton changes, or a misconfiguration of the node's DNS servers.  To resolve the issue we require your assistance.  All that is needed is to visit:
481
482         https://www.planet-lab.org/db/nodes/index.php?nodepattern=%(hostname)s
483
484 Find the primary node network entry and confirm that the settings are correct.  
485
486 If you use 'static' network configuration, verify that the DNS servers are correct.  If you are using 'dhcp' then you will need to confirm that the information returned for the node will allow it to perform lookups on it's own hostname.
487
488 If you change the network settings, then select, "Download -> Download plnode.txt file for %(hostname)s" menu.  This will generate a new configuration file for your node.  Copy this file to the appropriate read-only media, either floppy or USB stick, and reboot the machine.  If you are using an All-in-One boot image, then you will need to download the All-in-One image instead, burn it to the appropriate media (CD or USB) and reboot.
489
490 Please let us know if you need any assistance.
491
492 Thank you for your help,
493   -- PlanetLab Central (support@planet-lab.org)
494
495 BootManager.log output follows:
496 ---------------------------------------------------------
497 %(bmlog)s
498 """)
499
500         plnode_cfg=(""" Please Update Configuration file for PlanetLab node %(hostname)s""", 
501 """As part of PlanetLab node monitoring, we noticed %(hostname)s has an out-dated plnode.txt file with no NODE_ID or a mis-matched HOSTNAME.  This can happen either due to an initial configuration failure at your site, with information entered into our database, or after a software upgrade.  To resolve the issue we require your assistance.  All that is needed is to visit:
502
503         https://www.planet-lab.org/db/nodes/index.php?nodepattern=%(hostname)s
504
505 Then, select, "Download -> Download plnode.txt file for %(hostname)s" menu.  This will generate a new configuration file for your node.  Copy this file to the appropriate read-only media, either floppy or USB stick, and reboot the machine.
506
507 There is no need to respond to this message if you're able to update the configuration file without difficulty and your node returns to normal operation.  However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can help resolve the issue. 
508
509 Thank you for your help,
510   -- PlanetLab Central (support@planet-lab.org)
511 """)
512
513         bootcd=(""" Planetlab node %(hostname)s needs a new BootCD""", 
514 """As part of PlanetLab node monitoring, we noticed %(hostname)s has an out-dated BootCD: "%(version)".  This usually implies that you need to update both the BootCD and regenerate the planet.cnf file stored on the read-only floppy (Or read-only USB stick that stores the content of BootCD and planet.cnf).
515
516 Instructions to perform the steps necessary for a BootCD upgrade are available in the Technical Contact Guide.
517     https://www.planet-lab.org/doc/guides/tech#NodeInstallation
518
519 There's no need to respond to this message if you're able to follow the directions without difficulty and your node returns to normal operation. However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can help resolve the issue. 
520
521 Thanks you for your help,
522   -- PlanetLab Central (support@planet-lab.org)
523 """)
524
525         ssh=("""Planetlab node %(hostname)s down.""", """As part of PlanetLab node monitoring, we noticed node %(hostname)s is not available for ssh.
526
527 Please check the node's connectivity and, if properly networked, power cycle the machine. Note that rebooting the machine may not fully resolve the problems we're seeing. Once the machine has come back up, please visit the Comon status page to verify that your node is accessible from the network.
528
529 http://summer.cs.princeton.edu/status/tabulator.cgi?table=table_nodeviewshort&select='address==%(hostbyteorder)s'
530
531 There's no need to respond to this message if CoMon reports that your machine is accessible. However, if there are any console messages relating to the node's failure, please report them to PlanetLab support (support@planet-lab.org) so we can resolve the issue. 
532
533 Thanks.
534
535
536   -- PlanetLab Central (support@planet-lab.org)
537 """)
538
539
540         baddns=("""Planetlab node down: broken DNS configuration for %(hostname)s""", 
541 """As part of PlanetLab node monitoring, we noticed the DNS servers used by the following machine(s) are not responding to queries.
542
543     %(hostname)s 
544
545 The conseuqnece of this is that the node cannot boot correctly, and is not a functioning part of the PlanetLab network.
546
547 To help us return this machine to running order, please verify that the registered DNS servers in the node network configuration are correct.  
548
549 %(network_config)s
550
551 You may update the node's network information at the link below:
552
553     https://www.planet-lab.org/db/nodes/node_networks.php?id=%(interface_id)s
554
555 If you have any questions, please feel free to contact us at PlanetLab Support (support@planet-lab.org).
556
557 Thank you for your help,
558   -- PlanetLab Central (support@planet-lab.org)
559 """)
560
561
562         filerw=("""Planetlab node %(hostname)s has a bad disk.""", """As part of PlanetLab node monitoring, we noticed %(hostname)s has a read-only filesystem.
563
564 Please verify the integrity of the disk and email the site if a replacement is needed. 
565
566 Thanks.
567
568   -- PlanetLab Central (support@planet-lab.org)
569 """)
570
571
572         clock_drift=("""Planetlab node %(hostname)s and NTP.""", """As part of PlanetLab node monitoring, we noticed %(hostname)s cannot reach our NTP server.
573
574 Please verify that the NTP port (tcp/123) is not blocked by your site. 
575
576 Thanks.
577
578   -- PlanetLab Central (support@planet-lab.org)
579 """)
580
581   
582
583         removedSliceCreation=("""PlanetLab slice creation/renewal suspension.""","""As part of PlanetLab node monitoring, we noticed the %(loginbase)s site has less than 2 nodes up.  We have attempted to contact the PI and Technical contacts %(times)s times and have not received a response.  
584
585 Slice creation and renewal are now suspended for the %(loginbase)s site.  Please be aware that failure to respond will result in the automatic suspension of all running slices on PlanetLab.
586
587
588   -- PlanetLab Central (support@planet-lab.org)
589 """)
590
591
592         suspendSlices=("""PlanetLab slices suspended.""","""As part of PlanetLab node monitoring, we noticed the %(loginbase)s site has less than 2 nodes up.  We have attempted to contact the PI and Technical contacts %(times)s times and have not received a response.  
593
594 All %(loginbase)s slices are now suspended.  
595
596
597   -- PlanetLab Central (support@planet-lab.org)
598 """)
599
600
601         pcu_broken=("""%(hostname)s failed to reinstall""","""Hello,
602
603    %(hostname)s was remotely rebooted via your power control unit but has not contacted PlanetLab since. It should contact upon every boot, hence we believe that either the node has some hardware problems, is not properly connected to the power control unit, or has network connectivity issues. Could you please reboot the node and watch the console for error messages? 
604
605
606 Thanks.
607
608 -- PlanetLab Central (support@planet-lab.org)
609 """)
610
611
612         no_pcu=("""Hello,
613
614 We have set %(hostname)s to reinstall, but because your site does not have a power control unit, we are unable to powercycle the node.  Please  
615
616 Thanks.
617
618 -- PlanetLab Central (support@planet-lab.org)
619 """)
620