Uses CoMon's ability to find 'upness' to email. Changed queueing between threads...
[monitor.git] / emailTxt.py
1 #
2 # Copyright (c) 2004  The Trustees of Princeton University (Trustees).
3 #
4 # Faiyaz Ahmed <faiyaza@cs.princeton.edu>
5 #
6 # $Id: $
7
8
9
10 # Tis file contains the texts of the automatically generated
11 # emails sent to techs and PIs
12 #
13
14 class mailtxt:
15    DOWN="""As part of PlanetLab node monitoring, we noticed node %(hostname)s has been down for some time.
16
17 Please check the node's connectivity and, if properly networked, power cycle the machine. If there are any console messages relating to the node's failure, please pass those to the PlanetLab-support mailing list so we can resolve the issue.
18
19
20 Thanks.
21
22   -- PlanetLab Central (support@planet-lab.org)
23 """
24
25    SSH="""As part of PlanetLab node monitoring, we noticed node %(hostname)s is not available for ssh.
26
27 Please check the node's connectivity and, if properly networked, power cycle the machine. If there are any console messages relating to the node's failure, please pass those to the PlanetLab-support mailing list so we can resolve the issue.
28
29
30 Thanks.
31
32   -- PlanetLab Central (support@planet-lab.org)
33 """
34    DNS="""As part of PlanetLab node monitoring, we noticed the DNS servers used by  %(hostname)s are not responding to queries.
35
36 Please verify the DNS information used by the node is correct.  You can find directions on how to update the node's network information on the PlanetLab Technical Contacts Guid (http://www.planet-lab.org/doc/TechsGuide.php#id268898).
37
38 Thanks.
39
40   -- PlanetLab Central (support@planet-lab.org)
41 """
42    HDRO="""As part of PlanetLab node monitoring, we noticed %(hostname)s has a read-only filesystem.
43
44 Please verify the disk is damaged and email the site if a replacement is needed. 
45
46 Thanks.
47
48   -- PlanetLab Central (support@planet-lab.org)
49 """
50
51    STANDARD_PI="""As part of PlanetLab nodes monitoring, we noticed the node %(hostname)s is not available for ssh. We have made several attempts to contact the techinical contacts for this site (they are CCed) to help us bring the node back online. If there should be a different technical contact appointed, you may add the 'tech' role to any user registered for your site via the website. (Manage Users off the left nav bar on the PI tab, then click the user)
52
53 Our records indicate that there is no remote power control unit connected to this node. If this is not the case, please log into the PlanetLab Website and update the PCU information.
54
55 https://www.planet-lab.org/db/pcu/
56
57 Please check the machine's connectivity and, if properly networked, power cycle the machine to reboot it. If there are any console messages relating to the machines's failure, please pass those to the PlanetLab-support mailing list so we can resolve any problems.
58
59
60 Thanks.
61
62   -- PlanetLab Central (support@planet-lab.org)
63 """
64
65    PCU_DOWN="""Hello,
66
67 IMPORTANT: PLC has recently upgraded their monitoring system. One significant change is that PCU reboot attempts may now come from the following subnet:
68 128.112.154.64/26
69 If you have source IP filtering on your PCU please add this subnet.
70
71 We have attempted to reboot some nodes at your site that appear to be down and found that we were unable to connect to the power control unit. Could you please bring it back online? Certain units benefit from a power cycle. Occasionally the problem is that our information for the PCU is incorrect. If the unit seems fine, please verify that the information is correct by logging into the website and clicking the 'power control units' link in the lefthand nav bar. Please let us know if you run into problems.
72
73 Thanks.
74
75   -- PlanetLab Central (support@planet-lab.org)
76 """
77
78    PCU_DOWN_PI="""Hello,
79
80 We have made several attempts to contact the techinical contacts for this site (they are CCed) to help us bring the node back online. If there should be a different technical contact appointed, you may add the 'tech' role to any user registered for your site via the website. (Manage Users off the left nav bar on the PI tab, then click the user)
81
82 We have attempted to reboot some nodes at your site that appear to be down and found that we were unable to connect to the power control unit. Could you please bring it back online? Certain units benefit from a power cycle. Occasionally the problem is that our information for the PCU is incorrect. If the unit seems fine, please verify that the information is correct by logging into the website and clicking the 'power control units' link in the lefthand nav bar. Please let us know if you run into problems.
83
84 Thanks.
85
86   -- PlanetLab Central (support@planet-lab.org)
87 """
88
89    PCU_INEFFECTIVE="""Hello,
90
91 %(hostname)s was remotely rebooted via your power control unit but has not contacted PlanetLab since. It should contact upon every boot, hence we believe that either the node has some hardware problems, is not properly connected to the power control unit, or has network connectivity issues. Could you please reboot the node and watch the console for error messages? 'Couldn't resolve bootX.planet-lab.org' usualy mean connectivity problems. This could be either network configuration or occasionally filtering by the local network admins due to unusual traffic.
92
93 Thanks.
94
95   -- PlanetLab Central (support@planet-lab.org)
96 """
97
98    PCU_INEFFECTIVE_PI="""Hello,
99
100 We have made several attempts to contact the techinical contacts for this site (they are CCed) to help us bring the node back online. If there should be a different techinical contact appointed, you may add the 'tech' role to any user registered for your site via the website. (Manage Users off the left nav bar on the PI tab, then click the user)
101
102 %(hostname)s was remotely rebooted via your power control unit but has not contacted PlanetLab since. It should contact upon every boot, hence we believe that either the node has some hardware problems, is not properly connected to the power control unit, or has network connectivity issues. Could you please reboot the node and watch the console for error messages? 'Couldn't resolve bootX.planet-lab.org' usually indicates connectivity problems. This could be either network configuration or occasionally filtering by the local network admins due to unusual traffic.
103
104 Thanks.
105
106   -- PlanetLab Central (support@planet-lab.org)
107 """