stupid me
[bootcd.git] / initscripts / pl_netinit
1 #!/bin/sh
2 #-*-shell-script-*-
3
4 set -x
5
6 # the name of the floppy based network configuration
7 # files (checked first). the name planet.cnf is kept
8 # for backward compatibility with old nodes, and only
9 # the floppy disk is searched for files with this name.
10 # new files are named plnode.txt and can be located on
11 # a floppy or usb device or on the cdrom
12 OLD_NODE_CONF_NAME=planet.cnf
13 NEW_NODE_CONF_NAME=plnode.txt
14
15 # one location of cd-based network configuration file
16 # (checked if floppy conf file missing and usb
17 # configuration file is missing)
18 CD_NET_CONF_BOOT=/usr/boot/$NEW_NODE_CONF_NAME
19
20 # the other location of cd-based network configuration file
21 CD_NET_CONF_ROOT=/usr/$NEW_NODE_CONF_NAME
22
23 # if all other network configuration file sources 
24 # don't exist, fall back to this one (always on the cd)
25 FALLBACK_NET_CONF=/usr/boot/default-node.txt
26
27 # a temporary place to hold the old configuration file
28 # off of the floppy disk if we find it (so we don't have
29 # to remount the floppy later)
30 TMP_OLD_FLOPPY_CONF_FILE=/tmp/oldfloppy_planet.cnf
31
32 # once a configuration file is found, save it in /tmp
33 # (may be used later by boot scripts)
34 USED_NET_CONF=/tmp/planet.cnf
35
36 # default device to use for contacting PLC if not specified
37 # in the configuration file
38 DEFAULT_NET_DEV=eth0
39
40 # where to store the temporary dhclient conf file
41 DHCLIENT_CONF_FILE=/tmp/dhclient.conf
42
43 # which fs types we support finding node configuration files on
44 # (will be based as a -t parameter to mount)
45 NODE_CONF_DEVICE_FS_TYPES="msdos,ext2"
46
47 # a temporary place to mount devices that might contain configuration
48 # files on
49 CONF_DEVICE_MOUNT_POINT=/mnt/confdevice
50 /bin/mkdir -p $CONF_DEVICE_MOUNT_POINT
51
52 # for some backwards compatibility, save the ifconfig <device>
53 # output to this file after everything is online
54 IFCONFIG_OUTPUT=/tmp/ifconfig
55
56 # set to 1 if the default network configuration was loaded off the cd
57 # (no other configuration file found)
58 DEFAULT_NET_CONF=0
59
60
61 function net_init_failed() {
62     echo
63     echo $(date "+%H:%M:%S") " pl_netinit: network initialization failed,"
64     echo
65     echo For forensics
66     echo
67     echo ========== lspci beg
68     /sbin/lspci -n | /bin/grep "Class 0200"    
69     echo ========== lspci end
70     echo
71     echo ========== ifconfig beg
72     /sbin/ifconfig
73     echo ========== ifconfig end
74     echo 
75     echo $(date "+%H:%M:%S") " pl_netinit: shutting down machine in two hours"
76     /bin/sleep 2h
77     /sbin/shutdown -h now
78     exit 1
79 }
80
81 # Function for checking the IP address to see if its sensible.
82 function check_ip() {
83     case "$*" in
84         "" | *[!0-9.]* | *[!0-9]) return 1 ;;
85     esac
86     local IFS=.
87     set -- $*
88     [ $# -eq 4 ] &&
89     [ ${1:-666} -le 255 ] && [ ${2:-666} -le 255 ] &&
90     [ ${3:-666} -le 255 ] && [ ${4:-666} -le 255 ]
91 }
92
93 # find and parse a node network configuration file. return 0 if not found,
94 # return 1 if found and parsed. if this is the case, DEFAULT_NET_CONF will 
95 # be set to 1. For any found configuration file, $USED_NET_CONF will
96 # contain the validated contents
97 function find_node_config() {
98     /bin/rm -f $TMP_OLD_FLOPPY_CONF_FILE 2>&1 > /dev/null
99
100     echo $(date "+%H:%M:%S") " pl_netinit: looking for node configuration file on floppy"
101     
102     /bin/mount -o ro -t $NODE_CONF_DEVICE_FS_TYPES /dev/fd0 \
103         $CONF_DEVICE_MOUNT_POINT 2>&1 > /dev/null
104     if [[ $? -eq 0 ]]; then
105
106         # 1. check for new named file first on the floppy disk
107         if [ -r "$CONF_DEVICE_MOUNT_POINT/$NEW_NODE_CONF_NAME" ]; then
108             conf_file="$CONF_DEVICE_MOUNT_POINT/$NEW_NODE_CONF_NAME"
109             echo $(date "+%H:%M:%S") " pl_netinit: found node configuration file $conf_file"
110             /etc/init.d/pl_validateconf < $conf_file > $USED_NET_CONF
111             /bin/umount $CONF_DEVICE_MOUNT_POINT
112             return 1
113
114         # since we have the floppy mounted already, see if an old file
115         # exists there so we don't have to remount the floppy when we need
116         # to check for an old file on it (later in the order). if it does
117         # just copy it off to a special location
118         elif [ -r "$CONF_DEVICE_MOUNT_POINT/$OLD_NODE_CONF_NAME" ]; then
119             conf_file="$CONF_DEVICE_MOUNT_POINT/$OLD_NODE_CONF_NAME"
120             /bin/cp -f $conf_file $TMP_OLD_FLOPPY_CONF_FILE
121             echo $(date "+%H:%M:%S") " pl_netinit: found old named configuration file, checking later."
122         else
123             echo $(date "+%H:%M:%S") " pl_netinit: floppy mounted, but no configuration file."
124         fi
125
126         /bin/umount $CONF_DEVICE_MOUNT_POINT
127     else
128         echo $(date "+%H:%M:%S") " pl_netinit: no floppy could be mounted, continuing search."
129     fi
130
131     # 2. check for a new named file on removable flash devices (those 
132     # that start with sd*, because usb_storage emulates scsi devices).
133     # to prevent checking normal scsi disks, also make sure
134     # /sys/block/<dev>/removable is set to 1
135
136     echo $(date "+%H:%M:%S") " pl_netinit: looking for node configuration file on flash based devices"
137
138     # make the sd* hd* expansion fail to an empty string if there are no sd
139     # devices
140     shopt -s nullglob
141
142     for device in /sys/block/[hsv]d*; do
143         removable=$(cat $device/removable)
144         if [[ $removable -ne 1 ]]; then
145             continue
146         fi
147
148         partitions=$(/bin/awk "\$4 ~ /$(basename $device)[0-9]*/ { print \$4 }" /proc/partitions)
149         for partition in $partitions ; do
150             check_dev=/dev/$partition
151
152             echo $(date "+%H:%M:%S") " pl_netinit: looking for node configuration file on device $check_dev"
153             /bin/mount -o ro -t $NODE_CONF_DEVICE_FS_TYPES $check_dev \
154                 $CONF_DEVICE_MOUNT_POINT 2>&1 > /dev/null
155             if [[ $? -eq 0 ]]; then
156                 if [ -r "$CONF_DEVICE_MOUNT_POINT/$NEW_NODE_CONF_NAME" ]; then
157                     conf_file="$CONF_DEVICE_MOUNT_POINT/$NEW_NODE_CONF_NAME"
158                     echo $(date "+%H:%M:%S") " pl_netinit: found node configuration file $conf_file"
159                     /etc/init.d/pl_validateconf < $conf_file > $USED_NET_CONF
160                     echo $(date "+%H:%M:%S") " pl_netinit: found configuration"
161                     /bin/umount $CONF_DEVICE_MOUNT_POINT
162                     return 1
163                 fi
164                 
165                 echo $(date "+%H:%M:%S") " pl_netinit: not found"
166
167                 /bin/umount $CONF_DEVICE_MOUNT_POINT
168             fi
169         done
170     done
171
172     # normal filename expansion setting
173     shopt -u nullglob
174
175     # 3. see if there is an old file on the floppy disk. if there was,
176     # the file $TMP_OLD_FLOPPY_CONF_FILE will be readable.
177     if [ -r "$TMP_OLD_FLOPPY_CONF_FILE" ]; then
178         conf_file=$TMP_OLD_FLOPPY_CONF_FILE
179         echo $(date "+%H:%M:%S") " pl_netinit: found node configuration file $conf_file"
180         /etc/init.d/pl_validateconf < $conf_file > $USED_NET_CONF
181         return 1
182     fi
183
184
185     # 4. check for plnode.txt on the cd at /usr/boot
186     echo $(date "+%H:%M:%S") " pl_netinit: looking for network configuration on cd in /usr/boot"
187     if [ -r "$CD_NET_CONF_BOOT" ]; then
188         
189         echo $(date "+%H:%M:%S") " pl_netinit: found cd configuration file $CD_NET_BOOT_CONF"
190         /etc/init.d/pl_validateconf < $CD_NET_CONF_BOOT > $USED_NET_CONF
191         return 1
192     fi
193     
194
195     # 5. check for plnode.txt on the cd at /usr
196     echo $(date "+%H:%M:%S") " pl_netinit: looking for network configuration on cd in /usr"
197     if [ -r "$CD_NET_CONF_ROOT" ]; then
198         
199         echo $(date "+%H:%M:%S") " pl_netinit: found cd configuration file $CD_NET_CONF_ROOT"
200         /etc/init.d/pl_validateconf < $CD_NET_CONF_ROOT > $USED_NET_CONF
201         return 1
202     fi
203
204
205     # 6. no node configuration file could be found, fall back to
206     # builtin default. this can't be used to install a machine, but
207     # will at least let it download and run the boot manager, which
208     # can inform the users appropriately.
209     echo $(date "+%H:%M:%S") " pl_netinit: using default network configuration"
210     if [ -r "$FALLBACK_NET_CONF" ]; then
211         echo $(date "+%H:%M:%S") " pl_netinit: found cd default configuration file $FALLBACK_NET_CONF"
212         /etc/init.d/pl_validateconf < $FALLBACK_NET_CONF > $USED_NET_CONF
213         DEFAULT_NET_CONF=1
214         return 1
215     fi
216
217     return 0
218 }
219
220
221 echo $(date "+%H:%M:%S") " pl_netinit: bringing loopback network device up"
222 /sbin/ifconfig lo 127.0.0.1 up
223
224 find_node_config
225 if [ $? -eq 0 ]; then
226     # no network configuration file found. this should not happen as the
227     # default cd image has a backup one. halt.
228     echo $(date "+%H:%M:%S") " pl_netinit: unable to find even a default network configuration"
229     echo $(date "+%H:%M:%S") " pl_netinit: file, this cd may be corrupt."
230     net_init_failed
231 fi
232
233 # load the configuration file. if it was a default one (not user specified),
234 # then remove the saved copy from /tmp, but continue on. since a network 
235 # configuration file is required and boot scripts only know about this location
236 # they will fail (as they should) - but the network will be up if dhcp is
237 # available
238
239 echo $(date "+%H:%M:%S") " pl_netinit: loading network configuration"
240 . $USED_NET_CONF
241
242 if [[ $DEFAULT_NET_CONF -eq 1 ]]; then
243     /bin/rm -f $USED_NET_CONF
244 fi
245
246 # initialize IPMI device
247 if [[ -n "$IPMI_ADDRESS" ]] ; then
248     echo -n "pl_netinit: initializing IPMI: "
249     cmd="ipnmac -i $IPMI_ADDRESS"
250     if [[ -n "$IPMI_MAC" ]] ; then
251         cmd="$cmd -m $IPMI_MAC"
252     fi
253     echo $cmd
254     $cmd
255 fi
256
257 # now, we need to find which device to use (ie, eth0 or eth1). start out
258 # by defaulting to eth0, then see if the network configuration file specified
259 # either a mac address (in which case we will need to find the device), or
260 # the device itself
261
262 ETH_DEVICE=
263 if [[ -n "$NET_DEVICE" ]]; then
264     # the user specified a mac address we should use. find the network
265     # device for it.
266     NET_DEVICE=$(tr A-Z a-z <<<$NET_DEVICE)
267
268     pushd /sys/class/net
269     for device in *; do
270         dev_address=$(cat $device/address | tr A-Z a-z)
271         if [ "$device" == "$NET_DEVICE" -o "$dev_address" == "$NET_DEVICE" ]; then
272             ETH_DEVICE=$device
273             echo $(date "+%H:%M:%S") " pl_netinit: found device $ETH_DEVICE with mac address $dev_address"
274             break
275         fi
276     done
277     popd
278 fi
279
280 # if we didn't find a device yet, check which is the primary
281 if [[ -z "$ETH_DEVICE" ]]; then
282     pushd /etc/sysconfig/network-scripts > /dev/null
283     for conf in ifcfg-*; do
284         egrep -q '^PRIMARY=["'"'"']?[yY1t]' $conf || continue
285         ETH_DEVICE=${conf#ifcfg-}
286         break
287     done
288     popd > /dev/null
289 fi
290
291 # still nothing? fail the boot.
292 if [[ -z "$ETH_DEVICE" ]]; then
293     echo $(date "+%H:%M:%S") " pl_netinit: unable to find a usable device, check to make sure"
294     echo $(date "+%H:%M:%S") " pl_netinit: the NET_DEVICE field in the configuration file"
295     echo $(date "+%H:%M:%S") " pl_netinit: corresponds with a network adapter on this system"
296     net_init_failed
297 fi
298
299 # within a systemd-driven startup, we often see this stage
300 # triggered before the network interface is actually exposed
301 # by udev/kernel
302 # although of course we have network-online.target
303 # as a requirement; go figure what systemd actually does..
304
305 # in any case, let us try to work around that by allowing some delay
306 # here
307
308 ALLOW=5
309 COUNTER=0
310 while true; do
311     if /sbin/ifconfig $ETH_DEVICE >& /dev/null; then
312         echo "pl_netinit: device present $ETH_DEVICE, proceeding (${COUNTER}s/${ALLOW}s)"
313         break
314     fi
315     echo $(date "+%H:%M:%S") " pl_netinit: waiting for device $ETH_DEVICE,${COUNTER}s/${ALLOW}s"
316     COUNTER=$(($COUNTER+1))
317     [ $COUNTER -ge $ALLOW ] && net_init_failed
318     sleep 1
319 done
320
321
322 # actually check to make sure ifconfig <device> succeeds
323
324 /sbin/ifconfig $ETH_DEVICE up 2>&1 > /dev/null || {
325     echo $(date "+%H:%M:%S") " pl_netinit: device $ETH_DEVICE does not exist, most likely"
326     echo $(date "+%H:%M:%S") " pl_netinit: this CD does not have hardware support for your"
327     echo $(date "+%H:%M:%S") " pl_netinit: network adapter. please send the following lines"
328     echo $(date "+%H:%M:%S") " pl_netinit: to your PlanetLab support for further assistance"
329     net_init_failed
330 }
331
332 echo $(date "+%H:%M:%S") " pl_netinit: attempting to start networking"
333 /sbin/service network start
334
335 # for backwards compatibility
336 /sbin/ifconfig $ETH_DEVICE > $IFCONFIG_OUTPUT
337
338 echo $(date "+%H:%M:%S") " pl_netinit: network online"