Merge "citrix" into "master".
[sliver-openvswitch.git] / lib / netdev.c
1 /*
2  * Copyright (c) 2008, 2009 Nicira Networks.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at:
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #include <config.h>
18 #include "netdev.h"
19
20 #include <assert.h>
21 #include <errno.h>
22 #include <inttypes.h>
23 #include <netinet/in.h>
24 #include <stdlib.h>
25 #include <string.h>
26 #include <unistd.h>
27
28 #include "coverage.h"
29 #include "dynamic-string.h"
30 #include "fatal-signal.h"
31 #include "list.h"
32 #include "netdev-provider.h"
33 #include "ofpbuf.h"
34 #include "packets.h"
35 #include "poll-loop.h"
36 #include "shash.h"
37 #include "svec.h"
38
39 #define THIS_MODULE VLM_netdev
40 #include "vlog.h"
41
42 static const struct netdev_class *netdev_classes[] = {
43     &netdev_linux_class,
44     &netdev_tap_class,
45 };
46 static int n_netdev_classes = ARRAY_SIZE(netdev_classes);
47
48 /* All open network devices. */
49 static struct list netdev_list = LIST_INITIALIZER(&netdev_list);
50
51 /* This is set pretty low because we probably won't learn anything from the
52  * additional log messages. */
53 static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(5, 20);
54
55 static void restore_all_flags(void *aux);
56 static int restore_flags(struct netdev *netdev);
57
58 /* Attempts to initialize the netdev module.  Returns 0 if successful,
59  * otherwise a positive errno value.
60  *
61  * Calling this function is optional.  If not called explicitly, it will
62  * automatically be called upon the first attempt to open a network device. */
63 int
64 netdev_initialize(void)
65 {
66     static int status = -1;
67     if (status < 0) {
68         int i, j;
69
70         fatal_signal_add_hook(restore_all_flags, NULL, true);
71
72         status = 0;
73         for (i = j = 0; i < n_netdev_classes; i++) {
74             const struct netdev_class *class = netdev_classes[i];
75             if (class->init) {
76                 int retval = class->init();
77                 if (!retval) {
78                     netdev_classes[j++] = class;
79                 } else {
80                     VLOG_ERR("failed to initialize %s network device "
81                              "class: %s", class->name, strerror(retval));
82                     if (!status) {
83                         status = retval;
84                     }
85                 }
86             } else {
87                 netdev_classes[j++] = class;
88             }
89         }
90         n_netdev_classes = j;
91     }
92     return status;
93 }
94
95 /* Performs periodic work needed by all the various kinds of netdevs.
96  *
97  * If your program opens any netdevs, it must call this function within its
98  * main poll loop. */
99 void
100 netdev_run(void)
101 {
102     int i;
103     for (i = 0; i < n_netdev_classes; i++) {
104         const struct netdev_class *class = netdev_classes[i];
105         if (class->run) {
106             class->run();
107         }
108     }
109 }
110
111 /* Arranges for poll_block() to wake up when netdev_run() needs to be called.
112  *
113  * If your program opens any netdevs, it must call this function within its
114  * main poll loop. */
115 void
116 netdev_wait(void)
117 {
118     int i;
119     for (i = 0; i < n_netdev_classes; i++) {
120         const struct netdev_class *class = netdev_classes[i];
121         if (class->wait) {
122             class->wait();
123         }
124     }
125 }
126
127 /* Opens the network device named 'name' (e.g. "eth0") and returns zero if
128  * successful, otherwise a positive errno value.  On success, sets '*netdevp'
129  * to the new network device, otherwise to null.
130  *
131  * 'ethertype' may be a 16-bit Ethernet protocol value in host byte order to
132  * capture frames of that type received on the device.  It may also be one of
133  * the 'enum netdev_pseudo_ethertype' values to receive frames in one of those
134  * categories. */
135 int
136 netdev_open(const char *name_, int ethertype, struct netdev **netdevp)
137 {
138     char *name = xstrdup(name_);
139     char *prefix, *suffix, *colon;
140     struct netdev *netdev = NULL;
141     int error;
142     int i;
143
144     netdev_initialize();
145     colon = strchr(name, ':');
146     if (colon) {
147         *colon = '\0';
148         prefix = name;
149         suffix = colon + 1;
150     } else {
151         prefix = "";
152         suffix = name;
153     }
154
155     for (i = 0; i < n_netdev_classes; i++) {
156         const struct netdev_class *class = netdev_classes[i];
157         if (!strcmp(prefix, class->prefix)) {
158             error = class->open(name_, suffix, ethertype, &netdev);
159             goto exit;
160         }
161     }
162     error = EAFNOSUPPORT;
163
164 exit:
165     *netdevp = error ? NULL : netdev;
166     free(name);
167     return error;
168 }
169
170 /* Closes and destroys 'netdev'. */
171 void
172 netdev_close(struct netdev *netdev)
173 {
174     if (netdev) {
175         char *name;
176         int error;
177
178         /* Restore flags that we changed, if any. */
179         fatal_signal_block();
180         error = restore_flags(netdev);
181         list_remove(&netdev->node);
182         fatal_signal_unblock();
183         if (error) {
184             VLOG_WARN("failed to restore network device flags on %s: %s",
185                       netdev->name, strerror(error));
186         }
187
188         /* Free. */
189         name = netdev->name;
190         netdev->class->close(netdev);
191         free(name);
192     }
193 }
194
195 /* Returns true if a network device named 'name' exists and may be opened,
196  * otherwise false. */
197 bool
198 netdev_exists(const char *name)
199 {
200     struct netdev *netdev;
201     int error;
202
203     error = netdev_open(name, NETDEV_ETH_TYPE_NONE, &netdev);
204     if (!error) {
205         netdev_close(netdev);
206         return true;
207     } else {
208         if (error != ENODEV) {
209             VLOG_WARN("failed to open network device %s: %s",
210                       name, strerror(error));
211         }
212         return false;
213     }
214 }
215
216 /* Initializes 'svec' with a list of the names of all known network devices. */
217 int
218 netdev_enumerate(struct svec *svec)
219 {
220     int error;
221     int i;
222
223     svec_init(svec);
224
225     netdev_initialize();
226
227     error = 0;
228     for (i = 0; i < n_netdev_classes; i++) {
229         const struct netdev_class *class = netdev_classes[i];
230         if (class->enumerate) {
231             int retval = class->enumerate(svec);
232             if (retval) {
233                 VLOG_WARN("failed to enumerate %s network devices: %s",
234                           class->name, strerror(retval));
235                 if (!error) {
236                     error = retval;
237                 }
238             }
239         }
240     }
241     return error;
242 }
243
244 /* Attempts to receive a packet from 'netdev' into 'buffer', which the caller
245  * must have initialized with sufficient room for the packet.  The space
246  * required to receive any packet is ETH_HEADER_LEN bytes, plus VLAN_HEADER_LEN
247  * bytes, plus the device's MTU (which may be retrieved via netdev_get_mtu()).
248  * (Some devices do not allow for a VLAN header, in which case VLAN_HEADER_LEN
249  * need not be included.)
250  *
251  * If a packet is successfully retrieved, returns 0.  In this case 'buffer' is
252  * guaranteed to contain at least ETH_TOTAL_MIN bytes.  Otherwise, returns a
253  * positive errno value.  Returns EAGAIN immediately if no packet is ready to
254  * be returned.
255  */
256 int
257 netdev_recv(struct netdev *netdev, struct ofpbuf *buffer)
258 {
259     int retval;
260
261     assert(buffer->size == 0);
262     assert(ofpbuf_tailroom(buffer) >= ETH_TOTAL_MIN);
263
264     retval = netdev->class->recv(netdev,
265                                  buffer->data, ofpbuf_tailroom(buffer));
266     if (retval >= 0) {
267         COVERAGE_INC(netdev_received);
268         buffer->size += retval;
269         if (buffer->size < ETH_TOTAL_MIN) {
270             ofpbuf_put_zeros(buffer, ETH_TOTAL_MIN - buffer->size);
271         }
272         return 0;
273     } else {
274         return -retval;
275     }
276 }
277
278 /* Registers with the poll loop to wake up from the next call to poll_block()
279  * when a packet is ready to be received with netdev_recv() on 'netdev'. */
280 void
281 netdev_recv_wait(struct netdev *netdev)
282 {
283     netdev->class->recv_wait(netdev);
284 }
285
286 /* Discards all packets waiting to be received from 'netdev'. */
287 int
288 netdev_drain(struct netdev *netdev)
289 {
290     return netdev->class->drain(netdev);
291 }
292
293 /* Sends 'buffer' on 'netdev'.  Returns 0 if successful, otherwise a positive
294  * errno value.  Returns EAGAIN without blocking if the packet cannot be queued
295  * immediately.  Returns EMSGSIZE if a partial packet was transmitted or if
296  * the packet is too big or too small to transmit on the device.
297  *
298  * The caller retains ownership of 'buffer' in all cases.
299  *
300  * The kernel maintains a packet transmission queue, so the caller is not
301  * expected to do additional queuing of packets. */
302 int
303 netdev_send(struct netdev *netdev, const struct ofpbuf *buffer)
304 {
305     int error = netdev->class->send(netdev, buffer->data, buffer->size);
306     if (!error) {
307         COVERAGE_INC(netdev_sent);
308     }
309     return error;
310 }
311
312 /* Registers with the poll loop to wake up from the next call to poll_block()
313  * when the packet transmission queue has sufficient room to transmit a packet
314  * with netdev_send().
315  *
316  * The kernel maintains a packet transmission queue, so the client is not
317  * expected to do additional queuing of packets.  Thus, this function is
318  * unlikely to ever be used.  It is included for completeness. */
319 void
320 netdev_send_wait(struct netdev *netdev)
321 {
322     return netdev->class->send_wait(netdev);
323 }
324
325 /* Attempts to set 'netdev''s MAC address to 'mac'.  Returns 0 if successful,
326  * otherwise a positive errno value. */
327 int
328 netdev_set_etheraddr(struct netdev *netdev, const uint8_t mac[ETH_ADDR_LEN])
329 {
330     return netdev->class->set_etheraddr(netdev, mac);
331 }
332
333 /* Retrieves 'netdev''s MAC address.  If successful, returns 0 and copies the
334  * the MAC address into 'mac'.  On failure, returns a positive errno value and
335  * clears 'mac' to all-zeros. */
336 int
337 netdev_get_etheraddr(const struct netdev *netdev, uint8_t mac[ETH_ADDR_LEN])
338 {
339     return netdev->class->get_etheraddr(netdev, mac);
340 }
341
342 /* Returns the name of the network device that 'netdev' represents,
343  * e.g. "eth0".  The caller must not modify or free the returned string. */
344 const char *
345 netdev_get_name(const struct netdev *netdev)
346 {
347     return netdev->name;
348 }
349
350 /* Retrieves the MTU of 'netdev'.  The MTU is the maximum size of transmitted
351  * (and received) packets, in bytes, not including the hardware header; thus,
352  * this is typically 1500 bytes for Ethernet devices.
353  *
354  * If successful, returns 0 and stores the MTU size in '*mtup'.  On failure,
355  * returns a positive errno value and stores ETH_PAYLOAD_MAX (1500) in
356  * '*mtup'. */
357 int
358 netdev_get_mtu(const struct netdev *netdev, int *mtup)
359 {
360     int error = netdev->class->get_mtu(netdev, mtup);
361     if (error) {
362         VLOG_WARN_RL(&rl, "failed to retrieve MTU for network device %s: %s",
363                      netdev_get_name(netdev), strerror(error));
364         *mtup = ETH_PAYLOAD_MAX;
365     }
366     return error;
367 }
368
369 /* Stores the features supported by 'netdev' into each of '*current',
370  * '*advertised', '*supported', and '*peer' that are non-null.  Each value is a
371  * bitmap of "enum ofp_port_features" bits, in host byte order.  Returns 0 if
372  * successful, otherwise a positive errno value.  On failure, all of the
373  * passed-in values are set to 0. */
374 int
375 netdev_get_features(struct netdev *netdev,
376                     uint32_t *current, uint32_t *advertised,
377                     uint32_t *supported, uint32_t *peer)
378 {
379     uint32_t dummy[4];
380     return netdev->class->get_features(netdev,
381                                        current ? current : &dummy[0],
382                                        advertised ? advertised : &dummy[1],
383                                        supported ? supported : &dummy[2],
384                                        peer ? peer : &dummy[3]);
385 }
386
387 /* Set the features advertised by 'netdev' to 'advertise'.  Returns 0 if
388  * successful, otherwise a positive errno value. */
389 int
390 netdev_set_advertisements(struct netdev *netdev, uint32_t advertise)
391 {
392     return (netdev->class->set_advertisements
393             ? netdev->class->set_advertisements(netdev, advertise)
394             : EOPNOTSUPP);
395 }
396
397 /* If 'netdev' has an assigned IPv4 address, sets '*address' to that address
398  * and '*netmask' to its netmask and returns 0.  Otherwise, returns a positive
399  * errno value and sets '*address' to 0 (INADDR_ANY).
400  *
401  * The following error values have well-defined meanings:
402  *
403  *   - EADDRNOTAVAIL: 'netdev' has no assigned IPv4 address.
404  *
405  *   - EOPNOTSUPP: No IPv4 network stack attached to 'netdev'.
406  *
407  * 'address' or 'netmask' or both may be null, in which case the address or netmask
408  * is not reported. */
409 int
410 netdev_get_in4(const struct netdev *netdev,
411                struct in_addr *address_, struct in_addr *netmask_)
412 {
413     struct in_addr address;
414     struct in_addr netmask;
415     int error;
416
417     error = (netdev->class->get_in4
418              ? netdev->class->get_in4(netdev, &address, &netmask)
419              : EOPNOTSUPP);
420     if (address_) {
421         address_->s_addr = error ? 0 : address.s_addr;
422     }
423     if (netmask_) {
424         netmask_->s_addr = error ? 0 : netmask.s_addr;
425     }
426     return error;
427 }
428
429 /* Assigns 'addr' as 'netdev''s IPv4 address and 'mask' as its netmask.  If
430  * 'addr' is INADDR_ANY, 'netdev''s IPv4 address is cleared.  Returns a
431  * positive errno value. */
432 int
433 netdev_set_in4(struct netdev *netdev, struct in_addr addr, struct in_addr mask)
434 {
435     return (netdev->class->set_in4
436             ? netdev->class->set_in4(netdev, addr, mask)
437             : EOPNOTSUPP);
438 }
439
440 /* Adds 'router' as a default IP gateway for the TCP/IP stack that corresponds
441  * to 'netdev'. */
442 int
443 netdev_add_router(struct netdev *netdev, struct in_addr router)
444 {
445     COVERAGE_INC(netdev_add_router);
446     return (netdev->class->add_router
447             ? netdev->class->add_router(netdev, router)
448             : EOPNOTSUPP);
449 }
450
451 /* Looks up the next hop for 'host' for the TCP/IP stack that corresponds to
452  * 'netdev'.  If a route cannot not be determined, sets '*next_hop' to 0,
453  * '*netdev_name' to null, and returns a positive errno value.  Otherwise, if a
454  * next hop is found, stores the next hop gateway's address (0 if 'host' is on
455  * a directly connected network) in '*next_hop' and a copy of the name of the
456  * device to reach 'host' in '*netdev_name', and returns 0.  The caller is
457  * responsible for freeing '*netdev_name' (by calling free()). */
458 int
459 netdev_get_next_hop(const struct netdev *netdev,
460                     const struct in_addr *host, struct in_addr *next_hop,
461                     char **netdev_name)
462 {
463     int error = (netdev->class->get_next_hop
464                  ? netdev->class->get_next_hop(host, next_hop, netdev_name)
465                  : EOPNOTSUPP);
466     if (error) {
467         next_hop->s_addr = 0;
468         *netdev_name = NULL;
469     }
470     return error;
471 }
472
473 /* If 'netdev' has an assigned IPv6 address, sets '*in6' to that address and
474  * returns 0.  Otherwise, returns a positive errno value and sets '*in6' to
475  * all-zero-bits (in6addr_any).
476  *
477  * The following error values have well-defined meanings:
478  *
479  *   - EADDRNOTAVAIL: 'netdev' has no assigned IPv6 address.
480  *
481  *   - EOPNOTSUPP: No IPv6 network stack attached to 'netdev'.
482  *
483  * 'in6' may be null, in which case the address itself is not reported. */
484 int
485 netdev_get_in6(const struct netdev *netdev, struct in6_addr *in6)
486 {
487     struct in6_addr dummy;
488     int error;
489
490     error = (netdev->class->get_in6
491              ? netdev->class->get_in6(netdev, in6 ? in6 : &dummy)
492              : EOPNOTSUPP);
493     if (error && in6) {
494         memset(in6, 0, sizeof *in6);
495     }
496     return error;
497 }
498
499 /* On 'netdev', turns off the flags in 'off' and then turns on the flags in
500  * 'on'.  If 'permanent' is true, the changes will persist; otherwise, they
501  * will be reverted when 'netdev' is closed or the program exits.  Returns 0 if
502  * successful, otherwise a positive errno value. */
503 static int
504 do_update_flags(struct netdev *netdev, enum netdev_flags off,
505                 enum netdev_flags on, enum netdev_flags *old_flagsp,
506                 bool permanent)
507 {
508     enum netdev_flags old_flags;
509     int error;
510
511     error = netdev->class->update_flags(netdev, off & ~on, on, &old_flags);
512     if (error) {
513         VLOG_WARN_RL(&rl, "failed to %s flags for network device %s: %s",
514                      off || on ? "set" : "get", netdev_get_name(netdev),
515                      strerror(error));
516         old_flags = 0;
517     } else if ((off || on) && !permanent) {
518         enum netdev_flags new_flags = (old_flags & ~off) | on;
519         enum netdev_flags changed_flags = old_flags ^ new_flags;
520         if (changed_flags) {
521             if (!netdev->changed_flags) {
522                 netdev->save_flags = old_flags;
523             }
524             netdev->changed_flags |= changed_flags;
525         }
526     }
527     if (old_flagsp) {
528         *old_flagsp = old_flags;
529     }
530     return error;
531 }
532
533 /* Obtains the current flags for 'netdev' and stores them into '*flagsp'.
534  * Returns 0 if successful, otherwise a positive errno value.  On failure,
535  * stores 0 into '*flagsp'. */
536 int
537 netdev_get_flags(const struct netdev *netdev_, enum netdev_flags *flagsp)
538 {
539     struct netdev *netdev = (struct netdev *) netdev_;
540     return do_update_flags(netdev, 0, 0, flagsp, false);
541 }
542
543 /* Sets the flags for 'netdev' to 'flags'.
544  * If 'permanent' is true, the changes will persist; otherwise, they
545  * will be reverted when 'netdev' is closed or the program exits.
546  * Returns 0 if successful, otherwise a positive errno value. */
547 int
548 netdev_set_flags(struct netdev *netdev, enum netdev_flags flags,
549                  bool permanent)
550 {
551     return do_update_flags(netdev, -1, flags, NULL, permanent);
552 }
553
554 /* Turns on the specified 'flags' on 'netdev'.
555  * If 'permanent' is true, the changes will persist; otherwise, they
556  * will be reverted when 'netdev' is closed or the program exits.
557  * Returns 0 if successful, otherwise a positive errno value. */
558 int
559 netdev_turn_flags_on(struct netdev *netdev, enum netdev_flags flags,
560                      bool permanent)
561 {
562     return do_update_flags(netdev, 0, flags, NULL, permanent);
563 }
564
565 /* Turns off the specified 'flags' on 'netdev'.
566  * If 'permanent' is true, the changes will persist; otherwise, they
567  * will be reverted when 'netdev' is closed or the program exits.
568  * Returns 0 if successful, otherwise a positive errno value. */
569 int
570 netdev_turn_flags_off(struct netdev *netdev, enum netdev_flags flags,
571                       bool permanent)
572 {
573     return do_update_flags(netdev, flags, 0, NULL, permanent);
574 }
575
576 /* Looks up the ARP table entry for 'ip' on 'netdev'.  If one exists and can be
577  * successfully retrieved, it stores the corresponding MAC address in 'mac' and
578  * returns 0.  Otherwise, it returns a positive errno value; in particular,
579  * ENXIO indicates that there is no ARP table entry for 'ip' on 'netdev'. */
580 int
581 netdev_arp_lookup(const struct netdev *netdev,
582                   uint32_t ip, uint8_t mac[ETH_ADDR_LEN])
583 {
584     int error = (netdev->class->arp_lookup
585                  ? netdev->class->arp_lookup(netdev, ip, mac)
586                  : EOPNOTSUPP);
587     if (error) {
588         memset(mac, 0, ETH_ADDR_LEN);
589     }
590     return error;
591 }
592
593 /* Sets 'carrier' to true if carrier is active (link light is on) on
594  * 'netdev'. */
595 int
596 netdev_get_carrier(const struct netdev *netdev, bool *carrier)
597 {
598     int error = (netdev->class->get_carrier
599                  ? netdev->class->get_carrier(netdev, carrier)
600                  : EOPNOTSUPP);
601     if (error) {
602         *carrier = false;
603     }
604     return error;
605 }
606
607 /* Retrieves current device stats for 'netdev'. */
608 int
609 netdev_get_stats(const struct netdev *netdev, struct netdev_stats *stats)
610 {
611     int error;
612
613     COVERAGE_INC(netdev_get_stats);
614     error = (netdev->class->get_stats
615              ? netdev->class->get_stats(netdev, stats)
616              : EOPNOTSUPP);
617     if (error) {
618         memset(stats, 0xff, sizeof *stats);
619     }
620     return error;
621 }
622
623 /* Attempts to set input rate limiting (policing) policy, such that up to
624  * 'kbits_rate' kbps of traffic is accepted, with a maximum accumulative burst
625  * size of 'kbits' kb. */
626 int
627 netdev_set_policing(struct netdev *netdev, uint32_t kbits_rate,
628                     uint32_t kbits_burst)
629 {
630     return (netdev->class->set_policing
631             ? netdev->class->set_policing(netdev, kbits_rate, kbits_burst)
632             : EOPNOTSUPP);
633 }
634
635 /* If 'netdev' is a VLAN network device (e.g. one created with vconfig(8)),
636  * sets '*vlan_vid' to the VLAN VID associated with that device and returns 0.
637  * Otherwise returns a errno value (specifically ENOENT if 'netdev_name' is the
638  * name of a network device that is not a VLAN device) and sets '*vlan_vid' to
639  * -1. */
640 int
641 netdev_get_vlan_vid(const struct netdev *netdev, int *vlan_vid)
642 {
643     int error = (netdev->class->get_vlan_vid
644                  ? netdev->class->get_vlan_vid(netdev, vlan_vid)
645                  : ENOENT);
646     if (error) {
647         *vlan_vid = 0;
648     }
649     return error;
650 }
651
652 /* Returns a network device that has 'in4' as its IP address, if one exists,
653  * otherwise a null pointer. */
654 struct netdev *
655 netdev_find_dev_by_in4(const struct in_addr *in4)
656 {
657     struct netdev *netdev;
658     struct svec dev_list;
659     size_t i;
660
661     netdev_enumerate(&dev_list);
662     for (i = 0; i < dev_list.n; i++) {
663         const char *name = dev_list.names[i];
664         struct in_addr dev_in4;
665
666         if (!netdev_open(name, NETDEV_ETH_TYPE_NONE, &netdev)
667             && !netdev_get_in4(netdev, &dev_in4, NULL)
668             && dev_in4.s_addr == in4->s_addr) {
669             goto exit;
670         }
671         netdev_close(netdev);
672     }
673     netdev = NULL;
674
675 exit:
676     svec_destroy(&dev_list);
677     return netdev;
678 }
679 \f
680 /* Initializes 'netdev' as a netdev named 'name' of the specified 'class'.
681  *
682  * This function adds 'netdev' to a netdev-owned linked list, so it is very
683  * important that 'netdev' only be freed after calling netdev_close(). */
684 void
685 netdev_init(struct netdev *netdev, const char *name,
686             const struct netdev_class *class)
687 {
688     netdev->class = class;
689     netdev->name = xstrdup(name);
690     netdev->save_flags = 0;
691     netdev->changed_flags = 0;
692     list_push_back(&netdev_list, &netdev->node);
693 }
694
695 /* Initializes 'notifier' as a netdev notifier for 'netdev', for which
696  * notification will consist of calling 'cb', with auxiliary data 'aux'. */
697 void
698 netdev_notifier_init(struct netdev_notifier *notifier, struct netdev *netdev,
699                      void (*cb)(struct netdev_notifier *), void *aux)
700 {
701     notifier->netdev = netdev;
702     notifier->cb = cb;
703     notifier->aux = aux;
704 }
705 \f
706 /* Tracks changes in the status of a set of network devices. */
707 struct netdev_monitor {
708     struct shash polled_netdevs;
709     struct shash changed_netdevs;
710 };
711
712 /* Creates and returns a new structure for monitor changes in the status of
713  * network devices. */
714 struct netdev_monitor *
715 netdev_monitor_create(void)
716 {
717     struct netdev_monitor *monitor = xmalloc(sizeof *monitor);
718     shash_init(&monitor->polled_netdevs);
719     shash_init(&monitor->changed_netdevs);
720     return monitor;
721 }
722
723 /* Destroys 'monitor'. */
724 void
725 netdev_monitor_destroy(struct netdev_monitor *monitor)
726 {
727     if (monitor) {
728         struct shash_node *node;
729
730         SHASH_FOR_EACH (node, &monitor->polled_netdevs) {
731             struct netdev_notifier *notifier = node->data;
732             notifier->netdev->class->poll_remove(notifier);
733         }
734
735         shash_destroy(&monitor->polled_netdevs);
736         shash_destroy(&monitor->changed_netdevs);
737         free(monitor);
738     }
739 }
740
741 static void
742 netdev_monitor_cb(struct netdev_notifier *notifier)
743 {
744     struct netdev_monitor *monitor = notifier->aux;
745     const char *name = netdev_get_name(notifier->netdev);
746     if (!shash_find(&monitor->changed_netdevs, name)) {
747         shash_add(&monitor->changed_netdevs, name, NULL);
748     }
749 }
750
751 /* Attempts to add 'netdev' as a netdev monitored by 'monitor'.  Returns 0 if
752  * successful, otherwise a positive errno value.
753  *
754  * Adding a given 'netdev' to a monitor multiple times is equivalent to adding
755  * it once. */
756 int
757 netdev_monitor_add(struct netdev_monitor *monitor, struct netdev *netdev)
758 {
759     const char *netdev_name = netdev_get_name(netdev);
760     int error = 0;
761     if (!shash_find(&monitor->polled_netdevs, netdev_name)
762         && netdev->class->poll_add)
763     {
764         struct netdev_notifier *notifier;
765         error = netdev->class->poll_add(netdev, netdev_monitor_cb, monitor,
766                                         &notifier);
767         if (!error) {
768             assert(notifier->netdev == netdev);
769             shash_add(&monitor->polled_netdevs, netdev_name, notifier);
770         }
771     }
772     return error;
773 }
774
775 /* Removes 'netdev' from the set of netdevs monitored by 'monitor'.  (This has
776  * no effect if 'netdev' is not in the set of devices monitored by
777  * 'monitor'.) */
778 void
779 netdev_monitor_remove(struct netdev_monitor *monitor, struct netdev *netdev)
780 {
781     const char *netdev_name = netdev_get_name(netdev);
782     struct shash_node *node;
783
784     node = shash_find(&monitor->polled_netdevs, netdev_name);
785     if (node) {
786         /* Cancel future notifications. */
787         struct netdev_notifier *notifier = node->data;
788         netdev->class->poll_remove(notifier);
789         shash_delete(&monitor->polled_netdevs, node);
790
791         /* Drop any pending notification. */
792         node = shash_find(&monitor->changed_netdevs, netdev_name);
793         if (node) {
794             shash_delete(&monitor->changed_netdevs, node);
795         }
796     }
797 }
798
799 /* Checks for changes to netdevs in the set monitored by 'monitor'.  If any of
800  * the attributes (Ethernet address, carrier status, speed or peer-advertised
801  * speed, flags, etc.) of a network device monitored by 'monitor' has changed,
802  * sets '*devnamep' to the name of a device that has changed and returns 0.
803  * The caller is responsible for freeing '*devnamep' (with free()).
804  *
805  * If no devices have changed, sets '*devnamep' to NULL and returns EAGAIN.
806  */
807 int
808 netdev_monitor_poll(struct netdev_monitor *monitor, char **devnamep)
809 {
810     struct shash_node *node = shash_first(&monitor->changed_netdevs);
811     if (!node) {
812         *devnamep = NULL;
813         return EAGAIN;
814     } else {
815         *devnamep = xstrdup(node->name);
816         shash_delete(&monitor->changed_netdevs, node);
817         return 0;
818     }
819 }
820
821 /* Registers with the poll loop to wake up from the next call to poll_block()
822  * when netdev_monitor_poll(monitor) would indicate that a device has
823  * changed. */
824 void
825 netdev_monitor_poll_wait(const struct netdev_monitor *monitor)
826 {
827     if (!shash_is_empty(&monitor->changed_netdevs)) {
828         poll_immediate_wake();
829     } else {
830         /* XXX Nothing needed here for netdev_linux, but maybe other netdev
831          * classes need help. */
832     }
833 }
834 \f
835 /* Restore the network device flags on 'netdev' to those that were active
836  * before we changed them.  Returns 0 if successful, otherwise a positive
837  * errno value.
838  *
839  * To avoid reentry, the caller must ensure that fatal signals are blocked. */
840 static int
841 restore_flags(struct netdev *netdev)
842 {
843     if (netdev->changed_flags) {
844         enum netdev_flags restore = netdev->save_flags & netdev->changed_flags;
845         enum netdev_flags old_flags;
846         return netdev->class->update_flags(netdev,
847                                            netdev->changed_flags & ~restore,
848                                            restore, &old_flags);
849     }
850     return 0;
851 }
852
853 /* Retores all the flags on all network devices that we modified.  Called from
854  * a signal handler, so it does not attempt to report error conditions. */
855 static void
856 restore_all_flags(void *aux UNUSED)
857 {
858     struct netdev *netdev;
859     LIST_FOR_EACH (netdev, struct netdev, node, &netdev_list) {
860         restore_flags(netdev);
861     }
862 }