netdev-vport: New helper netdev_vport_get_dev().
[sliver-openvswitch.git] / lib / netdev-vport.c
1 /*
2  * Copyright (c) 2010, 2011, 2012, 2013 Nicira, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at:
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #include <config.h>
18
19 #include "netdev-vport.h"
20
21 #include <errno.h>
22 #include <fcntl.h>
23 #include <sys/socket.h>
24 #include <linux/openvswitch.h>
25 #include <linux/rtnetlink.h>
26 #include <net/if.h>
27 #include <sys/ioctl.h>
28
29 #include "byte-order.h"
30 #include "daemon.h"
31 #include "dirs.h"
32 #include "dpif-linux.h"
33 #include "hash.h"
34 #include "hmap.h"
35 #include "list.h"
36 #include "netdev-linux.h"
37 #include "netdev-provider.h"
38 #include "netlink.h"
39 #include "netlink-notifier.h"
40 #include "netlink-socket.h"
41 #include "ofpbuf.h"
42 #include "openvswitch/tunnel.h"
43 #include "packets.h"
44 #include "route-table.h"
45 #include "shash.h"
46 #include "socket-util.h"
47 #include "unaligned.h"
48 #include "vlog.h"
49
50 VLOG_DEFINE_THIS_MODULE(netdev_vport);
51
52 /* Default to the OTV port, per the VXLAN IETF draft. */
53 #define VXLAN_DST_PORT 8472
54
55 struct netdev_dev_vport {
56     struct netdev_dev netdev_dev;
57     struct ofpbuf *options;
58     unsigned int change_seq;
59 };
60
61 struct netdev_vport {
62     struct netdev netdev;
63 };
64
65 struct vport_class {
66     enum ovs_vport_type type;
67     struct netdev_class netdev_class;
68     int (*parse_config)(const char *name, const char *type,
69                         const struct smap *args, struct ofpbuf *options);
70     int (*unparse_config)(const char *name, const char *type,
71                           const struct nlattr *options, size_t options_len,
72                           struct smap *args);
73 };
74
75 static struct vlog_rate_limit rl = VLOG_RATE_LIMIT_INIT(5, 20);
76
77 static int netdev_vport_create(const struct netdev_class *, const char *,
78                                struct netdev_dev **);
79 static void netdev_vport_poll_notify(const struct netdev *);
80 static int tnl_port_config_from_nlattr(const struct nlattr *options,
81                                        size_t options_len,
82                                        struct nlattr *a[OVS_TUNNEL_ATTR_MAX + 1]);
83
84 static bool
85 is_vport_class(const struct netdev_class *class)
86 {
87     return class->create == netdev_vport_create;
88 }
89
90 static const struct vport_class *
91 vport_class_cast(const struct netdev_class *class)
92 {
93     assert(is_vport_class(class));
94     return CONTAINER_OF(class, struct vport_class, netdev_class);
95 }
96
97 static struct netdev_dev_vport *
98 netdev_dev_vport_cast(const struct netdev_dev *netdev_dev)
99 {
100     assert(is_vport_class(netdev_dev_get_class(netdev_dev)));
101     return CONTAINER_OF(netdev_dev, struct netdev_dev_vport, netdev_dev);
102 }
103
104 static struct netdev_dev_vport *
105 netdev_vport_get_dev(const struct netdev *netdev)
106 {
107     return netdev_dev_vport_cast(netdev_get_dev(netdev));
108 }
109
110 static struct netdev_vport *
111 netdev_vport_cast(const struct netdev *netdev)
112 {
113     struct netdev_dev *netdev_dev = netdev_get_dev(netdev);
114     assert(is_vport_class(netdev_dev_get_class(netdev_dev)));
115     return CONTAINER_OF(netdev, struct netdev_vport, netdev);
116 }
117
118 /* If 'netdev' is a vport netdev, returns an ofpbuf that contains Netlink
119  * options to include in OVS_VPORT_ATTR_OPTIONS for configuring that vport.
120  * Otherwise returns NULL. */
121 const struct ofpbuf *
122 netdev_vport_get_options(const struct netdev *netdev)
123 {
124     const struct netdev_dev *dev = netdev_get_dev(netdev);
125
126     return (is_vport_class(netdev_dev_get_class(dev))
127             ? netdev_dev_vport_cast(dev)->options
128             : NULL);
129 }
130
131 enum ovs_vport_type
132 netdev_vport_get_vport_type(const struct netdev *netdev)
133 {
134     const struct netdev_dev *dev = netdev_get_dev(netdev);
135     const struct netdev_class *class = netdev_dev_get_class(dev);
136
137     return (is_vport_class(class) ? vport_class_cast(class)->type
138             : class == &netdev_internal_class ? OVS_VPORT_TYPE_INTERNAL
139             : (class == &netdev_linux_class ||
140                class == &netdev_tap_class) ? OVS_VPORT_TYPE_NETDEV
141             : OVS_VPORT_TYPE_UNSPEC);
142 }
143
144 static uint32_t
145 get_u32_or_zero(const struct nlattr *a)
146 {
147     return a ? nl_attr_get_u32(a) : 0;
148 }
149
150 const char *
151 netdev_vport_get_netdev_type(const struct dpif_linux_vport *vport)
152 {
153     struct nlattr *a[OVS_TUNNEL_ATTR_MAX + 1];
154
155     switch (vport->type) {
156     case OVS_VPORT_TYPE_UNSPEC:
157         break;
158
159     case OVS_VPORT_TYPE_NETDEV:
160         return "system";
161
162     case OVS_VPORT_TYPE_INTERNAL:
163         return "internal";
164
165     case OVS_VPORT_TYPE_PATCH:
166         return "patch";
167
168     case OVS_VPORT_TYPE_GRE:
169         if (tnl_port_config_from_nlattr(vport->options, vport->options_len,
170                                         a)) {
171             break;
172         }
173         return (get_u32_or_zero(a[OVS_TUNNEL_ATTR_FLAGS]) & TNL_F_IPSEC
174                 ? "ipsec_gre" : "gre");
175
176     case OVS_VPORT_TYPE_GRE64:
177         if (tnl_port_config_from_nlattr(vport->options, vport->options_len,
178                                         a)) {
179             break;
180         }
181         return (get_u32_or_zero(a[OVS_TUNNEL_ATTR_FLAGS]) & TNL_F_IPSEC
182                 ? "ipsec_gre64" : "gre64");
183
184     case OVS_VPORT_TYPE_CAPWAP:
185         return "capwap";
186
187     case OVS_VPORT_TYPE_VXLAN:
188         return "vxlan";
189
190     case OVS_VPORT_TYPE_FT_GRE:
191     case __OVS_VPORT_TYPE_MAX:
192         break;
193     }
194
195     VLOG_WARN_RL(&rl, "dp%d: port `%s' has unsupported type %u",
196                  vport->dp_ifindex, vport->name, (unsigned int) vport->type);
197     return "unknown";
198 }
199
200 static int
201 netdev_vport_create(const struct netdev_class *netdev_class, const char *name,
202                     struct netdev_dev **netdev_devp)
203 {
204     struct netdev_dev_vport *dev;
205
206     dev = xmalloc(sizeof *dev);
207     netdev_dev_init(&dev->netdev_dev, name, netdev_class);
208     dev->options = NULL;
209     dev->change_seq = 1;
210
211     *netdev_devp = &dev->netdev_dev;
212     route_table_register();
213
214     return 0;
215 }
216
217 static void
218 netdev_vport_destroy(struct netdev_dev *netdev_dev_)
219 {
220     struct netdev_dev_vport *netdev_dev = netdev_dev_vport_cast(netdev_dev_);
221
222     ofpbuf_delete(netdev_dev->options);
223     route_table_unregister();
224     free(netdev_dev);
225 }
226
227 static int
228 netdev_vport_open(struct netdev_dev *netdev_dev_, struct netdev **netdevp)
229 {
230     struct netdev_vport *netdev;
231
232     netdev = xmalloc(sizeof *netdev);
233     netdev_init(&netdev->netdev, netdev_dev_);
234
235     *netdevp = &netdev->netdev;
236     return 0;
237 }
238
239 static void
240 netdev_vport_close(struct netdev *netdev_)
241 {
242     struct netdev_vport *netdev = netdev_vport_cast(netdev_);
243     free(netdev);
244 }
245
246 static int
247 netdev_vport_get_config(struct netdev_dev *dev_, struct smap *args)
248 {
249     const struct netdev_class *netdev_class = netdev_dev_get_class(dev_);
250     const struct vport_class *vport_class = vport_class_cast(netdev_class);
251     struct netdev_dev_vport *dev = netdev_dev_vport_cast(dev_);
252     const char *name = netdev_dev_get_name(dev_);
253     int error;
254
255     if (!dev->options) {
256         struct dpif_linux_vport reply;
257         struct ofpbuf *buf;
258
259         error = dpif_linux_vport_get(name, &reply, &buf);
260         if (error) {
261             VLOG_ERR_RL(&rl, "%s: vport query failed (%s)",
262                         name, strerror(error));
263             return error;
264         }
265
266         dev->options = ofpbuf_clone_data(reply.options, reply.options_len);
267         ofpbuf_delete(buf);
268     }
269
270     error = vport_class->unparse_config(name, netdev_class->type,
271                                         dev->options->data,
272                                         dev->options->size,
273                                         args);
274     if (error) {
275         VLOG_ERR_RL(&rl, "%s: failed to parse kernel config (%s)",
276                     name, strerror(error));
277     }
278     return error;
279 }
280
281 static int
282 netdev_vport_set_config(struct netdev_dev *dev_, const struct smap *args)
283 {
284     const struct netdev_class *netdev_class = netdev_dev_get_class(dev_);
285     const struct vport_class *vport_class = vport_class_cast(netdev_class);
286     struct netdev_dev_vport *dev = netdev_dev_vport_cast(dev_);
287     const char *name = netdev_dev_get_name(dev_);
288     struct ofpbuf *options;
289     int error;
290
291     options = ofpbuf_new(64);
292     error = vport_class->parse_config(name, netdev_dev_get_type(dev_),
293                                       args, options);
294     if (!error
295         && (!dev->options
296             || options->size != dev->options->size
297             || memcmp(options->data, dev->options->data, options->size))) {
298         struct dpif_linux_vport vport;
299
300         dpif_linux_vport_init(&vport);
301         vport.cmd = OVS_VPORT_CMD_SET;
302         vport.name = name;
303         vport.options = options->data;
304         vport.options_len = options->size;
305         error = dpif_linux_vport_transact(&vport, NULL, NULL);
306         if (!error || error == ENODEV) {
307             /* Either reconfiguration succeeded or this vport is not installed
308              * in the kernel (e.g. it hasn't been added to a dpif yet with
309              * dpif_port_add()). */
310             ofpbuf_delete(dev->options);
311             dev->options = options;
312             options = NULL;
313             error = 0;
314         }
315     }
316     ofpbuf_delete(options);
317
318     return error;
319 }
320
321 static int
322 netdev_vport_set_etheraddr(struct netdev *netdev,
323                            const uint8_t mac[ETH_ADDR_LEN])
324 {
325     struct dpif_linux_vport vport;
326     int error;
327
328     dpif_linux_vport_init(&vport);
329     vport.cmd = OVS_VPORT_CMD_SET;
330     vport.name = netdev_get_name(netdev);
331     vport.address = mac;
332
333     error = dpif_linux_vport_transact(&vport, NULL, NULL);
334     if (!error) {
335         netdev_vport_poll_notify(netdev);
336     }
337     return error;
338 }
339
340 static int
341 netdev_vport_get_etheraddr(const struct netdev *netdev,
342                            uint8_t mac[ETH_ADDR_LEN])
343 {
344     struct dpif_linux_vport reply;
345     struct ofpbuf *buf;
346     int error;
347
348     error = dpif_linux_vport_get(netdev_get_name(netdev), &reply, &buf);
349     if (!error) {
350         if (reply.address) {
351             memcpy(mac, reply.address, ETH_ADDR_LEN);
352         } else {
353             error = EOPNOTSUPP;
354         }
355         ofpbuf_delete(buf);
356     }
357     return error;
358 }
359
360 /* Copies 'src' into 'dst', performing format conversion in the process.
361  *
362  * 'src' is allowed to be misaligned. */
363 static void
364 netdev_stats_from_ovs_vport_stats(struct netdev_stats *dst,
365                                   const struct ovs_vport_stats *src)
366 {
367     dst->rx_packets = get_unaligned_u64(&src->rx_packets);
368     dst->tx_packets = get_unaligned_u64(&src->tx_packets);
369     dst->rx_bytes = get_unaligned_u64(&src->rx_bytes);
370     dst->tx_bytes = get_unaligned_u64(&src->tx_bytes);
371     dst->rx_errors = get_unaligned_u64(&src->rx_errors);
372     dst->tx_errors = get_unaligned_u64(&src->tx_errors);
373     dst->rx_dropped = get_unaligned_u64(&src->rx_dropped);
374     dst->tx_dropped = get_unaligned_u64(&src->tx_dropped);
375     dst->multicast = 0;
376     dst->collisions = 0;
377     dst->rx_length_errors = 0;
378     dst->rx_over_errors = 0;
379     dst->rx_crc_errors = 0;
380     dst->rx_frame_errors = 0;
381     dst->rx_fifo_errors = 0;
382     dst->rx_missed_errors = 0;
383     dst->tx_aborted_errors = 0;
384     dst->tx_carrier_errors = 0;
385     dst->tx_fifo_errors = 0;
386     dst->tx_heartbeat_errors = 0;
387     dst->tx_window_errors = 0;
388 }
389
390 int
391 netdev_vport_get_stats(const struct netdev *netdev, struct netdev_stats *stats)
392 {
393     struct dpif_linux_vport reply;
394     struct ofpbuf *buf;
395     int error;
396
397     error = dpif_linux_vport_get(netdev_get_name(netdev), &reply, &buf);
398     if (error) {
399         return error;
400     } else if (!reply.stats) {
401         ofpbuf_delete(buf);
402         return EOPNOTSUPP;
403     }
404
405     netdev_stats_from_ovs_vport_stats(stats, reply.stats);
406
407     ofpbuf_delete(buf);
408
409     return 0;
410 }
411
412 static int
413 tunnel_get_status(const struct netdev *netdev, struct smap *smap)
414 {
415     struct netdev_dev_vport *ndv = netdev_vport_get_dev(netdev);
416     struct nlattr *a[OVS_TUNNEL_ATTR_MAX + 1];
417     static char iface[IFNAMSIZ];
418     ovs_be32 route;
419
420     if (!ndv->options) {
421         /* Race condition when 'ndv' was created, but did not have it's
422          * configuration set yet. */
423         return 0;
424     }
425
426     if (tnl_port_config_from_nlattr(ndv->options->data,
427                                     ndv->options->size, a)) {
428         return 0;
429     }
430     route = nl_attr_get_be32(a[OVS_TUNNEL_ATTR_DST_IPV4]);
431
432     if (route_table_get_name(route, iface)) {
433         struct netdev *egress_netdev;
434
435         smap_add(smap, "tunnel_egress_iface", iface);
436
437         if (!netdev_open(iface, "system", &egress_netdev)) {
438             smap_add(smap, "tunnel_egress_iface_carrier",
439                      netdev_get_carrier(egress_netdev) ? "up" : "down");
440             netdev_close(egress_netdev);
441         }
442     }
443
444     return 0;
445 }
446
447 static int
448 netdev_vport_update_flags(struct netdev *netdev OVS_UNUSED,
449                         enum netdev_flags off, enum netdev_flags on OVS_UNUSED,
450                         enum netdev_flags *old_flagsp)
451 {
452     if (off & (NETDEV_UP | NETDEV_PROMISC)) {
453         return EOPNOTSUPP;
454     }
455
456     *old_flagsp = NETDEV_UP | NETDEV_PROMISC;
457     return 0;
458 }
459
460 static unsigned int
461 netdev_vport_change_seq(const struct netdev *netdev)
462 {
463     return netdev_vport_get_dev(netdev)->change_seq;
464 }
465
466 static void
467 netdev_vport_run(void)
468 {
469     route_table_run();
470 }
471
472 static void
473 netdev_vport_wait(void)
474 {
475     route_table_wait();
476 }
477 \f
478 /* Helper functions. */
479
480 static void
481 netdev_vport_poll_notify(const struct netdev *netdev)
482 {
483     struct netdev_dev_vport *ndv = netdev_vport_get_dev(netdev);
484
485     ndv->change_seq++;
486     if (!ndv->change_seq) {
487         ndv->change_seq++;
488     }
489 }
490 \f
491 /* Code specific to individual vport types. */
492
493 static void
494 set_key(const struct smap *args, const char *name, uint16_t type,
495         struct ofpbuf *options)
496 {
497     const char *s;
498
499     s = smap_get(args, name);
500     if (!s) {
501         s = smap_get(args, "key");
502         if (!s) {
503             s = "0";
504         }
505     }
506
507     if (!strcmp(s, "flow")) {
508         /* This is the default if no attribute is present. */
509     } else {
510         nl_msg_put_be64(options, type, htonll(strtoull(s, NULL, 0)));
511     }
512 }
513
514 static int
515 parse_tunnel_config(const char *name, const char *type,
516                     const struct smap *args, struct ofpbuf *options)
517 {
518     bool is_gre = false;
519     bool is_ipsec = false;
520     bool needs_dst_port = false;
521     bool found_dst_port = false;
522     struct smap_node *node;
523     bool ipsec_mech_set = false;
524     ovs_be32 daddr = htonl(0);
525     ovs_be32 saddr = htonl(0);
526     uint32_t flags;
527
528     if (!strcmp(type, "capwap")) {
529         VLOG_WARN_ONCE("CAPWAP tunnel support is deprecated.");
530     }
531
532     flags = TNL_F_DF_DEFAULT;
533     if (!strcmp(type, "gre") || !strcmp(type, "gre64")) {
534         is_gre = true;
535     } else if (!strcmp(type, "ipsec_gre") || !strcmp(type, "ipsec_gre64")) {
536         is_gre = true;
537         is_ipsec = true;
538         flags |= TNL_F_IPSEC;
539     } else if (!strcmp(type, "vxlan")) {
540         needs_dst_port = true;
541     }
542
543     SMAP_FOR_EACH (node, args) {
544         if (!strcmp(node->key, "remote_ip")) {
545             struct in_addr in_addr;
546             if (lookup_ip(node->value, &in_addr)) {
547                 VLOG_WARN("%s: bad %s 'remote_ip'", name, type);
548             } else {
549                 daddr = in_addr.s_addr;
550             }
551         } else if (!strcmp(node->key, "local_ip")) {
552             struct in_addr in_addr;
553             if (lookup_ip(node->value, &in_addr)) {
554                 VLOG_WARN("%s: bad %s 'local_ip'", name, type);
555             } else {
556                 saddr = in_addr.s_addr;
557             }
558         } else if (!strcmp(node->key, "tos")) {
559             if (!strcmp(node->value, "inherit")) {
560                 flags |= TNL_F_TOS_INHERIT;
561             } else {
562                 char *endptr;
563                 int tos;
564                 tos = strtol(node->value, &endptr, 0);
565                 if (*endptr == '\0' && tos == (tos & IP_DSCP_MASK)) {
566                     nl_msg_put_u8(options, OVS_TUNNEL_ATTR_TOS, tos);
567                 } else {
568                     VLOG_WARN("%s: invalid TOS %s", name, node->value);
569                 }
570             }
571         } else if (!strcmp(node->key, "ttl")) {
572             if (!strcmp(node->value, "inherit")) {
573                 flags |= TNL_F_TTL_INHERIT;
574             } else {
575                 nl_msg_put_u8(options, OVS_TUNNEL_ATTR_TTL, atoi(node->value));
576             }
577         } else if (!strcmp(node->key, "dst_port") && needs_dst_port) {
578             nl_msg_put_u16(options, OVS_TUNNEL_ATTR_DST_PORT,
579                            atoi(node->value));
580             found_dst_port = true;
581         } else if (!strcmp(node->key, "csum") && is_gre) {
582             if (!strcmp(node->value, "true")) {
583                 flags |= TNL_F_CSUM;
584             }
585         } else if (!strcmp(node->key, "df_inherit")) {
586             if (!strcmp(node->value, "true")) {
587                 flags |= TNL_F_DF_INHERIT;
588             }
589         } else if (!strcmp(node->key, "df_default")) {
590             if (!strcmp(node->value, "false")) {
591                 flags &= ~TNL_F_DF_DEFAULT;
592             }
593         } else if (!strcmp(node->key, "pmtud")) {
594             if (!strcmp(node->value, "true")) {
595                 VLOG_WARN_ONCE("%s: The tunnel Path MTU discovery is "
596                                "deprecated and may be removed in February "
597                                "2013. Please email dev@openvswitch.org with "
598                                "concerns.", name);
599                 flags |= TNL_F_PMTUD;
600             }
601         } else if (!strcmp(node->key, "peer_cert") && is_ipsec) {
602             if (smap_get(args, "certificate")) {
603                 ipsec_mech_set = true;
604             } else {
605                 const char *use_ssl_cert;
606
607                 /* If the "use_ssl_cert" is true, then "certificate" and
608                  * "private_key" will be pulled from the SSL table.  The
609                  * use of this option is strongly discouraged, since it
610                  * will like be removed when multiple SSL configurations
611                  * are supported by OVS.
612                  */
613                 use_ssl_cert = smap_get(args, "use_ssl_cert");
614                 if (!use_ssl_cert || strcmp(use_ssl_cert, "true")) {
615                     VLOG_ERR("%s: 'peer_cert' requires 'certificate' argument",
616                              name);
617                     return EINVAL;
618                 }
619                 ipsec_mech_set = true;
620             }
621         } else if (!strcmp(node->key, "psk") && is_ipsec) {
622             ipsec_mech_set = true;
623         } else if (is_ipsec
624                 && (!strcmp(node->key, "certificate")
625                     || !strcmp(node->key, "private_key")
626                     || !strcmp(node->key, "use_ssl_cert"))) {
627             /* Ignore options not used by the netdev. */
628         } else if (!strcmp(node->key, "key") ||
629                    !strcmp(node->key, "in_key") ||
630                    !strcmp(node->key, "out_key")) {
631             /* Handled separately below. */
632         } else {
633             VLOG_WARN("%s: unknown %s argument '%s'", name, type, node->key);
634         }
635     }
636
637     /* Add a default destination port for VXLAN if none specified. */
638     if (needs_dst_port && !found_dst_port) {
639         nl_msg_put_u16(options, OVS_TUNNEL_ATTR_DST_PORT, VXLAN_DST_PORT);
640     }
641
642     if (is_ipsec) {
643         static pid_t pid = 0;
644         if (pid <= 0) {
645             char *file_name = xasprintf("%s/%s", ovs_rundir(),
646                                         "ovs-monitor-ipsec.pid");
647             pid = read_pidfile(file_name);
648             free(file_name);
649         }
650
651         if (pid < 0) {
652             VLOG_ERR("%s: IPsec requires the ovs-monitor-ipsec daemon",
653                      name);
654             return EINVAL;
655         }
656
657         if (smap_get(args, "peer_cert") && smap_get(args, "psk")) {
658             VLOG_ERR("%s: cannot define both 'peer_cert' and 'psk'", name);
659             return EINVAL;
660         }
661
662         if (!ipsec_mech_set) {
663             VLOG_ERR("%s: IPsec requires an 'peer_cert' or psk' argument",
664                      name);
665             return EINVAL;
666         }
667     }
668
669     set_key(args, "in_key", OVS_TUNNEL_ATTR_IN_KEY, options);
670     set_key(args, "out_key", OVS_TUNNEL_ATTR_OUT_KEY, options);
671
672     if (!daddr) {
673         VLOG_ERR("%s: %s type requires valid 'remote_ip' argument",
674                  name, type);
675         return EINVAL;
676     }
677     nl_msg_put_be32(options, OVS_TUNNEL_ATTR_DST_IPV4, daddr);
678
679     if (saddr) {
680         if (ip_is_multicast(daddr)) {
681             VLOG_WARN("%s: remote_ip is multicast, ignoring local_ip", name);
682         } else {
683             nl_msg_put_be32(options, OVS_TUNNEL_ATTR_SRC_IPV4, saddr);
684         }
685     }
686
687     nl_msg_put_u32(options, OVS_TUNNEL_ATTR_FLAGS, flags);
688
689     return 0;
690 }
691
692 static int
693 tnl_port_config_from_nlattr(const struct nlattr *options, size_t options_len,
694                             struct nlattr *a[OVS_TUNNEL_ATTR_MAX + 1])
695 {
696     static const struct nl_policy ovs_tunnel_policy[] = {
697         [OVS_TUNNEL_ATTR_FLAGS] = { .type = NL_A_U32, .optional = true },
698         [OVS_TUNNEL_ATTR_DST_IPV4] = { .type = NL_A_BE32, .optional = true },
699         [OVS_TUNNEL_ATTR_SRC_IPV4] = { .type = NL_A_BE32, .optional = true },
700         [OVS_TUNNEL_ATTR_IN_KEY] = { .type = NL_A_BE64, .optional = true },
701         [OVS_TUNNEL_ATTR_OUT_KEY] = { .type = NL_A_BE64, .optional = true },
702         [OVS_TUNNEL_ATTR_TOS] = { .type = NL_A_U8, .optional = true },
703         [OVS_TUNNEL_ATTR_TTL] = { .type = NL_A_U8, .optional = true },
704         [OVS_TUNNEL_ATTR_DST_PORT] = { .type = NL_A_U16, .optional = true },
705     };
706     struct ofpbuf buf;
707
708     ofpbuf_use_const(&buf, options, options_len);
709     if (!nl_policy_parse(&buf, 0, ovs_tunnel_policy,
710                          a, ARRAY_SIZE(ovs_tunnel_policy))) {
711         return EINVAL;
712     }
713     return 0;
714 }
715
716 static uint64_t
717 get_be64_or_zero(const struct nlattr *a)
718 {
719     return a ? ntohll(nl_attr_get_be64(a)) : 0;
720 }
721
722 static int
723 unparse_tunnel_config(const char *name OVS_UNUSED, const char *type OVS_UNUSED,
724                       const struct nlattr *options, size_t options_len,
725                       struct smap *args)
726 {
727     struct nlattr *a[OVS_TUNNEL_ATTR_MAX + 1];
728     uint32_t flags;
729     int error;
730
731     error = tnl_port_config_from_nlattr(options, options_len, a);
732     if (error) {
733         return error;
734     }
735
736     if (a[OVS_TUNNEL_ATTR_DST_IPV4]) {
737         ovs_be32 daddr = nl_attr_get_be32(a[OVS_TUNNEL_ATTR_DST_IPV4]);
738         smap_add_format(args, "remote_ip", IP_FMT, IP_ARGS(daddr));
739     }
740
741     if (a[OVS_TUNNEL_ATTR_SRC_IPV4]) {
742         ovs_be32 saddr = nl_attr_get_be32(a[OVS_TUNNEL_ATTR_SRC_IPV4]);
743         smap_add_format(args, "local_ip", IP_FMT, IP_ARGS(saddr));
744     }
745
746     if (!a[OVS_TUNNEL_ATTR_IN_KEY] && !a[OVS_TUNNEL_ATTR_OUT_KEY]) {
747         smap_add(args, "key", "flow");
748     } else {
749         uint64_t in_key = get_be64_or_zero(a[OVS_TUNNEL_ATTR_IN_KEY]);
750         uint64_t out_key = get_be64_or_zero(a[OVS_TUNNEL_ATTR_OUT_KEY]);
751
752         if (in_key && in_key == out_key) {
753             smap_add_format(args, "key", "%"PRIu64, in_key);
754         } else {
755             if (!a[OVS_TUNNEL_ATTR_IN_KEY]) {
756                 smap_add(args, "in_key", "flow");
757             } else if (in_key) {
758                 smap_add_format(args, "in_key", "%"PRIu64, in_key);
759             }
760
761             if (!a[OVS_TUNNEL_ATTR_OUT_KEY]) {
762                 smap_add(args, "out_key", "flow");
763             } else if (out_key) {
764                 smap_add_format(args, "out_key", "%"PRIu64, out_key);
765             }
766         }
767     }
768
769     flags = get_u32_or_zero(a[OVS_TUNNEL_ATTR_FLAGS]);
770
771     if (flags & TNL_F_TTL_INHERIT) {
772         smap_add(args, "ttl", "inherit");
773     } else if (a[OVS_TUNNEL_ATTR_TTL]) {
774         int ttl = nl_attr_get_u8(a[OVS_TUNNEL_ATTR_TTL]);
775         smap_add_format(args, "ttl", "%d", ttl);
776     }
777
778     if (flags & TNL_F_TOS_INHERIT) {
779         smap_add(args, "tos", "inherit");
780     } else if (a[OVS_TUNNEL_ATTR_TOS]) {
781         int tos = nl_attr_get_u8(a[OVS_TUNNEL_ATTR_TOS]);
782         smap_add_format(args, "tos", "0x%x", tos);
783     }
784
785     if (a[OVS_TUNNEL_ATTR_DST_PORT]) {
786         uint16_t dst_port = nl_attr_get_u16(a[OVS_TUNNEL_ATTR_DST_PORT]);
787         if (dst_port != VXLAN_DST_PORT) {
788             smap_add_format(args, "dst_port", "%d", dst_port);
789         }
790     }
791
792     if (flags & TNL_F_CSUM) {
793         smap_add(args, "csum", "true");
794     }
795     if (flags & TNL_F_DF_INHERIT) {
796         smap_add(args, "df_inherit", "true");
797     }
798     if (!(flags & TNL_F_DF_DEFAULT)) {
799         smap_add(args, "df_default", "false");
800     }
801     if (flags & TNL_F_PMTUD) {
802         smap_add(args, "pmtud", "true");
803     }
804
805     return 0;
806 }
807
808 static int
809 parse_patch_config(const char *name, const char *type OVS_UNUSED,
810                    const struct smap *args, struct ofpbuf *options)
811 {
812     const char *peer;
813
814     peer = smap_get(args, "peer");
815     if (!peer) {
816         VLOG_ERR("%s: patch type requires valid 'peer' argument", name);
817         return EINVAL;
818     }
819
820     if (smap_count(args) > 1) {
821         VLOG_ERR("%s: patch type takes only a 'peer' argument", name);
822         return EINVAL;
823     }
824
825     if (strlen(peer) >= IFNAMSIZ) {
826         VLOG_ERR("%s: patch 'peer' arg too long", name);
827         return EINVAL;
828     }
829
830     if (!strcmp(name, peer)) {
831         VLOG_ERR("%s: patch peer must not be self", name);
832         return EINVAL;
833     }
834
835     nl_msg_put_string(options, OVS_PATCH_ATTR_PEER, peer);
836
837     return 0;
838 }
839
840 static int
841 unparse_patch_config(const char *name OVS_UNUSED, const char *type OVS_UNUSED,
842                      const struct nlattr *options, size_t options_len,
843                      struct smap *args)
844 {
845     static const struct nl_policy ovs_patch_policy[] = {
846         [OVS_PATCH_ATTR_PEER] = { .type = NL_A_STRING,
847                                .max_len = IFNAMSIZ,
848                                .optional = false }
849     };
850
851     struct nlattr *a[ARRAY_SIZE(ovs_patch_policy)];
852     struct ofpbuf buf;
853
854     ofpbuf_use_const(&buf, options, options_len);
855     if (!nl_policy_parse(&buf, 0, ovs_patch_policy,
856                          a, ARRAY_SIZE(ovs_patch_policy))) {
857         return EINVAL;
858     }
859
860     smap_add(args, "peer", nl_attr_get_string(a[OVS_PATCH_ATTR_PEER]));
861     return 0;
862 }
863 \f
864 #define VPORT_FUNCTIONS(GET_STATUS)                         \
865     NULL,                                                   \
866     netdev_vport_run,                                       \
867     netdev_vport_wait,                                      \
868                                                             \
869     netdev_vport_create,                                    \
870     netdev_vport_destroy,                                   \
871     netdev_vport_get_config,                                \
872     netdev_vport_set_config,                                \
873                                                             \
874     netdev_vport_open,                                      \
875     netdev_vport_close,                                     \
876                                                             \
877     NULL,                       /* listen */                \
878     NULL,                       /* recv */                  \
879     NULL,                       /* recv_wait */             \
880     NULL,                       /* drain */                 \
881                                                             \
882     NULL,                       /* send */                  \
883     NULL,                       /* send_wait */             \
884                                                             \
885     netdev_vport_set_etheraddr,                             \
886     netdev_vport_get_etheraddr,                             \
887     NULL,                       /* get_mtu */               \
888     NULL,                       /* set_mtu */               \
889     NULL,                       /* get_ifindex */           \
890     NULL,                       /* get_carrier */           \
891     NULL,                       /* get_carrier_resets */    \
892     NULL,                       /* get_miimon */            \
893     netdev_vport_get_stats,                                 \
894     NULL,                       /* set_stats */             \
895                                                             \
896     NULL,                       /* get_features */          \
897     NULL,                       /* set_advertisements */    \
898                                                             \
899     NULL,                       /* set_policing */          \
900     NULL,                       /* get_qos_types */         \
901     NULL,                       /* get_qos_capabilities */  \
902     NULL,                       /* get_qos */               \
903     NULL,                       /* set_qos */               \
904     NULL,                       /* get_queue */             \
905     NULL,                       /* set_queue */             \
906     NULL,                       /* delete_queue */          \
907     NULL,                       /* get_queue_stats */       \
908     NULL,                       /* dump_queues */           \
909     NULL,                       /* dump_queue_stats */      \
910                                                             \
911     NULL,                       /* get_in4 */               \
912     NULL,                       /* set_in4 */               \
913     NULL,                       /* get_in6 */               \
914     NULL,                       /* add_router */            \
915     NULL,                       /* get_next_hop */          \
916     GET_STATUS,                                             \
917     NULL,                       /* arp_lookup */            \
918                                                             \
919     netdev_vport_update_flags,                              \
920                                                             \
921     netdev_vport_change_seq
922
923 void
924 netdev_vport_register(void)
925 {
926     static const struct vport_class vport_classes[] = {
927         { OVS_VPORT_TYPE_GRE,
928           { "gre", VPORT_FUNCTIONS(tunnel_get_status) },
929           parse_tunnel_config, unparse_tunnel_config },
930
931         { OVS_VPORT_TYPE_GRE,
932           { "ipsec_gre", VPORT_FUNCTIONS(tunnel_get_status) },
933           parse_tunnel_config, unparse_tunnel_config },
934
935         { OVS_VPORT_TYPE_GRE64,
936           { "gre64", VPORT_FUNCTIONS(tunnel_get_status) },
937           parse_tunnel_config, unparse_tunnel_config },
938
939         { OVS_VPORT_TYPE_GRE64,
940           { "ipsec_gre64", VPORT_FUNCTIONS(tunnel_get_status) },
941           parse_tunnel_config, unparse_tunnel_config },
942
943         { OVS_VPORT_TYPE_CAPWAP,
944           { "capwap", VPORT_FUNCTIONS(tunnel_get_status) },
945           parse_tunnel_config, unparse_tunnel_config },
946
947         { OVS_VPORT_TYPE_VXLAN,
948           { "vxlan", VPORT_FUNCTIONS(tunnel_get_status) },
949           parse_tunnel_config, unparse_tunnel_config },
950
951         { OVS_VPORT_TYPE_PATCH,
952           { "patch", VPORT_FUNCTIONS(NULL) },
953           parse_patch_config, unparse_patch_config }
954     };
955
956     int i;
957
958     for (i = 0; i < ARRAY_SIZE(vport_classes); i++) {
959         netdev_register_provider(&vport_classes[i].netdev_class);
960     }
961 }