gre: Improve headroom calculation to reducing copying.
[sliver-openvswitch.git] / datapath / vport-gre.c
1 /*
2  * Copyright (c) 2010 Nicira Networks.
3  * Distributed under the terms of the GNU GPL version 2.
4  *
5  * Significant portions of this file may be copied from parts of the Linux
6  * kernel, by Linus Torvalds and others.
7  */
8
9 #include <linux/if_arp.h>
10 #include <linux/if_ether.h>
11 #include <linux/ip.h>
12 #include <linux/if_tunnel.h>
13 #include <linux/if_vlan.h>
14 #include <linux/in.h>
15 #include <linux/in_route.h>
16 #include <linux/jhash.h>
17 #include <linux/kernel.h>
18 #include <linux/version.h>
19
20 #include <net/dsfield.h>
21 #include <net/dst.h>
22 #include <net/icmp.h>
23 #include <net/inet_ecn.h>
24 #include <net/ip.h>
25 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
26 #include <net/ipv6.h>
27 #endif
28 #include <net/protocol.h>
29 #include <net/route.h>
30 #include <net/xfrm.h>
31
32 #include "actions.h"
33 #include "datapath.h"
34 #include "openvswitch/gre.h"
35 #include "table.h"
36 #include "vport.h"
37 #include "vport-generic.h"
38
39 /* The absolute minimum fragment size.  Note that there are many other
40  * definitions of the minimum MTU. */
41 #define IP_MIN_MTU 68
42
43 /* The GRE header is composed of a series of sections: a base and then a variable
44  * number of options. */
45 #define GRE_HEADER_SECTION 4
46
47 struct mutable_config {
48         struct rcu_head rcu;
49
50         unsigned char eth_addr[ETH_ALEN];
51         unsigned int mtu;
52         struct gre_port_config port_config;
53
54         int tunnel_hlen; /* Tunnel header length. */
55 };
56
57 struct gre_vport {
58         struct tbl_node tbl_node;
59
60         char name[IFNAMSIZ];
61
62         /* Protected by RCU. */
63         struct mutable_config *mutable;
64 };
65
66 /* Protected by RCU. */
67 static struct tbl *port_table;
68
69 /* These are just used as an optimization: they don't require any kind of
70  * synchronization because we could have just as easily read the value before
71  * the port change happened. */
72 static unsigned int key_local_remote_ports;
73 static unsigned int key_remote_ports;
74 static unsigned int local_remote_ports;
75 static unsigned int remote_ports;
76
77 static inline struct gre_vport *
78 gre_vport_priv(const struct vport *vport)
79 {
80         return vport_priv(vport);
81 }
82
83 static inline struct vport *
84 gre_vport_to_vport(const struct gre_vport *gre_vport)
85 {
86         return vport_from_priv(gre_vport);
87 }
88
89 static inline struct gre_vport *
90 gre_vport_table_cast(const struct tbl_node *node)
91 {
92         return container_of(node, struct gre_vport, tbl_node);
93 }
94
95 /* RCU callback. */
96 static void
97 free_config(struct rcu_head *rcu)
98 {
99         struct mutable_config *c = container_of(rcu, struct mutable_config, rcu);
100         kfree(c);
101 }
102
103 static void
104 assign_config_rcu(struct vport *vport, struct mutable_config *new_config)
105 {
106         struct gre_vport *gre_vport = gre_vport_priv(vport);
107         struct mutable_config *old_config;
108
109         old_config = rcu_dereference(gre_vport->mutable);
110         rcu_assign_pointer(gre_vport->mutable, new_config);
111         call_rcu(&old_config->rcu, free_config);
112 }
113
114 static unsigned int *
115 find_port_pool(const struct mutable_config *mutable)
116 {
117         if (mutable->port_config.flags & GRE_F_IN_KEY_MATCH) {
118                 if (mutable->port_config.saddr)
119                         return &local_remote_ports;
120                 else
121                         return &remote_ports;
122         } else {
123                 if (mutable->port_config.saddr)
124                         return &key_local_remote_ports;
125                 else
126                         return &key_remote_ports;
127         }
128 }
129
130 enum lookup_key {
131         LOOKUP_SADDR            = 0,
132         LOOKUP_DADDR            = 1,
133         LOOKUP_KEY              = 2,
134         LOOKUP_KEY_MATCH        = 3
135 };
136
137 struct port_lookup_key {
138         u32 vals[4];                    /* Contains enum lookup_key keys. */
139         const struct mutable_config *mutable;
140 };
141
142 /* Modifies 'target' to store the rcu_dereferenced pointer that was used to do
143  * the comparision. */
144 static int
145 port_cmp(const struct tbl_node *node, void *target)
146 {
147         const struct gre_vport *gre_vport = gre_vport_table_cast(node);
148         struct port_lookup_key *lookup = target;
149
150         lookup->mutable = rcu_dereference(gre_vport->mutable);
151
152         return ((lookup->mutable->port_config.flags & GRE_F_IN_KEY_MATCH) ==
153                         lookup->vals[LOOKUP_KEY_MATCH]) &&
154                lookup->mutable->port_config.daddr == lookup->vals[LOOKUP_DADDR] &&
155                lookup->mutable->port_config.in_key == lookup->vals[LOOKUP_KEY] &&
156                lookup->mutable->port_config.saddr == lookup->vals[LOOKUP_SADDR];
157 }
158
159 static u32
160 port_hash(struct port_lookup_key *lookup)
161 {
162         return jhash2(lookup->vals, ARRAY_SIZE(lookup->vals), 0);
163 }
164
165 static int
166 add_port(struct vport *vport)
167 {
168         struct gre_vport *gre_vport = gre_vport_priv(vport);
169         struct port_lookup_key lookup;
170         int err;
171
172         if (!port_table) {
173                 struct tbl *new_table;
174
175                 new_table = tbl_create(0);
176                 if (!new_table)
177                         return -ENOMEM;
178
179                 rcu_assign_pointer(port_table, new_table);
180
181         } else if (tbl_count(port_table) > tbl_n_buckets(port_table)) {
182                 struct tbl *old_table = port_table;
183                 struct tbl *new_table;
184
185                 new_table = tbl_expand(old_table);
186                 if (IS_ERR(new_table))
187                         return PTR_ERR(new_table);
188
189                 rcu_assign_pointer(port_table, new_table);
190                 tbl_deferred_destroy(old_table, NULL);
191         }
192
193         lookup.vals[LOOKUP_SADDR] = gre_vport->mutable->port_config.saddr;
194         lookup.vals[LOOKUP_DADDR] = gre_vport->mutable->port_config.daddr;
195         lookup.vals[LOOKUP_KEY] = gre_vport->mutable->port_config.in_key;
196         lookup.vals[LOOKUP_KEY_MATCH] = gre_vport->mutable->port_config.flags & GRE_F_IN_KEY_MATCH;
197
198         err = tbl_insert(port_table, &gre_vport->tbl_node, port_hash(&lookup));
199         if (err)
200                 return err;
201
202         (*find_port_pool(gre_vport->mutable))++;
203
204         return 0;
205 }
206
207 static int
208 del_port(struct vport *vport)
209 {
210         struct gre_vport *gre_vport = gre_vport_priv(vport);
211         int err;
212
213         err = tbl_remove(port_table, &gre_vport->tbl_node);
214         if (err)
215                 return err;
216
217         (*find_port_pool(gre_vport->mutable))--;
218
219         return 0;
220 }
221
222 #define FIND_PORT_KEY           (1 << 0)
223 #define FIND_PORT_MATCH         (1 << 1)
224 #define FIND_PORT_ANY           (FIND_PORT_KEY | FIND_PORT_MATCH)
225
226 static struct vport *
227 find_port(__be32 saddr, __be32 daddr, __be32 key, int port_type,
228           const struct mutable_config **mutable)
229 {
230         struct port_lookup_key lookup;
231         struct tbl *table = rcu_dereference(port_table);
232         struct tbl_node *tbl_node;
233
234         if (!table)
235                 return NULL;
236
237         lookup.vals[LOOKUP_SADDR] = saddr;
238         lookup.vals[LOOKUP_DADDR] = daddr;
239
240         if (port_type & FIND_PORT_KEY) {
241                 lookup.vals[LOOKUP_KEY] = key;
242                 lookup.vals[LOOKUP_KEY_MATCH] = 0;
243
244                 if (key_local_remote_ports) {
245                         tbl_node = tbl_lookup(table, &lookup, port_hash(&lookup), port_cmp);
246                         if (tbl_node)
247                                 goto found;
248                 }
249
250                 if (key_remote_ports) {
251                         lookup.vals[LOOKUP_SADDR] = 0;
252
253                         tbl_node = tbl_lookup(table, &lookup, port_hash(&lookup), port_cmp);
254                         if (tbl_node)
255                                 goto found;
256
257                         lookup.vals[LOOKUP_SADDR] = saddr;
258                 }
259         }
260
261         if (port_type & FIND_PORT_MATCH) {
262                 lookup.vals[LOOKUP_KEY] = 0;
263                 lookup.vals[LOOKUP_KEY_MATCH] = GRE_F_IN_KEY_MATCH;
264
265                 if (local_remote_ports) {
266                         tbl_node = tbl_lookup(table, &lookup, port_hash(&lookup), port_cmp);
267                         if (tbl_node)
268                                 goto found;
269                 }
270
271                 if (remote_ports) {
272                         lookup.vals[LOOKUP_SADDR] = 0;
273
274                         tbl_node = tbl_lookup(table, &lookup, port_hash(&lookup), port_cmp);
275                         if (tbl_node)
276                                 goto found;
277                 }
278         }
279
280         return NULL;
281
282 found:
283         *mutable = lookup.mutable;
284         return gre_vport_to_vport(gre_vport_table_cast(tbl_node));
285 }
286
287 static bool
288 check_ipv4_address(__be32 addr)
289 {
290         if (ipv4_is_multicast(addr) || ipv4_is_lbcast(addr)
291             || ipv4_is_loopback(addr) || ipv4_is_zeronet(addr))
292                 return false;
293
294         return true;
295 }
296
297 static bool
298 ipv4_should_icmp(struct sk_buff *skb)
299 {
300         struct iphdr *old_iph = ip_hdr(skb);
301
302         /* Don't respond to L2 broadcast. */
303         if (is_multicast_ether_addr(eth_hdr(skb)->h_dest))
304                 return false;
305
306         /* Don't respond to L3 broadcast or invalid addresses. */
307         if (!check_ipv4_address(old_iph->daddr) ||
308             !check_ipv4_address(old_iph->saddr))
309                 return false;
310
311         /* Only respond to the first fragment. */
312         if (old_iph->frag_off & htons(IP_OFFSET))
313                 return false;
314
315         /* Don't respond to ICMP error messages. */
316         if (old_iph->protocol == IPPROTO_ICMP) {
317                 u8 icmp_type, *icmp_typep;
318
319                 icmp_typep = skb_header_pointer(skb, (u8 *)old_iph +
320                                                 (old_iph->ihl << 2) +
321                                                 offsetof(struct icmphdr, type) -
322                                                 skb->data, sizeof(icmp_type),
323                                                 &icmp_type);
324
325                 if (!icmp_typep)
326                         return false;
327
328                 if (*icmp_typep > NR_ICMP_TYPES
329                         || (*icmp_typep <= ICMP_PARAMETERPROB
330                                 && *icmp_typep != ICMP_ECHOREPLY
331                                 && *icmp_typep != ICMP_ECHO))
332                         return false;
333         }
334
335         return true;
336 }
337
338 static void
339 ipv4_build_icmp(struct sk_buff *skb, struct sk_buff *nskb,
340                 unsigned int mtu, unsigned int payload_length)
341 {
342         struct iphdr *iph, *old_iph = ip_hdr(skb);
343         struct icmphdr *icmph;
344         u8 *payload;
345
346         iph = (struct iphdr *)skb_put(nskb, sizeof(struct iphdr));
347         icmph = (struct icmphdr *)skb_put(nskb, sizeof(struct icmphdr));
348         payload = skb_put(nskb, payload_length);
349
350         /* IP */
351         iph->version            =       4;
352         iph->ihl                =       sizeof(struct iphdr) >> 2;
353         iph->tos                =       (old_iph->tos & IPTOS_TOS_MASK) |
354                                         IPTOS_PREC_INTERNETCONTROL;
355         iph->tot_len            =       htons(sizeof(struct iphdr)
356                                               + sizeof(struct icmphdr)
357                                               + payload_length);
358         get_random_bytes(&iph->id, sizeof(iph->id));
359         iph->frag_off           =       0;
360         iph->ttl                =       IPDEFTTL;
361         iph->protocol           =       IPPROTO_ICMP;
362         iph->daddr              =       old_iph->saddr;
363         iph->saddr              =       old_iph->daddr;
364
365         ip_send_check(iph);
366
367         /* ICMP */
368         icmph->type             =       ICMP_DEST_UNREACH;
369         icmph->code             =       ICMP_FRAG_NEEDED;
370         icmph->un.gateway       =       htonl(mtu);
371         icmph->checksum         =       0;
372
373         nskb->csum = csum_partial((u8 *)icmph, sizeof(struct icmphdr), 0);
374         nskb->csum = skb_copy_and_csum_bits(skb, (u8 *)old_iph - skb->data,
375                                             payload, payload_length,
376                                             nskb->csum);
377         icmph->checksum = csum_fold(nskb->csum);
378 }
379
380 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
381 static bool
382 ipv6_should_icmp(struct sk_buff *skb)
383 {
384         struct ipv6hdr *old_ipv6h = ipv6_hdr(skb);
385         int addr_type;
386         int payload_off = (u8 *)(old_ipv6h + 1) - skb->data;
387         u8 nexthdr = ipv6_hdr(skb)->nexthdr;
388
389         /* Check source address is valid. */
390         addr_type = ipv6_addr_type(&old_ipv6h->saddr);
391         if (addr_type & IPV6_ADDR_MULTICAST || addr_type == IPV6_ADDR_ANY)
392                 return false;
393
394         /* Don't reply to unspecified addresses. */
395         if (ipv6_addr_type(&old_ipv6h->daddr) == IPV6_ADDR_ANY)
396                 return false;
397
398         /* Don't respond to ICMP error messages. */
399         payload_off = ipv6_skip_exthdr(skb, payload_off, &nexthdr);
400         if (payload_off < 0)
401                 return false;
402
403         if (nexthdr == NEXTHDR_ICMP) {
404                 u8 icmp_type, *icmp_typep;
405
406                 icmp_typep = skb_header_pointer(skb, payload_off +
407                                                 offsetof(struct icmp6hdr,
408                                                         icmp6_type),
409                                                 sizeof(icmp_type), &icmp_type);
410
411                 if (!icmp_typep || !(*icmp_typep & ICMPV6_INFOMSG_MASK))
412                         return false;
413         }
414
415         return true;
416 }
417
418 static void
419 ipv6_build_icmp(struct sk_buff *skb, struct sk_buff *nskb, unsigned int mtu,
420                 unsigned int payload_length)
421 {
422         struct ipv6hdr *ipv6h, *old_ipv6h = ipv6_hdr(skb);
423         struct icmp6hdr *icmp6h;
424         u8 *payload;
425
426         ipv6h = (struct ipv6hdr *)skb_put(nskb, sizeof(struct ipv6hdr));
427         icmp6h = (struct icmp6hdr *)skb_put(nskb, sizeof(struct icmp6hdr));
428         payload = skb_put(nskb, payload_length);
429
430         /* IPv6 */
431         ipv6h->version          =       6;
432         ipv6h->priority         =       0;
433         memset(&ipv6h->flow_lbl, 0, sizeof(ipv6h->flow_lbl));
434         ipv6h->payload_len      =       htons(sizeof(struct icmp6hdr)
435                                               + payload_length);
436         ipv6h->nexthdr          =       NEXTHDR_ICMP;
437         ipv6h->hop_limit        =       IPV6_DEFAULT_HOPLIMIT;
438         ipv6_addr_copy(&ipv6h->daddr, &old_ipv6h->saddr);
439         ipv6_addr_copy(&ipv6h->saddr, &old_ipv6h->daddr);
440
441         /* ICMPv6 */
442         icmp6h->icmp6_type      =       ICMPV6_PKT_TOOBIG;
443         icmp6h->icmp6_code      =       0;
444         icmp6h->icmp6_cksum     =       0;
445         icmp6h->icmp6_mtu       =       htonl(mtu);
446
447         nskb->csum = csum_partial((u8 *)icmp6h, sizeof(struct icmp6hdr), 0);
448         nskb->csum = skb_copy_and_csum_bits(skb, (u8 *)old_ipv6h - skb->data,
449                                             payload, payload_length,
450                                             nskb->csum);
451         icmp6h->icmp6_cksum = csum_ipv6_magic(&ipv6h->saddr, &ipv6h->daddr,
452                                                 sizeof(struct icmp6hdr)
453                                                 + payload_length,
454                                                 ipv6h->nexthdr, nskb->csum);
455 }
456 #endif /* IPv6 */
457
458 static bool
459 send_frag_needed(struct vport *vport, const struct mutable_config *mutable,
460                  struct sk_buff *skb, unsigned int mtu, __be32 flow_key)
461 {
462         unsigned int eth_hdr_len = ETH_HLEN;
463         unsigned int total_length = 0, header_length = 0, payload_length;
464         struct ethhdr *eh, *old_eh = eth_hdr(skb);
465         struct sk_buff *nskb;
466
467         /* Sanity check */
468         if (skb->protocol == htons(ETH_P_IP)) {
469                 if (mtu < IP_MIN_MTU)
470                         return false;
471
472                 if (!ipv4_should_icmp(skb))
473                         return true;
474         }
475 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
476         else if (skb->protocol == htons(ETH_P_IPV6)) {
477                 if (mtu < IPV6_MIN_MTU)
478                         return false;
479
480                 /* In theory we should do PMTUD on IPv6 multicast messages but
481                  * we don't have an address to send from so just fragment. */
482                 if (ipv6_addr_type(&ipv6_hdr(skb)->daddr) & IPV6_ADDR_MULTICAST)
483                         return false;
484
485                 if (!ipv6_should_icmp(skb))
486                         return true;
487         }
488 #endif
489         else
490                 return false;
491
492         /* Allocate */
493         if (old_eh->h_proto == htons(ETH_P_8021Q))
494                 eth_hdr_len = VLAN_ETH_HLEN;
495
496         payload_length = skb->len - eth_hdr_len;
497         if (skb->protocol == htons(ETH_P_IP)) {
498                 header_length = sizeof(struct iphdr) + sizeof(struct icmphdr);
499                 total_length = min_t(unsigned int, header_length +
500                                                    payload_length, 576);
501         }
502 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
503         else {
504                 header_length = sizeof(struct ipv6hdr) +
505                                 sizeof(struct icmp6hdr);
506                 total_length = min_t(unsigned int, header_length +
507                                                   payload_length, IPV6_MIN_MTU);
508         }
509 #endif
510
511         total_length = min(total_length, mutable->mtu);
512         payload_length = total_length - header_length;
513
514         nskb = dev_alloc_skb(NET_IP_ALIGN + eth_hdr_len + header_length +
515                              payload_length);
516         if (!nskb)
517                 return false;
518
519         skb_reserve(nskb, NET_IP_ALIGN);
520
521         /* Ethernet / VLAN */
522         eh = (struct ethhdr *)skb_put(nskb, eth_hdr_len);
523         memcpy(eh->h_dest, old_eh->h_source, ETH_ALEN);
524         memcpy(eh->h_source, mutable->eth_addr, ETH_ALEN);
525         nskb->protocol = eh->h_proto = old_eh->h_proto;
526         if (old_eh->h_proto == htons(ETH_P_8021Q)) {
527                 struct vlan_ethhdr *vh = (struct vlan_ethhdr *)eh;
528
529                 vh->h_vlan_TCI = vlan_eth_hdr(skb)->h_vlan_TCI;
530                 vh->h_vlan_encapsulated_proto = skb->protocol;
531         }
532         skb_reset_mac_header(nskb);
533
534         /* Protocol */
535         if (skb->protocol == htons(ETH_P_IP))
536                 ipv4_build_icmp(skb, nskb, mtu, payload_length);
537 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
538         else
539                 ipv6_build_icmp(skb, nskb, mtu, payload_length);
540 #endif
541
542         /* Assume that flow based keys are symmetric with respect to input
543          * and output and use the key that we were going to put on the
544          * outgoing packet for the fake received packet.  If the keys are
545          * not symmetric then PMTUD needs to be disabled since we won't have
546          * any way of synthesizing packets. */
547         if (mutable->port_config.flags & GRE_F_IN_KEY_MATCH &&
548             mutable->port_config.flags & GRE_F_OUT_KEY_ACTION)
549                 OVS_CB(nskb)->tun_id = flow_key;
550
551         compute_ip_summed(nskb, false);
552         vport_receive(vport, nskb);
553
554         return true;
555 }
556
557 static struct sk_buff *
558 check_headroom(struct sk_buff *skb, int headroom)
559 {
560         if (skb_headroom(skb) < headroom || skb_header_cloned(skb)) {
561                 struct sk_buff *nskb = skb_realloc_headroom(skb, max(headroom, 64));
562                 if (!nskb) {
563                         kfree_skb(skb);
564                         return ERR_PTR(-ENOMEM);
565                 }
566
567                 set_skb_csum_bits(skb, nskb);
568
569                 if (skb->sk)
570                         skb_set_owner_w(nskb, skb->sk);
571
572                 dev_kfree_skb(skb);
573                 return nskb;
574         }
575
576         return skb;
577 }
578
579 static void
580 create_gre_header(struct sk_buff *skb, const struct mutable_config *mutable)
581 {
582         struct iphdr *iph = ip_hdr(skb);
583         __be16 *flags = (__be16 *)(iph + 1);
584         __be16 *protocol = flags + 1;
585         __be32 *options = (__be32 *)((u8 *)iph + mutable->tunnel_hlen
586                                                - GRE_HEADER_SECTION);
587
588         *protocol = htons(ETH_P_TEB);
589         *flags = 0;
590
591         /* Work backwards over the options so the checksum is last. */
592         if (mutable->port_config.out_key ||
593             mutable->port_config.flags & GRE_F_OUT_KEY_ACTION) {
594                 *flags |= GRE_KEY;
595
596                 if (mutable->port_config.flags & GRE_F_OUT_KEY_ACTION)
597                         *options = OVS_CB(skb)->tun_id;
598                 else
599                         *options = mutable->port_config.out_key;
600
601                 options--;
602         }
603
604         if (mutable->port_config.flags & GRE_F_OUT_CSUM) {
605                 *flags |= GRE_CSUM;
606
607                 *options = 0;
608                 *(__sum16 *)options = csum_fold(skb_checksum(skb,
609                                                 sizeof(struct iphdr),
610                                                 skb->len - sizeof(struct iphdr),
611                                                 0));
612         }
613 }
614
615 static int
616 check_checksum(struct sk_buff *skb)
617 {
618         struct iphdr *iph = ip_hdr(skb);
619         __be16 flags = *(__be16 *)(iph + 1);
620         __sum16 csum = 0;
621
622         if (flags & GRE_CSUM) {
623                 switch (skb->ip_summed) {
624                 case CHECKSUM_COMPLETE:
625                         csum = csum_fold(skb->csum);
626
627                         if (!csum)
628                                 break;
629                         /* Fall through. */
630
631                 case CHECKSUM_NONE:
632                         skb->csum = 0;
633                         csum = __skb_checksum_complete(skb);
634                         skb->ip_summed = CHECKSUM_COMPLETE;
635                         break;
636                 }
637         }
638
639         return (csum == 0);
640 }
641
642 static int
643 parse_gre_header(struct iphdr *iph, __be16 *flags, __be32 *key)
644 {
645         /* IP and ICMP protocol handlers check that the IHL is valid. */
646         __be16 *flagsp = (__be16 *)((u8 *)iph + (iph->ihl << 2));
647         __be16 *protocol = flagsp + 1;
648         __be32 *options = (__be32 *)(protocol + 1);
649         int hdr_len;
650
651         *flags = *flagsp;
652
653         if (*flags & (GRE_VERSION | GRE_ROUTING))
654                 return -EINVAL;
655
656         if (*protocol != htons(ETH_P_TEB))
657                 return -EINVAL;
658
659         hdr_len = GRE_HEADER_SECTION;
660
661         if (*flags & GRE_CSUM) {
662                 hdr_len += GRE_HEADER_SECTION;
663                 options++;
664         }
665
666         if (*flags & GRE_KEY) {
667                 hdr_len += GRE_HEADER_SECTION;
668
669                 *key = *options;
670                 options++;
671         } else
672                 *key = 0;
673
674         if (*flags & GRE_SEQ)
675                 hdr_len += GRE_HEADER_SECTION;
676
677         return hdr_len;
678 }
679
680 static inline u8
681 ecn_encapsulate(u8 tos, struct sk_buff *skb)
682 {
683         u8 inner;
684
685         if (skb->protocol == htons(ETH_P_IP))
686                 inner = ((struct iphdr *)skb_network_header(skb))->tos;
687 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
688         else if (skb->protocol == htons(ETH_P_IPV6))
689                 inner = ipv6_get_dsfield((struct ipv6hdr *)skb_network_header(skb));
690 #endif
691         else
692                 inner = 0;
693
694         return INET_ECN_encapsulate(tos, inner);
695 }
696
697 static inline void
698 ecn_decapsulate(u8 tos, struct sk_buff *skb)
699 {
700         if (INET_ECN_is_ce(tos)) {
701                 __be16 protocol = skb->protocol;
702                 unsigned int nw_header = skb_network_header(skb) - skb->data;
703
704                 if (skb->protocol == htons(ETH_P_8021Q)) {
705                         if (unlikely(!pskb_may_pull(skb, VLAN_ETH_HLEN)))
706                                 return;
707
708                         protocol = vlan_eth_hdr(skb)->h_vlan_encapsulated_proto;
709                         nw_header += VLAN_HLEN;
710                 }
711
712                 if (protocol == htons(ETH_P_IP)) {
713                         if (unlikely(!pskb_may_pull(skb, nw_header
714                             + sizeof(struct iphdr))))
715                                 return;
716
717                         IP_ECN_set_ce((struct iphdr *)(nw_header + skb->data));
718                 }
719 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
720                 else if (protocol == htons(ETH_P_IPV6)) {
721                         if (unlikely(!pskb_may_pull(skb, nw_header
722                             + sizeof(struct ipv6hdr))))
723                                 return;
724
725                         IP6_ECN_set_ce((struct ipv6hdr *)(nw_header
726                                                           + skb->data));
727                 }
728 #endif
729         }
730 }
731
732 static struct sk_buff *
733 handle_gso(struct sk_buff *skb)
734 {
735         if (skb_is_gso(skb)) {
736                 struct sk_buff *nskb = skb_gso_segment(skb, NETIF_F_SG);
737
738                 dev_kfree_skb(skb);
739                 return nskb;
740         }
741
742         return skb;
743 }
744
745 static int
746 handle_csum_offload(struct sk_buff *skb)
747 {
748         if (skb->ip_summed == CHECKSUM_PARTIAL)
749                 return skb_checksum_help(skb);
750         else {
751                 skb->ip_summed = CHECKSUM_NONE;
752                 return 0;
753         }
754 }
755
756 /* Called with rcu_read_lock. */
757 static void
758 gre_err(struct sk_buff *skb, u32 info)
759 {
760         struct vport *vport;
761         const struct mutable_config *mutable;
762         const int type = icmp_hdr(skb)->type;
763         const int code = icmp_hdr(skb)->code;
764         int mtu = ntohs(icmp_hdr(skb)->un.frag.mtu);
765
766         struct iphdr *iph;
767         __be16 flags;
768         __be32 key;
769         int tunnel_hdr_len, tot_hdr_len;
770         unsigned int orig_mac_header;
771         unsigned int orig_nw_header;
772
773         if (type != ICMP_DEST_UNREACH || code != ICMP_FRAG_NEEDED)
774                 return;
775
776         /* The mimimum size packet that we would actually be able to process:
777          * encapsulating IP header, minimum GRE header, Ethernet header,
778          * inner IPv4 header. */
779         if (!pskb_may_pull(skb, sizeof(struct iphdr) + GRE_HEADER_SECTION +
780                                 ETH_HLEN + sizeof(struct iphdr)))
781                 return;
782
783         iph = (struct iphdr *)skb->data;
784
785         tunnel_hdr_len = parse_gre_header(iph, &flags, &key);
786         if (tunnel_hdr_len < 0)
787                 return;
788
789         vport = find_port(iph->saddr, iph->daddr, key, FIND_PORT_ANY, &mutable);
790         if (!vport)
791                 return;
792
793         /* Packets received by this function were previously sent by us, so
794          * any comparisons should be to the output values, not the input.
795          * However, it's not really worth it to have a hash table based on
796          * output keys (especially since ICMP error handling of tunneled packets
797          * isn't that reliable anyways).  Therefore, we do a lookup based on the
798          * out key as if it were the in key and then check to see if the input
799          * and output keys are the same. */
800         if (mutable->port_config.in_key != mutable->port_config.out_key)
801                 return;
802
803         if (!!(mutable->port_config.flags & GRE_F_IN_KEY_MATCH) !=
804             !!(mutable->port_config.flags & GRE_F_OUT_KEY_ACTION))
805                 return;
806
807         if ((mutable->port_config.flags & GRE_F_OUT_CSUM) && !(flags & GRE_CSUM))
808                 return;
809
810         tunnel_hdr_len += iph->ihl << 2;
811
812         orig_mac_header = skb_mac_header(skb) - skb->data;
813         orig_nw_header = skb_network_header(skb) - skb->data;
814         skb_set_mac_header(skb, tunnel_hdr_len);
815
816         tot_hdr_len = tunnel_hdr_len + ETH_HLEN;
817
818         skb->protocol = eth_hdr(skb)->h_proto;
819         if (skb->protocol == htons(ETH_P_8021Q)) {
820                 tot_hdr_len += VLAN_HLEN;
821                 skb->protocol = vlan_eth_hdr(skb)->h_vlan_encapsulated_proto;
822         }
823
824         skb_set_network_header(skb, tot_hdr_len);
825         mtu -= tot_hdr_len;
826
827         if (skb->protocol == htons(ETH_P_IP))
828                 tot_hdr_len += sizeof(struct iphdr);
829 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
830         else if (skb->protocol == htons(ETH_P_IPV6))
831                 tot_hdr_len += sizeof(struct ipv6hdr);
832 #endif
833         else
834                 goto out;
835
836         if (!pskb_may_pull(skb, tot_hdr_len))
837                 goto out;
838
839         if (skb->protocol == htons(ETH_P_IP)) {
840                 if (mtu < IP_MIN_MTU) {
841                         if (ntohs(ip_hdr(skb)->tot_len) >= IP_MIN_MTU)
842                                 mtu = IP_MIN_MTU;
843                         else
844                                 goto out;
845                 }
846
847         }
848 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
849         else if (skb->protocol == htons(ETH_P_IPV6)) {
850                 if (mtu < IPV6_MIN_MTU) {
851                         unsigned int packet_length = sizeof(struct ipv6hdr) +
852                                               ntohs(ipv6_hdr(skb)->payload_len);
853
854                         if (packet_length >= IPV6_MIN_MTU
855                             || ntohs(ipv6_hdr(skb)->payload_len) == 0)
856                                 mtu = IPV6_MIN_MTU;
857                         else
858                                 goto out;
859                 }
860         }
861 #endif
862
863         __pskb_pull(skb, tunnel_hdr_len);
864         send_frag_needed(vport, mutable, skb, mtu, key);
865         skb_push(skb, tunnel_hdr_len);
866
867 out:
868         skb_set_mac_header(skb, orig_mac_header);
869         skb_set_network_header(skb, orig_nw_header);
870         skb->protocol = htons(ETH_P_IP);
871 }
872
873 /* Called with rcu_read_lock. */
874 static int
875 gre_rcv(struct sk_buff *skb)
876 {
877         struct vport *vport;
878         const struct mutable_config *mutable;
879         int hdr_len;
880         struct iphdr *iph;
881         __be16 flags;
882         __be32 key;
883
884         if (!pskb_may_pull(skb, GRE_HEADER_SECTION + ETH_HLEN))
885                 goto error;
886
887         if (!check_checksum(skb))
888                 goto error;
889
890         iph = ip_hdr(skb);
891
892         hdr_len = parse_gre_header(iph, &flags, &key);
893         if (hdr_len < 0)
894                 goto error;
895
896         vport = find_port(iph->daddr, iph->saddr, key, FIND_PORT_ANY, &mutable);
897         if (!vport) {
898                 icmp_send(skb, ICMP_DEST_UNREACH, ICMP_PORT_UNREACH, 0);
899                 goto error;
900         }
901
902         if ((mutable->port_config.flags & GRE_F_IN_CSUM) && !(flags & GRE_CSUM)) {
903                 vport_record_error(vport, VPORT_E_RX_CRC);
904                 goto error;
905         }
906
907         if (!pskb_pull(skb, hdr_len) || !pskb_may_pull(skb, ETH_HLEN)) {
908                 vport_record_error(vport, VPORT_E_RX_ERROR);
909                 goto error;
910         }
911
912         skb->pkt_type = PACKET_HOST;
913         skb->protocol = eth_type_trans(skb, skb->dev);
914         skb_postpull_rcsum(skb, skb_transport_header(skb), hdr_len + ETH_HLEN);
915
916         skb_dst_drop(skb);
917         nf_reset(skb);
918         secpath_reset(skb);
919         skb_reset_network_header(skb);
920
921         ecn_decapsulate(iph->tos, skb);
922
923         if (mutable->port_config.flags & GRE_F_IN_KEY_MATCH)
924                 OVS_CB(skb)->tun_id = key;
925         else
926                 OVS_CB(skb)->tun_id = 0;
927
928         skb_push(skb, ETH_HLEN);
929         compute_ip_summed(skb, false);
930
931         vport_receive(vport, skb);
932
933         return 0;
934
935 error:
936         kfree_skb(skb);
937         return 0;
938 }
939
940 static int
941 build_packet(struct vport *vport, const struct mutable_config *mutable,
942              struct iphdr *iph, struct rtable *rt, int max_headroom, int mtu,
943              struct sk_buff *skb)
944 {
945         int err;
946         struct iphdr *new_iph;
947         int orig_len = skb->len;
948         __be16 frag_off = iph->frag_off;
949
950         skb = check_headroom(skb, max_headroom);
951         if (unlikely(IS_ERR(skb)))
952                 goto error;
953
954         err = handle_csum_offload(skb);
955         if (err)
956                 goto error_free;
957
958         if (skb->protocol == htons(ETH_P_IP)) {
959                 struct iphdr *old_iph = ip_hdr(skb);
960
961                 if ((old_iph->frag_off & htons(IP_DF)) &&
962                     mtu < ntohs(old_iph->tot_len)) {
963                         if (send_frag_needed(vport, mutable, skb, mtu, OVS_CB(skb)->tun_id))
964                                 goto error_free;
965                 }
966
967         }
968 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
969         else if (skb->protocol == htons(ETH_P_IPV6)) {
970                 unsigned int packet_length = skb->len - ETH_HLEN
971                         - (eth_hdr(skb)->h_proto == htons(ETH_P_8021Q) ? VLAN_HLEN : 0);
972
973                 /* IPv6 requires PMTUD if the packet is above the minimum MTU. */
974                 if (packet_length > IPV6_MIN_MTU)
975                         frag_off = htons(IP_DF);
976
977                 if (mtu < packet_length) {
978                         if (send_frag_needed(vport, mutable, skb, mtu, OVS_CB(skb)->tun_id))
979                                 goto error_free;
980                 }
981         }
982 #endif
983
984         skb_reset_transport_header(skb);
985         new_iph = (struct iphdr *)skb_push(skb, mutable->tunnel_hlen);
986         skb_reset_network_header(skb);
987
988         memcpy(new_iph, iph, sizeof(struct iphdr));
989         new_iph->frag_off = frag_off;
990         ip_select_ident(new_iph, &rt->u.dst, NULL);
991
992         create_gre_header(skb, mutable);
993
994         /* Allow our local IP stack to fragment the outer packet even if the
995          * DF bit is set as a last resort. */
996         skb->local_df = 1;
997
998         memset(&(IPCB(skb)->opt), 0, sizeof(IPCB(skb)->opt));
999         IPCB(skb)->flags = 0;
1000
1001         err = ip_local_out(skb);
1002         if (likely(net_xmit_eval(err) == 0))
1003                 return orig_len;
1004         else {
1005                 vport_record_error(vport, VPORT_E_TX_ERROR);
1006                 return 0;
1007         }
1008
1009 error_free:
1010         kfree_skb(skb);
1011 error:
1012         vport_record_error(vport, VPORT_E_TX_DROPPED);
1013
1014         return 0;
1015 }
1016
1017 static int
1018 gre_send(struct vport *vport, struct sk_buff *skb)
1019 {
1020         struct gre_vport *gre_vport = gre_vport_priv(vport);
1021         const struct mutable_config *mutable = rcu_dereference(gre_vport->mutable);
1022
1023         struct iphdr *old_iph;
1024         int orig_len;
1025         struct iphdr iph;
1026         struct rtable *rt;
1027         int max_headroom;
1028         int mtu;
1029
1030         /* Validate the protocol headers before we try to use them. */
1031         if (skb->protocol == htons(ETH_P_8021Q)) {
1032                 if (unlikely(!pskb_may_pull(skb, VLAN_ETH_HLEN)))
1033                         goto error_free;
1034
1035                 skb->protocol = vlan_eth_hdr(skb)->h_vlan_encapsulated_proto;
1036                 skb_set_network_header(skb, VLAN_ETH_HLEN);
1037         }
1038
1039         if (skb->protocol == htons(ETH_P_IP)) {
1040                 if (unlikely(!pskb_may_pull(skb, skb_network_header(skb)
1041                     + sizeof(struct iphdr) - skb->data)))
1042                         skb->protocol = 0;
1043         }
1044 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
1045         else if (skb->protocol == htons(ETH_P_IPV6)) {
1046                 if (unlikely(!pskb_may_pull(skb, skb_network_header(skb)
1047                     + sizeof(struct ipv6hdr) - skb->data)))
1048                         skb->protocol = 0;
1049         }
1050 #endif
1051         old_iph = ip_hdr(skb);
1052
1053         iph.tos = mutable->port_config.tos;
1054         if (mutable->port_config.flags & GRE_F_TOS_INHERIT) {
1055                 if (skb->protocol == htons(ETH_P_IP))
1056                         iph.tos = old_iph->tos;
1057 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
1058                 else if (skb->protocol == htons(ETH_P_IPV6))
1059                         iph.tos = ipv6_get_dsfield(ipv6_hdr(skb));
1060 #endif
1061         }
1062         iph.tos = ecn_encapsulate(iph.tos, skb);
1063
1064         {
1065                 struct flowi fl = { .nl_u = { .ip4_u =
1066                                               { .daddr = mutable->port_config.daddr,
1067                                                 .saddr = mutable->port_config.saddr,
1068                                                 .tos = RT_TOS(iph.tos) } },
1069                                     .proto = IPPROTO_GRE };
1070
1071                 if (ip_route_output_key(&init_net, &rt, &fl))
1072                         goto error_free;
1073         }
1074
1075         iph.ttl = mutable->port_config.ttl;
1076         if (mutable->port_config.flags & GRE_F_TTL_INHERIT) {
1077                 if (skb->protocol == htons(ETH_P_IP))
1078                         iph.ttl = old_iph->ttl;
1079 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
1080                 else if (skb->protocol == htons(ETH_P_IPV6))
1081                         iph.ttl = ipv6_hdr(skb)->hop_limit;
1082 #endif
1083         }
1084         if (!iph.ttl)
1085                 iph.ttl = dst_metric(&rt->u.dst, RTAX_HOPLIMIT);
1086
1087         iph.frag_off = (mutable->port_config.flags & GRE_F_PMTUD) ? htons(IP_DF) : 0;
1088         if (iph.frag_off)
1089                 mtu = dst_mtu(&rt->u.dst)
1090                         - ETH_HLEN
1091                         - mutable->tunnel_hlen
1092                         - (eth_hdr(skb)->h_proto == htons(ETH_P_8021Q) ? VLAN_HLEN : 0);
1093         else
1094                 mtu = mutable->mtu;
1095
1096         if (skb->protocol == htons(ETH_P_IP)) {
1097                 iph.frag_off |= old_iph->frag_off & htons(IP_DF);
1098                 mtu = max(mtu, IP_MIN_MTU);
1099         }
1100 #if defined(CONFIG_IPV6) || defined(CONFIG_IPV6_MODULE)
1101         else if (skb->protocol == htons(ETH_P_IPV6))
1102                 mtu = max(mtu, IPV6_MIN_MTU);
1103 #endif
1104
1105         iph.version = 4;
1106         iph.ihl = sizeof(struct iphdr) >> 2;
1107         iph.protocol = IPPROTO_GRE;
1108         iph.daddr = rt->rt_dst;
1109         iph.saddr = rt->rt_src;
1110
1111         nf_reset(skb);
1112         secpath_reset(skb);
1113         skb_dst_drop(skb);
1114         skb_dst_set(skb, &rt->u.dst);
1115
1116         /* If we are doing GSO on a pskb it is better to make sure that the
1117          * headroom is correct now.  We will only have to copy the portion in
1118          * the linear data area and GSO will preserve headroom when it creates
1119          * the segments.  This is particularly beneficial on Xen where we get
1120          * lots of GSO pskbs.  Conversely, we delay copying if it is just to
1121          * get our own writable clone because GSO may do the copy for us. */
1122         max_headroom = LL_RESERVED_SPACE(rt->u.dst.dev) + rt->u.dst.header_len
1123                         + mutable->tunnel_hlen;
1124
1125         if (skb_headroom(skb) < max_headroom) {
1126                 skb = check_headroom(skb, max_headroom);
1127                 if (unlikely(IS_ERR(skb))) {
1128                         vport_record_error(vport, VPORT_E_TX_DROPPED);
1129                         goto error;
1130                 }
1131         }
1132
1133         forward_ip_summed(skb);
1134         vswitch_skb_checksum_setup(skb);
1135
1136         skb = handle_gso(skb);
1137         if (unlikely(IS_ERR(skb))) {
1138                 vport_record_error(vport, VPORT_E_TX_DROPPED);
1139                 goto error;
1140         }
1141
1142         /* Process GSO segments.  Try to do any work for the entire packet that
1143          * doesn't involve actually writing to it before this point. */
1144         orig_len = 0;
1145         do {
1146                 struct sk_buff *next_skb = skb->next;
1147                 skb->next = NULL;
1148
1149                 orig_len += build_packet(vport, mutable, &iph, rt, max_headroom, mtu, skb);
1150
1151                 skb = next_skb;
1152         } while (skb);
1153
1154         return orig_len;
1155
1156 error_free:
1157         kfree_skb(skb);
1158         vport_record_error(vport, VPORT_E_TX_ERROR);
1159 error:
1160         return 0;
1161 }
1162
1163 static struct net_protocol gre_protocol_handlers = {
1164         .handler        =       gre_rcv,
1165         .err_handler    =       gre_err,
1166 };
1167
1168 static int
1169 gre_init(void)
1170 {
1171         int err;
1172
1173         err = inet_add_protocol(&gre_protocol_handlers, IPPROTO_GRE);
1174         if (err)
1175                 printk(KERN_WARNING "openvswitch: cannot register gre protocol handler\n");
1176
1177         return err;
1178 }
1179
1180 static void
1181 gre_exit(void)
1182 {
1183         tbl_destroy(port_table, NULL);
1184         inet_del_protocol(&gre_protocol_handlers, IPPROTO_GRE);
1185 }
1186
1187 static int
1188 set_config(const struct vport *cur_vport, struct mutable_config *mutable,
1189            const void __user *uconfig)
1190 {
1191         const struct vport *old_vport;
1192         const struct mutable_config *old_mutable;
1193         int port_type;
1194
1195         if (copy_from_user(&mutable->port_config, uconfig, sizeof(struct gre_port_config)))
1196                 return -EFAULT;
1197
1198         if (mutable->port_config.daddr == 0)
1199                 return -EINVAL;
1200
1201         if (mutable->port_config.flags & GRE_F_IN_KEY_MATCH) {
1202                 port_type = FIND_PORT_MATCH;
1203                 mutable->port_config.in_key = 0;
1204         } else
1205                 port_type = FIND_PORT_KEY;
1206
1207         old_vport = find_port(mutable->port_config.saddr,
1208                               mutable->port_config.daddr,
1209                               mutable->port_config.in_key, port_type,
1210                               &old_mutable);
1211
1212         if (old_vport && old_vport != cur_vport)
1213                 return -EEXIST;
1214
1215         if (mutable->port_config.flags & GRE_F_OUT_KEY_ACTION)
1216                 mutable->port_config.out_key = 0;
1217
1218         mutable->tunnel_hlen = sizeof(struct iphdr) + GRE_HEADER_SECTION;
1219
1220         if (mutable->port_config.flags & GRE_F_OUT_CSUM)
1221                 mutable->tunnel_hlen += GRE_HEADER_SECTION;
1222
1223         if (mutable->port_config.out_key ||
1224             mutable->port_config.flags & GRE_F_OUT_KEY_ACTION)
1225                 mutable->tunnel_hlen += GRE_HEADER_SECTION;
1226
1227         return 0;
1228 }
1229
1230 static struct vport *
1231 gre_create(const char *name, const void __user *config)
1232 {
1233         struct vport *vport;
1234         struct gre_vport *gre_vport;
1235         int err;
1236
1237         vport = vport_alloc(sizeof(struct gre_vport), &gre_vport_ops);
1238         if (IS_ERR(vport)) {
1239                 err = PTR_ERR(vport);
1240                 goto error;
1241         }
1242
1243         gre_vport = gre_vport_priv(vport);
1244
1245         strcpy(gre_vport->name, name);
1246
1247         gre_vport->mutable = kmalloc(sizeof(struct mutable_config), GFP_KERNEL);
1248         if (!gre_vport->mutable) {
1249                 err = -ENOMEM;
1250                 goto error_free_vport;
1251         }
1252
1253         vport_gen_rand_ether_addr(gre_vport->mutable->eth_addr);
1254         gre_vport->mutable->mtu = ETH_DATA_LEN;
1255
1256         err = set_config(NULL, gre_vport->mutable, config);
1257         if (err)
1258                 goto error_free_mutable;
1259
1260         err = add_port(vport);
1261         if (err)
1262                 goto error_free_mutable;
1263
1264         return vport;
1265
1266 error_free_mutable:
1267         kfree(gre_vport->mutable);
1268 error_free_vport:
1269         vport_free(vport);
1270 error:
1271         return ERR_PTR(err);
1272 }
1273
1274 static int
1275 gre_modify(struct vport *vport, const void __user *config)
1276 {
1277         struct gre_vport *gre_vport = gre_vport_priv(vport);
1278         struct mutable_config *mutable;
1279         int err;
1280         int update_hash = 0;
1281
1282         mutable = kmemdup(gre_vport->mutable, sizeof(struct mutable_config), GFP_KERNEL);
1283         if (!mutable) {
1284                 err = -ENOMEM;
1285                 goto error;
1286         }
1287
1288         err = set_config(vport, mutable, config);
1289         if (err)
1290                 goto error_free;
1291
1292         /* Only remove the port from the hash table if something that would
1293          * affect the lookup has changed. */
1294         if (gre_vport->mutable->port_config.saddr != mutable->port_config.saddr ||
1295             gre_vport->mutable->port_config.daddr != mutable->port_config.daddr ||
1296             gre_vport->mutable->port_config.in_key != mutable->port_config.in_key ||
1297             (gre_vport->mutable->port_config.flags & GRE_F_IN_KEY_MATCH) !=
1298             (mutable->port_config.flags & GRE_F_IN_KEY_MATCH))
1299                 update_hash = 1;
1300
1301
1302         /* This update is not atomic but the lookup uses the config, which
1303          * serves as an inherent double check. */
1304         if (update_hash) {
1305                 err = del_port(vport);
1306                 if (err)
1307                         goto error_free;
1308         }
1309
1310         assign_config_rcu(vport, mutable);
1311
1312         if (update_hash) {
1313                 err = add_port(vport);
1314                 if (err)
1315                         goto error_free;
1316         }
1317
1318         return 0;
1319
1320 error_free:
1321         kfree(mutable);
1322 error:
1323         return err;
1324 }
1325
1326 static int
1327 gre_destroy(struct vport *vport)
1328 {
1329         struct gre_vport *gre_vport = gre_vport_priv(vport);
1330         int port_type;
1331         const struct mutable_config *old_mutable;
1332
1333         /* Do a hash table lookup to make sure that the port exists.  It should
1334          * exist but might not if a modify failed earlier. */
1335         if (gre_vport->mutable->port_config.flags & GRE_F_IN_KEY_MATCH)
1336                 port_type = FIND_PORT_MATCH;
1337         else
1338                 port_type = FIND_PORT_KEY;
1339
1340         if (vport == find_port(gre_vport->mutable->port_config.saddr,
1341             gre_vport->mutable->port_config.daddr,
1342             gre_vport->mutable->port_config.in_key, port_type, &old_mutable))
1343                 del_port(vport);
1344
1345         kfree(gre_vport->mutable);
1346         vport_free(vport);
1347
1348         return 0;
1349 }
1350
1351 static int
1352 gre_set_mtu(struct vport *vport, int mtu)
1353 {
1354         struct gre_vport *gre_vport = gre_vport_priv(vport);
1355         struct mutable_config *mutable;
1356
1357         mutable = kmemdup(gre_vport->mutable, sizeof(struct mutable_config), GFP_KERNEL);
1358         if (!mutable)
1359                 return -ENOMEM;
1360
1361         mutable->mtu = mtu;
1362         assign_config_rcu(vport, mutable);
1363
1364         return 0;
1365 }
1366
1367 static int
1368 gre_set_addr(struct vport *vport, const unsigned char *addr)
1369 {
1370         struct gre_vport *gre_vport = gre_vport_priv(vport);
1371         struct mutable_config *mutable;
1372
1373         mutable = kmemdup(gre_vport->mutable, sizeof(struct mutable_config), GFP_KERNEL);
1374         if (!mutable)
1375                 return -ENOMEM;
1376
1377         memcpy(mutable->eth_addr, addr, ETH_ALEN);
1378         assign_config_rcu(vport, mutable);
1379
1380         return 0;
1381 }
1382
1383
1384 static const char *
1385 gre_get_name(const struct vport *vport)
1386 {
1387         const struct gre_vport *gre_vport = gre_vport_priv(vport);
1388         return gre_vport->name;
1389 }
1390
1391 static const unsigned char *
1392 gre_get_addr(const struct vport *vport)
1393 {
1394         const struct gre_vport *gre_vport = gre_vport_priv(vport);
1395         return rcu_dereference(gre_vport->mutable)->eth_addr;
1396 }
1397
1398 static int
1399 gre_get_mtu(const struct vport *vport)
1400 {
1401         const struct gre_vport *gre_vport = gre_vport_priv(vport);
1402         return rcu_dereference(gre_vport->mutable)->mtu;
1403 }
1404
1405 struct vport_ops gre_vport_ops = {
1406         .type           = "gre",
1407         .flags          = VPORT_F_GEN_STATS | VPORT_F_TUN_ID,
1408         .init           = gre_init,
1409         .exit           = gre_exit,
1410         .create         = gre_create,
1411         .modify         = gre_modify,
1412         .destroy        = gre_destroy,
1413         .set_mtu        = gre_set_mtu,
1414         .set_addr       = gre_set_addr,
1415         .get_name       = gre_get_name,
1416         .get_addr       = gre_get_addr,
1417         .get_dev_flags  = vport_gen_get_dev_flags,
1418         .is_running     = vport_gen_is_running,
1419         .get_operstate  = vport_gen_get_operstate,
1420         .get_mtu        = gre_get_mtu,
1421         .send           = gre_send,
1422 };