be2907454ebe5fe4870522036d1884f76326829f
[sliver-openvswitch.git] / datapath / vport-internal_dev.c
1 /*
2  * Copyright (c) 2009, 2010, 2011 Nicira Networks.
3  * Distributed under the terms of the GNU GPL version 2.
4  *
5  * Significant portions of this file may be copied from parts of the Linux
6  * kernel, by Linus Torvalds and others.
7  */
8
9 #include <linux/kernel.h>
10 #include <linux/netdevice.h>
11 #include <linux/etherdevice.h>
12 #include <linux/ethtool.h>
13 #include <linux/skbuff.h>
14 #include <linux/version.h>
15
16 #include "checksum.h"
17 #include "datapath.h"
18 #include "vlan.h"
19 #include "vport-generic.h"
20 #include "vport-internal_dev.h"
21 #include "vport-netdev.h"
22
23 struct internal_dev {
24         struct vport *vport;
25         struct net_device_stats stats;
26 };
27
28 static inline struct internal_dev *internal_dev_priv(struct net_device *netdev)
29 {
30         return netdev_priv(netdev);
31 }
32
33 /* This function is only called by the kernel network layer.  It is not a vport
34  * get_stats() function.  If a vport get_stats() function is defined that
35  * results in this being called it will cause infinite recursion. */
36 static struct net_device_stats *internal_dev_sys_stats(struct net_device *netdev)
37 {
38         struct vport *vport = internal_dev_get_vport(netdev);
39         struct net_device_stats *stats = &internal_dev_priv(netdev)->stats;
40
41         if (vport) {
42                 struct rtnl_link_stats64 vport_stats;
43
44                 vport_get_stats(vport, &vport_stats);
45
46                 /* The tx and rx stats need to be swapped because the switch
47                  * and host OS have opposite perspectives. */
48                 stats->rx_packets       = vport_stats.tx_packets;
49                 stats->tx_packets       = vport_stats.rx_packets;
50                 stats->rx_bytes         = vport_stats.tx_bytes;
51                 stats->tx_bytes         = vport_stats.rx_bytes;
52                 stats->rx_errors        = vport_stats.tx_errors;
53                 stats->tx_errors        = vport_stats.rx_errors;
54                 stats->rx_dropped       = vport_stats.tx_dropped;
55                 stats->tx_dropped       = vport_stats.rx_dropped;
56                 stats->collisions       = vport_stats.collisions;
57         }
58
59         return stats;
60 }
61
62 static int internal_dev_mac_addr(struct net_device *dev, void *p)
63 {
64         struct sockaddr *addr = p;
65
66         if (!is_valid_ether_addr(addr->sa_data))
67                 return -EADDRNOTAVAIL;
68         memcpy(dev->dev_addr, addr->sa_data, dev->addr_len);
69         return 0;
70 }
71
72 /* Called with rcu_read_lock and bottom-halves disabled. */
73 static int internal_dev_xmit(struct sk_buff *skb, struct net_device *netdev)
74 {
75         compute_ip_summed(skb, true);
76         vlan_copy_skb_tci(skb);
77         OVS_CB(skb)->flow = NULL;
78
79         vport_receive(internal_dev_priv(netdev)->vport, skb);
80         return 0;
81 }
82
83 static int internal_dev_open(struct net_device *netdev)
84 {
85         netif_start_queue(netdev);
86         return 0;
87 }
88
89 static int internal_dev_stop(struct net_device *netdev)
90 {
91         netif_stop_queue(netdev);
92         return 0;
93 }
94
95 static void internal_dev_getinfo(struct net_device *netdev,
96                                  struct ethtool_drvinfo *info)
97 {
98         strcpy(info->driver, "openvswitch");
99 }
100
101 static const struct ethtool_ops internal_dev_ethtool_ops = {
102         .get_drvinfo    = internal_dev_getinfo,
103         .get_link       = ethtool_op_get_link,
104         .get_sg         = ethtool_op_get_sg,
105         .set_sg         = ethtool_op_set_sg,
106         .get_tx_csum    = ethtool_op_get_tx_csum,
107         .set_tx_csum    = ethtool_op_set_tx_hw_csum,
108         .get_tso        = ethtool_op_get_tso,
109         .set_tso        = ethtool_op_set_tso,
110 };
111
112 static int internal_dev_change_mtu(struct net_device *netdev, int new_mtu)
113 {
114         struct vport *vport = internal_dev_get_vport(netdev);
115
116         if (new_mtu < 68)
117                 return -EINVAL;
118
119         if (new_mtu > dp_min_mtu(vport->dp))
120                 return -EINVAL;
121
122         netdev->mtu = new_mtu;
123         return 0;
124 }
125
126 static int internal_dev_do_ioctl(struct net_device *dev, struct ifreq *ifr, int cmd)
127 {
128         if (dp_ioctl_hook)
129                 return dp_ioctl_hook(dev, ifr, cmd);
130
131         return -EOPNOTSUPP;
132 }
133
134 #ifdef HAVE_NET_DEVICE_OPS
135 static const struct net_device_ops internal_dev_netdev_ops = {
136         .ndo_open = internal_dev_open,
137         .ndo_stop = internal_dev_stop,
138         .ndo_start_xmit = internal_dev_xmit,
139         .ndo_set_mac_address = internal_dev_mac_addr,
140         .ndo_do_ioctl = internal_dev_do_ioctl,
141         .ndo_change_mtu = internal_dev_change_mtu,
142         .ndo_get_stats = internal_dev_sys_stats,
143 };
144 #endif
145
146 static void do_setup(struct net_device *netdev)
147 {
148         ether_setup(netdev);
149
150 #ifdef HAVE_NET_DEVICE_OPS
151         netdev->netdev_ops = &internal_dev_netdev_ops;
152 #else
153         netdev->do_ioctl = internal_dev_do_ioctl;
154         netdev->get_stats = internal_dev_sys_stats;
155         netdev->hard_start_xmit = internal_dev_xmit;
156         netdev->open = internal_dev_open;
157         netdev->stop = internal_dev_stop;
158         netdev->set_mac_address = internal_dev_mac_addr;
159         netdev->change_mtu = internal_dev_change_mtu;
160 #endif
161
162         netdev->destructor = free_netdev;
163         SET_ETHTOOL_OPS(netdev, &internal_dev_ethtool_ops);
164         netdev->tx_queue_len = 0;
165
166         netdev->flags = IFF_BROADCAST | IFF_MULTICAST;
167         netdev->features = NETIF_F_LLTX | NETIF_F_SG | NETIF_F_FRAGLIST |
168                                 NETIF_F_HIGHDMA | NETIF_F_HW_CSUM | NETIF_F_TSO;
169
170         vport_gen_rand_ether_addr(netdev->dev_addr);
171 }
172
173 static struct vport *internal_dev_create(const struct vport_parms *parms)
174 {
175         struct vport *vport;
176         struct netdev_vport *netdev_vport;
177         struct internal_dev *internal_dev;
178         int err;
179
180         vport = vport_alloc(sizeof(struct netdev_vport), &internal_vport_ops, parms);
181         if (IS_ERR(vport)) {
182                 err = PTR_ERR(vport);
183                 goto error;
184         }
185
186         netdev_vport = netdev_vport_priv(vport);
187
188         netdev_vport->dev = alloc_netdev(sizeof(struct internal_dev), parms->name, do_setup);
189         if (!netdev_vport->dev) {
190                 err = -ENOMEM;
191                 goto error_free_vport;
192         }
193
194         internal_dev = internal_dev_priv(netdev_vport->dev);
195         internal_dev->vport = vport;
196
197         err = register_netdevice(netdev_vport->dev);
198         if (err)
199                 goto error_free_netdev;
200
201         dev_set_promiscuity(netdev_vport->dev, 1);
202         netif_start_queue(netdev_vport->dev);
203
204         return vport;
205
206 error_free_netdev:
207         free_netdev(netdev_vport->dev);
208 error_free_vport:
209         vport_free(vport);
210 error:
211         return ERR_PTR(err);
212 }
213
214 static int internal_dev_destroy(struct vport *vport)
215 {
216         struct netdev_vport *netdev_vport = netdev_vport_priv(vport);
217
218         netif_stop_queue(netdev_vport->dev);
219         dev_set_promiscuity(netdev_vport->dev, -1);
220
221         unregister_netdevice(netdev_vport->dev);
222         /* unregister_netdevice() waits for an RCU grace period. */
223         vport_free(vport);
224
225         return 0;
226 }
227
228 static int internal_dev_recv(struct vport *vport, struct sk_buff *skb)
229 {
230         struct net_device *netdev = netdev_vport_priv(vport)->dev;
231         int len;
232
233         skb->dev = netdev;
234         len = skb->len;
235         skb->pkt_type = PACKET_HOST;
236         skb->protocol = eth_type_trans(skb, netdev);
237
238         if (in_interrupt())
239                 netif_rx(skb);
240         else
241                 netif_rx_ni(skb);
242
243 #if LINUX_VERSION_CODE < KERNEL_VERSION(2,6,29)
244         netdev->last_rx = jiffies;
245 #endif
246
247         return len;
248 }
249
250 const struct vport_ops internal_vport_ops = {
251         .type           = ODP_VPORT_TYPE_INTERNAL,
252         .flags          = VPORT_F_REQUIRED | VPORT_F_GEN_STATS | VPORT_F_FLOW,
253         .create         = internal_dev_create,
254         .destroy        = internal_dev_destroy,
255         .set_mtu        = netdev_set_mtu,
256         .set_addr       = netdev_set_addr,
257         .get_name       = netdev_get_name,
258         .get_addr       = netdev_get_addr,
259         .get_kobj       = netdev_get_kobj,
260         .get_dev_flags  = netdev_get_dev_flags,
261         .is_running     = netdev_is_running,
262         .get_operstate  = netdev_get_operstate,
263         .get_ifindex    = netdev_get_ifindex,
264         .get_iflink     = netdev_get_iflink,
265         .get_mtu        = netdev_get_mtu,
266         .send           = internal_dev_recv,
267 };
268
269 int is_internal_dev(const struct net_device *netdev)
270 {
271 #ifdef HAVE_NET_DEVICE_OPS
272         return netdev->netdev_ops == &internal_dev_netdev_ops;
273 #else
274         return netdev->open == internal_dev_open;
275 #endif
276 }
277
278 int is_internal_vport(const struct vport *vport)
279 {
280         return vport->ops == &internal_vport_ops;
281 }
282
283 struct vport *internal_dev_get_vport(struct net_device *netdev)
284 {
285         if (!is_internal_dev(netdev))
286                 return NULL;
287
288         return internal_dev_priv(netdev)->vport;
289 }