2bbd6fecf8d05a52f851b3562b2ad9663a1fbff8
[sliver-openvswitch.git] / datapath / dp_dev.c
1 /*
2  * Copyright (c) 2009, 2010 Nicira Networks.
3  * Distributed under the terms of the GNU GPL version 2.
4  *
5  * Significant portions of this file may be copied from parts of the Linux
6  * kernel, by Linus Torvalds and others.
7  */
8
9 #include <linux/kernel.h>
10 #include <linux/netdevice.h>
11 #include <linux/etherdevice.h>
12 #include <linux/ethtool.h>
13 #include <linux/preempt.h>
14 #include <linux/rcupdate.h>
15 #include <linux/skbuff.h>
16 #include <linux/workqueue.h>
17
18 #include "datapath.h"
19 #include "dp_dev.h"
20
21 struct pcpu_lstats {
22         unsigned long rx_packets;
23         unsigned long rx_bytes;
24         unsigned long tx_packets;
25         unsigned long tx_bytes;
26 };
27
28 struct datapath *dp_dev_get_dp(struct net_device *netdev)
29 {
30         return dp_dev_priv(netdev)->dp;
31 }
32
33 static struct net_device_stats *dp_dev_get_stats(struct net_device *netdev)
34 {
35         struct dp_dev *dp_dev = dp_dev_priv(netdev);
36         struct net_device_stats *stats;
37         int i;
38
39         stats = &dp_dev->stats;
40         memset(stats, 0, sizeof *stats);
41         for_each_possible_cpu(i) {
42                 const struct pcpu_lstats *lb_stats;
43
44                 lb_stats = per_cpu_ptr(dp_dev->lstats, i);
45                 stats->rx_bytes   += lb_stats->rx_bytes;
46                 stats->rx_packets += lb_stats->rx_packets;
47                 stats->tx_bytes   += lb_stats->tx_bytes;
48                 stats->tx_packets += lb_stats->tx_packets;
49         }
50         return stats;
51 }
52
53 int dp_dev_recv(struct net_device *netdev, struct sk_buff *skb) 
54 {
55         struct dp_dev *dp_dev = dp_dev_priv(netdev);
56         struct pcpu_lstats *lb_stats;
57         int len;
58         len = skb->len;
59         skb->pkt_type = PACKET_HOST;
60         skb->protocol = eth_type_trans(skb, netdev);
61         if (in_interrupt())
62                 netif_rx(skb);
63         else
64                 netif_rx_ni(skb);
65         netdev->last_rx = jiffies;
66
67         preempt_disable();
68         lb_stats = per_cpu_ptr(dp_dev->lstats, smp_processor_id());
69         lb_stats->rx_packets++;
70         lb_stats->rx_bytes += len;
71         preempt_enable();
72
73         return len;
74 }
75
76 static int dp_dev_mac_addr(struct net_device *dev, void *p)
77 {
78         struct sockaddr *addr = p;
79
80         if (!is_valid_ether_addr(addr->sa_data))
81                 return -EADDRNOTAVAIL;
82         memcpy(dev->dev_addr, addr->sa_data, dev->addr_len);
83         return 0;
84 }
85
86 /* Not reentrant (because it is called with BHs disabled), but may be called
87  * simultaneously on different CPUs. */
88 static int dp_dev_xmit(struct sk_buff *skb, struct net_device *netdev)
89 {
90         struct dp_dev *dp_dev = dp_dev_priv(netdev);
91         struct pcpu_lstats *lb_stats;
92
93         /* dp_process_received_packet() needs its own clone. */
94         skb = skb_share_check(skb, GFP_ATOMIC);
95         if (!skb)
96                 return 0;
97
98         lb_stats = per_cpu_ptr(dp_dev->lstats, smp_processor_id());
99         lb_stats->tx_packets++;
100         lb_stats->tx_bytes += skb->len;
101
102         skb_reset_mac_header(skb);
103         rcu_read_lock_bh();
104         dp_process_received_packet(skb, dp_dev->dp->ports[dp_dev->port_no]);
105         rcu_read_unlock_bh();
106
107         return 0;
108 }
109
110 static int dp_dev_open(struct net_device *netdev)
111 {
112         netif_start_queue(netdev);
113         return 0;
114 }
115
116 static int dp_dev_stop(struct net_device *netdev)
117 {
118         netif_stop_queue(netdev);
119         return 0;
120 }
121
122 static void dp_getinfo(struct net_device *netdev, struct ethtool_drvinfo *info)
123 {
124         struct dp_dev *dp_dev = dp_dev_priv(netdev);
125         strcpy(info->driver, "openvswitch");
126         sprintf(info->bus_info, "%d.%d", dp_dev->dp->dp_idx, dp_dev->port_no);
127 }
128
129 static struct ethtool_ops dp_ethtool_ops = {
130         .get_drvinfo = dp_getinfo,
131         .get_link = ethtool_op_get_link,
132         .get_sg = ethtool_op_get_sg,
133         .get_tx_csum = ethtool_op_get_tx_csum,
134         .get_tso = ethtool_op_get_tso,
135 };
136
137 static int dp_dev_change_mtu(struct net_device *dev, int new_mtu)
138 {
139         if (new_mtu < 68 || new_mtu > dp_min_mtu(dp_dev_get_dp(dev)))
140                 return -EINVAL;
141
142         dev->mtu = new_mtu;
143         return 0;
144 }
145
146 static int dp_dev_init(struct net_device *netdev)
147 {
148         struct dp_dev *dp_dev = dp_dev_priv(netdev);
149
150         dp_dev->lstats = alloc_percpu(struct pcpu_lstats);
151         if (!dp_dev->lstats)
152                 return -ENOMEM;
153
154         return 0;
155 }
156
157 static void dp_dev_free(struct net_device *netdev)
158 {
159         struct dp_dev *dp_dev = dp_dev_priv(netdev);
160
161         free_percpu(dp_dev->lstats);
162         free_netdev(netdev);
163 }
164
165 static int dp_dev_do_ioctl(struct net_device *dev, struct ifreq *ifr, int cmd)
166 {
167         if (dp_ioctl_hook)
168                 return dp_ioctl_hook(dev, ifr, cmd);
169         return -EOPNOTSUPP;
170 }
171
172 #ifdef HAVE_NET_DEVICE_OPS
173 static const struct net_device_ops dp_dev_netdev_ops = {
174         .ndo_init = dp_dev_init,
175         .ndo_open = dp_dev_open,
176         .ndo_stop = dp_dev_stop,
177         .ndo_start_xmit = dp_dev_xmit,
178         .ndo_set_mac_address = dp_dev_mac_addr,
179         .ndo_do_ioctl = dp_dev_do_ioctl,
180         .ndo_change_mtu = dp_dev_change_mtu,
181         .ndo_get_stats = dp_dev_get_stats,
182 };
183 #endif
184
185 static void
186 do_setup(struct net_device *netdev)
187 {
188         ether_setup(netdev);
189
190 #ifdef HAVE_NET_DEVICE_OPS
191         netdev->netdev_ops = &dp_dev_netdev_ops;
192 #else
193         netdev->do_ioctl = dp_dev_do_ioctl;
194         netdev->get_stats = dp_dev_get_stats;
195         netdev->hard_start_xmit = dp_dev_xmit;
196         netdev->open = dp_dev_open;
197         netdev->stop = dp_dev_stop;
198         netdev->set_mac_address = dp_dev_mac_addr;
199         netdev->change_mtu = dp_dev_change_mtu;
200         netdev->init = dp_dev_init;
201 #endif
202
203         netdev->destructor = dp_dev_free;
204         SET_ETHTOOL_OPS(netdev, &dp_ethtool_ops);
205         netdev->tx_queue_len = 0;
206
207         netdev->flags = IFF_BROADCAST | IFF_MULTICAST;
208         netdev->features = NETIF_F_LLTX; /* XXX other features? */
209
210         random_ether_addr(netdev->dev_addr);
211
212         /* Set the OUI to the Nicira one. */
213         netdev->dev_addr[0] = 0x00;
214         netdev->dev_addr[1] = 0x23;
215         netdev->dev_addr[2] = 0x20;
216
217         /* Set the top bit to indicate random Nicira address. */
218         netdev->dev_addr[3] |= 0x80;
219 }
220
221 /* Create a datapath device associated with 'dp'.  If 'dp_name' is null,
222  * the device name will be of the form 'of<dp_idx>'.  Returns the new device or
223  * an error code.
224  *
225  * Called with RTNL lock and dp_mutex. */
226 struct net_device *dp_dev_create(struct datapath *dp, const char *dp_name, int port_no)
227 {
228         struct dp_dev *dp_dev;
229         struct net_device *netdev;
230         char dev_name[IFNAMSIZ];
231         int err;
232
233         if (dp_name) {
234                 if (strlen(dp_name) >= IFNAMSIZ)
235                         return ERR_PTR(-EINVAL);
236                 strncpy(dev_name, dp_name, sizeof(dev_name));
237         } else
238                 snprintf(dev_name, sizeof dev_name, "of%d", dp->dp_idx);
239
240         netdev = alloc_netdev(sizeof(struct dp_dev), dev_name, do_setup);
241         if (!netdev)
242                 return ERR_PTR(-ENOMEM);
243
244         dp_dev = dp_dev_priv(netdev);
245         dp_dev->dp = dp;
246         dp_dev->port_no = port_no;
247         dp_dev->dev = netdev;
248
249         err = register_netdevice(netdev);
250         if (err) {
251                 free_netdev(netdev);
252                 return ERR_PTR(err);
253         }
254
255         return netdev;
256 }
257
258 /* Called with RTNL lock and dp_mutex.*/
259 void dp_dev_destroy(struct net_device *netdev)
260 {
261         unregister_netdevice(netdev);
262 }
263
264 int is_dp_dev(struct net_device *netdev) 
265 {
266 #ifdef HAVE_NET_DEVICE_OPS
267         return netdev->netdev_ops == &dp_dev_netdev_ops;
268 #else
269         return netdev->open == dp_dev_open;
270 #endif
271 }