mac-learning: Reference count 'struct mac_learning".
[sliver-openvswitch.git] / lib / mac-learning.c
1 /*
2  * Copyright (c) 2008, 2009, 2010, 2011, 2012 Nicira, Inc.
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at:
7  *
8  *     http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #include <config.h>
18 #include "mac-learning.h"
19
20 #include <inttypes.h>
21 #include <stdlib.h>
22
23 #include "bitmap.h"
24 #include "coverage.h"
25 #include "hash.h"
26 #include "list.h"
27 #include "poll-loop.h"
28 #include "tag.h"
29 #include "timeval.h"
30 #include "unaligned.h"
31 #include "util.h"
32 #include "vlan-bitmap.h"
33 #include "vlog.h"
34
35 VLOG_DEFINE_THIS_MODULE(mac_learning);
36
37 COVERAGE_DEFINE(mac_learning_learned);
38 COVERAGE_DEFINE(mac_learning_expired);
39
40 /* Returns the number of seconds since 'e' (within 'ml') was last learned. */
41 int
42 mac_entry_age(const struct mac_learning *ml, const struct mac_entry *e)
43 {
44     time_t remaining = e->expires - time_now();
45     return ml->idle_time - remaining;
46 }
47
48 static uint32_t
49 mac_table_hash(const struct mac_learning *ml, const uint8_t mac[ETH_ADDR_LEN],
50                uint16_t vlan)
51 {
52     unsigned int mac1 = get_unaligned_u32((uint32_t *) mac);
53     unsigned int mac2 = get_unaligned_u16((uint16_t *) (mac + 4));
54     return hash_3words(mac1, mac2 | (vlan << 16), ml->secret);
55 }
56
57 static struct mac_entry *
58 mac_entry_from_lru_node(struct list *list)
59 {
60     return CONTAINER_OF(list, struct mac_entry, lru_node);
61 }
62
63 /* Returns a tag that represents that 'mac' is on an unknown port in 'vlan'.
64  * (When we learn where 'mac' is in 'vlan', this allows flows that were
65  * flooded to be revalidated.) */
66 static tag_type
67 make_unknown_mac_tag(const struct mac_learning *ml,
68                      const uint8_t mac[ETH_ADDR_LEN], uint16_t vlan)
69 {
70     return tag_create_deterministic(mac_table_hash(ml, mac, vlan));
71 }
72
73 static struct mac_entry *
74 mac_entry_lookup(const struct mac_learning *ml,
75                  const uint8_t mac[ETH_ADDR_LEN], uint16_t vlan)
76 {
77     struct mac_entry *e;
78
79     HMAP_FOR_EACH_WITH_HASH (e, hmap_node, mac_table_hash(ml, mac, vlan),
80                              &ml->table) {
81         if (e->vlan == vlan && eth_addr_equals(e->mac, mac)) {
82             return e;
83         }
84     }
85     return NULL;
86 }
87
88 /* If the LRU list is not empty, stores the least-recently-used entry in '*e'
89  * and returns true.  Otherwise, if the LRU list is empty, stores NULL in '*e'
90  * and return false. */
91 static bool
92 get_lru(struct mac_learning *ml, struct mac_entry **e)
93 {
94     if (!list_is_empty(&ml->lrus)) {
95         *e = mac_entry_from_lru_node(ml->lrus.next);
96         return true;
97     } else {
98         *e = NULL;
99         return false;
100     }
101 }
102
103 static unsigned int
104 normalize_idle_time(unsigned int idle_time)
105 {
106     return (idle_time < 15 ? 15
107             : idle_time > 3600 ? 3600
108             : idle_time);
109 }
110
111 /* Creates and returns a new MAC learning table with an initial MAC aging
112  * timeout of 'idle_time' seconds and an initial maximum of MAC_DEFAULT_MAX
113  * entries. */
114 struct mac_learning *
115 mac_learning_create(unsigned int idle_time)
116 {
117     struct mac_learning *ml;
118
119     ml = xmalloc(sizeof *ml);
120     list_init(&ml->lrus);
121     hmap_init(&ml->table);
122     ml->secret = random_uint32();
123     ml->flood_vlans = NULL;
124     ml->idle_time = normalize_idle_time(idle_time);
125     ml->max_entries = MAC_DEFAULT_MAX;
126     tag_set_init(&ml->tags);
127     ml->ref_cnt = 1;
128     return ml;
129 }
130
131 struct mac_learning *
132 mac_learning_ref(const struct mac_learning *ml_)
133 {
134     struct mac_learning *ml = CONST_CAST(struct mac_learning *, ml_);
135     if (ml) {
136         ovs_assert(ml->ref_cnt > 0);
137         ml->ref_cnt++;
138     }
139     return ml;
140 }
141
142 /* Unreferences (and possibly destroys) MAC learning table 'ml'. */
143 void
144 mac_learning_unref(struct mac_learning *ml)
145 {
146     if (!ml) {
147         return;
148     }
149
150     ovs_assert(ml->ref_cnt > 0);
151     if (!--ml->ref_cnt) {
152         struct mac_entry *e, *next;
153
154         HMAP_FOR_EACH_SAFE (e, next, hmap_node, &ml->table) {
155             hmap_remove(&ml->table, &e->hmap_node);
156             free(e);
157         }
158         hmap_destroy(&ml->table);
159
160         bitmap_free(ml->flood_vlans);
161         free(ml);
162     }
163 }
164
165 /* Provides a bitmap of VLANs which have learning disabled, that is, VLANs on
166  * which all packets are flooded.  Returns true if the set has changed from the
167  * previous value. */
168 bool
169 mac_learning_set_flood_vlans(struct mac_learning *ml,
170                              const unsigned long *bitmap)
171 {
172     if (vlan_bitmap_equal(ml->flood_vlans, bitmap)) {
173         return false;
174     } else {
175         bitmap_free(ml->flood_vlans);
176         ml->flood_vlans = vlan_bitmap_clone(bitmap);
177         return true;
178     }
179 }
180
181 /* Changes the MAC aging timeout of 'ml' to 'idle_time' seconds. */
182 void
183 mac_learning_set_idle_time(struct mac_learning *ml, unsigned int idle_time)
184 {
185     idle_time = normalize_idle_time(idle_time);
186     if (idle_time != ml->idle_time) {
187         struct mac_entry *e;
188         int delta;
189
190         delta = (int) idle_time - (int) ml->idle_time;
191         LIST_FOR_EACH (e, lru_node, &ml->lrus) {
192             e->expires += delta;
193         }
194         ml->idle_time = idle_time;
195     }
196 }
197
198 /* Sets the maximum number of entries in 'ml' to 'max_entries', adjusting it
199  * to be within a reasonable range. */
200 void
201 mac_learning_set_max_entries(struct mac_learning *ml, size_t max_entries)
202 {
203     ml->max_entries = (max_entries < 10 ? 10
204                        : max_entries > 1000 * 1000 ? 1000 * 1000
205                        : max_entries);
206 }
207
208 static bool
209 is_learning_vlan(const struct mac_learning *ml, uint16_t vlan)
210 {
211     return !ml->flood_vlans || !bitmap_is_set(ml->flood_vlans, vlan);
212 }
213
214 /* Returns true if 'src_mac' may be learned on 'vlan' for 'ml'.
215  * Returns false if 'ml' is NULL, if src_mac is not valid for learning, or if
216  * 'vlan' is configured on 'ml' to flood all packets. */
217 bool
218 mac_learning_may_learn(const struct mac_learning *ml,
219                        const uint8_t src_mac[ETH_ADDR_LEN], uint16_t vlan)
220 {
221     return ml && is_learning_vlan(ml, vlan) && !eth_addr_is_multicast(src_mac);
222 }
223
224 /* Searches 'ml' for and returns a MAC learning entry for 'src_mac' in 'vlan',
225  * inserting a new entry if necessary.  The caller must have already verified,
226  * by calling mac_learning_may_learn(), that 'src_mac' and 'vlan' are
227  * learnable.
228  *
229  * If the returned MAC entry is new (as may be determined by calling
230  * mac_entry_is_new()), then the caller must pass the new entry to
231  * mac_learning_changed().  The caller must also initialize the new entry's
232  * 'port' member.  Otherwise calling those functions is at the caller's
233  * discretion. */
234 struct mac_entry *
235 mac_learning_insert(struct mac_learning *ml,
236                     const uint8_t src_mac[ETH_ADDR_LEN], uint16_t vlan)
237 {
238     struct mac_entry *e;
239
240     e = mac_entry_lookup(ml, src_mac, vlan);
241     if (!e) {
242         uint32_t hash = mac_table_hash(ml, src_mac, vlan);
243
244         if (hmap_count(&ml->table) >= ml->max_entries) {
245             get_lru(ml, &e);
246             mac_learning_expire(ml, e);
247         }
248
249         e = xmalloc(sizeof *e);
250         hmap_insert(&ml->table, &e->hmap_node, hash);
251         memcpy(e->mac, src_mac, ETH_ADDR_LEN);
252         e->vlan = vlan;
253         e->tag = 0;
254         e->grat_arp_lock = TIME_MIN;
255     } else {
256         list_remove(&e->lru_node);
257     }
258
259     /* Mark 'e' as recently used. */
260     list_push_back(&ml->lrus, &e->lru_node);
261     e->expires = time_now() + ml->idle_time;
262
263     return e;
264 }
265
266 /* Changes 'e''s tag to a new, randomly selected one.  Causes
267  * mac_learning_run() to flag for revalidation the tag that would have been
268  * previously used for this entry's MAC and VLAN (either before 'e' was
269  * inserted, if it is new, or otherwise before its port was updated.)
270  *
271  * The client should call this function after obtaining a MAC learning entry
272  * from mac_learning_insert(), if the entry is either new or if its learned
273  * port has changed. */
274 void
275 mac_learning_changed(struct mac_learning *ml, struct mac_entry *e)
276 {
277     tag_type tag = e->tag ? e->tag : make_unknown_mac_tag(ml, e->mac, e->vlan);
278
279     COVERAGE_INC(mac_learning_learned);
280
281     e->tag = tag_create_random();
282     tag_set_add(&ml->tags, tag);
283 }
284
285 /* Looks up MAC 'dst' for VLAN 'vlan' in 'ml' and returns the associated MAC
286  * learning entry, if any.  If 'tag' is nonnull, then the tag that associates
287  * 'dst' and 'vlan' with its currently learned port will be OR'd into
288  * '*tag'. */
289 struct mac_entry *
290 mac_learning_lookup(const struct mac_learning *ml,
291                     const uint8_t dst[ETH_ADDR_LEN], uint16_t vlan,
292                     tag_type *tag)
293 {
294     if (eth_addr_is_multicast(dst)) {
295         /* No tag because the treatment of multicast destinations never
296          * changes. */
297         return NULL;
298     } else if (!is_learning_vlan(ml, vlan)) {
299         /* We don't tag this property.  The set of learning VLANs changes so
300          * rarely that we revalidate every flow when it changes. */
301         return NULL;
302     } else {
303         struct mac_entry *e = mac_entry_lookup(ml, dst, vlan);
304
305         ovs_assert(e == NULL || e->tag != 0);
306         if (tag) {
307             /* Tag either the learned port or the lack thereof. */
308             *tag |= e ? e->tag : make_unknown_mac_tag(ml, dst, vlan);
309         }
310         return e;
311     }
312 }
313
314 /* Expires 'e' from the 'ml' hash table. */
315 void
316 mac_learning_expire(struct mac_learning *ml, struct mac_entry *e)
317 {
318     hmap_remove(&ml->table, &e->hmap_node);
319     list_remove(&e->lru_node);
320     free(e);
321 }
322
323 /* Expires all the mac-learning entries in 'ml'.  If not NULL, the tags in 'ml'
324  * are added to 'tags'.  Otherwise the tags in 'ml' are discarded.  The client
325  * is responsible for revalidating any flows that depend on 'ml', if
326  * necessary. */
327 void
328 mac_learning_flush(struct mac_learning *ml, struct tag_set *tags)
329 {
330     struct mac_entry *e;
331     while (get_lru(ml, &e)){
332         if (tags) {
333             tag_set_add(tags, e->tag);
334         }
335         mac_learning_expire(ml, e);
336     }
337     hmap_shrink(&ml->table);
338 }
339
340 void
341 mac_learning_run(struct mac_learning *ml, struct tag_set *set)
342 {
343     struct mac_entry *e;
344
345     if (set) {
346         tag_set_union(set, &ml->tags);
347     }
348     tag_set_init(&ml->tags);
349
350     while (get_lru(ml, &e)
351            && (hmap_count(&ml->table) > ml->max_entries
352                || time_now() >= e->expires)) {
353         COVERAGE_INC(mac_learning_expired);
354         if (set) {
355             tag_set_add(set, e->tag);
356         }
357         mac_learning_expire(ml, e);
358     }
359 }
360
361 void
362 mac_learning_wait(struct mac_learning *ml)
363 {
364     if (hmap_count(&ml->table) > ml->max_entries
365         || !tag_set_is_empty(&ml->tags)) {
366         poll_immediate_wake();
367     } else if (!list_is_empty(&ml->lrus)) {
368         struct mac_entry *e = mac_entry_from_lru_node(ml->lrus.next);
369         poll_timer_wait_until(e->expires * 1000LL);
370     }
371 }