vserver 2.0-pre4
[linux-2.6.git] / include / net / route.h
1 /*
2  * INET         An implementation of the TCP/IP protocol suite for the LINUX
3  *              operating system.  INET  is implemented using the  BSD Socket
4  *              interface as the means of communication with the user level.
5  *
6  *              Definitions for the IP router.
7  *
8  * Version:     @(#)route.h     1.0.4   05/27/93
9  *
10  * Authors:     Ross Biro, <bir7@leland.Stanford.Edu>
11  *              Fred N. van Kempen, <waltje@uWalt.NL.Mugnet.ORG>
12  * Fixes:
13  *              Alan Cox        :       Reformatted. Added ip_rt_local()
14  *              Alan Cox        :       Support for TCP parameters.
15  *              Alexey Kuznetsov:       Major changes for new routing code.
16  *              Mike McLagan    :       Routing by source
17  *              Robert Olsson   :       Added rt_cache statistics
18  *
19  *              This program is free software; you can redistribute it and/or
20  *              modify it under the terms of the GNU General Public License
21  *              as published by the Free Software Foundation; either version
22  *              2 of the License, or (at your option) any later version.
23  */
24 #ifndef _ROUTE_H
25 #define _ROUTE_H
26
27 #include <linux/config.h>
28 #include <net/dst.h>
29 #include <net/inetpeer.h>
30 #include <net/flow.h>
31 #include <linux/in_route.h>
32 #include <linux/rtnetlink.h>
33 #include <linux/route.h>
34 #include <linux/ip.h>
35 #include <linux/cache.h>
36 #include <linux/vs_network.h>
37
38 #ifndef __KERNEL__
39 #warning This file is not supposed to be used outside of kernel.
40 #endif
41
42 #define RTO_ONLINK      0x01
43
44 #define RTO_CONN        0
45 /* RTO_CONN is not used (being alias for 0), but preserved not to break
46  * some modules referring to it. */
47
48 #define RT_CONN_FLAGS(sk)   (RT_TOS(inet_sk(sk)->tos) | sk->sk_localroute)
49
50 struct inet_peer;
51 struct rtable
52 {
53         union
54         {
55                 struct dst_entry        dst;
56                 struct rtable           *rt_next;
57         } u;
58
59         struct in_device        *idev;
60         
61         unsigned                rt_flags;
62         unsigned                rt_type;
63
64         __u32                   rt_dst; /* Path destination     */
65         __u32                   rt_src; /* Path source          */
66         int                     rt_iif;
67
68         /* Info on neighbour */
69         __u32                   rt_gateway;
70
71         /* Cache lookup keys */
72         struct flowi            fl;
73
74         /* Miscellaneous cached information */
75         __u32                   rt_spec_dst; /* RFC1122 specific destination */
76         struct inet_peer        *peer; /* long-living peer info */
77 };
78
79 struct ip_rt_acct
80 {
81         __u32   o_bytes;
82         __u32   o_packets;
83         __u32   i_bytes;
84         __u32   i_packets;
85 };
86
87 struct rt_cache_stat 
88 {
89         unsigned int in_hit;
90         unsigned int in_slow_tot;
91         unsigned int in_slow_mc;
92         unsigned int in_no_route;
93         unsigned int in_brd;
94         unsigned int in_martian_dst;
95         unsigned int in_martian_src;
96         unsigned int out_hit;
97         unsigned int out_slow_tot;
98         unsigned int out_slow_mc;
99         unsigned int gc_total;
100         unsigned int gc_ignored;
101         unsigned int gc_goal_miss;
102         unsigned int gc_dst_overflow;
103         unsigned int in_hlist_search;
104         unsigned int out_hlist_search;
105 };
106
107 extern struct rt_cache_stat *rt_cache_stat;
108 #define RT_CACHE_STAT_INC(field)                                          \
109                 (per_cpu_ptr(rt_cache_stat, _smp_processor_id())->field++)
110
111 extern struct ip_rt_acct *ip_rt_acct;
112
113 struct in_device;
114 extern int              ip_rt_init(void);
115 extern void             ip_rt_redirect(u32 old_gw, u32 dst, u32 new_gw,
116                                        u32 src, u8 tos, struct net_device *dev);
117 extern void             ip_rt_advice(struct rtable **rp, int advice);
118 extern void             rt_cache_flush(int how);
119 extern int              __ip_route_output_key(struct rtable **, const struct flowi *flp);
120 extern int              ip_route_output_key(struct rtable **, struct flowi *flp);
121 extern int              ip_route_output_flow(struct rtable **rp, struct flowi *flp, struct sock *sk, int flags);
122 extern int              ip_route_input(struct sk_buff*, u32 dst, u32 src, u8 tos, struct net_device *devin);
123 extern unsigned short   ip_rt_frag_needed(struct iphdr *iph, unsigned short new_mtu);
124 extern void             ip_rt_send_redirect(struct sk_buff *skb);
125
126 extern unsigned         inet_addr_type(u32 addr);
127 extern void             ip_rt_multicast_event(struct in_device *);
128 extern int              ip_rt_ioctl(unsigned int cmd, void __user *arg);
129 extern void             ip_rt_get_source(u8 *src, struct rtable *rt);
130 extern int              ip_rt_dump(struct sk_buff *skb,  struct netlink_callback *cb);
131
132 static inline void ip_rt_put(struct rtable * rt)
133 {
134         if (rt)
135                 dst_release(&rt->u.dst);
136 }
137
138 #define IPTOS_RT_MASK   (IPTOS_TOS_MASK & ~3)
139
140 extern __u8 ip_tos2prio[16];
141
142 static inline char rt_tos2priority(u8 tos)
143 {
144         return ip_tos2prio[IPTOS_TOS(tos)>>1];
145 }
146
147 #define IPI_LOOPBACK    0x0100007f
148
149 static inline int ip_find_src(struct nx_info *nxi, struct rtable **rp, struct flowi *fl)
150 {
151         int err;
152         int i, n = nxi->nbipv4;
153         u32 ipv4root = nxi->ipv4[0];
154
155         if (ipv4root == 0)
156                 return 0;
157
158         if (fl->fl4_src == 0) {
159                 if (n > 1) {
160                         u32 foundsrc;
161
162                         err = __ip_route_output_key(rp, fl);
163                         if (err) {
164                                 fl->fl4_src = ipv4root;
165                                 err = __ip_route_output_key(rp, fl);
166                         }
167                         if (err)
168                                 return err;
169
170                         foundsrc = (*rp)->rt_src;
171                         ip_rt_put(*rp);
172
173                         for (i=0; i<n; i++){
174                                 u32 mask = nxi->mask[i];
175                                 u32 ipv4 = nxi->ipv4[i];
176                                 u32 net4 = ipv4 & mask;
177
178                                 if (foundsrc == ipv4) {
179                                         fl->fl4_src = ipv4;
180                                         break;
181                                 }
182                                 if (!fl->fl4_src && (foundsrc & mask) == net4)
183                                         fl->fl4_src = ipv4;
184                         }
185                 }
186                 if (fl->fl4_src == 0)
187                         fl->fl4_src = (fl->fl4_dst == IPI_LOOPBACK)
188                                 ? IPI_LOOPBACK : ipv4root;
189         } else {
190                 for (i=0; i<n; i++) {
191                         if (nxi->ipv4[i] == fl->fl4_src)
192                                 break;
193                 }
194                 if (i == n)
195                         return -EPERM;
196         }
197         return 0;
198 }
199
200 static inline int ip_route_connect(struct rtable **rp, u32 dst,
201                                    u32 src, u32 tos, int oif, u8 protocol,
202                                    u16 sport, u16 dport, struct sock *sk)
203 {
204         struct flowi fl = { .oif = oif,
205                             .nl_u = { .ip4_u = { .daddr = dst,
206                                                  .saddr = src,
207                                                  .tos   = tos } },
208                             .proto = protocol,
209                             .uli_u = { .ports =
210                                        { .sport = sport,
211                                          .dport = dport } } };
212
213         int err;
214         struct nx_info *nx_info = current->nx_info;
215
216         if (sk)
217                 nx_info = sk->sk_nx_info;
218         vxdprintk(VXD_CBIT(net, 4),
219                 "ip_route_connect(%p) %p,%p;%lx",
220                 sk, nx_info, sk->sk_socket,
221                 (sk->sk_socket?sk->sk_socket->flags:0));
222
223         if (nx_info) {
224                 err = ip_find_src(nx_info, rp, &fl);
225                 if (err)
226                         return err;
227                 if (fl.fl4_dst == IPI_LOOPBACK && !vx_check(0, VX_ADMIN))
228                         fl.fl4_dst = nx_info->ipv4[0];
229         }
230         if (!fl.fl4_dst || !fl.fl4_src) {
231                 err = __ip_route_output_key(rp, &fl);
232                 if (err)
233                         return err;
234                 fl.fl4_dst = (*rp)->rt_dst;
235                 fl.fl4_src = (*rp)->rt_src;
236                 ip_rt_put(*rp);
237                 *rp = NULL;
238         }
239         return ip_route_output_flow(rp, &fl, sk, 0);
240 }
241
242 static inline int ip_route_newports(struct rtable **rp, u16 sport, u16 dport,
243                                     struct sock *sk)
244 {
245         if (sport != (*rp)->fl.fl_ip_sport ||
246             dport != (*rp)->fl.fl_ip_dport) {
247                 struct flowi fl;
248
249                 memcpy(&fl, &(*rp)->fl, sizeof(fl));
250                 fl.fl_ip_sport = sport;
251                 fl.fl_ip_dport = dport;
252                 ip_rt_put(*rp);
253                 *rp = NULL;
254                 return ip_route_output_flow(rp, &fl, sk, 0);
255         }
256         return 0;
257 }
258
259 extern void rt_bind_peer(struct rtable *rt, int create);
260
261 static inline struct inet_peer *rt_get_peer(struct rtable *rt)
262 {
263         if (rt->peer)
264                 return rt->peer;
265
266         rt_bind_peer(rt, 0);
267         return rt->peer;
268 }
269
270 #endif  /* _ROUTE_H */