vserver 2.0 rc7
[linux-2.6.git] / include / net / route.h
1 /*
2  * INET         An implementation of the TCP/IP protocol suite for the LINUX
3  *              operating system.  INET  is implemented using the  BSD Socket
4  *              interface as the means of communication with the user level.
5  *
6  *              Definitions for the IP router.
7  *
8  * Version:     @(#)route.h     1.0.4   05/27/93
9  *
10  * Authors:     Ross Biro
11  *              Fred N. van Kempen, <waltje@uWalt.NL.Mugnet.ORG>
12  * Fixes:
13  *              Alan Cox        :       Reformatted. Added ip_rt_local()
14  *              Alan Cox        :       Support for TCP parameters.
15  *              Alexey Kuznetsov:       Major changes for new routing code.
16  *              Mike McLagan    :       Routing by source
17  *              Robert Olsson   :       Added rt_cache statistics
18  *
19  *              This program is free software; you can redistribute it and/or
20  *              modify it under the terms of the GNU General Public License
21  *              as published by the Free Software Foundation; either version
22  *              2 of the License, or (at your option) any later version.
23  */
24 #ifndef _ROUTE_H
25 #define _ROUTE_H
26
27 #include <linux/config.h>
28 #include <net/dst.h>
29 #include <net/inetpeer.h>
30 #include <net/flow.h>
31 #include <linux/in_route.h>
32 #include <linux/rtnetlink.h>
33 #include <linux/route.h>
34 #include <linux/ip.h>
35 #include <linux/cache.h>
36 #include <linux/vs_network.h>
37
38 #ifndef __KERNEL__
39 #warning This file is not supposed to be used outside of kernel.
40 #endif
41
42 #define RTO_ONLINK      0x01
43
44 #define RTO_CONN        0
45 /* RTO_CONN is not used (being alias for 0), but preserved not to break
46  * some modules referring to it. */
47
48 #define RT_CONN_FLAGS(sk)   (RT_TOS(inet_sk(sk)->tos) | sock_flag(sk, SOCK_LOCALROUTE))
49
50 struct fib_nh;
51 struct inet_peer;
52 struct rtable
53 {
54         union
55         {
56                 struct dst_entry        dst;
57                 struct rtable           *rt_next;
58         } u;
59
60         struct in_device        *idev;
61         
62         unsigned                rt_flags;
63         __u16                   rt_type;
64         __u16                   rt_multipath_alg;
65
66         __u32                   rt_dst; /* Path destination     */
67         __u32                   rt_src; /* Path source          */
68         int                     rt_iif;
69
70         /* Info on neighbour */
71         __u32                   rt_gateway;
72
73         /* Cache lookup keys */
74         struct flowi            fl;
75
76         /* Miscellaneous cached information */
77         __u32                   rt_spec_dst; /* RFC1122 specific destination */
78         struct inet_peer        *peer; /* long-living peer info */
79 };
80
81 struct ip_rt_acct
82 {
83         __u32   o_bytes;
84         __u32   o_packets;
85         __u32   i_bytes;
86         __u32   i_packets;
87 };
88
89 struct rt_cache_stat 
90 {
91         unsigned int in_hit;
92         unsigned int in_slow_tot;
93         unsigned int in_slow_mc;
94         unsigned int in_no_route;
95         unsigned int in_brd;
96         unsigned int in_martian_dst;
97         unsigned int in_martian_src;
98         unsigned int out_hit;
99         unsigned int out_slow_tot;
100         unsigned int out_slow_mc;
101         unsigned int gc_total;
102         unsigned int gc_ignored;
103         unsigned int gc_goal_miss;
104         unsigned int gc_dst_overflow;
105         unsigned int in_hlist_search;
106         unsigned int out_hlist_search;
107 };
108
109 extern struct rt_cache_stat *rt_cache_stat;
110 #define RT_CACHE_STAT_INC(field)                                          \
111                 (per_cpu_ptr(rt_cache_stat, _smp_processor_id())->field++)
112
113 extern struct ip_rt_acct *ip_rt_acct;
114
115 struct in_device;
116 extern int              ip_rt_init(void);
117 extern void             ip_rt_redirect(u32 old_gw, u32 dst, u32 new_gw,
118                                        u32 src, u8 tos, struct net_device *dev);
119 extern void             ip_rt_advice(struct rtable **rp, int advice);
120 extern void             rt_cache_flush(int how);
121 extern int              __ip_route_output_key(struct rtable **, const struct flowi *flp);
122 extern int              ip_route_output_key(struct rtable **, struct flowi *flp);
123 extern int              ip_route_output_flow(struct rtable **rp, struct flowi *flp, struct sock *sk, int flags);
124 extern int              ip_route_input(struct sk_buff*, u32 dst, u32 src, u8 tos, struct net_device *devin);
125 extern unsigned short   ip_rt_frag_needed(struct iphdr *iph, unsigned short new_mtu);
126 extern void             ip_rt_send_redirect(struct sk_buff *skb);
127
128 extern unsigned         inet_addr_type(u32 addr);
129 extern void             ip_rt_multicast_event(struct in_device *);
130 extern int              ip_rt_ioctl(unsigned int cmd, void __user *arg);
131 extern void             ip_rt_get_source(u8 *src, struct rtable *rt);
132 extern int              ip_rt_dump(struct sk_buff *skb,  struct netlink_callback *cb);
133
134 static inline void ip_rt_put(struct rtable * rt)
135 {
136         if (rt)
137                 dst_release(&rt->u.dst);
138 }
139
140 #define IPTOS_RT_MASK   (IPTOS_TOS_MASK & ~3)
141
142 extern __u8 ip_tos2prio[16];
143
144 static inline char rt_tos2priority(u8 tos)
145 {
146         return ip_tos2prio[IPTOS_TOS(tos)>>1];
147 }
148
149 #define IPI_LOOPBACK    0x0100007f
150
151 static inline int ip_find_src(struct nx_info *nxi, struct rtable **rp, struct flowi *fl)
152 {
153         int err;
154         int i, n = nxi->nbipv4;
155         u32 ipv4root = nxi->ipv4[0];
156
157         if (ipv4root == 0)
158                 return 0;
159
160         if (fl->fl4_src == 0) {
161                 if (n > 1) {
162                         u32 foundsrc;
163
164                         err = __ip_route_output_key(rp, fl);
165                         if (err) {
166                                 fl->fl4_src = ipv4root;
167                                 err = __ip_route_output_key(rp, fl);
168                         }
169                         if (err)
170                                 return err;
171
172                         foundsrc = (*rp)->rt_src;
173                         ip_rt_put(*rp);
174
175                         for (i=0; i<n; i++){
176                                 u32 mask = nxi->mask[i];
177                                 u32 ipv4 = nxi->ipv4[i];
178                                 u32 net4 = ipv4 & mask;
179
180                                 if (foundsrc == ipv4) {
181                                         fl->fl4_src = ipv4;
182                                         break;
183                                 }
184                                 if (!fl->fl4_src && (foundsrc & mask) == net4)
185                                         fl->fl4_src = ipv4;
186                         }
187                 }
188                 if (fl->fl4_src == 0)
189                         fl->fl4_src = (fl->fl4_dst == IPI_LOOPBACK)
190                                 ? IPI_LOOPBACK : ipv4root;
191         } else {
192                 for (i=0; i<n; i++) {
193                         if (nxi->ipv4[i] == fl->fl4_src)
194                                 break;
195                 }
196                 if (i == n)
197                         return -EPERM;
198         }
199         return 0;
200 }
201
202 static inline int ip_route_connect(struct rtable **rp, u32 dst,
203                                    u32 src, u32 tos, int oif, u8 protocol,
204                                    u16 sport, u16 dport, struct sock *sk)
205 {
206         struct flowi fl = { .oif = oif,
207                             .nl_u = { .ip4_u = { .daddr = dst,
208                                                  .saddr = src,
209                                                  .tos   = tos } },
210                             .proto = protocol,
211                             .uli_u = { .ports =
212                                        { .sport = sport,
213                                          .dport = dport } } };
214
215         int err;
216         struct nx_info *nx_info = current->nx_info;
217
218         if (sk)
219                 nx_info = sk->sk_nx_info;
220         vxdprintk(VXD_CBIT(net, 4),
221                 "ip_route_connect(%p) %p,%p;%lx",
222                 sk, nx_info, sk->sk_socket,
223                 (sk->sk_socket?sk->sk_socket->flags:0));
224
225         if (nx_info) {
226                 err = ip_find_src(nx_info, rp, &fl);
227                 if (err)
228                         return err;
229                 if (fl.fl4_dst == IPI_LOOPBACK && !vx_check(0, VX_ADMIN))
230                         fl.fl4_dst = nx_info->ipv4[0];
231         }
232         if (!fl.fl4_dst || !fl.fl4_src) {
233                 err = __ip_route_output_key(rp, &fl);
234                 if (err)
235                         return err;
236                 fl.fl4_dst = (*rp)->rt_dst;
237                 fl.fl4_src = (*rp)->rt_src;
238                 ip_rt_put(*rp);
239                 *rp = NULL;
240         }
241         return ip_route_output_flow(rp, &fl, sk, 0);
242 }
243
244 static inline int ip_route_newports(struct rtable **rp, u16 sport, u16 dport,
245                                     struct sock *sk)
246 {
247         if (sport != (*rp)->fl.fl_ip_sport ||
248             dport != (*rp)->fl.fl_ip_dport) {
249                 struct flowi fl;
250
251                 memcpy(&fl, &(*rp)->fl, sizeof(fl));
252                 fl.fl_ip_sport = sport;
253                 fl.fl_ip_dport = dport;
254                 ip_rt_put(*rp);
255                 *rp = NULL;
256                 return ip_route_output_flow(rp, &fl, sk, 0);
257         }
258         return 0;
259 }
260
261 extern void rt_bind_peer(struct rtable *rt, int create);
262
263 static inline struct inet_peer *rt_get_peer(struct rtable *rt)
264 {
265         if (rt->peer)
266                 return rt->peer;
267
268         rt_bind_peer(rt, 0);
269         return rt->peer;
270 }
271
272 #endif  /* _ROUTE_H */