1f1eb94a21b6b847df711f7c58980af5a20fb45b
[linux-2.6.git] / net / ipv6 / udp.c
1 /*
2  *      UDP over IPv6
3  *      Linux INET6 implementation 
4  *
5  *      Authors:
6  *      Pedro Roque             <roque@di.fc.ul.pt>     
7  *
8  *      Based on linux/ipv4/udp.c
9  *
10  *      $Id: udp.c,v 1.65 2002/02/01 22:01:04 davem Exp $
11  *
12  *      Fixes:
13  *      Hideaki YOSHIFUJI       :       sin6_scope_id support
14  *      YOSHIFUJI Hideaki @USAGI and:   Support IPV6_V6ONLY socket option, which
15  *      Alexey Kuznetsov                allow both IPv4 and IPv6 sockets to bind
16  *                                      a single port at the same time.
17  *      Kazunori MIYAZAWA @USAGI:       change process style to use ip6_append_data
18  *      YOSHIFUJI Hideaki @USAGI:       convert /proc/net/udp6 to seq_file.
19  *
20  *      This program is free software; you can redistribute it and/or
21  *      modify it under the terms of the GNU General Public License
22  *      as published by the Free Software Foundation; either version
23  *      2 of the License, or (at your option) any later version.
24  */
25
26 #include <linux/errno.h>
27 #include <linux/types.h>
28 #include <linux/socket.h>
29 #include <linux/sockios.h>
30 #include <linux/sched.h>
31 #include <linux/net.h>
32 #include <linux/in6.h>
33 #include <linux/netdevice.h>
34 #include <linux/if_arp.h>
35 #include <linux/ipv6.h>
36 #include <linux/icmpv6.h>
37 #include <linux/init.h>
38 #include <linux/skbuff.h>
39 #include <asm/uaccess.h>
40
41 #include <net/ndisc.h>
42 #include <net/protocol.h>
43 #include <net/transp_v6.h>
44 #include <net/ip6_route.h>
45 #include <net/raw.h>
46 #include <net/tcp_states.h>
47 #include <net/ip6_checksum.h>
48 #include <net/xfrm.h>
49
50 #include <linux/proc_fs.h>
51 #include <linux/seq_file.h>
52 #include "udp_impl.h"
53
54 DEFINE_SNMP_STAT(struct udp_mib, udp_stats_in6) __read_mostly;
55
56 static inline int udp_v6_get_port(struct sock *sk, unsigned short snum)
57 {
58         return udp_get_port(sk, snum, ipv6_rcv_saddr_equal);
59 }
60
61 static inline int udp_v6_in_list(struct nx_info *nx_info, struct in6_addr *addr)
62 {
63         int n = nx_info->nbipv6;
64         int i;
65
66         for (i=0; i<n; i++)
67                 if (ipv6_addr_equal(&nx_info->ipv6[i], addr))
68                         return 1;
69         return 0;
70 }
71
72 static struct sock *__udp6_lib_lookup(struct in6_addr *saddr, __be16 sport,
73                                       struct in6_addr *daddr, __be16 dport,
74                                       int dif, struct hlist_head udptable[])
75 {
76         struct sock *sk, *result = NULL;
77         struct hlist_node *node;
78         unsigned short hnum = ntohs(dport);
79         int badness = -1;
80
81         read_lock(&udp_hash_lock);
82         sk_for_each(sk, node, &udptable[hnum & (UDP_HTABLE_SIZE - 1)]) {
83                 struct inet_sock *inet = inet_sk(sk);
84
85                 if (inet->num == hnum && sk->sk_family == PF_INET6) {
86                         struct ipv6_pinfo *np = inet6_sk(sk);
87                         int score = 0;
88                         if (inet->dport) {
89                                 if (inet->dport != sport)
90                                         continue;
91                                 score++;
92                         }
93                         if (!ipv6_addr_any(&np->rcv_saddr)) {
94                                 if (!ipv6_addr_equal(&np->rcv_saddr, daddr))
95                                         continue;
96                                 score++;
97                         } else if (sk->sk_nx_info) {
98                                 if (udp_v6_in_list(sk->sk_nx_info, daddr))
99                                         score++;
100                                 else
101                                         continue;
102                         }
103                         if (!ipv6_addr_any(&np->daddr)) {
104                                 if (!ipv6_addr_equal(&np->daddr, saddr))
105                                         continue;
106                                 score++;
107                         }
108                         if (sk->sk_bound_dev_if) {
109                                 if (sk->sk_bound_dev_if != dif)
110                                         continue;
111                                 score++;
112                         }
113                         if(score == 4) {
114                                 result = sk;
115                                 break;
116                         } else if(score > badness) {
117                                 result = sk;
118                                 badness = score;
119                         }
120                 }
121         }
122         if (result)
123                 sock_hold(result);
124         read_unlock(&udp_hash_lock);
125         return result;
126 }
127
128 /*
129  *      This should be easy, if there is something there we
130  *      return it, otherwise we block.
131  */
132
133 int udpv6_recvmsg(struct kiocb *iocb, struct sock *sk,
134                   struct msghdr *msg, size_t len,
135                   int noblock, int flags, int *addr_len)
136 {
137         struct ipv6_pinfo *np = inet6_sk(sk);
138         struct inet_sock *inet = inet_sk(sk);
139         struct sk_buff *skb;
140         size_t copied;
141         int err, copy_only, is_udplite = IS_UDPLITE(sk);
142
143         if (addr_len)
144                 *addr_len=sizeof(struct sockaddr_in6);
145   
146         if (flags & MSG_ERRQUEUE)
147                 return ipv6_recv_error(sk, msg, len);
148
149 try_again:
150         skb = skb_recv_datagram(sk, flags, noblock, &err);
151         if (!skb)
152                 goto out;
153
154         copied = skb->len - sizeof(struct udphdr);
155         if (copied > len) {
156                 copied = len;
157                 msg->msg_flags |= MSG_TRUNC;
158         }
159
160         /*
161          *      Decide whether to checksum and/or copy data.
162          */
163         copy_only = (skb->ip_summed==CHECKSUM_UNNECESSARY);
164
165         if (is_udplite  ||  (!copy_only  &&  msg->msg_flags&MSG_TRUNC)) {
166                 if (__udp_lib_checksum_complete(skb))
167                         goto csum_copy_err;
168                 copy_only = 1;
169         }
170
171         if (copy_only)
172                 err = skb_copy_datagram_iovec(skb, sizeof(struct udphdr),
173                                               msg->msg_iov, copied       );
174         else {
175                 err = skb_copy_and_csum_datagram_iovec(skb, sizeof(struct udphdr), msg->msg_iov);
176                 if (err == -EINVAL)
177                         goto csum_copy_err;
178         }
179         if (err)
180                 goto out_free;
181
182         sock_recv_timestamp(msg, sk, skb);
183
184         /* Copy the address. */
185         if (msg->msg_name) {
186                 struct sockaddr_in6 *sin6;
187           
188                 sin6 = (struct sockaddr_in6 *) msg->msg_name;
189                 sin6->sin6_family = AF_INET6;
190                 sin6->sin6_port = skb->h.uh->source;
191                 sin6->sin6_flowinfo = 0;
192                 sin6->sin6_scope_id = 0;
193
194                 if (skb->protocol == htons(ETH_P_IP))
195                         ipv6_addr_set(&sin6->sin6_addr, 0, 0,
196                                       htonl(0xffff), skb->nh.iph->saddr);
197                 else {
198                         ipv6_addr_copy(&sin6->sin6_addr, &skb->nh.ipv6h->saddr);
199                         if (ipv6_addr_type(&sin6->sin6_addr) & IPV6_ADDR_LINKLOCAL)
200                                 sin6->sin6_scope_id = IP6CB(skb)->iif;
201                 }
202
203         }
204         if (skb->protocol == htons(ETH_P_IP)) {
205                 if (inet->cmsg_flags)
206                         ip_cmsg_recv(msg, skb);
207         } else {
208                 if (np->rxopt.all)
209                         datagram_recv_ctl(sk, msg, skb);
210         }
211
212         err = copied;
213         if (flags & MSG_TRUNC)
214                 err = skb->len - sizeof(struct udphdr);
215
216 out_free:
217         skb_free_datagram(sk, skb);
218 out:
219         return err;
220
221 csum_copy_err:
222         skb_kill_datagram(sk, skb, flags);
223
224         if (flags & MSG_DONTWAIT) {
225                 UDP6_INC_STATS_USER(UDP_MIB_INERRORS, is_udplite);
226                 return -EAGAIN;
227         }
228         goto try_again;
229 }
230
231 void __udp6_lib_err(struct sk_buff *skb, struct inet6_skb_parm *opt,
232                     int type, int code, int offset, __be32 info,
233                     struct hlist_head udptable[]                    )
234 {
235         struct ipv6_pinfo *np;
236         struct ipv6hdr *hdr = (struct ipv6hdr*)skb->data;
237         struct in6_addr *saddr = &hdr->saddr;
238         struct in6_addr *daddr = &hdr->daddr;
239         struct udphdr *uh = (struct udphdr*)(skb->data+offset);
240         struct sock *sk;
241         int err;
242
243         sk = __udp6_lib_lookup(daddr, uh->dest,
244                                saddr, uh->source, inet6_iif(skb), udptable);
245         if (sk == NULL)
246                 return;
247
248         np = inet6_sk(sk);
249
250         if (!icmpv6_err_convert(type, code, &err) && !np->recverr)
251                 goto out;
252
253         if (sk->sk_state != TCP_ESTABLISHED && !np->recverr)
254                 goto out;
255
256         if (np->recverr)
257                 ipv6_icmp_error(sk, skb, err, uh->dest, ntohl(info), (u8 *)(uh+1));
258
259         sk->sk_err = err;
260         sk->sk_error_report(sk);
261 out:
262         sock_put(sk);
263 }
264
265 static __inline__ void udpv6_err(struct sk_buff *skb,
266                                  struct inet6_skb_parm *opt, int type,
267                                  int code, int offset, __be32 info     )
268 {
269         return __udp6_lib_err(skb, opt, type, code, offset, info, udp_hash);
270 }
271
272 int udpv6_queue_rcv_skb(struct sock * sk, struct sk_buff *skb)
273 {
274         struct udp_sock *up = udp_sk(sk);
275         int rc;
276
277         if (!xfrm6_policy_check(sk, XFRM_POLICY_IN, skb))
278                 goto drop;
279
280         /*
281          * UDP-Lite specific tests, ignored on UDP sockets (see net/ipv4/udp.c).
282          */
283         if ((up->pcflag & UDPLITE_RECV_CC)  &&  UDP_SKB_CB(skb)->partial_cov) {
284
285                 if (up->pcrlen == 0) {          /* full coverage was set  */
286                         LIMIT_NETDEBUG(KERN_WARNING "UDPLITE6: partial coverage"
287                                 " %d while full coverage %d requested\n",
288                                 UDP_SKB_CB(skb)->cscov, skb->len);
289                         goto drop;
290                 }
291                 if (UDP_SKB_CB(skb)->cscov  <  up->pcrlen) {
292                         LIMIT_NETDEBUG(KERN_WARNING "UDPLITE6: coverage %d "
293                                                     "too small, need min %d\n",
294                                        UDP_SKB_CB(skb)->cscov, up->pcrlen);
295                         goto drop;
296                 }
297         }
298
299         if (udp_lib_checksum_complete(skb))
300                 goto drop;
301
302         if ((rc = sock_queue_rcv_skb(sk,skb)) < 0) {
303                 /* Note that an ENOMEM error is charged twice */
304                 if (rc == -ENOMEM)
305                         UDP6_INC_STATS_BH(UDP_MIB_RCVBUFERRORS, up->pcflag);
306                 goto drop;
307         }
308         UDP6_INC_STATS_BH(UDP_MIB_INDATAGRAMS, up->pcflag);
309         return 0;
310 drop:
311         UDP6_INC_STATS_BH(UDP_MIB_INERRORS, up->pcflag);
312         kfree_skb(skb);
313         return -1;
314 }
315
316 static struct sock *udp_v6_mcast_next(struct sock *sk,
317                                       __be16 loc_port, struct in6_addr *loc_addr,
318                                       __be16 rmt_port, struct in6_addr *rmt_addr,
319                                       int dif)
320 {
321         struct hlist_node *node;
322         struct sock *s = sk;
323         unsigned short num = ntohs(loc_port);
324
325         sk_for_each_from(s, node) {
326                 struct inet_sock *inet = inet_sk(s);
327
328                 if (inet->num == num && s->sk_family == PF_INET6) {
329                         struct ipv6_pinfo *np = inet6_sk(s);
330                         if (inet->dport) {
331                                 if (inet->dport != rmt_port)
332                                         continue;
333                         }
334                         if (!ipv6_addr_any(&np->daddr) &&
335                             !ipv6_addr_equal(&np->daddr, rmt_addr))
336                                 continue;
337
338                         if (s->sk_bound_dev_if && s->sk_bound_dev_if != dif)
339                                 continue;
340
341                         if (!ipv6_addr_any(&np->rcv_saddr)) {
342                                 if (!ipv6_addr_equal(&np->rcv_saddr, loc_addr))
343                                         continue;
344                         }
345                         if(!inet6_mc_check(s, loc_addr, rmt_addr))
346                                 continue;
347                         return s;
348                 }
349         }
350         return NULL;
351 }
352
353 /*
354  * Note: called only from the BH handler context,
355  * so we don't need to lock the hashes.
356  */
357 static int __udp6_lib_mcast_deliver(struct sk_buff *skb, struct in6_addr *saddr,
358                            struct in6_addr *daddr, struct hlist_head udptable[])
359 {
360         struct sock *sk, *sk2;
361         const struct udphdr *uh = skb->h.uh;
362         int dif;
363
364         read_lock(&udp_hash_lock);
365         sk = sk_head(&udptable[ntohs(uh->dest) & (UDP_HTABLE_SIZE - 1)]);
366         dif = inet6_iif(skb);
367         sk = udp_v6_mcast_next(sk, uh->dest, daddr, uh->source, saddr, dif);
368         if (!sk) {
369                 kfree_skb(skb);
370                 goto out;
371         }
372
373         sk2 = sk;
374         while ((sk2 = udp_v6_mcast_next(sk_next(sk2), uh->dest, daddr,
375                                         uh->source, saddr, dif))) {
376                 struct sk_buff *buff = skb_clone(skb, GFP_ATOMIC);
377                 if (buff)
378                         udpv6_queue_rcv_skb(sk2, buff);
379         }
380         udpv6_queue_rcv_skb(sk, skb);
381 out:
382         read_unlock(&udp_hash_lock);
383         return 0;
384 }
385
386 static inline int udp6_csum_init(struct sk_buff *skb, struct udphdr *uh)
387
388 {
389         if (uh->check == 0) {
390                 /* RFC 2460 section 8.1 says that we SHOULD log
391                    this error. Well, it is reasonable.
392                  */
393                 LIMIT_NETDEBUG(KERN_INFO "IPv6: udp checksum is 0\n");
394                 return 1;
395         }
396         if (skb->ip_summed == CHECKSUM_COMPLETE &&
397             !csum_ipv6_magic(&skb->nh.ipv6h->saddr, &skb->nh.ipv6h->daddr,
398                              skb->len, IPPROTO_UDP, skb->csum             ))
399                 skb->ip_summed = CHECKSUM_UNNECESSARY;
400
401         if (skb->ip_summed != CHECKSUM_UNNECESSARY)
402                 skb->csum = ~csum_unfold(csum_ipv6_magic(&skb->nh.ipv6h->saddr,
403                                                          &skb->nh.ipv6h->daddr,
404                                                          skb->len, IPPROTO_UDP,
405                                                          0));
406
407         return (UDP_SKB_CB(skb)->partial_cov = 0);
408 }
409
410 int __udp6_lib_rcv(struct sk_buff **pskb, struct hlist_head udptable[],
411                    int is_udplite)
412 {
413         struct sk_buff *skb = *pskb;
414         struct sock *sk;
415         struct udphdr *uh;
416         struct net_device *dev = skb->dev;
417         struct in6_addr *saddr, *daddr;
418         u32 ulen = 0;
419
420         if (!pskb_may_pull(skb, sizeof(struct udphdr)))
421                 goto short_packet;
422
423         saddr = &skb->nh.ipv6h->saddr;
424         daddr = &skb->nh.ipv6h->daddr;
425         uh = skb->h.uh;
426
427         ulen = ntohs(uh->len);
428         if (ulen > skb->len)
429                 goto short_packet;
430
431         if(! is_udplite ) {             /* UDP validates ulen. */
432
433                 /* Check for jumbo payload */
434                 if (ulen == 0)
435                         ulen = skb->len;
436
437                 if (ulen < sizeof(*uh))
438                         goto short_packet;
439
440                 if (ulen < skb->len) {
441                         if (pskb_trim_rcsum(skb, ulen))
442                                 goto short_packet;
443                         saddr = &skb->nh.ipv6h->saddr;
444                         daddr = &skb->nh.ipv6h->daddr;
445                         uh = skb->h.uh;
446                 }
447
448                 if (udp6_csum_init(skb, uh))
449                         goto discard;
450
451         } else  {                       /* UDP-Lite validates cscov. */
452                 if (udplite6_csum_init(skb, uh))
453                         goto discard;
454         }
455
456         /* 
457          *      Multicast receive code 
458          */
459         if (ipv6_addr_is_multicast(daddr))
460                 return __udp6_lib_mcast_deliver(skb, saddr, daddr, udptable);
461
462         /* Unicast */
463
464         /* 
465          * check socket cache ... must talk to Alan about his plans
466          * for sock caches... i'll skip this for now.
467          */
468         sk = __udp6_lib_lookup(saddr, uh->source,
469                                daddr, uh->dest, inet6_iif(skb), udptable);
470
471         if (sk == NULL) {
472                 if (!xfrm6_policy_check(NULL, XFRM_POLICY_IN, skb))
473                         goto discard;
474
475                 if (udp_lib_checksum_complete(skb))
476                         goto discard;
477                 UDP6_INC_STATS_BH(UDP_MIB_NOPORTS, is_udplite);
478
479                 icmpv6_send(skb, ICMPV6_DEST_UNREACH, ICMPV6_PORT_UNREACH, 0, dev);
480
481                 kfree_skb(skb);
482                 return(0);
483         }
484         
485         /* deliver */
486         
487         udpv6_queue_rcv_skb(sk, skb);
488         sock_put(sk);
489         return(0);
490
491 short_packet:   
492         LIMIT_NETDEBUG(KERN_DEBUG "UDP%sv6: short packet: %d/%u\n",
493                        is_udplite? "-Lite" : "",  ulen, skb->len);
494
495 discard:
496         UDP6_INC_STATS_BH(UDP_MIB_INERRORS, is_udplite);
497         kfree_skb(skb);
498         return(0);      
499 }
500
501 static __inline__ int udpv6_rcv(struct sk_buff **pskb)
502 {
503         return __udp6_lib_rcv(pskb, udp_hash, 0);
504 }
505
506 /*
507  * Throw away all pending data and cancel the corking. Socket is locked.
508  */
509 static void udp_v6_flush_pending_frames(struct sock *sk)
510 {
511         struct udp_sock *up = udp_sk(sk);
512
513         if (up->pending) {
514                 up->len = 0;
515                 up->pending = 0;
516                 ip6_flush_pending_frames(sk);
517         }
518 }
519
520 /*
521  *      Sending
522  */
523
524 static int udp_v6_push_pending_frames(struct sock *sk)
525 {
526         struct sk_buff *skb;
527         struct udphdr *uh;
528         struct udp_sock  *up = udp_sk(sk);
529         struct inet_sock *inet = inet_sk(sk);
530         struct flowi *fl = &inet->cork.fl;
531         int err = 0;
532         __wsum csum = 0;
533
534         /* Grab the skbuff where UDP header space exists. */
535         if ((skb = skb_peek(&sk->sk_write_queue)) == NULL)
536                 goto out;
537
538         /*
539          * Create a UDP header
540          */
541         uh = skb->h.uh;
542         uh->source = fl->fl_ip_sport;
543         uh->dest = fl->fl_ip_dport;
544         uh->len = htons(up->len);
545         uh->check = 0;
546
547         if (up->pcflag)
548                 csum = udplite_csum_outgoing(sk, skb);
549          else
550                 csum = udp_csum_outgoing(sk, skb);
551
552         /* add protocol-dependent pseudo-header */
553         uh->check = csum_ipv6_magic(&fl->fl6_src, &fl->fl6_dst,
554                                     up->len, fl->proto, csum   );
555         if (uh->check == 0)
556                 uh->check = CSUM_MANGLED_0;
557
558         err = ip6_push_pending_frames(sk);
559 out:
560         up->len = 0;
561         up->pending = 0;
562         return err;
563 }
564
565 int udpv6_sendmsg(struct kiocb *iocb, struct sock *sk,
566                   struct msghdr *msg, size_t len)
567 {
568         struct ipv6_txoptions opt_space;
569         struct udp_sock *up = udp_sk(sk);
570         struct inet_sock *inet = inet_sk(sk);
571         struct ipv6_pinfo *np = inet6_sk(sk);
572         struct sockaddr_in6 *sin6 = (struct sockaddr_in6 *) msg->msg_name;
573         struct in6_addr *daddr, *final_p = NULL, final;
574         struct ipv6_txoptions *opt = NULL;
575         struct ip6_flowlabel *flowlabel = NULL;
576         struct flowi fl;
577         struct dst_entry *dst;
578         int addr_len = msg->msg_namelen;
579         int ulen = len;
580         int hlimit = -1;
581         int tclass = -1;
582         int corkreq = up->corkflag || msg->msg_flags&MSG_MORE;
583         int err;
584         int connected = 0;
585         int is_udplite = up->pcflag;
586         int (*getfrag)(void *, char *, int, int, int, struct sk_buff *);
587
588         /* destination address check */
589         if (sin6) {
590                 if (addr_len < offsetof(struct sockaddr, sa_data))
591                         return -EINVAL;
592
593                 switch (sin6->sin6_family) {
594                 case AF_INET6:
595                         if (addr_len < SIN6_LEN_RFC2133)
596                                 return -EINVAL;
597                         daddr = &sin6->sin6_addr;
598                         break;
599                 case AF_INET:
600                         goto do_udp_sendmsg;
601                 case AF_UNSPEC:
602                         msg->msg_name = sin6 = NULL;
603                         msg->msg_namelen = addr_len = 0;
604                         daddr = NULL;
605                         break;
606                 default:
607                         return -EINVAL;
608                 }
609         } else if (!up->pending) {
610                 if (sk->sk_state != TCP_ESTABLISHED)
611                         return -EDESTADDRREQ;
612                 daddr = &np->daddr;
613         } else 
614                 daddr = NULL;
615
616         if (daddr) {
617                 if (ipv6_addr_type(daddr) == IPV6_ADDR_MAPPED) {
618                         struct sockaddr_in sin;
619                         sin.sin_family = AF_INET;
620                         sin.sin_port = sin6 ? sin6->sin6_port : inet->dport;
621                         sin.sin_addr.s_addr = daddr->s6_addr32[3];
622                         msg->msg_name = &sin;
623                         msg->msg_namelen = sizeof(sin);
624 do_udp_sendmsg:
625                         if (__ipv6_only_sock(sk))
626                                 return -ENETUNREACH;
627                         return udp_sendmsg(iocb, sk, msg, len);
628                 }
629         }
630
631         if (up->pending == AF_INET)
632                 return udp_sendmsg(iocb, sk, msg, len);
633
634         /* Rough check on arithmetic overflow,
635            better check is made in ip6_append_data().
636            */
637         if (len > INT_MAX - sizeof(struct udphdr))
638                 return -EMSGSIZE;
639         
640         if (up->pending) {
641                 /*
642                  * There are pending frames.
643                  * The socket lock must be held while it's corked.
644                  */
645                 lock_sock(sk);
646                 if (likely(up->pending)) {
647                         if (unlikely(up->pending != AF_INET6)) {
648                                 release_sock(sk);
649                                 return -EAFNOSUPPORT;
650                         }
651                         dst = NULL;
652                         goto do_append_data;
653                 }
654                 release_sock(sk);
655         }
656         ulen += sizeof(struct udphdr);
657
658         memset(&fl, 0, sizeof(fl));
659
660         if (sin6) {
661                 if (sin6->sin6_port == 0)
662                         return -EINVAL;
663
664                 fl.fl_ip_dport = sin6->sin6_port;
665                 daddr = &sin6->sin6_addr;
666
667                 if (np->sndflow) {
668                         fl.fl6_flowlabel = sin6->sin6_flowinfo&IPV6_FLOWINFO_MASK;
669                         if (fl.fl6_flowlabel&IPV6_FLOWLABEL_MASK) {
670                                 flowlabel = fl6_sock_lookup(sk, fl.fl6_flowlabel);
671                                 if (flowlabel == NULL)
672                                         return -EINVAL;
673                                 daddr = &flowlabel->dst;
674                         }
675                 }
676
677                 /*
678                  * Otherwise it will be difficult to maintain
679                  * sk->sk_dst_cache.
680                  */
681                 if (sk->sk_state == TCP_ESTABLISHED &&
682                     ipv6_addr_equal(daddr, &np->daddr))
683                         daddr = &np->daddr;
684
685                 if (addr_len >= sizeof(struct sockaddr_in6) &&
686                     sin6->sin6_scope_id &&
687                     ipv6_addr_type(daddr)&IPV6_ADDR_LINKLOCAL)
688                         fl.oif = sin6->sin6_scope_id;
689         } else {
690                 if (sk->sk_state != TCP_ESTABLISHED)
691                         return -EDESTADDRREQ;
692
693                 fl.fl_ip_dport = inet->dport;
694                 daddr = &np->daddr;
695                 fl.fl6_flowlabel = np->flow_label;
696                 connected = 1;
697         }
698
699         if (!fl.oif)
700                 fl.oif = sk->sk_bound_dev_if;
701
702         if (msg->msg_controllen) {
703                 opt = &opt_space;
704                 memset(opt, 0, sizeof(struct ipv6_txoptions));
705                 opt->tot_len = sizeof(*opt);
706
707                 err = datagram_send_ctl(msg, &fl, opt, &hlimit, &tclass);
708                 if (err < 0) {
709                         fl6_sock_release(flowlabel);
710                         return err;
711                 }
712                 if ((fl.fl6_flowlabel&IPV6_FLOWLABEL_MASK) && !flowlabel) {
713                         flowlabel = fl6_sock_lookup(sk, fl.fl6_flowlabel);
714                         if (flowlabel == NULL)
715                                 return -EINVAL;
716                 }
717                 if (!(opt->opt_nflen|opt->opt_flen))
718                         opt = NULL;
719                 connected = 0;
720         }
721         if (opt == NULL)
722                 opt = np->opt;
723         if (flowlabel)
724                 opt = fl6_merge_options(&opt_space, flowlabel, opt);
725         opt = ipv6_fixup_options(&opt_space, opt);
726
727         fl.proto = sk->sk_protocol;
728         ipv6_addr_copy(&fl.fl6_dst, daddr);
729         if (ipv6_addr_any(&fl.fl6_src) && !ipv6_addr_any(&np->saddr))
730                 ipv6_addr_copy(&fl.fl6_src, &np->saddr);
731         fl.fl_ip_sport = inet->sport;
732         
733         /* merge ip6_build_xmit from ip6_output */
734         if (opt && opt->srcrt) {
735                 struct rt0_hdr *rt0 = (struct rt0_hdr *) opt->srcrt;
736                 ipv6_addr_copy(&final, &fl.fl6_dst);
737                 ipv6_addr_copy(&fl.fl6_dst, rt0->addr);
738                 final_p = &final;
739                 connected = 0;
740         }
741
742         if (!fl.oif && ipv6_addr_is_multicast(&fl.fl6_dst)) {
743                 fl.oif = np->mcast_oif;
744                 connected = 0;
745         }
746
747         security_sk_classify_flow(sk, &fl);
748
749         err = ip6_sk_dst_lookup(sk, &dst, &fl);
750         if (err)
751                 goto out;
752         if (final_p)
753                 ipv6_addr_copy(&fl.fl6_dst, final_p);
754
755         if ((err = xfrm_lookup(&dst, &fl, sk, 0)) < 0)
756                 goto out;
757
758         if (hlimit < 0) {
759                 if (ipv6_addr_is_multicast(&fl.fl6_dst))
760                         hlimit = np->mcast_hops;
761                 else
762                         hlimit = np->hop_limit;
763                 if (hlimit < 0)
764                         hlimit = dst_metric(dst, RTAX_HOPLIMIT);
765                 if (hlimit < 0)
766                         hlimit = ipv6_get_hoplimit(dst->dev);
767         }
768
769         if (tclass < 0) {
770                 tclass = np->tclass;
771                 if (tclass < 0)
772                         tclass = 0;
773         }
774
775         if (msg->msg_flags&MSG_CONFIRM)
776                 goto do_confirm;
777 back_from_confirm:
778
779         lock_sock(sk);
780         if (unlikely(up->pending)) {
781                 /* The socket is already corked while preparing it. */
782                 /* ... which is an evident application bug. --ANK */
783                 release_sock(sk);
784
785                 LIMIT_NETDEBUG(KERN_DEBUG "udp cork app bug 2\n");
786                 err = -EINVAL;
787                 goto out;
788         }
789
790         up->pending = AF_INET6;
791
792 do_append_data:
793         up->len += ulen;
794         getfrag  =  is_udplite ?  udplite_getfrag : ip_generic_getfrag;
795         err = ip6_append_data(sk, getfrag, msg->msg_iov, ulen,
796                 sizeof(struct udphdr), hlimit, tclass, opt, &fl,
797                 (struct rt6_info*)dst,
798                 corkreq ? msg->msg_flags|MSG_MORE : msg->msg_flags);
799         if (err)
800                 udp_v6_flush_pending_frames(sk);
801         else if (!corkreq)
802                 err = udp_v6_push_pending_frames(sk);
803         else if (unlikely(skb_queue_empty(&sk->sk_write_queue)))
804                 up->pending = 0;
805
806         if (dst) {
807                 if (connected) {
808                         ip6_dst_store(sk, dst,
809                                       ipv6_addr_equal(&fl.fl6_dst, &np->daddr) ?
810                                       &np->daddr : NULL,
811 #ifdef CONFIG_IPV6_SUBTREES
812                                       ipv6_addr_equal(&fl.fl6_src, &np->saddr) ?
813                                       &np->saddr :
814 #endif
815                                       NULL);
816                 } else {
817                         dst_release(dst);
818                 }
819         }
820
821         if (err > 0)
822                 err = np->recverr ? net_xmit_errno(err) : 0;
823         release_sock(sk);
824 out:
825         fl6_sock_release(flowlabel);
826         if (!err) {
827                 UDP6_INC_STATS_USER(UDP_MIB_OUTDATAGRAMS, is_udplite);
828                 return len;
829         }
830         /*
831          * ENOBUFS = no kernel mem, SOCK_NOSPACE = no sndbuf space.  Reporting
832          * ENOBUFS might not be good (it's not tunable per se), but otherwise
833          * we don't have a good statistic (IpOutDiscards but it can be too many
834          * things).  We could add another new stat but at least for now that
835          * seems like overkill.
836          */
837         if (err == -ENOBUFS || test_bit(SOCK_NOSPACE, &sk->sk_socket->flags)) {
838                 UDP6_INC_STATS_USER(UDP_MIB_SNDBUFERRORS, is_udplite);
839         }
840         return err;
841
842 do_confirm:
843         dst_confirm(dst);
844         if (!(msg->msg_flags&MSG_PROBE) || len)
845                 goto back_from_confirm;
846         err = 0;
847         goto out;
848 }
849
850 int udpv6_destroy_sock(struct sock *sk)
851 {
852         lock_sock(sk);
853         udp_v6_flush_pending_frames(sk);
854         release_sock(sk);
855
856         inet6_destroy_sock(sk);
857
858         return 0;
859 }
860
861 /*
862  *      Socket option code for UDP
863  */
864 int udpv6_setsockopt(struct sock *sk, int level, int optname,
865                      char __user *optval, int optlen)
866 {
867         if (level == SOL_UDP  ||  level == SOL_UDPLITE)
868                 return udp_lib_setsockopt(sk, level, optname, optval, optlen,
869                                           udp_v6_push_pending_frames);
870         return ipv6_setsockopt(sk, level, optname, optval, optlen);
871 }
872
873 #ifdef CONFIG_COMPAT
874 int compat_udpv6_setsockopt(struct sock *sk, int level, int optname,
875                             char __user *optval, int optlen)
876 {
877         if (level == SOL_UDP  ||  level == SOL_UDPLITE)
878                 return udp_lib_setsockopt(sk, level, optname, optval, optlen,
879                                           udp_v6_push_pending_frames);
880         return compat_ipv6_setsockopt(sk, level, optname, optval, optlen);
881 }
882 #endif
883
884 int udpv6_getsockopt(struct sock *sk, int level, int optname,
885                      char __user *optval, int __user *optlen)
886 {
887         if (level == SOL_UDP  ||  level == SOL_UDPLITE)
888                 return udp_lib_getsockopt(sk, level, optname, optval, optlen);
889         return ipv6_getsockopt(sk, level, optname, optval, optlen);
890 }
891
892 #ifdef CONFIG_COMPAT
893 int compat_udpv6_getsockopt(struct sock *sk, int level, int optname,
894                             char __user *optval, int __user *optlen)
895 {
896         if (level == SOL_UDP  ||  level == SOL_UDPLITE)
897                 return udp_lib_getsockopt(sk, level, optname, optval, optlen);
898         return compat_ipv6_getsockopt(sk, level, optname, optval, optlen);
899 }
900 #endif
901
902 static struct inet6_protocol udpv6_protocol = {
903         .handler        =       udpv6_rcv,
904         .err_handler    =       udpv6_err,
905         .flags          =       INET6_PROTO_NOPOLICY|INET6_PROTO_FINAL,
906 };
907
908 /* ------------------------------------------------------------------------ */
909 #ifdef CONFIG_PROC_FS
910
911 static void udp6_sock_seq_show(struct seq_file *seq, struct sock *sp, int bucket)
912 {
913         struct inet_sock *inet = inet_sk(sp);
914         struct ipv6_pinfo *np = inet6_sk(sp);
915         struct in6_addr *dest, *src;
916         __u16 destp, srcp;
917
918         dest  = &np->daddr;
919         src   = &np->rcv_saddr;
920         destp = ntohs(inet->dport);
921         srcp  = ntohs(inet->sport);
922         seq_printf(seq,
923                    "%4d: %08X%08X%08X%08X:%04X %08X%08X%08X%08X:%04X "
924                    "%02X %08X:%08X %02X:%08lX %08X %5d %8d %lu %d %p\n",
925                    bucket,
926                    src->s6_addr32[0], src->s6_addr32[1],
927                    src->s6_addr32[2], src->s6_addr32[3], srcp,
928                    dest->s6_addr32[0], dest->s6_addr32[1],
929                    dest->s6_addr32[2], dest->s6_addr32[3], destp,
930                    sp->sk_state, 
931                    atomic_read(&sp->sk_wmem_alloc),
932                    atomic_read(&sp->sk_rmem_alloc),
933                    0, 0L, 0,
934                    sock_i_uid(sp), 0,
935                    sock_i_ino(sp),
936                    atomic_read(&sp->sk_refcnt), sp);
937 }
938
939 int udp6_seq_show(struct seq_file *seq, void *v)
940 {
941         if (v == SEQ_START_TOKEN)
942                 seq_printf(seq,
943                            "  sl  "
944                            "local_address                         "
945                            "remote_address                        "
946                            "st tx_queue rx_queue tr tm->when retrnsmt"
947                            "   uid  timeout inode\n");
948         else
949                 udp6_sock_seq_show(seq, v, ((struct udp_iter_state *)seq->private)->bucket);
950         return 0;
951 }
952
953 static struct file_operations udp6_seq_fops;
954 static struct udp_seq_afinfo udp6_seq_afinfo = {
955         .owner          = THIS_MODULE,
956         .name           = "udp6",
957         .family         = AF_INET6,
958         .hashtable      = udp_hash,
959         .seq_show       = udp6_seq_show,
960         .seq_fops       = &udp6_seq_fops,
961 };
962
963 int __init udp6_proc_init(void)
964 {
965         return udp_proc_register(&udp6_seq_afinfo);
966 }
967
968 void udp6_proc_exit(void) {
969         udp_proc_unregister(&udp6_seq_afinfo);
970 }
971 #endif /* CONFIG_PROC_FS */
972
973 /* ------------------------------------------------------------------------ */
974
975 struct proto udpv6_prot = {
976         .name              = "UDPv6",
977         .owner             = THIS_MODULE,
978         .close             = udp_lib_close,
979         .connect           = ip6_datagram_connect,
980         .disconnect        = udp_disconnect,
981         .ioctl             = udp_ioctl,
982         .destroy           = udpv6_destroy_sock,
983         .setsockopt        = udpv6_setsockopt,
984         .getsockopt        = udpv6_getsockopt,
985         .sendmsg           = udpv6_sendmsg,
986         .recvmsg           = udpv6_recvmsg,
987         .backlog_rcv       = udpv6_queue_rcv_skb,
988         .hash              = udp_lib_hash,
989         .unhash            = udp_lib_unhash,
990         .get_port          = udp_v6_get_port,
991         .obj_size          = sizeof(struct udp6_sock),
992 #ifdef CONFIG_COMPAT
993         .compat_setsockopt = compat_udpv6_setsockopt,
994         .compat_getsockopt = compat_udpv6_getsockopt,
995 #endif
996 };
997
998 static struct inet_protosw udpv6_protosw = {
999         .type =      SOCK_DGRAM,
1000         .protocol =  IPPROTO_UDP,
1001         .prot =      &udpv6_prot,
1002         .ops =       &inet6_dgram_ops,
1003         .capability =-1,
1004         .no_check =  UDP_CSUM_DEFAULT,
1005         .flags =     INET_PROTOSW_PERMANENT,
1006 };
1007
1008
1009 void __init udpv6_init(void)
1010 {
1011         if (inet6_add_protocol(&udpv6_protocol, IPPROTO_UDP) < 0)
1012                 printk(KERN_ERR "udpv6_init: Could not register protocol\n");
1013         inet6_register_protosw(&udpv6_protosw);
1014 }