vserver 1.9.5.x5
[linux-2.6.git] / net / ipv4 / esp4.c
1 #include <linux/config.h>
2 #include <linux/module.h>
3 #include <net/ip.h>
4 #include <net/xfrm.h>
5 #include <net/esp.h>
6 #include <asm/scatterlist.h>
7 #include <linux/crypto.h>
8 #include <linux/pfkeyv2.h>
9 #include <linux/random.h>
10 #include <net/icmp.h>
11 #include <net/udp.h>
12
13 /* decapsulation data for use when post-processing */
14 struct esp_decap_data {
15         xfrm_address_t  saddr;
16         __u16           sport;
17         __u8            proto;
18 };
19
20 static int esp_output(struct sk_buff *skb)
21 {
22         int err;
23         struct dst_entry *dst = skb->dst;
24         struct xfrm_state *x  = dst->xfrm;
25         struct iphdr *top_iph;
26         struct ip_esp_hdr *esph;
27         struct crypto_tfm *tfm;
28         struct esp_data *esp;
29         struct sk_buff *trailer;
30         int blksize;
31         int clen;
32         int alen;
33         int nfrags;
34
35         /* Strip IP+ESP header. */
36         __skb_pull(skb, skb->h.raw - skb->data);
37         /* Now skb is pure payload to encrypt */
38
39         err = -ENOMEM;
40
41         /* Round to block size */
42         clen = skb->len;
43
44         esp = x->data;
45         alen = esp->auth.icv_trunc_len;
46         tfm = esp->conf.tfm;
47         blksize = (crypto_tfm_alg_blocksize(tfm) + 3) & ~3;
48         clen = (clen + 2 + blksize-1)&~(blksize-1);
49         if (esp->conf.padlen)
50                 clen = (clen + esp->conf.padlen-1)&~(esp->conf.padlen-1);
51
52         if ((nfrags = skb_cow_data(skb, clen-skb->len+alen, &trailer)) < 0)
53                 goto error;
54
55         /* Fill padding... */
56         do {
57                 int i;
58                 for (i=0; i<clen-skb->len - 2; i++)
59                         *(u8*)(trailer->tail + i) = i+1;
60         } while (0);
61         *(u8*)(trailer->tail + clen-skb->len - 2) = (clen - skb->len)-2;
62         pskb_put(skb, trailer, clen - skb->len);
63
64         __skb_push(skb, skb->data - skb->nh.raw);
65         top_iph = skb->nh.iph;
66         esph = (struct ip_esp_hdr *)(skb->nh.raw + top_iph->ihl*4);
67         top_iph->tot_len = htons(skb->len + alen);
68         *(u8*)(trailer->tail - 1) = top_iph->protocol;
69
70         /* this is non-NULL only with UDP Encapsulation */
71         if (x->encap) {
72                 struct xfrm_encap_tmpl *encap = x->encap;
73                 struct udphdr *uh;
74                 u32 *udpdata32;
75
76                 uh = (struct udphdr *)esph;
77                 uh->source = encap->encap_sport;
78                 uh->dest = encap->encap_dport;
79                 uh->len = htons(skb->len + alen - top_iph->ihl*4);
80                 uh->check = 0;
81
82                 switch (encap->encap_type) {
83                 default:
84                 case UDP_ENCAP_ESPINUDP:
85                         esph = (struct ip_esp_hdr *)(uh + 1);
86                         break;
87                 case UDP_ENCAP_ESPINUDP_NON_IKE:
88                         udpdata32 = (u32 *)(uh + 1);
89                         udpdata32[0] = udpdata32[1] = 0;
90                         esph = (struct ip_esp_hdr *)(udpdata32 + 2);
91                         break;
92                 }
93
94                 top_iph->protocol = IPPROTO_UDP;
95         } else
96                 top_iph->protocol = IPPROTO_ESP;
97
98         esph->spi = x->id.spi;
99         esph->seq_no = htonl(++x->replay.oseq);
100
101         if (esp->conf.ivlen)
102                 crypto_cipher_set_iv(tfm, esp->conf.ivec, crypto_tfm_alg_ivsize(tfm));
103
104         do {
105                 struct scatterlist *sg = &esp->sgbuf[0];
106
107                 if (unlikely(nfrags > ESP_NUM_FAST_SG)) {
108                         sg = kmalloc(sizeof(struct scatterlist)*nfrags, GFP_ATOMIC);
109                         if (!sg)
110                                 goto error;
111                 }
112                 skb_to_sgvec(skb, sg, esph->enc_data+esp->conf.ivlen-skb->data, clen);
113                 crypto_cipher_encrypt(tfm, sg, sg, clen);
114                 if (unlikely(sg != &esp->sgbuf[0]))
115                         kfree(sg);
116         } while (0);
117
118         if (esp->conf.ivlen) {
119                 memcpy(esph->enc_data, esp->conf.ivec, crypto_tfm_alg_ivsize(tfm));
120                 crypto_cipher_get_iv(tfm, esp->conf.ivec, crypto_tfm_alg_ivsize(tfm));
121         }
122
123         if (esp->auth.icv_full_len) {
124                 esp->auth.icv(esp, skb, (u8*)esph-skb->data,
125                               sizeof(struct ip_esp_hdr) + esp->conf.ivlen+clen, trailer->tail);
126                 pskb_put(skb, trailer, alen);
127         }
128
129         ip_send_check(top_iph);
130
131         err = 0;
132
133 error:
134         return err;
135 }
136
137 /*
138  * Note: detecting truncated vs. non-truncated authentication data is very
139  * expensive, so we only support truncated data, which is the recommended
140  * and common case.
141  */
142 static int esp_input(struct xfrm_state *x, struct xfrm_decap_state *decap, struct sk_buff *skb)
143 {
144         struct iphdr *iph;
145         struct ip_esp_hdr *esph;
146         struct esp_data *esp = x->data;
147         struct sk_buff *trailer;
148         int blksize = crypto_tfm_alg_blocksize(esp->conf.tfm);
149         int alen = esp->auth.icv_trunc_len;
150         int elen = skb->len - sizeof(struct ip_esp_hdr) - esp->conf.ivlen - alen;
151         int nfrags;
152         int encap_len = 0;
153
154         if (!pskb_may_pull(skb, sizeof(struct ip_esp_hdr)))
155                 goto out;
156
157         if (elen <= 0 || (elen & (blksize-1)))
158                 goto out;
159
160         /* If integrity check is required, do this. */
161         if (esp->auth.icv_full_len) {
162                 u8 sum[esp->auth.icv_full_len];
163                 u8 sum1[alen];
164                 
165                 esp->auth.icv(esp, skb, 0, skb->len-alen, sum);
166
167                 if (skb_copy_bits(skb, skb->len-alen, sum1, alen))
168                         BUG();
169
170                 if (unlikely(memcmp(sum, sum1, alen))) {
171                         x->stats.integrity_failed++;
172                         goto out;
173                 }
174         }
175
176         if ((nfrags = skb_cow_data(skb, 0, &trailer)) < 0)
177                 goto out;
178
179         skb->ip_summed = CHECKSUM_NONE;
180
181         esph = (struct ip_esp_hdr*)skb->data;
182         iph = skb->nh.iph;
183
184         /* Get ivec. This can be wrong, check against another impls. */
185         if (esp->conf.ivlen)
186                 crypto_cipher_set_iv(esp->conf.tfm, esph->enc_data, crypto_tfm_alg_ivsize(esp->conf.tfm));
187
188         {
189                 u8 nexthdr[2];
190                 struct scatterlist *sg = &esp->sgbuf[0];
191                 u8 workbuf[60];
192                 int padlen;
193
194                 if (unlikely(nfrags > ESP_NUM_FAST_SG)) {
195                         sg = kmalloc(sizeof(struct scatterlist)*nfrags, GFP_ATOMIC);
196                         if (!sg)
197                                 goto out;
198                 }
199                 skb_to_sgvec(skb, sg, sizeof(struct ip_esp_hdr) + esp->conf.ivlen, elen);
200                 crypto_cipher_decrypt(esp->conf.tfm, sg, sg, elen);
201                 if (unlikely(sg != &esp->sgbuf[0]))
202                         kfree(sg);
203
204                 if (skb_copy_bits(skb, skb->len-alen-2, nexthdr, 2))
205                         BUG();
206
207                 padlen = nexthdr[0];
208                 if (padlen+2 >= elen)
209                         goto out;
210
211                 /* ... check padding bits here. Silly. :-) */ 
212
213                 if (x->encap && decap && decap->decap_type) {
214                         struct esp_decap_data *encap_data;
215                         struct udphdr *uh = (struct udphdr *) (iph+1);
216
217                         encap_data = (struct esp_decap_data *) (decap->decap_data);
218                         encap_data->proto = 0;
219
220                         switch (decap->decap_type) {
221                         case UDP_ENCAP_ESPINUDP:
222                         case UDP_ENCAP_ESPINUDP_NON_IKE:
223                                 encap_data->proto = AF_INET;
224                                 encap_data->saddr.a4 = iph->saddr;
225                                 encap_data->sport = uh->source;
226                                 encap_len = (void*)esph - (void*)uh;
227                                 break;
228
229                         default:
230                                 goto out;
231                         }
232                 }
233
234                 iph->protocol = nexthdr[1];
235                 pskb_trim(skb, skb->len - alen - padlen - 2);
236                 memcpy(workbuf, skb->nh.raw, iph->ihl*4);
237                 skb->h.raw = skb_pull(skb, sizeof(struct ip_esp_hdr) + esp->conf.ivlen);
238                 skb->nh.raw += encap_len + sizeof(struct ip_esp_hdr) + esp->conf.ivlen;
239                 memcpy(skb->nh.raw, workbuf, iph->ihl*4);
240                 skb->nh.iph->tot_len = htons(skb->len);
241         }
242
243         return 0;
244
245 out:
246         return -EINVAL;
247 }
248
249 static int esp_post_input(struct xfrm_state *x, struct xfrm_decap_state *decap, struct sk_buff *skb)
250 {
251   
252         if (x->encap) {
253                 struct xfrm_encap_tmpl *encap;
254                 struct esp_decap_data *decap_data;
255
256                 encap = x->encap;
257                 decap_data = (struct esp_decap_data *)(decap->decap_data);
258
259                 /* first, make sure that the decap type == the encap type */
260                 if (encap->encap_type != decap->decap_type)
261                         return -EINVAL;
262
263                 switch (encap->encap_type) {
264                 default:
265                 case UDP_ENCAP_ESPINUDP:
266                 case UDP_ENCAP_ESPINUDP_NON_IKE:
267                         /*
268                          * 1) if the NAT-T peer's IP or port changed then
269                          *    advertize the change to the keying daemon.
270                          *    This is an inbound SA, so just compare
271                          *    SRC ports.
272                          */
273                         if (decap_data->proto == AF_INET &&
274                             (decap_data->saddr.a4 != x->props.saddr.a4 ||
275                              decap_data->sport != encap->encap_sport)) {
276                                 xfrm_address_t ipaddr;
277
278                                 ipaddr.a4 = decap_data->saddr.a4;
279                                 km_new_mapping(x, &ipaddr, decap_data->sport);
280                                         
281                                 /* XXX: perhaps add an extra
282                                  * policy check here, to see
283                                  * if we should allow or
284                                  * reject a packet from a
285                                  * different source
286                                  * address/port.
287                                  */
288                         }
289                 
290                         /*
291                          * 2) ignore UDP/TCP checksums in case
292                          *    of NAT-T in Transport Mode, or
293                          *    perform other post-processing fixes
294                          *    as per * draft-ietf-ipsec-udp-encaps-06,
295                          *    section 3.1.2
296                          */
297                         if (!x->props.mode)
298                                 skb->ip_summed = CHECKSUM_UNNECESSARY;
299
300                         break;
301                 }
302         }
303         return 0;
304 }
305
306 static u32 esp4_get_max_size(struct xfrm_state *x, int mtu)
307 {
308         struct esp_data *esp = x->data;
309         u32 blksize = crypto_tfm_alg_blocksize(esp->conf.tfm);
310
311         if (x->props.mode) {
312                 mtu = (mtu + 2 + blksize-1)&~(blksize-1);
313         } else {
314                 /* The worst case. */
315                 mtu += 2 + blksize;
316         }
317         if (esp->conf.padlen)
318                 mtu = (mtu + esp->conf.padlen-1)&~(esp->conf.padlen-1);
319
320         return mtu + x->props.header_len + esp->auth.icv_trunc_len;
321 }
322
323 static void esp4_err(struct sk_buff *skb, u32 info)
324 {
325         struct iphdr *iph = (struct iphdr*)skb->data;
326         struct ip_esp_hdr *esph = (struct ip_esp_hdr*)(skb->data+(iph->ihl<<2));
327         struct xfrm_state *x;
328
329         if (skb->h.icmph->type != ICMP_DEST_UNREACH ||
330             skb->h.icmph->code != ICMP_FRAG_NEEDED)
331                 return;
332
333         x = xfrm_state_lookup((xfrm_address_t *)&iph->daddr, esph->spi, IPPROTO_ESP, AF_INET);
334         if (!x)
335                 return;
336         NETDEBUG(printk(KERN_DEBUG "pmtu discovery on SA ESP/%08x/%08x\n",
337                         ntohl(esph->spi), ntohl(iph->daddr)));
338         xfrm_state_put(x);
339 }
340
341 static void esp_destroy(struct xfrm_state *x)
342 {
343         struct esp_data *esp = x->data;
344
345         if (!esp)
346                 return;
347
348         if (esp->conf.tfm) {
349                 crypto_free_tfm(esp->conf.tfm);
350                 esp->conf.tfm = NULL;
351         }
352         if (esp->conf.ivec) {
353                 kfree(esp->conf.ivec);
354                 esp->conf.ivec = NULL;
355         }
356         if (esp->auth.tfm) {
357                 crypto_free_tfm(esp->auth.tfm);
358                 esp->auth.tfm = NULL;
359         }
360         if (esp->auth.work_icv) {
361                 kfree(esp->auth.work_icv);
362                 esp->auth.work_icv = NULL;
363         }
364         kfree(esp);
365 }
366
367 static int esp_init_state(struct xfrm_state *x, void *args)
368 {
369         struct esp_data *esp = NULL;
370
371         /* null auth and encryption can have zero length keys */
372         if (x->aalg) {
373                 if (x->aalg->alg_key_len > 512)
374                         goto error;
375         }
376         if (x->ealg == NULL)
377                 goto error;
378
379         esp = kmalloc(sizeof(*esp), GFP_KERNEL);
380         if (esp == NULL)
381                 return -ENOMEM;
382
383         memset(esp, 0, sizeof(*esp));
384
385         if (x->aalg) {
386                 struct xfrm_algo_desc *aalg_desc;
387
388                 esp->auth.key = x->aalg->alg_key;
389                 esp->auth.key_len = (x->aalg->alg_key_len+7)/8;
390                 esp->auth.tfm = crypto_alloc_tfm(x->aalg->alg_name, 0);
391                 if (esp->auth.tfm == NULL)
392                         goto error;
393                 esp->auth.icv = esp_hmac_digest;
394
395                 aalg_desc = xfrm_aalg_get_byname(x->aalg->alg_name, 0);
396                 BUG_ON(!aalg_desc);
397
398                 if (aalg_desc->uinfo.auth.icv_fullbits/8 !=
399                     crypto_tfm_alg_digestsize(esp->auth.tfm)) {
400                         NETDEBUG(printk(KERN_INFO "ESP: %s digestsize %u != %hu\n",
401                                x->aalg->alg_name,
402                                crypto_tfm_alg_digestsize(esp->auth.tfm),
403                                aalg_desc->uinfo.auth.icv_fullbits/8));
404                         goto error;
405                 }
406
407                 esp->auth.icv_full_len = aalg_desc->uinfo.auth.icv_fullbits/8;
408                 esp->auth.icv_trunc_len = aalg_desc->uinfo.auth.icv_truncbits/8;
409
410                 esp->auth.work_icv = kmalloc(esp->auth.icv_full_len, GFP_KERNEL);
411                 if (!esp->auth.work_icv)
412                         goto error;
413         }
414         esp->conf.key = x->ealg->alg_key;
415         esp->conf.key_len = (x->ealg->alg_key_len+7)/8;
416         if (x->props.ealgo == SADB_EALG_NULL)
417                 esp->conf.tfm = crypto_alloc_tfm(x->ealg->alg_name, CRYPTO_TFM_MODE_ECB);
418         else
419                 esp->conf.tfm = crypto_alloc_tfm(x->ealg->alg_name, CRYPTO_TFM_MODE_CBC);
420         if (esp->conf.tfm == NULL)
421                 goto error;
422         esp->conf.ivlen = crypto_tfm_alg_ivsize(esp->conf.tfm);
423         esp->conf.padlen = 0;
424         if (esp->conf.ivlen) {
425                 esp->conf.ivec = kmalloc(esp->conf.ivlen, GFP_KERNEL);
426                 if (unlikely(esp->conf.ivec == NULL))
427                         goto error;
428                 get_random_bytes(esp->conf.ivec, esp->conf.ivlen);
429         }
430         if (crypto_cipher_setkey(esp->conf.tfm, esp->conf.key, esp->conf.key_len))
431                 goto error;
432         x->props.header_len = sizeof(struct ip_esp_hdr) + esp->conf.ivlen;
433         if (x->props.mode)
434                 x->props.header_len += sizeof(struct iphdr);
435         if (x->encap) {
436                 struct xfrm_encap_tmpl *encap = x->encap;
437
438                 switch (encap->encap_type) {
439                 default:
440                         goto error;
441                 case UDP_ENCAP_ESPINUDP:
442                         x->props.header_len += sizeof(struct udphdr);
443                         break;
444                 case UDP_ENCAP_ESPINUDP_NON_IKE:
445                         x->props.header_len += sizeof(struct udphdr) + 2 * sizeof(u32);
446                         break;
447                 }
448         }
449         x->data = esp;
450         x->props.trailer_len = esp4_get_max_size(x, 0) - x->props.header_len;
451         return 0;
452
453 error:
454         x->data = esp;
455         esp_destroy(x);
456         x->data = NULL;
457         return -EINVAL;
458 }
459
460 static struct xfrm_type esp_type =
461 {
462         .description    = "ESP4",
463         .owner          = THIS_MODULE,
464         .proto          = IPPROTO_ESP,
465         .init_state     = esp_init_state,
466         .destructor     = esp_destroy,
467         .get_max_size   = esp4_get_max_size,
468         .input          = esp_input,
469         .post_input     = esp_post_input,
470         .output         = esp_output
471 };
472
473 static struct net_protocol esp4_protocol = {
474         .handler        =       xfrm4_rcv,
475         .err_handler    =       esp4_err,
476         .no_policy      =       1,
477 };
478
479 static int __init esp4_init(void)
480 {
481         struct xfrm_decap_state decap;
482
483         if (sizeof(struct esp_decap_data)  <
484             sizeof(decap.decap_data)) {
485                 extern void decap_data_too_small(void);
486
487                 decap_data_too_small();
488         }
489
490         if (xfrm_register_type(&esp_type, AF_INET) < 0) {
491                 printk(KERN_INFO "ip esp init: can't add xfrm type\n");
492                 return -EAGAIN;
493         }
494         if (inet_add_protocol(&esp4_protocol, IPPROTO_ESP) < 0) {
495                 printk(KERN_INFO "ip esp init: can't add protocol\n");
496                 xfrm_unregister_type(&esp_type, AF_INET);
497                 return -EAGAIN;
498         }
499         return 0;
500 }
501
502 static void __exit esp4_fini(void)
503 {
504         if (inet_del_protocol(&esp4_protocol, IPPROTO_ESP) < 0)
505                 printk(KERN_INFO "ip esp close: can't remove protocol\n");
506         if (xfrm_unregister_type(&esp_type, AF_INET) < 0)
507                 printk(KERN_INFO "ip esp close: can't remove xfrm type\n");
508 }
509
510 module_init(esp4_init);
511 module_exit(esp4_fini);
512 MODULE_LICENSE("GPL");