edc03610494206d595c4963deb6a53fbe2c641e5
[linux-2.6.git] / fs / compat.c
1 /*
2  *  linux/fs/compat.c
3  *
4  *  Kernel compatibililty routines for e.g. 32 bit syscall support
5  *  on 64 bit kernels.
6  *
7  *  Copyright (C) 2002       Stephen Rothwell, IBM Corporation
8  *  Copyright (C) 1997-2000  Jakub Jelinek  (jakub@redhat.com)
9  *  Copyright (C) 1998       Eddie C. Dost  (ecd@skynet.be)
10  *  Copyright (C) 2001,2002  Andi Kleen, SuSE Labs 
11  *  Copyright (C) 2003       Pavel Machek (pavel@suse.cz)
12  *
13  *  This program is free software; you can redistribute it and/or modify
14  *  it under the terms of the GNU General Public License version 2 as
15  *  published by the Free Software Foundation.
16  */
17
18 #include <linux/linkage.h>
19 #include <linux/compat.h>
20 #include <linux/errno.h>
21 #include <linux/time.h>
22 #include <linux/fs.h>
23 #include <linux/fcntl.h>
24 #include <linux/namei.h>
25 #include <linux/file.h>
26 #include <linux/vfs.h>
27 #include <linux/ioctl32.h>
28 #include <linux/ioctl.h>
29 #include <linux/init.h>
30 #include <linux/sockios.h>      /* for SIOCDEVPRIVATE */
31 #include <linux/smb.h>
32 #include <linux/smb_mount.h>
33 #include <linux/ncp_mount.h>
34 #include <linux/nfs4_mount.h>
35 #include <linux/smp_lock.h>
36 #include <linux/syscalls.h>
37 #include <linux/ctype.h>
38 #include <linux/module.h>
39 #include <linux/dirent.h>
40 #include <linux/fsnotify.h>
41 #include <linux/highuid.h>
42 #include <linux/sunrpc/svc.h>
43 #include <linux/nfsd/nfsd.h>
44 #include <linux/nfsd/syscall.h>
45 #include <linux/personality.h>
46 #include <linux/rwsem.h>
47 #include <linux/acct.h>
48 #include <linux/mm.h>
49
50 #include <net/sock.h>           /* siocdevprivate_ioctl */
51
52 #include <asm/uaccess.h>
53 #include <asm/mmu_context.h>
54 #include <asm/ioctls.h>
55
56 extern void sigset_from_compat(sigset_t *set, compat_sigset_t *compat);
57
58 /*
59  * Not all architectures have sys_utime, so implement this in terms
60  * of sys_utimes.
61  */
62 asmlinkage long compat_sys_utime(char __user *filename, struct compat_utimbuf __user *t)
63 {
64         struct timeval tv[2];
65
66         if (t) {
67                 if (get_user(tv[0].tv_sec, &t->actime) ||
68                     get_user(tv[1].tv_sec, &t->modtime))
69                         return -EFAULT;
70                 tv[0].tv_usec = 0;
71                 tv[1].tv_usec = 0;
72         }
73         return do_utimes(AT_FDCWD, filename, t ? tv : NULL);
74 }
75
76 asmlinkage long compat_sys_futimesat(unsigned int dfd, char __user *filename, struct compat_timeval __user *t)
77 {
78         struct timeval tv[2];
79
80         if (t) {
81                 if (get_user(tv[0].tv_sec, &t[0].tv_sec) ||
82                     get_user(tv[0].tv_usec, &t[0].tv_usec) ||
83                     get_user(tv[1].tv_sec, &t[1].tv_sec) ||
84                     get_user(tv[1].tv_usec, &t[1].tv_usec))
85                         return -EFAULT;
86         }
87         return do_utimes(dfd, filename, t ? tv : NULL);
88 }
89
90 asmlinkage long compat_sys_utimes(char __user *filename, struct compat_timeval __user *t)
91 {
92         return compat_sys_futimesat(AT_FDCWD, filename, t);
93 }
94
95 asmlinkage long compat_sys_newstat(char __user * filename,
96                 struct compat_stat __user *statbuf)
97 {
98         struct kstat stat;
99         int error = vfs_stat_fd(AT_FDCWD, filename, &stat);
100
101         if (!error)
102                 error = cp_compat_stat(&stat, statbuf);
103         return error;
104 }
105
106 asmlinkage long compat_sys_newlstat(char __user * filename,
107                 struct compat_stat __user *statbuf)
108 {
109         struct kstat stat;
110         int error = vfs_lstat_fd(AT_FDCWD, filename, &stat);
111
112         if (!error)
113                 error = cp_compat_stat(&stat, statbuf);
114         return error;
115 }
116
117 asmlinkage long compat_sys_newfstatat(unsigned int dfd, char __user *filename,
118                 struct compat_stat __user *statbuf, int flag)
119 {
120         struct kstat stat;
121         int error = -EINVAL;
122
123         if ((flag & ~AT_SYMLINK_NOFOLLOW) != 0)
124                 goto out;
125
126         if (flag & AT_SYMLINK_NOFOLLOW)
127                 error = vfs_lstat_fd(dfd, filename, &stat);
128         else
129                 error = vfs_stat_fd(dfd, filename, &stat);
130
131         if (!error)
132                 error = cp_compat_stat(&stat, statbuf);
133
134 out:
135         return error;
136 }
137
138 asmlinkage long compat_sys_newfstat(unsigned int fd,
139                 struct compat_stat __user * statbuf)
140 {
141         struct kstat stat;
142         int error = vfs_fstat(fd, &stat);
143
144         if (!error)
145                 error = cp_compat_stat(&stat, statbuf);
146         return error;
147 }
148
149 static int put_compat_statfs(struct compat_statfs __user *ubuf, struct kstatfs *kbuf)
150 {
151         
152         if (sizeof ubuf->f_blocks == 4) {
153                 if ((kbuf->f_blocks | kbuf->f_bfree | kbuf->f_bavail) &
154                     0xffffffff00000000ULL)
155                         return -EOVERFLOW;
156                 /* f_files and f_ffree may be -1; it's okay
157                  * to stuff that into 32 bits */
158                 if (kbuf->f_files != 0xffffffffffffffffULL
159                  && (kbuf->f_files & 0xffffffff00000000ULL))
160                         return -EOVERFLOW;
161                 if (kbuf->f_ffree != 0xffffffffffffffffULL
162                  && (kbuf->f_ffree & 0xffffffff00000000ULL))
163                         return -EOVERFLOW;
164         }
165         if (!access_ok(VERIFY_WRITE, ubuf, sizeof(*ubuf)) ||
166             __put_user(kbuf->f_type, &ubuf->f_type) ||
167             __put_user(kbuf->f_bsize, &ubuf->f_bsize) ||
168             __put_user(kbuf->f_blocks, &ubuf->f_blocks) ||
169             __put_user(kbuf->f_bfree, &ubuf->f_bfree) ||
170             __put_user(kbuf->f_bavail, &ubuf->f_bavail) ||
171             __put_user(kbuf->f_files, &ubuf->f_files) ||
172             __put_user(kbuf->f_ffree, &ubuf->f_ffree) ||
173             __put_user(kbuf->f_namelen, &ubuf->f_namelen) ||
174             __put_user(kbuf->f_fsid.val[0], &ubuf->f_fsid.val[0]) ||
175             __put_user(kbuf->f_fsid.val[1], &ubuf->f_fsid.val[1]) ||
176             __put_user(kbuf->f_frsize, &ubuf->f_frsize) ||
177             __put_user(0, &ubuf->f_spare[0]) || 
178             __put_user(0, &ubuf->f_spare[1]) || 
179             __put_user(0, &ubuf->f_spare[2]) || 
180             __put_user(0, &ubuf->f_spare[3]) || 
181             __put_user(0, &ubuf->f_spare[4]))
182                 return -EFAULT;
183         return 0;
184 }
185
186 /*
187  * The following statfs calls are copies of code from fs/open.c and
188  * should be checked against those from time to time
189  */
190 asmlinkage long compat_sys_statfs(const char __user *path, struct compat_statfs __user *buf)
191 {
192         struct nameidata nd;
193         int error;
194
195         error = user_path_walk(path, &nd);
196         if (!error) {
197                 struct kstatfs tmp;
198                 error = vfs_statfs(nd.dentry->d_inode->i_sb, &tmp);
199                 if (!error)
200                         error = put_compat_statfs(buf, &tmp);
201                 path_release(&nd);
202         }
203         return error;
204 }
205
206 asmlinkage long compat_sys_fstatfs(unsigned int fd, struct compat_statfs __user *buf)
207 {
208         struct file * file;
209         struct kstatfs tmp;
210         int error;
211
212         error = -EBADF;
213         file = fget(fd);
214         if (!file)
215                 goto out;
216         error = vfs_statfs(file->f_dentry->d_inode->i_sb, &tmp);
217         if (!error)
218                 error = put_compat_statfs(buf, &tmp);
219         fput(file);
220 out:
221         return error;
222 }
223
224 static int put_compat_statfs64(struct compat_statfs64 __user *ubuf, struct kstatfs *kbuf)
225 {
226         if (sizeof ubuf->f_blocks == 4) {
227                 if ((kbuf->f_blocks | kbuf->f_bfree | kbuf->f_bavail) &
228                     0xffffffff00000000ULL)
229                         return -EOVERFLOW;
230                 /* f_files and f_ffree may be -1; it's okay
231                  * to stuff that into 32 bits */
232                 if (kbuf->f_files != 0xffffffffffffffffULL
233                  && (kbuf->f_files & 0xffffffff00000000ULL))
234                         return -EOVERFLOW;
235                 if (kbuf->f_ffree != 0xffffffffffffffffULL
236                  && (kbuf->f_ffree & 0xffffffff00000000ULL))
237                         return -EOVERFLOW;
238         }
239         if (!access_ok(VERIFY_WRITE, ubuf, sizeof(*ubuf)) ||
240             __put_user(kbuf->f_type, &ubuf->f_type) ||
241             __put_user(kbuf->f_bsize, &ubuf->f_bsize) ||
242             __put_user(kbuf->f_blocks, &ubuf->f_blocks) ||
243             __put_user(kbuf->f_bfree, &ubuf->f_bfree) ||
244             __put_user(kbuf->f_bavail, &ubuf->f_bavail) ||
245             __put_user(kbuf->f_files, &ubuf->f_files) ||
246             __put_user(kbuf->f_ffree, &ubuf->f_ffree) ||
247             __put_user(kbuf->f_namelen, &ubuf->f_namelen) ||
248             __put_user(kbuf->f_fsid.val[0], &ubuf->f_fsid.val[0]) ||
249             __put_user(kbuf->f_fsid.val[1], &ubuf->f_fsid.val[1]) ||
250             __put_user(kbuf->f_frsize, &ubuf->f_frsize))
251                 return -EFAULT;
252         return 0;
253 }
254
255 asmlinkage long compat_sys_statfs64(const char __user *path, compat_size_t sz, struct compat_statfs64 __user *buf)
256 {
257         struct nameidata nd;
258         int error;
259
260         if (sz != sizeof(*buf))
261                 return -EINVAL;
262
263         error = user_path_walk(path, &nd);
264         if (!error) {
265                 struct kstatfs tmp;
266                 error = vfs_statfs(nd.dentry->d_inode->i_sb, &tmp);
267                 if (!error)
268                         error = put_compat_statfs64(buf, &tmp);
269                 path_release(&nd);
270         }
271         return error;
272 }
273
274 asmlinkage long compat_sys_fstatfs64(unsigned int fd, compat_size_t sz, struct compat_statfs64 __user *buf)
275 {
276         struct file * file;
277         struct kstatfs tmp;
278         int error;
279
280         if (sz != sizeof(*buf))
281                 return -EINVAL;
282
283         error = -EBADF;
284         file = fget(fd);
285         if (!file)
286                 goto out;
287         error = vfs_statfs(file->f_dentry->d_inode->i_sb, &tmp);
288         if (!error)
289                 error = put_compat_statfs64(buf, &tmp);
290         fput(file);
291 out:
292         return error;
293 }
294
295 /* ioctl32 stuff, used by sparc64, parisc, s390x, ppc64, x86_64, MIPS */
296
297 #define IOCTL_HASHSIZE 256
298 static struct ioctl_trans *ioctl32_hash_table[IOCTL_HASHSIZE];
299
300 extern struct ioctl_trans ioctl_start[];
301 extern int ioctl_table_size;
302
303 static inline unsigned long ioctl32_hash(unsigned long cmd)
304 {
305         return (((cmd >> 6) ^ (cmd >> 4) ^ cmd)) % IOCTL_HASHSIZE;
306 }
307
308 static void ioctl32_insert_translation(struct ioctl_trans *trans)
309 {
310         unsigned long hash;
311         struct ioctl_trans *t;
312
313         hash = ioctl32_hash (trans->cmd);
314         if (!ioctl32_hash_table[hash])
315                 ioctl32_hash_table[hash] = trans;
316         else {
317                 t = ioctl32_hash_table[hash];
318                 while (t->next)
319                         t = t->next;
320                 trans->next = NULL;
321                 t->next = trans;
322         }
323 }
324
325 static int __init init_sys32_ioctl(void)
326 {
327         int i;
328
329         for (i = 0; i < ioctl_table_size; i++) {
330                 if (ioctl_start[i].next != 0) { 
331                         printk("ioctl translation %d bad\n",i); 
332                         return -1;
333                 }
334
335                 ioctl32_insert_translation(&ioctl_start[i]);
336         }
337         return 0;
338 }
339
340 __initcall(init_sys32_ioctl);
341
342 static void compat_ioctl_error(struct file *filp, unsigned int fd,
343                 unsigned int cmd, unsigned long arg)
344 {
345         char buf[10];
346         char *fn = "?";
347         char *path;
348
349         /* find the name of the device. */
350         path = (char *)__get_free_page(GFP_KERNEL);
351         if (path) {
352                 fn = d_path(filp->f_dentry, filp->f_vfsmnt, path, PAGE_SIZE);
353                 if (IS_ERR(fn))
354                         fn = "?";
355         }
356
357         sprintf(buf,"'%c'", (cmd>>24) & 0x3f);
358         if (!isprint(buf[1]))
359                 sprintf(buf, "%02x", buf[1]);
360         printk("ioctl32(%s:%d): Unknown cmd fd(%d) "
361                         "cmd(%08x){%s} arg(%08x) on %s\n",
362                         current->comm, current->pid,
363                         (int)fd, (unsigned int)cmd, buf,
364                         (unsigned int)arg, fn);
365
366         if (path)
367                 free_page((unsigned long)path);
368 }
369
370 asmlinkage long compat_sys_ioctl(unsigned int fd, unsigned int cmd,
371                                 unsigned long arg)
372 {
373         struct file *filp;
374         int error = -EBADF;
375         struct ioctl_trans *t;
376         int fput_needed;
377
378         filp = fget_light(fd, &fput_needed);
379         if (!filp)
380                 goto out;
381
382         /* RED-PEN how should LSM module know it's handling 32bit? */
383         error = security_file_ioctl(filp, cmd, arg);
384         if (error)
385                 goto out_fput;
386
387         /*
388          * To allow the compat_ioctl handlers to be self contained
389          * we need to check the common ioctls here first.
390          * Just handle them with the standard handlers below.
391          */
392         switch (cmd) {
393         case FIOCLEX:
394         case FIONCLEX:
395         case FIONBIO:
396         case FIOASYNC:
397         case FIOQSIZE:
398                 break;
399
400         case FIBMAP:
401         case FIGETBSZ:
402         case FIONREAD:
403                 if (S_ISREG(filp->f_dentry->d_inode->i_mode))
404                         break;
405                 /*FALL THROUGH*/
406
407         default:
408                 if (filp->f_op && filp->f_op->compat_ioctl) {
409                         error = filp->f_op->compat_ioctl(filp, cmd, arg);
410                         if (error != -ENOIOCTLCMD)
411                                 goto out_fput;
412                 }
413
414                 if (!filp->f_op ||
415                     (!filp->f_op->ioctl && !filp->f_op->unlocked_ioctl))
416                         goto do_ioctl;
417                 break;
418         }
419
420         for (t = ioctl32_hash_table[ioctl32_hash(cmd)]; t; t = t->next) {
421                 if (t->cmd == cmd)
422                         goto found_handler;
423         }
424
425         if (S_ISSOCK(filp->f_dentry->d_inode->i_mode) &&
426             cmd >= SIOCDEVPRIVATE && cmd <= (SIOCDEVPRIVATE + 15)) {
427                 error = siocdevprivate_ioctl(fd, cmd, arg);
428         } else {
429                 static int count;
430
431                 if (++count <= 50)
432                         compat_ioctl_error(filp, fd, cmd, arg);
433                 error = -EINVAL;
434         }
435
436         goto out_fput;
437
438  found_handler:
439         if (t->handler) {
440                 lock_kernel();
441                 error = t->handler(fd, cmd, arg, filp);
442                 unlock_kernel();
443                 goto out_fput;
444         }
445
446  do_ioctl:
447         error = vfs_ioctl(filp, fd, cmd, arg);
448  out_fput:
449         fput_light(filp, fput_needed);
450  out:
451         return error;
452 }
453
454 static int get_compat_flock(struct flock *kfl, struct compat_flock __user *ufl)
455 {
456         if (!access_ok(VERIFY_READ, ufl, sizeof(*ufl)) ||
457             __get_user(kfl->l_type, &ufl->l_type) ||
458             __get_user(kfl->l_whence, &ufl->l_whence) ||
459             __get_user(kfl->l_start, &ufl->l_start) ||
460             __get_user(kfl->l_len, &ufl->l_len) ||
461             __get_user(kfl->l_pid, &ufl->l_pid))
462                 return -EFAULT;
463         return 0;
464 }
465
466 static int put_compat_flock(struct flock *kfl, struct compat_flock __user *ufl)
467 {
468         if (!access_ok(VERIFY_WRITE, ufl, sizeof(*ufl)) ||
469             __put_user(kfl->l_type, &ufl->l_type) ||
470             __put_user(kfl->l_whence, &ufl->l_whence) ||
471             __put_user(kfl->l_start, &ufl->l_start) ||
472             __put_user(kfl->l_len, &ufl->l_len) ||
473             __put_user(kfl->l_pid, &ufl->l_pid))
474                 return -EFAULT;
475         return 0;
476 }
477
478 #ifndef HAVE_ARCH_GET_COMPAT_FLOCK64
479 static int get_compat_flock64(struct flock *kfl, struct compat_flock64 __user *ufl)
480 {
481         if (!access_ok(VERIFY_READ, ufl, sizeof(*ufl)) ||
482             __get_user(kfl->l_type, &ufl->l_type) ||
483             __get_user(kfl->l_whence, &ufl->l_whence) ||
484             __get_user(kfl->l_start, &ufl->l_start) ||
485             __get_user(kfl->l_len, &ufl->l_len) ||
486             __get_user(kfl->l_pid, &ufl->l_pid))
487                 return -EFAULT;
488         return 0;
489 }
490 #endif
491
492 #ifndef HAVE_ARCH_PUT_COMPAT_FLOCK64
493 static int put_compat_flock64(struct flock *kfl, struct compat_flock64 __user *ufl)
494 {
495         if (!access_ok(VERIFY_WRITE, ufl, sizeof(*ufl)) ||
496             __put_user(kfl->l_type, &ufl->l_type) ||
497             __put_user(kfl->l_whence, &ufl->l_whence) ||
498             __put_user(kfl->l_start, &ufl->l_start) ||
499             __put_user(kfl->l_len, &ufl->l_len) ||
500             __put_user(kfl->l_pid, &ufl->l_pid))
501                 return -EFAULT;
502         return 0;
503 }
504 #endif
505
506 asmlinkage long compat_sys_fcntl64(unsigned int fd, unsigned int cmd,
507                 unsigned long arg)
508 {
509         mm_segment_t old_fs;
510         struct flock f;
511         long ret;
512
513         switch (cmd) {
514         case F_GETLK:
515         case F_SETLK:
516         case F_SETLKW:
517                 ret = get_compat_flock(&f, compat_ptr(arg));
518                 if (ret != 0)
519                         break;
520                 old_fs = get_fs();
521                 set_fs(KERNEL_DS);
522                 ret = sys_fcntl(fd, cmd, (unsigned long)&f);
523                 set_fs(old_fs);
524                 if (cmd == F_GETLK && ret == 0) {
525                         /* GETLK was successfule and we need to return the data...
526                          * but it needs to fit in the compat structure.
527                          * l_start shouldn't be too big, unless the original
528                          * start + end is greater than COMPAT_OFF_T_MAX, in which
529                          * case the app was asking for trouble, so we return
530                          * -EOVERFLOW in that case.
531                          * l_len could be too big, in which case we just truncate it,
532                          * and only allow the app to see that part of the conflicting
533                          * lock that might make sense to it anyway
534                          */
535
536                         if (f.l_start > COMPAT_OFF_T_MAX)
537                                 ret = -EOVERFLOW;
538                         if (f.l_len > COMPAT_OFF_T_MAX)
539                                 f.l_len = COMPAT_OFF_T_MAX;
540                         if (ret == 0)
541                                 ret = put_compat_flock(&f, compat_ptr(arg));
542                 }
543                 break;
544
545         case F_GETLK64:
546         case F_SETLK64:
547         case F_SETLKW64:
548                 ret = get_compat_flock64(&f, compat_ptr(arg));
549                 if (ret != 0)
550                         break;
551                 old_fs = get_fs();
552                 set_fs(KERNEL_DS);
553                 ret = sys_fcntl(fd, (cmd == F_GETLK64) ? F_GETLK :
554                                 ((cmd == F_SETLK64) ? F_SETLK : F_SETLKW),
555                                 (unsigned long)&f);
556                 set_fs(old_fs);
557                 if (cmd == F_GETLK64 && ret == 0) {
558                         /* need to return lock information - see above for commentary */
559                         if (f.l_start > COMPAT_LOFF_T_MAX)
560                                 ret = -EOVERFLOW;
561                         if (f.l_len > COMPAT_LOFF_T_MAX)
562                                 f.l_len = COMPAT_LOFF_T_MAX;
563                         if (ret == 0)
564                                 ret = put_compat_flock64(&f, compat_ptr(arg));
565                 }
566                 break;
567
568         default:
569                 ret = sys_fcntl(fd, cmd, arg);
570                 break;
571         }
572         return ret;
573 }
574
575 asmlinkage long compat_sys_fcntl(unsigned int fd, unsigned int cmd,
576                 unsigned long arg)
577 {
578         if ((cmd == F_GETLK64) || (cmd == F_SETLK64) || (cmd == F_SETLKW64))
579                 return -EINVAL;
580         return compat_sys_fcntl64(fd, cmd, arg);
581 }
582
583 asmlinkage long
584 compat_sys_io_setup(unsigned nr_reqs, u32 __user *ctx32p)
585 {
586         long ret;
587         aio_context_t ctx64;
588
589         mm_segment_t oldfs = get_fs();
590         if (unlikely(get_user(ctx64, ctx32p)))
591                 return -EFAULT;
592
593         set_fs(KERNEL_DS);
594         /* The __user pointer cast is valid because of the set_fs() */
595         ret = sys_io_setup(nr_reqs, (aio_context_t __user *) &ctx64);
596         set_fs(oldfs);
597         /* truncating is ok because it's a user address */
598         if (!ret)
599                 ret = put_user((u32) ctx64, ctx32p);
600         return ret;
601 }
602
603 asmlinkage long
604 compat_sys_io_getevents(aio_context_t ctx_id,
605                                  unsigned long min_nr,
606                                  unsigned long nr,
607                                  struct io_event __user *events,
608                                  struct compat_timespec __user *timeout)
609 {
610         long ret;
611         struct timespec t;
612         struct timespec __user *ut = NULL;
613
614         ret = -EFAULT;
615         if (unlikely(!access_ok(VERIFY_WRITE, events, 
616                                 nr * sizeof(struct io_event))))
617                 goto out;
618         if (timeout) {
619                 if (get_compat_timespec(&t, timeout))
620                         goto out;
621
622                 ut = compat_alloc_user_space(sizeof(*ut));
623                 if (copy_to_user(ut, &t, sizeof(t)) )
624                         goto out;
625         } 
626         ret = sys_io_getevents(ctx_id, min_nr, nr, events, ut);
627 out:
628         return ret;
629 }
630
631 static inline long
632 copy_iocb(long nr, u32 __user *ptr32, struct iocb __user * __user *ptr64)
633 {
634         compat_uptr_t uptr;
635         int i;
636
637         for (i = 0; i < nr; ++i) {
638                 if (get_user(uptr, ptr32 + i))
639                         return -EFAULT;
640                 if (put_user(compat_ptr(uptr), ptr64 + i))
641                         return -EFAULT;
642         }
643         return 0;
644 }
645
646 #define MAX_AIO_SUBMITS         (PAGE_SIZE/sizeof(struct iocb *))
647
648 asmlinkage long
649 compat_sys_io_submit(aio_context_t ctx_id, int nr, u32 __user *iocb)
650 {
651         struct iocb __user * __user *iocb64; 
652         long ret;
653
654         if (unlikely(nr < 0))
655                 return -EINVAL;
656
657         if (nr > MAX_AIO_SUBMITS)
658                 nr = MAX_AIO_SUBMITS;
659         
660         iocb64 = compat_alloc_user_space(nr * sizeof(*iocb64));
661         ret = copy_iocb(nr, iocb, iocb64);
662         if (!ret)
663                 ret = sys_io_submit(ctx_id, nr, iocb64);
664         return ret;
665 }
666
667 struct compat_ncp_mount_data {
668         compat_int_t version;
669         compat_uint_t ncp_fd;
670         __compat_uid_t mounted_uid;
671         compat_pid_t wdog_pid;
672         unsigned char mounted_vol[NCP_VOLNAME_LEN + 1];
673         compat_uint_t time_out;
674         compat_uint_t retry_count;
675         compat_uint_t flags;
676         __compat_uid_t uid;
677         __compat_gid_t gid;
678         compat_mode_t file_mode;
679         compat_mode_t dir_mode;
680 };
681
682 struct compat_ncp_mount_data_v4 {
683         compat_int_t version;
684         compat_ulong_t flags;
685         compat_ulong_t mounted_uid;
686         compat_long_t wdog_pid;
687         compat_uint_t ncp_fd;
688         compat_uint_t time_out;
689         compat_uint_t retry_count;
690         compat_ulong_t uid;
691         compat_ulong_t gid;
692         compat_ulong_t file_mode;
693         compat_ulong_t dir_mode;
694 };
695
696 static void *do_ncp_super_data_conv(void *raw_data)
697 {
698         int version = *(unsigned int *)raw_data;
699
700         if (version == 3) {
701                 struct compat_ncp_mount_data *c_n = raw_data;
702                 struct ncp_mount_data *n = raw_data;
703
704                 n->dir_mode = c_n->dir_mode;
705                 n->file_mode = c_n->file_mode;
706                 n->gid = c_n->gid;
707                 n->uid = c_n->uid;
708                 memmove (n->mounted_vol, c_n->mounted_vol, (sizeof (c_n->mounted_vol) + 3 * sizeof (unsigned int)));
709                 n->wdog_pid = c_n->wdog_pid;
710                 n->mounted_uid = c_n->mounted_uid;
711         } else if (version == 4) {
712                 struct compat_ncp_mount_data_v4 *c_n = raw_data;
713                 struct ncp_mount_data_v4 *n = raw_data;
714
715                 n->dir_mode = c_n->dir_mode;
716                 n->file_mode = c_n->file_mode;
717                 n->gid = c_n->gid;
718                 n->uid = c_n->uid;
719                 n->retry_count = c_n->retry_count;
720                 n->time_out = c_n->time_out;
721                 n->ncp_fd = c_n->ncp_fd;
722                 n->wdog_pid = c_n->wdog_pid;
723                 n->mounted_uid = c_n->mounted_uid;
724                 n->flags = c_n->flags;
725         } else if (version != 5) {
726                 return NULL;
727         }
728
729         return raw_data;
730 }
731
732 struct compat_smb_mount_data {
733         compat_int_t version;
734         __compat_uid_t mounted_uid;
735         __compat_uid_t uid;
736         __compat_gid_t gid;
737         compat_mode_t file_mode;
738         compat_mode_t dir_mode;
739 };
740
741 static void *do_smb_super_data_conv(void *raw_data)
742 {
743         struct smb_mount_data *s = raw_data;
744         struct compat_smb_mount_data *c_s = raw_data;
745
746         if (c_s->version != SMB_MOUNT_OLDVERSION)
747                 goto out;
748         s->dir_mode = c_s->dir_mode;
749         s->file_mode = c_s->file_mode;
750         s->gid = c_s->gid;
751         s->uid = c_s->uid;
752         s->mounted_uid = c_s->mounted_uid;
753  out:
754         return raw_data;
755 }
756
757 struct compat_nfs_string {
758         compat_uint_t len;
759         compat_uptr_t data;
760 };
761
762 static inline void compat_nfs_string(struct nfs_string *dst,
763                                      struct compat_nfs_string *src)
764 {
765         dst->data = compat_ptr(src->data);
766         dst->len = src->len;
767 }
768
769 struct compat_nfs4_mount_data_v1 {
770         compat_int_t version;
771         compat_int_t flags;
772         compat_int_t rsize;
773         compat_int_t wsize;
774         compat_int_t timeo;
775         compat_int_t retrans;
776         compat_int_t acregmin;
777         compat_int_t acregmax;
778         compat_int_t acdirmin;
779         compat_int_t acdirmax;
780         struct compat_nfs_string client_addr;
781         struct compat_nfs_string mnt_path;
782         struct compat_nfs_string hostname;
783         compat_uint_t host_addrlen;
784         compat_uptr_t host_addr;
785         compat_int_t proto;
786         compat_int_t auth_flavourlen;
787         compat_uptr_t auth_flavours;
788 };
789
790 static int do_nfs4_super_data_conv(void *raw_data)
791 {
792         int version = *(compat_uint_t *) raw_data;
793
794         if (version == 1) {
795                 struct compat_nfs4_mount_data_v1 *raw = raw_data;
796                 struct nfs4_mount_data *real = raw_data;
797
798                 /* copy the fields backwards */
799                 real->auth_flavours = compat_ptr(raw->auth_flavours);
800                 real->auth_flavourlen = raw->auth_flavourlen;
801                 real->proto = raw->proto;
802                 real->host_addr = compat_ptr(raw->host_addr);
803                 real->host_addrlen = raw->host_addrlen;
804                 compat_nfs_string(&real->hostname, &raw->hostname);
805                 compat_nfs_string(&real->mnt_path, &raw->mnt_path);
806                 compat_nfs_string(&real->client_addr, &raw->client_addr);
807                 real->acdirmax = raw->acdirmax;
808                 real->acdirmin = raw->acdirmin;
809                 real->acregmax = raw->acregmax;
810                 real->acregmin = raw->acregmin;
811                 real->retrans = raw->retrans;
812                 real->timeo = raw->timeo;
813                 real->wsize = raw->wsize;
814                 real->rsize = raw->rsize;
815                 real->flags = raw->flags;
816                 real->version = raw->version;
817         }
818         else {
819                 return -EINVAL;
820         }
821
822         return 0;
823 }
824
825 extern int copy_mount_options (const void __user *, unsigned long *);
826
827 #define SMBFS_NAME      "smbfs"
828 #define NCPFS_NAME      "ncpfs"
829 #define NFS4_NAME       "nfs4"
830
831 asmlinkage long compat_sys_mount(char __user * dev_name, char __user * dir_name,
832                                  char __user * type, unsigned long flags,
833                                  void __user * data)
834 {
835         unsigned long type_page;
836         unsigned long data_page;
837         unsigned long dev_page;
838         char *dir_page;
839         int retval;
840
841         retval = copy_mount_options (type, &type_page);
842         if (retval < 0)
843                 goto out;
844
845         dir_page = getname(dir_name);
846         retval = PTR_ERR(dir_page);
847         if (IS_ERR(dir_page))
848                 goto out1;
849
850         retval = copy_mount_options (dev_name, &dev_page);
851         if (retval < 0)
852                 goto out2;
853
854         retval = copy_mount_options (data, &data_page);
855         if (retval < 0)
856                 goto out3;
857
858         retval = -EINVAL;
859
860         if (type_page && data_page) {
861                 if (!strcmp((char *)type_page, SMBFS_NAME)) {
862                         do_smb_super_data_conv((void *)data_page);
863                 } else if (!strcmp((char *)type_page, NCPFS_NAME)) {
864                         do_ncp_super_data_conv((void *)data_page);
865                 } else if (!strcmp((char *)type_page, NFS4_NAME)) {
866                         if (do_nfs4_super_data_conv((void *) data_page))
867                                 goto out4;
868                 }
869         }
870
871         lock_kernel();
872         retval = do_mount((char*)dev_page, dir_page, (char*)type_page,
873                         flags, (void*)data_page);
874         unlock_kernel();
875
876  out4:
877         free_page(data_page);
878  out3:
879         free_page(dev_page);
880  out2:
881         putname(dir_page);
882  out1:
883         free_page(type_page);
884  out:
885         return retval;
886 }
887
888 #define NAME_OFFSET(de) ((int) ((de)->d_name - (char __user *) (de)))
889 #define COMPAT_ROUND_UP(x) (((x)+sizeof(compat_long_t)-1) & \
890                                 ~(sizeof(compat_long_t)-1))
891
892 struct compat_old_linux_dirent {
893         compat_ulong_t  d_ino;
894         compat_ulong_t  d_offset;
895         unsigned short  d_namlen;
896         char            d_name[1];
897 };
898
899 struct compat_readdir_callback {
900         struct compat_old_linux_dirent __user *dirent;
901         int result;
902 };
903
904 static int compat_fillonedir(void *__buf, const char *name, int namlen,
905                         loff_t offset, ino_t ino, unsigned int d_type)
906 {
907         struct compat_readdir_callback *buf = __buf;
908         struct compat_old_linux_dirent __user *dirent;
909
910         if (buf->result)
911                 return -EINVAL;
912         buf->result++;
913         dirent = buf->dirent;
914         if (!access_ok(VERIFY_WRITE, dirent,
915                         (unsigned long)(dirent->d_name + namlen + 1) -
916                                 (unsigned long)dirent))
917                 goto efault;
918         if (    __put_user(ino, &dirent->d_ino) ||
919                 __put_user(offset, &dirent->d_offset) ||
920                 __put_user(namlen, &dirent->d_namlen) ||
921                 __copy_to_user(dirent->d_name, name, namlen) ||
922                 __put_user(0, dirent->d_name + namlen))
923                 goto efault;
924         return 0;
925 efault:
926         buf->result = -EFAULT;
927         return -EFAULT;
928 }
929
930 asmlinkage long compat_sys_old_readdir(unsigned int fd,
931         struct compat_old_linux_dirent __user *dirent, unsigned int count)
932 {
933         int error;
934         struct file *file;
935         struct compat_readdir_callback buf;
936
937         error = -EBADF;
938         file = fget(fd);
939         if (!file)
940                 goto out;
941
942         buf.result = 0;
943         buf.dirent = dirent;
944
945         error = vfs_readdir(file, compat_fillonedir, &buf);
946         if (error >= 0)
947                 error = buf.result;
948
949         fput(file);
950 out:
951         return error;
952 }
953
954 struct compat_linux_dirent {
955         compat_ulong_t  d_ino;
956         compat_ulong_t  d_off;
957         unsigned short  d_reclen;
958         char            d_name[1];
959 };
960
961 struct compat_getdents_callback {
962         struct compat_linux_dirent __user *current_dir;
963         struct compat_linux_dirent __user *previous;
964         int count;
965         int error;
966 };
967
968 static int compat_filldir(void *__buf, const char *name, int namlen,
969                 loff_t offset, ino_t ino, unsigned int d_type)
970 {
971         struct compat_linux_dirent __user * dirent;
972         struct compat_getdents_callback *buf = __buf;
973         int reclen = COMPAT_ROUND_UP(NAME_OFFSET(dirent) + namlen + 2);
974
975         buf->error = -EINVAL;   /* only used if we fail.. */
976         if (reclen > buf->count)
977                 return -EINVAL;
978         dirent = buf->previous;
979         if (dirent) {
980                 if (__put_user(offset, &dirent->d_off))
981                         goto efault;
982         }
983         dirent = buf->current_dir;
984         if (__put_user(ino, &dirent->d_ino))
985                 goto efault;
986         if (__put_user(reclen, &dirent->d_reclen))
987                 goto efault;
988         if (copy_to_user(dirent->d_name, name, namlen))
989                 goto efault;
990         if (__put_user(0, dirent->d_name + namlen))
991                 goto efault;
992         if (__put_user(d_type, (char  __user *) dirent + reclen - 1))
993                 goto efault;
994         buf->previous = dirent;
995         dirent = (void __user *)dirent + reclen;
996         buf->current_dir = dirent;
997         buf->count -= reclen;
998         return 0;
999 efault:
1000         buf->error = -EFAULT;
1001         return -EFAULT;
1002 }
1003
1004 asmlinkage long compat_sys_getdents(unsigned int fd,
1005                 struct compat_linux_dirent __user *dirent, unsigned int count)
1006 {
1007         struct file * file;
1008         struct compat_linux_dirent __user * lastdirent;
1009         struct compat_getdents_callback buf;
1010         int error;
1011
1012         error = -EFAULT;
1013         if (!access_ok(VERIFY_WRITE, dirent, count))
1014                 goto out;
1015
1016         error = -EBADF;
1017         file = fget(fd);
1018         if (!file)
1019                 goto out;
1020
1021         buf.current_dir = dirent;
1022         buf.previous = NULL;
1023         buf.count = count;
1024         buf.error = 0;
1025
1026         error = vfs_readdir(file, compat_filldir, &buf);
1027         if (error < 0)
1028                 goto out_putf;
1029         error = buf.error;
1030         lastdirent = buf.previous;
1031         if (lastdirent) {
1032                 if (put_user(file->f_pos, &lastdirent->d_off))
1033                         error = -EFAULT;
1034                 else
1035                         error = count - buf.count;
1036         }
1037
1038 out_putf:
1039         fput(file);
1040 out:
1041         return error;
1042 }
1043
1044 #ifndef __ARCH_OMIT_COMPAT_SYS_GETDENTS64
1045 #define COMPAT_ROUND_UP64(x) (((x)+sizeof(u64)-1) & ~(sizeof(u64)-1))
1046
1047 struct compat_getdents_callback64 {
1048         struct linux_dirent64 __user *current_dir;
1049         struct linux_dirent64 __user *previous;
1050         int count;
1051         int error;
1052 };
1053
1054 static int compat_filldir64(void * __buf, const char * name, int namlen, loff_t offset,
1055                      ino_t ino, unsigned int d_type)
1056 {
1057         struct linux_dirent64 __user *dirent;
1058         struct compat_getdents_callback64 *buf = __buf;
1059         int jj = NAME_OFFSET(dirent);
1060         int reclen = COMPAT_ROUND_UP64(jj + namlen + 1);
1061         u64 off;
1062
1063         buf->error = -EINVAL;   /* only used if we fail.. */
1064         if (reclen > buf->count)
1065                 return -EINVAL;
1066         dirent = buf->previous;
1067
1068         if (dirent) {
1069                 if (__put_user_unaligned(offset, &dirent->d_off))
1070                         goto efault;
1071         }
1072         dirent = buf->current_dir;
1073         if (__put_user_unaligned(ino, &dirent->d_ino))
1074                 goto efault;
1075         off = 0;
1076         if (__put_user_unaligned(off, &dirent->d_off))
1077                 goto efault;
1078         if (__put_user(reclen, &dirent->d_reclen))
1079                 goto efault;
1080         if (__put_user(d_type, &dirent->d_type))
1081                 goto efault;
1082         if (copy_to_user(dirent->d_name, name, namlen))
1083                 goto efault;
1084         if (__put_user(0, dirent->d_name + namlen))
1085                 goto efault;
1086         buf->previous = dirent;
1087         dirent = (void __user *)dirent + reclen;
1088         buf->current_dir = dirent;
1089         buf->count -= reclen;
1090         return 0;
1091 efault:
1092         buf->error = -EFAULT;
1093         return -EFAULT;
1094 }
1095
1096 asmlinkage long compat_sys_getdents64(unsigned int fd,
1097                 struct linux_dirent64 __user * dirent, unsigned int count)
1098 {
1099         struct file * file;
1100         struct linux_dirent64 __user * lastdirent;
1101         struct compat_getdents_callback64 buf;
1102         int error;
1103
1104         error = -EFAULT;
1105         if (!access_ok(VERIFY_WRITE, dirent, count))
1106                 goto out;
1107
1108         error = -EBADF;
1109         file = fget(fd);
1110         if (!file)
1111                 goto out;
1112
1113         buf.current_dir = dirent;
1114         buf.previous = NULL;
1115         buf.count = count;
1116         buf.error = 0;
1117
1118         error = vfs_readdir(file, compat_filldir64, &buf);
1119         if (error < 0)
1120                 goto out_putf;
1121         error = buf.error;
1122         lastdirent = buf.previous;
1123         if (lastdirent) {
1124                 typeof(lastdirent->d_off) d_off = file->f_pos;
1125                 __put_user_unaligned(d_off, &lastdirent->d_off);
1126                 error = count - buf.count;
1127         }
1128
1129 out_putf:
1130         fput(file);
1131 out:
1132         return error;
1133 }
1134 #endif /* ! __ARCH_OMIT_COMPAT_SYS_GETDENTS64 */
1135
1136 static ssize_t compat_do_readv_writev(int type, struct file *file,
1137                                const struct compat_iovec __user *uvector,
1138                                unsigned long nr_segs, loff_t *pos)
1139 {
1140         typedef ssize_t (*io_fn_t)(struct file *, char __user *, size_t, loff_t *);
1141         typedef ssize_t (*iov_fn_t)(struct file *, const struct iovec *, unsigned long, loff_t *);
1142
1143         compat_ssize_t tot_len;
1144         struct iovec iovstack[UIO_FASTIOV];
1145         struct iovec *iov=iovstack, *vector;
1146         ssize_t ret;
1147         int seg;
1148         io_fn_t fn;
1149         iov_fn_t fnv;
1150
1151         /*
1152          * SuS says "The readv() function *may* fail if the iovcnt argument
1153          * was less than or equal to 0, or greater than {IOV_MAX}.  Linux has
1154          * traditionally returned zero for zero segments, so...
1155          */
1156         ret = 0;
1157         if (nr_segs == 0)
1158                 goto out;
1159
1160         /*
1161          * First get the "struct iovec" from user memory and
1162          * verify all the pointers
1163          */
1164         ret = -EINVAL;
1165         if ((nr_segs > UIO_MAXIOV) || (nr_segs <= 0))
1166                 goto out;
1167         if (!file->f_op)
1168                 goto out;
1169         if (nr_segs > UIO_FASTIOV) {
1170                 ret = -ENOMEM;
1171                 iov = kmalloc(nr_segs*sizeof(struct iovec), GFP_KERNEL);
1172                 if (!iov)
1173                         goto out;
1174         }
1175         ret = -EFAULT;
1176         if (!access_ok(VERIFY_READ, uvector, nr_segs*sizeof(*uvector)))
1177                 goto out;
1178
1179         /*
1180          * Single unix specification:
1181          * We should -EINVAL if an element length is not >= 0 and fitting an
1182          * ssize_t.  The total length is fitting an ssize_t
1183          *
1184          * Be careful here because iov_len is a size_t not an ssize_t
1185          */
1186         tot_len = 0;
1187         vector = iov;
1188         ret = -EINVAL;
1189         for (seg = 0 ; seg < nr_segs; seg++) {
1190                 compat_ssize_t tmp = tot_len;
1191                 compat_ssize_t len;
1192                 compat_uptr_t buf;
1193
1194                 if (__get_user(len, &uvector->iov_len) ||
1195                     __get_user(buf, &uvector->iov_base)) {
1196                         ret = -EFAULT;
1197                         goto out;
1198                 }
1199                 if (len < 0)    /* size_t not fitting an compat_ssize_t .. */
1200                         goto out;
1201                 tot_len += len;
1202                 if (tot_len < tmp) /* maths overflow on the compat_ssize_t */
1203                         goto out;
1204                 vector->iov_base = compat_ptr(buf);
1205                 vector->iov_len = (compat_size_t) len;
1206                 uvector++;
1207                 vector++;
1208         }
1209         if (tot_len == 0) {
1210                 ret = 0;
1211                 goto out;
1212         }
1213
1214         ret = rw_verify_area(type, file, pos, tot_len);
1215         if (ret < 0)
1216                 goto out;
1217
1218         ret = security_file_permission(file, type == READ ? MAY_READ:MAY_WRITE);
1219         if (ret)
1220                 goto out;
1221
1222         fnv = NULL;
1223         if (type == READ) {
1224                 fn = file->f_op->read;
1225                 fnv = file->f_op->readv;
1226         } else {
1227                 fn = (io_fn_t)file->f_op->write;
1228                 fnv = file->f_op->writev;
1229         }
1230         if (fnv) {
1231                 ret = fnv(file, iov, nr_segs, pos);
1232                 goto out;
1233         }
1234
1235         /* Do it by hand, with file-ops */
1236         ret = 0;
1237         vector = iov;
1238         while (nr_segs > 0) {
1239                 void __user * base;
1240                 size_t len;
1241                 ssize_t nr;
1242
1243                 base = vector->iov_base;
1244                 len = vector->iov_len;
1245                 vector++;
1246                 nr_segs--;
1247
1248                 nr = fn(file, base, len, pos);
1249
1250                 if (nr < 0) {
1251                         if (!ret) ret = nr;
1252                         break;
1253                 }
1254                 ret += nr;
1255                 if (nr != len)
1256                         break;
1257         }
1258 out:
1259         if (iov != iovstack)
1260                 kfree(iov);
1261         if ((ret + (type == READ)) > 0) {
1262                 struct dentry *dentry = file->f_dentry;
1263                 if (type == READ)
1264                         fsnotify_access(dentry);
1265                 else
1266                         fsnotify_modify(dentry);
1267         }
1268         return ret;
1269 }
1270
1271 asmlinkage ssize_t
1272 compat_sys_readv(unsigned long fd, const struct compat_iovec __user *vec, unsigned long vlen)
1273 {
1274         struct file *file;
1275         ssize_t ret = -EBADF;
1276
1277         file = fget(fd);
1278         if (!file)
1279                 return -EBADF;
1280
1281         if (!(file->f_mode & FMODE_READ))
1282                 goto out;
1283
1284         ret = -EINVAL;
1285         if (!file->f_op || (!file->f_op->readv && !file->f_op->read))
1286                 goto out;
1287
1288         ret = compat_do_readv_writev(READ, file, vec, vlen, &file->f_pos);
1289
1290 out:
1291         fput(file);
1292         return ret;
1293 }
1294
1295 asmlinkage ssize_t
1296 compat_sys_writev(unsigned long fd, const struct compat_iovec __user *vec, unsigned long vlen)
1297 {
1298         struct file *file;
1299         ssize_t ret = -EBADF;
1300
1301         file = fget(fd);
1302         if (!file)
1303                 return -EBADF;
1304         if (!(file->f_mode & FMODE_WRITE))
1305                 goto out;
1306
1307         ret = -EINVAL;
1308         if (!file->f_op || (!file->f_op->writev && !file->f_op->write))
1309                 goto out;
1310
1311         ret = compat_do_readv_writev(WRITE, file, vec, vlen, &file->f_pos);
1312
1313 out:
1314         fput(file);
1315         return ret;
1316 }
1317
1318 /*
1319  * Exactly like fs/open.c:sys_open(), except that it doesn't set the
1320  * O_LARGEFILE flag.
1321  */
1322 asmlinkage long
1323 compat_sys_open(const char __user *filename, int flags, int mode)
1324 {
1325         return do_sys_open(AT_FDCWD, filename, flags, mode);
1326 }
1327
1328 /*
1329  * Exactly like fs/open.c:sys_openat(), except that it doesn't set the
1330  * O_LARGEFILE flag.
1331  */
1332 asmlinkage long
1333 compat_sys_openat(unsigned int dfd, const char __user *filename, int flags, int mode)
1334 {
1335         return do_sys_open(dfd, filename, flags, mode);
1336 }
1337
1338 /*
1339  * compat_count() counts the number of arguments/envelopes. It is basically
1340  * a copy of count() from fs/exec.c, except that it works with 32 bit argv
1341  * and envp pointers.
1342  */
1343 static int compat_count(compat_uptr_t __user *argv, int max)
1344 {
1345         int i = 0;
1346
1347         if (argv != NULL) {
1348                 for (;;) {
1349                         compat_uptr_t p;
1350
1351                         if (get_user(p, argv))
1352                                 return -EFAULT;
1353                         if (!p)
1354                                 break;
1355                         argv++;
1356                         if(++i > max)
1357                                 return -E2BIG;
1358                 }
1359         }
1360         return i;
1361 }
1362
1363 /*
1364  * compat_copy_strings() is basically a copy of copy_strings() from fs/exec.c
1365  * except that it works with 32 bit argv and envp pointers.
1366  */
1367 static int compat_copy_strings(int argc, compat_uptr_t __user *argv,
1368                                 struct linux_binprm *bprm)
1369 {
1370         struct page *kmapped_page = NULL;
1371         char *kaddr = NULL;
1372         int ret;
1373
1374         while (argc-- > 0) {
1375                 compat_uptr_t str;
1376                 int len;
1377                 unsigned long pos;
1378
1379                 if (get_user(str, argv+argc) ||
1380                         !(len = strnlen_user(compat_ptr(str), bprm->p))) {
1381                         ret = -EFAULT;
1382                         goto out;
1383                 }
1384
1385                 if (bprm->p < len)  {
1386                         ret = -E2BIG;
1387                         goto out;
1388                 }
1389
1390                 bprm->p -= len;
1391                 /* XXX: add architecture specific overflow check here. */
1392                 pos = bprm->p;
1393
1394                 while (len > 0) {
1395                         int i, new, err;
1396                         int offset, bytes_to_copy;
1397                         struct page *page;
1398
1399                         offset = pos % PAGE_SIZE;
1400                         i = pos/PAGE_SIZE;
1401                         page = bprm->page[i];
1402                         new = 0;
1403                         if (!page) {
1404                                 page = alloc_page(GFP_HIGHUSER);
1405                                 bprm->page[i] = page;
1406                                 if (!page) {
1407                                         ret = -ENOMEM;
1408                                         goto out;
1409                                 }
1410                                 new = 1;
1411                         }
1412
1413                         if (page != kmapped_page) {
1414                                 if (kmapped_page)
1415                                         kunmap(kmapped_page);
1416                                 kmapped_page = page;
1417                                 kaddr = kmap(kmapped_page);
1418                         }
1419                         if (new && offset)
1420                                 memset(kaddr, 0, offset);
1421                         bytes_to_copy = PAGE_SIZE - offset;
1422                         if (bytes_to_copy > len) {
1423                                 bytes_to_copy = len;
1424                                 if (new)
1425                                         memset(kaddr+offset+len, 0,
1426                                                 PAGE_SIZE-offset-len);
1427                         }
1428                         err = copy_from_user(kaddr+offset, compat_ptr(str),
1429                                                 bytes_to_copy);
1430                         if (err) {
1431                                 ret = -EFAULT;
1432                                 goto out;
1433                         }
1434
1435                         pos += bytes_to_copy;
1436                         str += bytes_to_copy;
1437                         len -= bytes_to_copy;
1438                 }
1439         }
1440         ret = 0;
1441 out:
1442         if (kmapped_page)
1443                 kunmap(kmapped_page);
1444         return ret;
1445 }
1446
1447 #ifdef CONFIG_MMU
1448
1449 #define free_arg_pages(bprm) do { } while (0)
1450
1451 #else
1452
1453 static inline void free_arg_pages(struct linux_binprm *bprm)
1454 {
1455         int i;
1456
1457         for (i = 0; i < MAX_ARG_PAGES; i++) {
1458                 if (bprm->page[i])
1459                         __free_page(bprm->page[i]);
1460                 bprm->page[i] = NULL;
1461         }
1462 }
1463
1464 #endif /* CONFIG_MMU */
1465
1466 /*
1467  * compat_do_execve() is mostly a copy of do_execve(), with the exception
1468  * that it processes 32 bit argv and envp pointers.
1469  */
1470 int compat_do_execve(char * filename,
1471         compat_uptr_t __user *argv,
1472         compat_uptr_t __user *envp,
1473         struct pt_regs * regs)
1474 {
1475         struct linux_binprm *bprm;
1476         struct file *file;
1477         int retval;
1478         int i;
1479
1480         retval = -ENOMEM;
1481         bprm = kmalloc(sizeof(*bprm), GFP_KERNEL);
1482         if (!bprm)
1483                 goto out_ret;
1484         memset(bprm, 0, sizeof(*bprm));
1485
1486         file = open_exec(filename);
1487         retval = PTR_ERR(file);
1488         if (IS_ERR(file))
1489                 goto out_kfree;
1490
1491         sched_exec();
1492
1493         bprm->p = PAGE_SIZE*MAX_ARG_PAGES-sizeof(void *);
1494         bprm->file = file;
1495         bprm->filename = filename;
1496         bprm->interp = filename;
1497         bprm->mm = mm_alloc();
1498         retval = -ENOMEM;
1499         if (!bprm->mm)
1500                 goto out_file;
1501
1502         retval = init_new_context(current, bprm->mm);
1503         if (retval < 0)
1504                 goto out_mm;
1505
1506         bprm->argc = compat_count(argv, bprm->p / sizeof(compat_uptr_t));
1507         if ((retval = bprm->argc) < 0)
1508                 goto out_mm;
1509
1510         bprm->envc = compat_count(envp, bprm->p / sizeof(compat_uptr_t));
1511         if ((retval = bprm->envc) < 0)
1512                 goto out_mm;
1513
1514         retval = security_bprm_alloc(bprm);
1515         if (retval)
1516                 goto out;
1517
1518         retval = prepare_binprm(bprm);
1519         if (retval < 0)
1520                 goto out;
1521
1522         retval = copy_strings_kernel(1, &bprm->filename, bprm);
1523         if (retval < 0)
1524                 goto out;
1525
1526         bprm->exec = bprm->p;
1527         retval = compat_copy_strings(bprm->envc, envp, bprm);
1528         if (retval < 0)
1529                 goto out;
1530
1531         retval = compat_copy_strings(bprm->argc, argv, bprm);
1532         if (retval < 0)
1533                 goto out;
1534
1535         retval = search_binary_handler(bprm, regs);
1536         if (retval >= 0) {
1537                 free_arg_pages(bprm);
1538
1539                 /* execve success */
1540                 security_bprm_free(bprm);
1541                 acct_update_integrals(current);
1542                 kfree(bprm);
1543                 return retval;
1544         }
1545
1546 out:
1547         /* Something went wrong, return the inode and free the argument pages*/
1548         for (i = 0 ; i < MAX_ARG_PAGES ; i++) {
1549                 struct page * page = bprm->page[i];
1550                 if (page)
1551                         __free_page(page);
1552         }
1553
1554         if (bprm->security)
1555                 security_bprm_free(bprm);
1556
1557 out_mm:
1558         if (bprm->mm)
1559                 mmdrop(bprm->mm);
1560
1561 out_file:
1562         if (bprm->file) {
1563                 allow_write_access(bprm->file);
1564                 fput(bprm->file);
1565         }
1566
1567 out_kfree:
1568         kfree(bprm);
1569
1570 out_ret:
1571         return retval;
1572 }
1573
1574 #define __COMPAT_NFDBITS       (8 * sizeof(compat_ulong_t))
1575
1576 #define ROUND_UP(x,y) (((x)+(y)-1)/(y))
1577
1578 /*
1579  * Ooo, nasty.  We need here to frob 32-bit unsigned longs to
1580  * 64-bit unsigned longs.
1581  */
1582 static
1583 int compat_get_fd_set(unsigned long nr, compat_ulong_t __user *ufdset,
1584                         unsigned long *fdset)
1585 {
1586         nr = ROUND_UP(nr, __COMPAT_NFDBITS);
1587         if (ufdset) {
1588                 unsigned long odd;
1589
1590                 if (!access_ok(VERIFY_WRITE, ufdset, nr*sizeof(compat_ulong_t)))
1591                         return -EFAULT;
1592
1593                 odd = nr & 1UL;
1594                 nr &= ~1UL;
1595                 while (nr) {
1596                         unsigned long h, l;
1597                         __get_user(l, ufdset);
1598                         __get_user(h, ufdset+1);
1599                         ufdset += 2;
1600                         *fdset++ = h << 32 | l;
1601                         nr -= 2;
1602                 }
1603                 if (odd)
1604                         __get_user(*fdset, ufdset);
1605         } else {
1606                 /* Tricky, must clear full unsigned long in the
1607                  * kernel fdset at the end, this makes sure that
1608                  * actually happens.
1609                  */
1610                 memset(fdset, 0, ((nr + 1) & ~1)*sizeof(compat_ulong_t));
1611         }
1612         return 0;
1613 }
1614
1615 static
1616 void compat_set_fd_set(unsigned long nr, compat_ulong_t __user *ufdset,
1617                         unsigned long *fdset)
1618 {
1619         unsigned long odd;
1620         nr = ROUND_UP(nr, __COMPAT_NFDBITS);
1621
1622         if (!ufdset)
1623                 return;
1624
1625         odd = nr & 1UL;
1626         nr &= ~1UL;
1627         while (nr) {
1628                 unsigned long h, l;
1629                 l = *fdset++;
1630                 h = l >> 32;
1631                 __put_user(l, ufdset);
1632                 __put_user(h, ufdset+1);
1633                 ufdset += 2;
1634                 nr -= 2;
1635         }
1636         if (odd)
1637                 __put_user(*fdset, ufdset);
1638 }
1639
1640
1641 /*
1642  * This is a virtual copy of sys_select from fs/select.c and probably
1643  * should be compared to it from time to time
1644  */
1645 static void *select_bits_alloc(int size)
1646 {
1647         return kmalloc(6 * size, GFP_KERNEL);
1648 }
1649
1650 static void select_bits_free(void *bits, int size)
1651 {
1652         kfree(bits);
1653 }
1654
1655 /*
1656  * We can actually return ERESTARTSYS instead of EINTR, but I'd
1657  * like to be certain this leads to no problems. So I return
1658  * EINTR just for safety.
1659  *
1660  * Update: ERESTARTSYS breaks at least the xview clock binary, so
1661  * I'm trying ERESTARTNOHAND which restart only when you want to.
1662  */
1663 #define MAX_SELECT_SECONDS \
1664         ((unsigned long) (MAX_SCHEDULE_TIMEOUT / HZ)-1)
1665
1666 int compat_core_sys_select(int n, compat_ulong_t __user *inp,
1667         compat_ulong_t __user *outp, compat_ulong_t __user *exp, s64 *timeout)
1668 {
1669         fd_set_bits fds;
1670         char *bits;
1671         int size, max_fdset, ret = -EINVAL;
1672         struct fdtable *fdt;
1673
1674         if (n < 0)
1675                 goto out_nofds;
1676
1677         /* max_fdset can increase, so grab it once to avoid race */
1678         rcu_read_lock();
1679         fdt = files_fdtable(current->files);
1680         max_fdset = fdt->max_fdset;
1681         rcu_read_unlock();
1682         if (n > max_fdset)
1683                 n = max_fdset;
1684
1685         /*
1686          * We need 6 bitmaps (in/out/ex for both incoming and outgoing),
1687          * since we used fdset we need to allocate memory in units of
1688          * long-words.
1689          */
1690         ret = -ENOMEM;
1691         size = FDS_BYTES(n);
1692         bits = select_bits_alloc(size);
1693         if (!bits)
1694                 goto out_nofds;
1695         fds.in      = (unsigned long *)  bits;
1696         fds.out     = (unsigned long *) (bits +   size);
1697         fds.ex      = (unsigned long *) (bits + 2*size);
1698         fds.res_in  = (unsigned long *) (bits + 3*size);
1699         fds.res_out = (unsigned long *) (bits + 4*size);
1700         fds.res_ex  = (unsigned long *) (bits + 5*size);
1701
1702         if ((ret = compat_get_fd_set(n, inp, fds.in)) ||
1703             (ret = compat_get_fd_set(n, outp, fds.out)) ||
1704             (ret = compat_get_fd_set(n, exp, fds.ex)))
1705                 goto out;
1706         zero_fd_set(n, fds.res_in);
1707         zero_fd_set(n, fds.res_out);
1708         zero_fd_set(n, fds.res_ex);
1709
1710         ret = do_select(n, &fds, timeout);
1711
1712         if (ret < 0)
1713                 goto out;
1714         if (!ret) {
1715                 ret = -ERESTARTNOHAND;
1716                 if (signal_pending(current))
1717                         goto out;
1718                 ret = 0;
1719         }
1720
1721         compat_set_fd_set(n, inp, fds.res_in);
1722         compat_set_fd_set(n, outp, fds.res_out);
1723         compat_set_fd_set(n, exp, fds.res_ex);
1724
1725 out:
1726         select_bits_free(bits, size);
1727 out_nofds:
1728         return ret;
1729 }
1730
1731 asmlinkage long compat_sys_select(int n, compat_ulong_t __user *inp,
1732         compat_ulong_t __user *outp, compat_ulong_t __user *exp,
1733         struct compat_timeval __user *tvp)
1734 {
1735         s64 timeout = -1;
1736         struct compat_timeval tv;
1737         int ret;
1738
1739         if (tvp) {
1740                 if (copy_from_user(&tv, tvp, sizeof(tv)))
1741                         return -EFAULT;
1742
1743                 if (tv.tv_sec < 0 || tv.tv_usec < 0)
1744                         return -EINVAL;
1745
1746                 /* Cast to u64 to make GCC stop complaining */
1747                 if ((u64)tv.tv_sec >= (u64)MAX_INT64_SECONDS)
1748                         timeout = -1;   /* infinite */
1749                 else {
1750                         timeout = ROUND_UP(tv.tv_usec, 1000000/HZ);
1751                         timeout += tv.tv_sec * HZ;
1752                 }
1753         }
1754
1755         ret = compat_core_sys_select(n, inp, outp, exp, &timeout);
1756
1757         if (tvp) {
1758                 struct compat_timeval rtv;
1759
1760                 if (current->personality & STICKY_TIMEOUTS)
1761                         goto sticky;
1762                 rtv.tv_usec = jiffies_to_usecs(do_div((*(u64*)&timeout), HZ));
1763                 rtv.tv_sec = timeout;
1764                 if (compat_timeval_compare(&rtv, &tv) >= 0)
1765                         rtv = tv;
1766                 if (copy_to_user(tvp, &rtv, sizeof(rtv))) {
1767 sticky:
1768                         /*
1769                          * If an application puts its timeval in read-only
1770                          * memory, we don't want the Linux-specific update to
1771                          * the timeval to cause a fault after the select has
1772                          * completed successfully. However, because we're not
1773                          * updating the timeval, we can't restart the system
1774                          * call.
1775                          */
1776                         if (ret == -ERESTARTNOHAND)
1777                                 ret = -EINTR;
1778                 }
1779         }
1780
1781         return ret;
1782 }
1783
1784 #ifdef TIF_RESTORE_SIGMASK
1785 asmlinkage long compat_sys_pselect7(int n, compat_ulong_t __user *inp,
1786         compat_ulong_t __user *outp, compat_ulong_t __user *exp,
1787         struct compat_timespec __user *tsp, compat_sigset_t __user *sigmask,
1788         compat_size_t sigsetsize)
1789 {
1790         compat_sigset_t ss32;
1791         sigset_t ksigmask, sigsaved;
1792         s64 timeout = MAX_SCHEDULE_TIMEOUT;
1793         struct compat_timespec ts;
1794         int ret;
1795
1796         if (tsp) {
1797                 if (copy_from_user(&ts, tsp, sizeof(ts)))
1798                         return -EFAULT;
1799
1800                 if (ts.tv_sec < 0 || ts.tv_nsec < 0)
1801                         return -EINVAL;
1802         }
1803
1804         if (sigmask) {
1805                 if (sigsetsize != sizeof(compat_sigset_t))
1806                         return -EINVAL;
1807                 if (copy_from_user(&ss32, sigmask, sizeof(ss32)))
1808                         return -EFAULT;
1809                 sigset_from_compat(&ksigmask, &ss32);
1810
1811                 sigdelsetmask(&ksigmask, sigmask(SIGKILL)|sigmask(SIGSTOP));
1812                 sigprocmask(SIG_SETMASK, &ksigmask, &sigsaved);
1813         }
1814
1815         do {
1816                 if (tsp) {
1817                         if ((unsigned long)ts.tv_sec < MAX_SELECT_SECONDS) {
1818                                 timeout = ROUND_UP(ts.tv_nsec, 1000000000/HZ);
1819                                 timeout += ts.tv_sec * (unsigned long)HZ;
1820                                 ts.tv_sec = 0;
1821                                 ts.tv_nsec = 0;
1822                         } else {
1823                                 ts.tv_sec -= MAX_SELECT_SECONDS;
1824                                 timeout = MAX_SELECT_SECONDS * HZ;
1825                         }
1826                 }
1827
1828                 ret = compat_core_sys_select(n, inp, outp, exp, &timeout);
1829
1830         } while (!ret && !timeout && tsp && (ts.tv_sec || ts.tv_nsec));
1831
1832         if (tsp && !(current->personality & STICKY_TIMEOUTS)) {
1833                 struct compat_timespec rts;
1834
1835                 rts.tv_sec = timeout / HZ;
1836                 rts.tv_nsec = (timeout % HZ) * (NSEC_PER_SEC/HZ);
1837                 if (rts.tv_nsec >= NSEC_PER_SEC) {
1838                         rts.tv_sec++;
1839                         rts.tv_nsec -= NSEC_PER_SEC;
1840                 }
1841                 if (compat_timespec_compare(&rts, &ts) >= 0)
1842                         rts = ts;
1843                 copy_to_user(tsp, &rts, sizeof(rts));
1844         }
1845
1846         if (ret == -ERESTARTNOHAND) {
1847                 /*
1848                  * Don't restore the signal mask yet. Let do_signal() deliver
1849                  * the signal on the way back to userspace, before the signal
1850                  * mask is restored.
1851                  */
1852                 if (sigmask) {
1853                         memcpy(&current->saved_sigmask, &sigsaved,
1854                                         sizeof(sigsaved));
1855                         set_thread_flag(TIF_RESTORE_SIGMASK);
1856                 }
1857         } else if (sigmask)
1858                 sigprocmask(SIG_SETMASK, &sigsaved, NULL);
1859
1860         return ret;
1861 }
1862
1863 asmlinkage long compat_sys_pselect6(int n, compat_ulong_t __user *inp,
1864         compat_ulong_t __user *outp, compat_ulong_t __user *exp,
1865         struct compat_timespec __user *tsp, void __user *sig)
1866 {
1867         compat_size_t sigsetsize = 0;
1868         compat_uptr_t up = 0;
1869
1870         if (sig) {
1871                 if (!access_ok(VERIFY_READ, sig,
1872                                 sizeof(compat_uptr_t)+sizeof(compat_size_t)) ||
1873                         __get_user(up, (compat_uptr_t __user *)sig) ||
1874                         __get_user(sigsetsize,
1875                                 (compat_size_t __user *)(sig+sizeof(up))))
1876                         return -EFAULT;
1877         }
1878         return compat_sys_pselect7(n, inp, outp, exp, tsp, compat_ptr(up),
1879                                         sigsetsize);
1880 }
1881
1882 asmlinkage long compat_sys_ppoll(struct pollfd __user *ufds,
1883         unsigned int nfds, struct compat_timespec __user *tsp,
1884         const compat_sigset_t __user *sigmask, compat_size_t sigsetsize)
1885 {
1886         compat_sigset_t ss32;
1887         sigset_t ksigmask, sigsaved;
1888         struct compat_timespec ts;
1889         s64 timeout = -1;
1890         int ret;
1891
1892         if (tsp) {
1893                 if (copy_from_user(&ts, tsp, sizeof(ts)))
1894                         return -EFAULT;
1895
1896                 /* We assume that ts.tv_sec is always lower than
1897                    the number of seconds that can be expressed in
1898                    an s64. Otherwise the compiler bitches at us */
1899                 timeout = ROUND_UP(ts.tv_nsec, 1000000000/HZ);
1900                 timeout += ts.tv_sec * HZ;
1901         }
1902
1903         if (sigmask) {
1904                 if (sigsetsize != sizeof(compat_sigset_t))
1905                         return -EINVAL;
1906                 if (copy_from_user(&ss32, sigmask, sizeof(ss32)))
1907                         return -EFAULT;
1908                 sigset_from_compat(&ksigmask, &ss32);
1909
1910                 sigdelsetmask(&ksigmask, sigmask(SIGKILL)|sigmask(SIGSTOP));
1911                 sigprocmask(SIG_SETMASK, &ksigmask, &sigsaved);
1912         }
1913
1914         ret = do_sys_poll(ufds, nfds, &timeout);
1915
1916         /* We can restart this syscall, usually */
1917         if (ret == -EINTR) {
1918                 /*
1919                  * Don't restore the signal mask yet. Let do_signal() deliver
1920                  * the signal on the way back to userspace, before the signal
1921                  * mask is restored.
1922                  */
1923                 if (sigmask) {
1924                         memcpy(&current->saved_sigmask, &sigsaved,
1925                                 sizeof(sigsaved));
1926                         set_thread_flag(TIF_RESTORE_SIGMASK);
1927                 }
1928                 ret = -ERESTARTNOHAND;
1929         } else if (sigmask)
1930                 sigprocmask(SIG_SETMASK, &sigsaved, NULL);
1931
1932         if (tsp && timeout >= 0) {
1933                 struct compat_timespec rts;
1934
1935                 if (current->personality & STICKY_TIMEOUTS)
1936                         goto sticky;
1937                 /* Yes, we know it's actually an s64, but it's also positive. */
1938                 rts.tv_nsec = jiffies_to_usecs(do_div((*(u64*)&timeout), HZ)) *
1939                                         1000;
1940                 rts.tv_sec = timeout;
1941                 if (compat_timespec_compare(&rts, &ts) >= 0)
1942                         rts = ts;
1943                 if (copy_to_user(tsp, &rts, sizeof(rts))) {
1944 sticky:
1945                         /*
1946                          * If an application puts its timeval in read-only
1947                          * memory, we don't want the Linux-specific update to
1948                          * the timeval to cause a fault after the select has
1949                          * completed successfully. However, because we're not
1950                          * updating the timeval, we can't restart the system
1951                          * call.
1952                          */
1953                         if (ret == -ERESTARTNOHAND && timeout >= 0)
1954                                 ret = -EINTR;
1955                 }
1956         }
1957
1958         return ret;
1959 }
1960 #endif /* TIF_RESTORE_SIGMASK */
1961
1962 #if defined(CONFIG_NFSD) || defined(CONFIG_NFSD_MODULE)
1963 /* Stuff for NFS server syscalls... */
1964 struct compat_nfsctl_svc {
1965         u16                     svc32_port;
1966         s32                     svc32_nthreads;
1967 };
1968
1969 struct compat_nfsctl_client {
1970         s8                      cl32_ident[NFSCLNT_IDMAX+1];
1971         s32                     cl32_naddr;
1972         struct in_addr          cl32_addrlist[NFSCLNT_ADDRMAX];
1973         s32                     cl32_fhkeytype;
1974         s32                     cl32_fhkeylen;
1975         u8                      cl32_fhkey[NFSCLNT_KEYMAX];
1976 };
1977
1978 struct compat_nfsctl_export {
1979         char            ex32_client[NFSCLNT_IDMAX+1];
1980         char            ex32_path[NFS_MAXPATHLEN+1];
1981         compat_dev_t    ex32_dev;
1982         compat_ino_t    ex32_ino;
1983         compat_int_t    ex32_flags;
1984         __compat_uid_t  ex32_anon_uid;
1985         __compat_gid_t  ex32_anon_gid;
1986 };
1987
1988 struct compat_nfsctl_fdparm {
1989         struct sockaddr         gd32_addr;
1990         s8                      gd32_path[NFS_MAXPATHLEN+1];
1991         compat_int_t            gd32_version;
1992 };
1993
1994 struct compat_nfsctl_fsparm {
1995         struct sockaddr         gd32_addr;
1996         s8                      gd32_path[NFS_MAXPATHLEN+1];
1997         compat_int_t            gd32_maxlen;
1998 };
1999
2000 struct compat_nfsctl_arg {
2001         compat_int_t            ca32_version;   /* safeguard */
2002         union {
2003                 struct compat_nfsctl_svc        u32_svc;
2004                 struct compat_nfsctl_client     u32_client;
2005                 struct compat_nfsctl_export     u32_export;
2006                 struct compat_nfsctl_fdparm     u32_getfd;
2007                 struct compat_nfsctl_fsparm     u32_getfs;
2008         } u;
2009 #define ca32_svc        u.u32_svc
2010 #define ca32_client     u.u32_client
2011 #define ca32_export     u.u32_export
2012 #define ca32_getfd      u.u32_getfd
2013 #define ca32_getfs      u.u32_getfs
2014 };
2015
2016 union compat_nfsctl_res {
2017         __u8                    cr32_getfh[NFS_FHSIZE];
2018         struct knfsd_fh         cr32_getfs;
2019 };
2020
2021 static int compat_nfs_svc_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
2022 {
2023         int err;
2024
2025         err = access_ok(VERIFY_READ, &arg->ca32_svc, sizeof(arg->ca32_svc));
2026         err |= get_user(karg->ca_version, &arg->ca32_version);
2027         err |= __get_user(karg->ca_svc.svc_port, &arg->ca32_svc.svc32_port);
2028         err |= __get_user(karg->ca_svc.svc_nthreads, &arg->ca32_svc.svc32_nthreads);
2029         return (err) ? -EFAULT : 0;
2030 }
2031
2032 static int compat_nfs_clnt_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
2033 {
2034         int err;
2035
2036         err = access_ok(VERIFY_READ, &arg->ca32_client, sizeof(arg->ca32_client));
2037         err |= get_user(karg->ca_version, &arg->ca32_version);
2038         err |= __copy_from_user(&karg->ca_client.cl_ident[0],
2039                           &arg->ca32_client.cl32_ident[0],
2040                           NFSCLNT_IDMAX);
2041         err |= __get_user(karg->ca_client.cl_naddr, &arg->ca32_client.cl32_naddr);
2042         err |= __copy_from_user(&karg->ca_client.cl_addrlist[0],
2043                           &arg->ca32_client.cl32_addrlist[0],
2044                           (sizeof(struct in_addr) * NFSCLNT_ADDRMAX));
2045         err |= __get_user(karg->ca_client.cl_fhkeytype,
2046                       &arg->ca32_client.cl32_fhkeytype);
2047         err |= __get_user(karg->ca_client.cl_fhkeylen,
2048                       &arg->ca32_client.cl32_fhkeylen);
2049         err |= __copy_from_user(&karg->ca_client.cl_fhkey[0],
2050                           &arg->ca32_client.cl32_fhkey[0],
2051                           NFSCLNT_KEYMAX);
2052
2053         return (err) ? -EFAULT : 0;
2054 }
2055
2056 static int compat_nfs_exp_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
2057 {
2058         int err;
2059
2060         err = access_ok(VERIFY_READ, &arg->ca32_export, sizeof(arg->ca32_export));
2061         err |= get_user(karg->ca_version, &arg->ca32_version);
2062         err |= __copy_from_user(&karg->ca_export.ex_client[0],
2063                           &arg->ca32_export.ex32_client[0],
2064                           NFSCLNT_IDMAX);
2065         err |= __copy_from_user(&karg->ca_export.ex_path[0],
2066                           &arg->ca32_export.ex32_path[0],
2067                           NFS_MAXPATHLEN);
2068         err |= __get_user(karg->ca_export.ex_dev,
2069                       &arg->ca32_export.ex32_dev);
2070         err |= __get_user(karg->ca_export.ex_ino,
2071                       &arg->ca32_export.ex32_ino);
2072         err |= __get_user(karg->ca_export.ex_flags,
2073                       &arg->ca32_export.ex32_flags);
2074         err |= __get_user(karg->ca_export.ex_anon_uid,
2075                       &arg->ca32_export.ex32_anon_uid);
2076         err |= __get_user(karg->ca_export.ex_anon_gid,
2077                       &arg->ca32_export.ex32_anon_gid);
2078         SET_UID(karg->ca_export.ex_anon_uid, karg->ca_export.ex_anon_uid);
2079         SET_GID(karg->ca_export.ex_anon_gid, karg->ca_export.ex_anon_gid);
2080
2081         return (err) ? -EFAULT : 0;
2082 }
2083
2084 static int compat_nfs_getfd_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
2085 {
2086         int err;
2087
2088         err = access_ok(VERIFY_READ, &arg->ca32_getfd, sizeof(arg->ca32_getfd));
2089         err |= get_user(karg->ca_version, &arg->ca32_version);
2090         err |= __copy_from_user(&karg->ca_getfd.gd_addr,
2091                           &arg->ca32_getfd.gd32_addr,
2092                           (sizeof(struct sockaddr)));
2093         err |= __copy_from_user(&karg->ca_getfd.gd_path,
2094                           &arg->ca32_getfd.gd32_path,
2095                           (NFS_MAXPATHLEN+1));
2096         err |= __get_user(karg->ca_getfd.gd_version,
2097                       &arg->ca32_getfd.gd32_version);
2098
2099         return (err) ? -EFAULT : 0;
2100 }
2101
2102 static int compat_nfs_getfs_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
2103 {
2104         int err;
2105
2106         err = access_ok(VERIFY_READ, &arg->ca32_getfs, sizeof(arg->ca32_getfs));
2107         err |= get_user(karg->ca_version, &arg->ca32_version);
2108         err |= __copy_from_user(&karg->ca_getfs.gd_addr,
2109                           &arg->ca32_getfs.gd32_addr,
2110                           (sizeof(struct sockaddr)));
2111         err |= __copy_from_user(&karg->ca_getfs.gd_path,
2112                           &arg->ca32_getfs.gd32_path,
2113                           (NFS_MAXPATHLEN+1));
2114         err |= __get_user(karg->ca_getfs.gd_maxlen,
2115                       &arg->ca32_getfs.gd32_maxlen);
2116
2117         return (err) ? -EFAULT : 0;
2118 }
2119
2120 /* This really doesn't need translations, we are only passing
2121  * back a union which contains opaque nfs file handle data.
2122  */
2123 static int compat_nfs_getfh_res_trans(union nfsctl_res *kres, union compat_nfsctl_res __user *res)
2124 {
2125         int err;
2126
2127         err = copy_to_user(res, kres, sizeof(*res));
2128
2129         return (err) ? -EFAULT : 0;
2130 }
2131
2132 asmlinkage long compat_sys_nfsservctl(int cmd, struct compat_nfsctl_arg __user *arg,
2133                                         union compat_nfsctl_res __user *res)
2134 {
2135         struct nfsctl_arg *karg;
2136         union nfsctl_res *kres;
2137         mm_segment_t oldfs;
2138         int err;
2139
2140         karg = kmalloc(sizeof(*karg), GFP_USER);
2141         kres = kmalloc(sizeof(*kres), GFP_USER);
2142         if(!karg || !kres) {
2143                 err = -ENOMEM;
2144                 goto done;
2145         }
2146
2147         switch(cmd) {
2148         case NFSCTL_SVC:
2149                 err = compat_nfs_svc_trans(karg, arg);
2150                 break;
2151
2152         case NFSCTL_ADDCLIENT:
2153                 err = compat_nfs_clnt_trans(karg, arg);
2154                 break;
2155
2156         case NFSCTL_DELCLIENT:
2157                 err = compat_nfs_clnt_trans(karg, arg);
2158                 break;
2159
2160         case NFSCTL_EXPORT:
2161         case NFSCTL_UNEXPORT:
2162                 err = compat_nfs_exp_trans(karg, arg);
2163                 break;
2164
2165         case NFSCTL_GETFD:
2166                 err = compat_nfs_getfd_trans(karg, arg);
2167                 break;
2168
2169         case NFSCTL_GETFS:
2170                 err = compat_nfs_getfs_trans(karg, arg);
2171                 break;
2172
2173         default:
2174                 err = -EINVAL;
2175                 goto done;
2176         }
2177
2178         oldfs = get_fs();
2179         set_fs(KERNEL_DS);
2180         /* The __user pointer casts are valid because of the set_fs() */
2181         err = sys_nfsservctl(cmd, (void __user *) karg, (void __user *) kres);
2182         set_fs(oldfs);
2183
2184         if (err)
2185                 goto done;
2186
2187         if((cmd == NFSCTL_GETFD) ||
2188            (cmd == NFSCTL_GETFS))
2189                 err = compat_nfs_getfh_res_trans(kres, res);
2190
2191 done:
2192         kfree(karg);
2193         kfree(kres);
2194         return err;
2195 }
2196 #else /* !NFSD */
2197 long asmlinkage compat_sys_nfsservctl(int cmd, void *notused, void *notused2)
2198 {
2199         return sys_ni_syscall();
2200 }
2201 #endif