upgrade to linux 2.6.10-1.12_FC2
[linux-2.6.git] / fs / compat.c
1 /*
2  *  linux/fs/compat.c
3  *
4  *  Kernel compatibililty routines for e.g. 32 bit syscall support
5  *  on 64 bit kernels.
6  *
7  *  Copyright (C) 2002       Stephen Rothwell, IBM Corporation
8  *  Copyright (C) 1997-2000  Jakub Jelinek  (jakub@redhat.com)
9  *  Copyright (C) 1998       Eddie C. Dost  (ecd@skynet.be)
10  *  Copyright (C) 2001,2002  Andi Kleen, SuSE Labs 
11  *  Copyright (C) 2003       Pavel Machek (pavel@suse.cz)
12  *
13  *  This program is free software; you can redistribute it and/or modify
14  *  it under the terms of the GNU General Public License version 2 as
15  *  published by the Free Software Foundation.
16  */
17
18 #include <linux/linkage.h>
19 #include <linux/compat.h>
20 #include <linux/errno.h>
21 #include <linux/time.h>
22 #include <linux/fs.h>
23 #include <linux/fcntl.h>
24 #include <linux/namei.h>
25 #include <linux/file.h>
26 #include <linux/vfs.h>
27 #include <linux/ioctl32.h>
28 #include <linux/init.h>
29 #include <linux/sockios.h>      /* for SIOCDEVPRIVATE */
30 #include <linux/smb.h>
31 #include <linux/smb_mount.h>
32 #include <linux/ncp_mount.h>
33 #include <linux/smp_lock.h>
34 #include <linux/syscalls.h>
35 #include <linux/ctype.h>
36 #include <linux/module.h>
37 #include <linux/dirent.h>
38 #include <linux/dnotify.h>
39 #include <linux/highuid.h>
40 #include <linux/sunrpc/svc.h>
41 #include <linux/nfsd/nfsd.h>
42 #include <linux/nfsd/syscall.h>
43 #include <linux/personality.h>
44 #include <linux/rwsem.h>
45
46 #include <net/sock.h>           /* siocdevprivate_ioctl */
47
48 #include <asm/uaccess.h>
49 #include <asm/mmu_context.h>
50
51 /*
52  * Not all architectures have sys_utime, so implement this in terms
53  * of sys_utimes.
54  */
55 asmlinkage long compat_sys_utime(char __user *filename, struct compat_utimbuf __user *t)
56 {
57         struct timeval tv[2];
58
59         if (t) {
60                 if (get_user(tv[0].tv_sec, &t->actime) ||
61                     get_user(tv[1].tv_sec, &t->modtime))
62                         return -EFAULT;
63                 tv[0].tv_usec = 0;
64                 tv[1].tv_usec = 0;
65         }
66         return do_utimes(filename, t ? tv : NULL);
67 }
68
69 asmlinkage long compat_sys_utimes(char __user *filename, struct compat_timeval __user *t)
70 {
71         struct timeval tv[2];
72
73         if (t) { 
74                 if (get_user(tv[0].tv_sec, &t[0].tv_sec) ||
75                     get_user(tv[0].tv_usec, &t[0].tv_usec) ||
76                     get_user(tv[1].tv_sec, &t[1].tv_sec) ||
77                     get_user(tv[1].tv_usec, &t[1].tv_usec))
78                         return -EFAULT; 
79         } 
80         return do_utimes(filename, t ? tv : NULL);
81 }
82
83 asmlinkage long compat_sys_newstat(char __user * filename,
84                 struct compat_stat __user *statbuf)
85 {
86         struct kstat stat;
87         int error = vfs_stat(filename, &stat);
88
89         if (!error)
90                 error = cp_compat_stat(&stat, statbuf);
91         return error;
92 }
93
94 asmlinkage long compat_sys_newlstat(char __user * filename,
95                 struct compat_stat __user *statbuf)
96 {
97         struct kstat stat;
98         int error = vfs_lstat(filename, &stat);
99
100         if (!error)
101                 error = cp_compat_stat(&stat, statbuf);
102         return error;
103 }
104
105 asmlinkage long compat_sys_newfstat(unsigned int fd,
106                 struct compat_stat __user * statbuf)
107 {
108         struct kstat stat;
109         int error = vfs_fstat(fd, &stat);
110
111         if (!error)
112                 error = cp_compat_stat(&stat, statbuf);
113         return error;
114 }
115
116 static int put_compat_statfs(struct compat_statfs __user *ubuf, struct kstatfs *kbuf)
117 {
118         
119         if (sizeof ubuf->f_blocks == 4) {
120                 if ((kbuf->f_blocks | kbuf->f_bfree | kbuf->f_bavail) &
121                     0xffffffff00000000ULL)
122                         return -EOVERFLOW;
123                 /* f_files and f_ffree may be -1; it's okay
124                  * to stuff that into 32 bits */
125                 if (kbuf->f_files != 0xffffffffffffffffULL
126                  && (kbuf->f_files & 0xffffffff00000000ULL))
127                         return -EOVERFLOW;
128                 if (kbuf->f_ffree != 0xffffffffffffffffULL
129                  && (kbuf->f_ffree & 0xffffffff00000000ULL))
130                         return -EOVERFLOW;
131         }
132         if (verify_area(VERIFY_WRITE, ubuf, sizeof(*ubuf)) ||
133             __put_user(kbuf->f_type, &ubuf->f_type) ||
134             __put_user(kbuf->f_bsize, &ubuf->f_bsize) ||
135             __put_user(kbuf->f_blocks, &ubuf->f_blocks) ||
136             __put_user(kbuf->f_bfree, &ubuf->f_bfree) ||
137             __put_user(kbuf->f_bavail, &ubuf->f_bavail) ||
138             __put_user(kbuf->f_files, &ubuf->f_files) ||
139             __put_user(kbuf->f_ffree, &ubuf->f_ffree) ||
140             __put_user(kbuf->f_namelen, &ubuf->f_namelen) ||
141             __put_user(kbuf->f_fsid.val[0], &ubuf->f_fsid.val[0]) ||
142             __put_user(kbuf->f_fsid.val[1], &ubuf->f_fsid.val[1]) ||
143             __put_user(kbuf->f_frsize, &ubuf->f_frsize) ||
144             __put_user(0, &ubuf->f_spare[0]) || 
145             __put_user(0, &ubuf->f_spare[1]) || 
146             __put_user(0, &ubuf->f_spare[2]) || 
147             __put_user(0, &ubuf->f_spare[3]) || 
148             __put_user(0, &ubuf->f_spare[4]))
149                 return -EFAULT;
150         return 0;
151 }
152
153 /*
154  * The following statfs calls are copies of code from fs/open.c and
155  * should be checked against those from time to time
156  */
157 asmlinkage long compat_sys_statfs(const char __user *path, struct compat_statfs __user *buf)
158 {
159         struct nameidata nd;
160         int error;
161
162         error = user_path_walk(path, &nd);
163         if (!error) {
164                 struct kstatfs tmp;
165                 error = vfs_statfs(nd.dentry->d_inode->i_sb, &tmp);
166                 if (!error && put_compat_statfs(buf, &tmp))
167                         error = -EFAULT;
168                 path_release(&nd);
169         }
170         return error;
171 }
172
173 asmlinkage long compat_sys_fstatfs(unsigned int fd, struct compat_statfs __user *buf)
174 {
175         struct file * file;
176         struct kstatfs tmp;
177         int error;
178
179         error = -EBADF;
180         file = fget(fd);
181         if (!file)
182                 goto out;
183         error = vfs_statfs(file->f_dentry->d_inode->i_sb, &tmp);
184         if (!error && put_compat_statfs(buf, &tmp))
185                 error = -EFAULT;
186         fput(file);
187 out:
188         return error;
189 }
190
191 static int put_compat_statfs64(struct compat_statfs64 __user *ubuf, struct kstatfs *kbuf)
192 {
193         if (sizeof ubuf->f_blocks == 4) {
194                 if ((kbuf->f_blocks | kbuf->f_bfree | kbuf->f_bavail) &
195                     0xffffffff00000000ULL)
196                         return -EOVERFLOW;
197                 /* f_files and f_ffree may be -1; it's okay
198                  * to stuff that into 32 bits */
199                 if (kbuf->f_files != 0xffffffffffffffffULL
200                  && (kbuf->f_files & 0xffffffff00000000ULL))
201                         return -EOVERFLOW;
202                 if (kbuf->f_ffree != 0xffffffffffffffffULL
203                  && (kbuf->f_ffree & 0xffffffff00000000ULL))
204                         return -EOVERFLOW;
205         }
206         if (verify_area(VERIFY_WRITE, ubuf, sizeof(*ubuf)) ||
207             __put_user(kbuf->f_type, &ubuf->f_type) ||
208             __put_user(kbuf->f_bsize, &ubuf->f_bsize) ||
209             __put_user(kbuf->f_blocks, &ubuf->f_blocks) ||
210             __put_user(kbuf->f_bfree, &ubuf->f_bfree) ||
211             __put_user(kbuf->f_bavail, &ubuf->f_bavail) ||
212             __put_user(kbuf->f_files, &ubuf->f_files) ||
213             __put_user(kbuf->f_ffree, &ubuf->f_ffree) ||
214             __put_user(kbuf->f_namelen, &ubuf->f_namelen) ||
215             __put_user(kbuf->f_fsid.val[0], &ubuf->f_fsid.val[0]) ||
216             __put_user(kbuf->f_fsid.val[1], &ubuf->f_fsid.val[1]) ||
217             __put_user(kbuf->f_frsize, &ubuf->f_frsize))
218                 return -EFAULT;
219         return 0;
220 }
221
222 asmlinkage long compat_sys_statfs64(const char __user *path, compat_size_t sz, struct compat_statfs64 __user *buf)
223 {
224         struct nameidata nd;
225         int error;
226
227         if (sz != sizeof(*buf))
228                 return -EINVAL;
229
230         error = user_path_walk(path, &nd);
231         if (!error) {
232                 struct kstatfs tmp;
233                 error = vfs_statfs(nd.dentry->d_inode->i_sb, &tmp);
234                 if (!error && put_compat_statfs64(buf, &tmp))
235                         error = -EFAULT;
236                 path_release(&nd);
237         }
238         return error;
239 }
240
241 asmlinkage long compat_sys_fstatfs64(unsigned int fd, compat_size_t sz, struct compat_statfs64 __user *buf)
242 {
243         struct file * file;
244         struct kstatfs tmp;
245         int error;
246
247         if (sz != sizeof(*buf))
248                 return -EINVAL;
249
250         error = -EBADF;
251         file = fget(fd);
252         if (!file)
253                 goto out;
254         error = vfs_statfs(file->f_dentry->d_inode->i_sb, &tmp);
255         if (!error && put_compat_statfs64(buf, &tmp))
256                 error = -EFAULT;
257         fput(file);
258 out:
259         return error;
260 }
261
262 /* ioctl32 stuff, used by sparc64, parisc, s390x, ppc64, x86_64, MIPS */
263
264 #define IOCTL_HASHSIZE 256
265 static struct ioctl_trans *ioctl32_hash_table[IOCTL_HASHSIZE];
266 static DECLARE_RWSEM(ioctl32_sem);
267
268 extern struct ioctl_trans ioctl_start[];
269 extern int ioctl_table_size;
270
271 static inline unsigned long ioctl32_hash(unsigned long cmd)
272 {
273         return (((cmd >> 6) ^ (cmd >> 4) ^ cmd)) % IOCTL_HASHSIZE;
274 }
275
276 static void ioctl32_insert_translation(struct ioctl_trans *trans)
277 {
278         unsigned long hash;
279         struct ioctl_trans *t;
280
281         hash = ioctl32_hash (trans->cmd);
282         if (!ioctl32_hash_table[hash])
283                 ioctl32_hash_table[hash] = trans;
284         else {
285                 t = ioctl32_hash_table[hash];
286                 while (t->next)
287                         t = t->next;
288                 trans->next = NULL;
289                 t->next = trans;
290         }
291 }
292
293 static int __init init_sys32_ioctl(void)
294 {
295         int i;
296
297         for (i = 0; i < ioctl_table_size; i++) {
298                 if (ioctl_start[i].next != 0) { 
299                         printk("ioctl translation %d bad\n",i); 
300                         return -1;
301                 }
302
303                 ioctl32_insert_translation(&ioctl_start[i]);
304         }
305         return 0;
306 }
307
308 __initcall(init_sys32_ioctl);
309
310 int register_ioctl32_conversion(unsigned int cmd,
311                                 ioctl_trans_handler_t handler)
312 {
313         struct ioctl_trans *t;
314         struct ioctl_trans *new_t;
315         unsigned long hash = ioctl32_hash(cmd);
316
317         new_t = kmalloc(sizeof(*new_t), GFP_KERNEL);
318         if (!new_t)
319                 return -ENOMEM;
320
321         down_write(&ioctl32_sem);
322         for (t = ioctl32_hash_table[hash]; t; t = t->next) {
323                 if (t->cmd == cmd) {
324                         printk(KERN_ERR "Trying to register duplicated ioctl32 "
325                                         "handler %x\n", cmd);
326                         up_write(&ioctl32_sem);
327                         kfree(new_t);
328                         return -EINVAL; 
329                 }
330         }
331         new_t->next = NULL;
332         new_t->cmd = cmd;
333         new_t->handler = handler;
334         ioctl32_insert_translation(new_t);
335
336         up_write(&ioctl32_sem);
337         return 0;
338 }
339 EXPORT_SYMBOL(register_ioctl32_conversion);
340
341 static inline int builtin_ioctl(struct ioctl_trans *t)
342
343         return t >= ioctl_start && t < (ioctl_start + ioctl_table_size);
344
345
346 /* Problem: 
347    This function cannot unregister duplicate ioctls, because they are not
348    unique.
349    When they happen we need to extend the prototype to pass the handler too. */
350
351 int unregister_ioctl32_conversion(unsigned int cmd)
352 {
353         unsigned long hash = ioctl32_hash(cmd);
354         struct ioctl_trans *t, *t1;
355
356         down_write(&ioctl32_sem);
357
358         t = ioctl32_hash_table[hash];
359         if (!t) { 
360                 up_write(&ioctl32_sem);
361                 return -EINVAL;
362         } 
363
364         if (t->cmd == cmd) { 
365                 if (builtin_ioctl(t)) {
366                         printk("%p tried to unregister builtin ioctl %x\n",
367                                __builtin_return_address(0), cmd);
368                 } else { 
369                         ioctl32_hash_table[hash] = t->next;
370                         up_write(&ioctl32_sem);
371                         kfree(t);
372                         return 0;
373                 }
374         } 
375         while (t->next) {
376                 t1 = t->next;
377                 if (t1->cmd == cmd) { 
378                         if (builtin_ioctl(t1)) {
379                                 printk("%p tried to unregister builtin "
380                                         "ioctl %x\n",
381                                         __builtin_return_address(0), cmd);
382                                 goto out;
383                         } else { 
384                                 t->next = t1->next;
385                                 up_write(&ioctl32_sem);
386                                 kfree(t1);
387                                 return 0;
388                         }
389                 }
390                 t = t1;
391         }
392         printk(KERN_ERR "Trying to free unknown 32bit ioctl handler %x\n",
393                                 cmd);
394 out:
395         up_write(&ioctl32_sem);
396         return -EINVAL;
397 }
398 EXPORT_SYMBOL(unregister_ioctl32_conversion); 
399
400 asmlinkage long compat_sys_ioctl(unsigned int fd, unsigned int cmd,
401                                 unsigned long arg)
402 {
403         struct file * filp;
404         int error = -EBADF;
405         struct ioctl_trans *t;
406
407         filp = fget(fd);
408         if(!filp)
409                 goto out2;
410
411         if (!filp->f_op || !filp->f_op->ioctl) {
412                 error = sys_ioctl (fd, cmd, arg);
413                 goto out;
414         }
415
416         down_read(&ioctl32_sem);
417
418         t = ioctl32_hash_table[ioctl32_hash (cmd)];
419
420         while (t && t->cmd != cmd)
421                 t = t->next;
422         if (t) {
423                 if (t->handler) { 
424                         lock_kernel();
425                         error = t->handler(fd, cmd, arg, filp);
426                         unlock_kernel();
427                         up_read(&ioctl32_sem);
428                 } else {
429                         up_read(&ioctl32_sem);
430                         error = sys_ioctl(fd, cmd, arg);
431                 }
432         } else {
433                 up_read(&ioctl32_sem);
434                 if (cmd >= SIOCDEVPRIVATE && cmd <= (SIOCDEVPRIVATE + 15)) {
435                         error = siocdevprivate_ioctl(fd, cmd, arg);
436                 } else {
437                         static int count;
438                         if (++count <= 50) {
439                                 char buf[10];
440                                 char *fn = "?";
441                                 char *path;
442
443                                 path = (char *)__get_free_page(GFP_KERNEL);
444
445                                 /* find the name of the device. */
446                                 if (path) {
447                                         fn = d_path(filp->f_dentry,
448                                                 filp->f_vfsmnt, path,
449                                                 PAGE_SIZE);
450                                         if (IS_ERR(fn))
451                                                 fn = "?";
452                                 }
453
454                                 sprintf(buf,"'%c'", (cmd>>24) & 0x3f);
455                                 if (!isprint(buf[1]))
456                                     sprintf(buf, "%02x", buf[1]);
457                                 printk("ioctl32(%s:%d): Unknown cmd fd(%d) "
458                                         "cmd(%08x){%s} arg(%08x) on %s\n",
459                                         current->comm, current->pid,
460                                         (int)fd, (unsigned int)cmd, buf,
461                                         (unsigned int)arg, fn);
462                                 if (path)
463                                         free_page((unsigned long)path);
464                         }
465                         error = -EINVAL;
466                 }
467         }
468 out:
469         fput(filp);
470 out2:
471         return error;
472 }
473
474 static int get_compat_flock(struct flock *kfl, struct compat_flock __user *ufl)
475 {
476         if (!access_ok(VERIFY_READ, ufl, sizeof(*ufl)) ||
477             __get_user(kfl->l_type, &ufl->l_type) ||
478             __get_user(kfl->l_whence, &ufl->l_whence) ||
479             __get_user(kfl->l_start, &ufl->l_start) ||
480             __get_user(kfl->l_len, &ufl->l_len) ||
481             __get_user(kfl->l_pid, &ufl->l_pid))
482                 return -EFAULT;
483         return 0;
484 }
485
486 static int put_compat_flock(struct flock *kfl, struct compat_flock __user *ufl)
487 {
488         if (!access_ok(VERIFY_WRITE, ufl, sizeof(*ufl)) ||
489             __put_user(kfl->l_type, &ufl->l_type) ||
490             __put_user(kfl->l_whence, &ufl->l_whence) ||
491             __put_user(kfl->l_start, &ufl->l_start) ||
492             __put_user(kfl->l_len, &ufl->l_len) ||
493             __put_user(kfl->l_pid, &ufl->l_pid))
494                 return -EFAULT;
495         return 0;
496 }
497
498 #ifndef HAVE_ARCH_GET_COMPAT_FLOCK64
499 static int get_compat_flock64(struct flock *kfl, struct compat_flock64 __user *ufl)
500 {
501         if (!access_ok(VERIFY_READ, ufl, sizeof(*ufl)) ||
502             __get_user(kfl->l_type, &ufl->l_type) ||
503             __get_user(kfl->l_whence, &ufl->l_whence) ||
504             __get_user(kfl->l_start, &ufl->l_start) ||
505             __get_user(kfl->l_len, &ufl->l_len) ||
506             __get_user(kfl->l_pid, &ufl->l_pid))
507                 return -EFAULT;
508         return 0;
509 }
510 #endif
511
512 #ifndef HAVE_ARCH_PUT_COMPAT_FLOCK64
513 static int put_compat_flock64(struct flock *kfl, struct compat_flock64 __user *ufl)
514 {
515         if (!access_ok(VERIFY_WRITE, ufl, sizeof(*ufl)) ||
516             __put_user(kfl->l_type, &ufl->l_type) ||
517             __put_user(kfl->l_whence, &ufl->l_whence) ||
518             __put_user(kfl->l_start, &ufl->l_start) ||
519             __put_user(kfl->l_len, &ufl->l_len) ||
520             __put_user(kfl->l_pid, &ufl->l_pid))
521                 return -EFAULT;
522         return 0;
523 }
524 #endif
525
526 asmlinkage long compat_sys_fcntl64(unsigned int fd, unsigned int cmd,
527                 unsigned long arg)
528 {
529         mm_segment_t old_fs;
530         struct flock f;
531         long ret;
532
533         switch (cmd) {
534         case F_GETLK:
535         case F_SETLK:
536         case F_SETLKW:
537                 ret = get_compat_flock(&f, compat_ptr(arg));
538                 if (ret != 0)
539                         break;
540                 old_fs = get_fs();
541                 set_fs(KERNEL_DS);
542                 ret = sys_fcntl(fd, cmd, (unsigned long)&f);
543                 set_fs(old_fs);
544                 if (cmd == F_GETLK && ret == 0) {
545                         if ((f.l_start >= COMPAT_OFF_T_MAX) ||
546                             ((f.l_start + f.l_len) > COMPAT_OFF_T_MAX))
547                                 ret = -EOVERFLOW;
548                         if (ret == 0)
549                                 ret = put_compat_flock(&f, compat_ptr(arg));
550                 }
551                 break;
552
553         case F_GETLK64:
554         case F_SETLK64:
555         case F_SETLKW64:
556                 ret = get_compat_flock64(&f, compat_ptr(arg));
557                 if (ret != 0)
558                         break;
559                 old_fs = get_fs();
560                 set_fs(KERNEL_DS);
561                 ret = sys_fcntl(fd, (cmd == F_GETLK64) ? F_GETLK :
562                                 ((cmd == F_SETLK64) ? F_SETLK : F_SETLKW),
563                                 (unsigned long)&f);
564                 set_fs(old_fs);
565                 if (cmd == F_GETLK64 && ret == 0) {
566                         if ((f.l_start >= COMPAT_LOFF_T_MAX) ||
567                             ((f.l_start + f.l_len) > COMPAT_LOFF_T_MAX))
568                                 ret = -EOVERFLOW;
569                         if (ret == 0)
570                                 ret = put_compat_flock64(&f, compat_ptr(arg));
571                 }
572                 break;
573
574         default:
575                 ret = sys_fcntl(fd, cmd, arg);
576                 break;
577         }
578         return ret;
579 }
580
581 asmlinkage long compat_sys_fcntl(unsigned int fd, unsigned int cmd,
582                 unsigned long arg)
583 {
584         if ((cmd == F_GETLK64) || (cmd == F_SETLK64) || (cmd == F_SETLKW64))
585                 return -EINVAL;
586         return compat_sys_fcntl64(fd, cmd, arg);
587 }
588
589 asmlinkage long
590 compat_sys_io_setup(unsigned nr_reqs, u32 __user *ctx32p)
591 {
592         long ret;
593         aio_context_t ctx64;
594
595         mm_segment_t oldfs = get_fs();
596         if (unlikely(get_user(ctx64, ctx32p)))
597                 return -EFAULT;
598
599         set_fs(KERNEL_DS);
600         /* The __user pointer cast is valid because of the set_fs() */
601         ret = sys_io_setup(nr_reqs, (aio_context_t __user *) &ctx64);
602         set_fs(oldfs);
603         /* truncating is ok because it's a user address */
604         if (!ret)
605                 ret = put_user((u32) ctx64, ctx32p);
606         return ret;
607 }
608
609 asmlinkage long
610 compat_sys_io_getevents(aio_context_t ctx_id,
611                                  unsigned long min_nr,
612                                  unsigned long nr,
613                                  struct io_event __user *events,
614                                  struct compat_timespec __user *timeout)
615 {
616         long ret;
617         struct timespec t;
618         struct timespec __user *ut = NULL;
619
620         ret = -EFAULT;
621         if (unlikely(!access_ok(VERIFY_WRITE, events, 
622                                 nr * sizeof(struct io_event))))
623                 goto out;
624         if (timeout) {
625                 if (get_compat_timespec(&t, timeout))
626                         goto out;
627
628                 ut = compat_alloc_user_space(sizeof(*ut));
629                 if (copy_to_user(ut, &t, sizeof(t)) )
630                         goto out;
631         } 
632         ret = sys_io_getevents(ctx_id, min_nr, nr, events, ut);
633 out:
634         return ret;
635 }
636
637 static inline long
638 copy_iocb(long nr, u32 __user *ptr32, struct iocb __user * __user *ptr64)
639 {
640         compat_uptr_t uptr;
641         int i;
642
643         for (i = 0; i < nr; ++i) {
644                 if (get_user(uptr, ptr32 + i))
645                         return -EFAULT;
646                 if (put_user(compat_ptr(uptr), ptr64 + i))
647                         return -EFAULT;
648         }
649         return 0;
650 }
651
652 #define MAX_AIO_SUBMITS         (PAGE_SIZE/sizeof(struct iocb *))
653
654 asmlinkage long
655 compat_sys_io_submit(aio_context_t ctx_id, int nr, u32 __user *iocb)
656 {
657         struct iocb __user * __user *iocb64; 
658         long ret;
659
660         if (unlikely(nr < 0))
661                 return -EINVAL;
662
663         if (nr > MAX_AIO_SUBMITS)
664                 nr = MAX_AIO_SUBMITS;
665         
666         iocb64 = compat_alloc_user_space(nr * sizeof(*iocb64));
667         ret = copy_iocb(nr, iocb, iocb64);
668         if (!ret)
669                 ret = sys_io_submit(ctx_id, nr, iocb64);
670         return ret;
671 }
672
673 struct compat_ncp_mount_data {
674         compat_int_t version;
675         compat_uint_t ncp_fd;
676         compat_uid_t mounted_uid;
677         compat_pid_t wdog_pid;
678         unsigned char mounted_vol[NCP_VOLNAME_LEN + 1];
679         compat_uint_t time_out;
680         compat_uint_t retry_count;
681         compat_uint_t flags;
682         compat_uid_t uid;
683         compat_gid_t gid;
684         compat_mode_t file_mode;
685         compat_mode_t dir_mode;
686 };
687
688 struct compat_ncp_mount_data_v4 {
689         compat_int_t version;
690         compat_ulong_t flags;
691         compat_ulong_t mounted_uid;
692         compat_long_t wdog_pid;
693         compat_uint_t ncp_fd;
694         compat_uint_t time_out;
695         compat_uint_t retry_count;
696         compat_ulong_t uid;
697         compat_ulong_t gid;
698         compat_ulong_t file_mode;
699         compat_ulong_t dir_mode;
700 };
701
702 static void *do_ncp_super_data_conv(void *raw_data)
703 {
704         int version = *(unsigned int *)raw_data;
705
706         if (version == 3) {
707                 struct compat_ncp_mount_data *c_n = raw_data;
708                 struct ncp_mount_data *n = raw_data;
709
710                 n->dir_mode = c_n->dir_mode;
711                 n->file_mode = c_n->file_mode;
712                 n->gid = c_n->gid;
713                 n->uid = c_n->uid;
714                 memmove (n->mounted_vol, c_n->mounted_vol, (sizeof (c_n->mounted_vol) + 3 * sizeof (unsigned int)));
715                 n->wdog_pid = c_n->wdog_pid;
716                 n->mounted_uid = c_n->mounted_uid;
717         } else if (version == 4) {
718                 struct compat_ncp_mount_data_v4 *c_n = raw_data;
719                 struct ncp_mount_data_v4 *n = raw_data;
720
721                 n->dir_mode = c_n->dir_mode;
722                 n->file_mode = c_n->file_mode;
723                 n->gid = c_n->gid;
724                 n->uid = c_n->uid;
725                 n->retry_count = c_n->retry_count;
726                 n->time_out = c_n->time_out;
727                 n->ncp_fd = c_n->ncp_fd;
728                 n->wdog_pid = c_n->wdog_pid;
729                 n->mounted_uid = c_n->mounted_uid;
730                 n->flags = c_n->flags;
731         } else if (version != 5) {
732                 return NULL;
733         }
734
735         return raw_data;
736 }
737
738 struct compat_smb_mount_data {
739         compat_int_t version;
740         compat_uid_t mounted_uid;
741         compat_uid_t uid;
742         compat_gid_t gid;
743         compat_mode_t file_mode;
744         compat_mode_t dir_mode;
745 };
746
747 static void *do_smb_super_data_conv(void *raw_data)
748 {
749         struct smb_mount_data *s = raw_data;
750         struct compat_smb_mount_data *c_s = raw_data;
751
752         if (c_s->version != SMB_MOUNT_OLDVERSION)
753                 goto out;
754         s->dir_mode = c_s->dir_mode;
755         s->file_mode = c_s->file_mode;
756         s->gid = c_s->gid;
757         s->uid = c_s->uid;
758         s->mounted_uid = c_s->mounted_uid;
759  out:
760         return raw_data;
761 }
762
763 extern int copy_mount_options (const void __user *, unsigned long *);
764
765 #define SMBFS_NAME      "smbfs"
766 #define NCPFS_NAME      "ncpfs"
767
768 asmlinkage long compat_sys_mount(char __user * dev_name, char __user * dir_name,
769                                  char __user * type, unsigned long flags,
770                                  void __user * data)
771 {
772         unsigned long type_page;
773         unsigned long data_page;
774         unsigned long dev_page;
775         char *dir_page;
776         int retval;
777
778         retval = copy_mount_options (type, &type_page);
779         if (retval < 0)
780                 goto out;
781
782         dir_page = getname(dir_name);
783         retval = PTR_ERR(dir_page);
784         if (IS_ERR(dir_page))
785                 goto out1;
786
787         retval = copy_mount_options (dev_name, &dev_page);
788         if (retval < 0)
789                 goto out2;
790
791         retval = copy_mount_options (data, &data_page);
792         if (retval < 0)
793                 goto out3;
794
795         retval = -EINVAL;
796
797         if (type_page) {
798                 if (!strcmp((char *)type_page, SMBFS_NAME)) {
799                         do_smb_super_data_conv((void *)data_page);
800                 } else if (!strcmp((char *)type_page, NCPFS_NAME)) {
801                         do_ncp_super_data_conv((void *)data_page);
802                 }
803         }
804
805         lock_kernel();
806         retval = do_mount((char*)dev_page, dir_page, (char*)type_page,
807                         flags, (void*)data_page);
808         unlock_kernel();
809
810         free_page(data_page);
811  out3:
812         free_page(dev_page);
813  out2:
814         putname(dir_page);
815  out1:
816         free_page(type_page);
817  out:
818         return retval;
819 }
820
821 #define NAME_OFFSET(de) ((int) ((de)->d_name - (char __user *) (de)))
822 #define COMPAT_ROUND_UP(x) (((x)+sizeof(compat_long_t)-1) & \
823                                 ~(sizeof(compat_long_t)-1))
824
825 struct compat_old_linux_dirent {
826         compat_ulong_t  d_ino;
827         compat_ulong_t  d_offset;
828         unsigned short  d_namlen;
829         char            d_name[1];
830 };
831
832 struct compat_readdir_callback {
833         struct compat_old_linux_dirent __user *dirent;
834         int result;
835 };
836
837 static int compat_fillonedir(void *__buf, const char *name, int namlen,
838                         loff_t offset, ino_t ino, unsigned int d_type)
839 {
840         struct compat_readdir_callback *buf = __buf;
841         struct compat_old_linux_dirent __user *dirent;
842
843         if (buf->result)
844                 return -EINVAL;
845         buf->result++;
846         dirent = buf->dirent;
847         if (!access_ok(VERIFY_WRITE, dirent,
848                         (unsigned long)(dirent->d_name + namlen + 1) -
849                                 (unsigned long)dirent))
850                 goto efault;
851         if (    __put_user(ino, &dirent->d_ino) ||
852                 __put_user(offset, &dirent->d_offset) ||
853                 __put_user(namlen, &dirent->d_namlen) ||
854                 __copy_to_user(dirent->d_name, name, namlen) ||
855                 __put_user(0, dirent->d_name + namlen))
856                 goto efault;
857         return 0;
858 efault:
859         buf->result = -EFAULT;
860         return -EFAULT;
861 }
862
863 asmlinkage long compat_sys_old_readdir(unsigned int fd,
864         struct compat_old_linux_dirent __user *dirent, unsigned int count)
865 {
866         int error;
867         struct file *file;
868         struct compat_readdir_callback buf;
869
870         error = -EBADF;
871         file = fget(fd);
872         if (!file)
873                 goto out;
874
875         buf.result = 0;
876         buf.dirent = dirent;
877
878         error = vfs_readdir(file, compat_fillonedir, &buf);
879         if (error >= 0)
880                 error = buf.result;
881
882         fput(file);
883 out:
884         return error;
885 }
886
887 struct compat_linux_dirent {
888         compat_ulong_t  d_ino;
889         compat_ulong_t  d_off;
890         unsigned short  d_reclen;
891         char            d_name[1];
892 };
893
894 struct compat_getdents_callback {
895         struct compat_linux_dirent __user *current_dir;
896         struct compat_linux_dirent __user *previous;
897         int count;
898         int error;
899 };
900
901 static int compat_filldir(void *__buf, const char *name, int namlen,
902                 loff_t offset, ino_t ino, unsigned int d_type)
903 {
904         struct compat_linux_dirent __user * dirent;
905         struct compat_getdents_callback *buf = __buf;
906         int reclen = COMPAT_ROUND_UP(NAME_OFFSET(dirent) + namlen + 2);
907
908         buf->error = -EINVAL;   /* only used if we fail.. */
909         if (reclen > buf->count)
910                 return -EINVAL;
911         dirent = buf->previous;
912         if (dirent) {
913                 if (__put_user(offset, &dirent->d_off))
914                         goto efault;
915         }
916         dirent = buf->current_dir;
917         if (__put_user(ino, &dirent->d_ino))
918                 goto efault;
919         if (__put_user(reclen, &dirent->d_reclen))
920                 goto efault;
921         if (copy_to_user(dirent->d_name, name, namlen))
922                 goto efault;
923         if (__put_user(0, dirent->d_name + namlen))
924                 goto efault;
925         if (__put_user(d_type, (char  __user *) dirent + reclen - 1))
926                 goto efault;
927         buf->previous = dirent;
928         dirent = (void __user *)dirent + reclen;
929         buf->current_dir = dirent;
930         buf->count -= reclen;
931         return 0;
932 efault:
933         buf->error = -EFAULT;
934         return -EFAULT;
935 }
936
937 asmlinkage long compat_sys_getdents(unsigned int fd,
938                 struct compat_linux_dirent __user *dirent, unsigned int count)
939 {
940         struct file * file;
941         struct compat_linux_dirent __user * lastdirent;
942         struct compat_getdents_callback buf;
943         int error;
944
945         error = -EFAULT;
946         if (!access_ok(VERIFY_WRITE, dirent, count))
947                 goto out;
948
949         error = -EBADF;
950         file = fget(fd);
951         if (!file)
952                 goto out;
953
954         buf.current_dir = dirent;
955         buf.previous = NULL;
956         buf.count = count;
957         buf.error = 0;
958
959         error = vfs_readdir(file, compat_filldir, &buf);
960         if (error < 0)
961                 goto out_putf;
962         error = buf.error;
963         lastdirent = buf.previous;
964         if (lastdirent) {
965                 if (put_user(file->f_pos, &lastdirent->d_off))
966                         error = -EFAULT;
967                 else
968                         error = count - buf.count;
969         }
970
971 out_putf:
972         fput(file);
973 out:
974         return error;
975 }
976
977 #ifndef __ARCH_OMIT_COMPAT_SYS_GETDENTS64
978 #define COMPAT_ROUND_UP64(x) (((x)+sizeof(u64)-1) & ~(sizeof(u64)-1))
979
980 struct compat_getdents_callback64 {
981         struct linux_dirent64 __user *current_dir;
982         struct linux_dirent64 __user *previous;
983         int count;
984         int error;
985 };
986
987 static int compat_filldir64(void * __buf, const char * name, int namlen, loff_t offset,
988                      ino_t ino, unsigned int d_type)
989 {
990         struct linux_dirent64 __user *dirent;
991         struct compat_getdents_callback64 *buf = __buf;
992         int jj = NAME_OFFSET(dirent);
993         int reclen = COMPAT_ROUND_UP64(jj + namlen + 1);
994         u64 off;
995
996         buf->error = -EINVAL;   /* only used if we fail.. */
997         if (reclen > buf->count)
998                 return -EINVAL;
999         dirent = buf->previous;
1000
1001         if (dirent) {
1002                 if (__put_user_unaligned(offset, &dirent->d_off))
1003                         goto efault;
1004         }
1005         dirent = buf->current_dir;
1006         if (__put_user_unaligned(ino, &dirent->d_ino))
1007                 goto efault;
1008         off = 0;
1009         if (__put_user_unaligned(off, &dirent->d_off))
1010                 goto efault;
1011         if (__put_user(reclen, &dirent->d_reclen))
1012                 goto efault;
1013         if (__put_user(d_type, &dirent->d_type))
1014                 goto efault;
1015         if (copy_to_user(dirent->d_name, name, namlen))
1016                 goto efault;
1017         if (__put_user(0, dirent->d_name + namlen))
1018                 goto efault;
1019         buf->previous = dirent;
1020         dirent = (void __user *)dirent + reclen;
1021         buf->current_dir = dirent;
1022         buf->count -= reclen;
1023         return 0;
1024 efault:
1025         buf->error = -EFAULT;
1026         return -EFAULT;
1027 }
1028
1029 asmlinkage long compat_sys_getdents64(unsigned int fd,
1030                 struct linux_dirent64 __user * dirent, unsigned int count)
1031 {
1032         struct file * file;
1033         struct linux_dirent64 __user * lastdirent;
1034         struct compat_getdents_callback64 buf;
1035         int error;
1036
1037         error = -EFAULT;
1038         if (!access_ok(VERIFY_WRITE, dirent, count))
1039                 goto out;
1040
1041         error = -EBADF;
1042         file = fget(fd);
1043         if (!file)
1044                 goto out;
1045
1046         buf.current_dir = dirent;
1047         buf.previous = NULL;
1048         buf.count = count;
1049         buf.error = 0;
1050
1051         error = vfs_readdir(file, compat_filldir64, &buf);
1052         if (error < 0)
1053                 goto out_putf;
1054         error = buf.error;
1055         lastdirent = buf.previous;
1056         if (lastdirent) {
1057                 typeof(lastdirent->d_off) d_off = file->f_pos;
1058                 __put_user_unaligned(d_off, &lastdirent->d_off);
1059                 error = count - buf.count;
1060         }
1061
1062 out_putf:
1063         fput(file);
1064 out:
1065         return error;
1066 }
1067 #endif /* ! __ARCH_OMIT_COMPAT_SYS_GETDENTS64 */
1068
1069 static ssize_t compat_do_readv_writev(int type, struct file *file,
1070                                const struct compat_iovec __user *uvector,
1071                                unsigned long nr_segs, loff_t *pos)
1072 {
1073         typedef ssize_t (*io_fn_t)(struct file *, char __user *, size_t, loff_t *);
1074         typedef ssize_t (*iov_fn_t)(struct file *, const struct iovec *, unsigned long, loff_t *);
1075
1076         compat_ssize_t tot_len;
1077         struct iovec iovstack[UIO_FASTIOV];
1078         struct iovec *iov=iovstack, *vector;
1079         ssize_t ret;
1080         int seg;
1081         io_fn_t fn;
1082         iov_fn_t fnv;
1083         struct inode *inode;
1084
1085         /*
1086          * SuS says "The readv() function *may* fail if the iovcnt argument
1087          * was less than or equal to 0, or greater than {IOV_MAX}.  Linux has
1088          * traditionally returned zero for zero segments, so...
1089          */
1090         ret = 0;
1091         if (nr_segs == 0)
1092                 goto out;
1093
1094         /*
1095          * First get the "struct iovec" from user memory and
1096          * verify all the pointers
1097          */
1098         ret = -EINVAL;
1099         if ((nr_segs > UIO_MAXIOV) || (nr_segs <= 0))
1100                 goto out;
1101         if (!file->f_op)
1102                 goto out;
1103         if (nr_segs > UIO_FASTIOV) {
1104                 ret = -ENOMEM;
1105                 iov = kmalloc(nr_segs*sizeof(struct iovec), GFP_KERNEL);
1106                 if (!iov)
1107                         goto out;
1108         }
1109         ret = -EFAULT;
1110         if (verify_area(VERIFY_READ, uvector, nr_segs*sizeof(*uvector)))
1111                 goto out;
1112
1113         /*
1114          * Single unix specification:
1115          * We should -EINVAL if an element length is not >= 0 and fitting an
1116          * ssize_t.  The total length is fitting an ssize_t
1117          *
1118          * Be careful here because iov_len is a size_t not an ssize_t
1119          */
1120         tot_len = 0;
1121         vector = iov;
1122         ret = -EINVAL;
1123         for (seg = 0 ; seg < nr_segs; seg++) {
1124                 compat_ssize_t tmp = tot_len;
1125                 compat_ssize_t len;
1126                 compat_uptr_t buf;
1127
1128                 if (__get_user(len, &uvector->iov_len) ||
1129                     __get_user(buf, &uvector->iov_base)) {
1130                         ret = -EFAULT;
1131                         goto out;
1132                 }
1133                 if (len < 0)    /* size_t not fitting an compat_ssize_t .. */
1134                         goto out;
1135                 tot_len += len;
1136                 if (tot_len < tmp) /* maths overflow on the compat_ssize_t */
1137                         goto out;
1138                 vector->iov_base = compat_ptr(buf);
1139                 vector->iov_len = (compat_size_t) len;
1140                 uvector++;
1141                 vector++;
1142         }
1143         if (tot_len == 0) {
1144                 ret = 0;
1145                 goto out;
1146         }
1147
1148         inode = file->f_dentry->d_inode;
1149         /* VERIFY_WRITE actually means a read, as we write to user space */
1150         ret = locks_verify_area((type == READ
1151                                  ? FLOCK_VERIFY_READ : FLOCK_VERIFY_WRITE),
1152                                 inode, file, *pos, tot_len);
1153         if (ret)
1154                 goto out;
1155
1156         fnv = NULL;
1157         if (type == READ) {
1158                 fn = file->f_op->read;
1159                 fnv = file->f_op->readv;
1160         } else {
1161                 fn = (io_fn_t)file->f_op->write;
1162                 fnv = file->f_op->writev;
1163         }
1164         if (fnv) {
1165                 ret = fnv(file, iov, nr_segs, pos);
1166                 goto out;
1167         }
1168
1169         /* Do it by hand, with file-ops */
1170         ret = 0;
1171         vector = iov;
1172         while (nr_segs > 0) {
1173                 void __user * base;
1174                 size_t len;
1175                 ssize_t nr;
1176
1177                 base = vector->iov_base;
1178                 len = vector->iov_len;
1179                 vector++;
1180                 nr_segs--;
1181
1182                 nr = fn(file, base, len, pos);
1183
1184                 if (nr < 0) {
1185                         if (!ret) ret = nr;
1186                         break;
1187                 }
1188                 ret += nr;
1189                 if (nr != len)
1190                         break;
1191         }
1192 out:
1193         if (iov != iovstack)
1194                 kfree(iov);
1195         if ((ret + (type == READ)) > 0)
1196                 dnotify_parent(file->f_dentry,
1197                                 (type == READ) ? DN_ACCESS : DN_MODIFY);
1198         return ret;
1199 }
1200
1201 asmlinkage ssize_t
1202 compat_sys_readv(unsigned long fd, const struct compat_iovec __user *vec, unsigned long vlen)
1203 {
1204         struct file *file;
1205         ssize_t ret = -EBADF;
1206
1207         file = fget(fd);
1208         if (!file)
1209                 return -EBADF;
1210
1211         if (!(file->f_mode & FMODE_READ))
1212                 goto out;
1213
1214         ret = -EINVAL;
1215         if (!file->f_op || (!file->f_op->readv && !file->f_op->read))
1216                 goto out;
1217
1218         ret = compat_do_readv_writev(READ, file, vec, vlen, &file->f_pos);
1219
1220 out:
1221         fput(file);
1222         return ret;
1223 }
1224
1225 asmlinkage ssize_t
1226 compat_sys_writev(unsigned long fd, const struct compat_iovec __user *vec, unsigned long vlen)
1227 {
1228         struct file *file;
1229         ssize_t ret = -EBADF;
1230
1231         file = fget(fd);
1232         if (!file)
1233                 return -EBADF;
1234         if (!(file->f_mode & FMODE_WRITE))
1235                 goto out;
1236
1237         ret = -EINVAL;
1238         if (!file->f_op || (!file->f_op->writev && !file->f_op->write))
1239                 goto out;
1240
1241         ret = compat_do_readv_writev(WRITE, file, vec, vlen, &file->f_pos);
1242
1243 out:
1244         fput(file);
1245         return ret;
1246 }
1247
1248 /*
1249  * compat_count() counts the number of arguments/envelopes. It is basically
1250  * a copy of count() from fs/exec.c, except that it works with 32 bit argv
1251  * and envp pointers.
1252  */
1253 static int compat_count(compat_uptr_t __user *argv, int max)
1254 {
1255         int i = 0;
1256
1257         if (argv != NULL) {
1258                 for (;;) {
1259                         compat_uptr_t p;
1260
1261                         if (get_user(p, argv))
1262                                 return -EFAULT;
1263                         if (!p)
1264                                 break;
1265                         argv++;
1266                         if(++i > max)
1267                                 return -E2BIG;
1268                 }
1269         }
1270         return i;
1271 }
1272
1273 /*
1274  * compat_copy_strings() is basically a copy of copy_strings() from fs/exec.c
1275  * except that it works with 32 bit argv and envp pointers.
1276  */
1277 static int compat_copy_strings(int argc, compat_uptr_t __user *argv,
1278                                 struct linux_binprm *bprm)
1279 {
1280         struct page *kmapped_page = NULL;
1281         char *kaddr = NULL;
1282         int ret;
1283
1284         while (argc-- > 0) {
1285                 compat_uptr_t str;
1286                 int len;
1287                 unsigned long pos;
1288
1289                 if (get_user(str, argv+argc) ||
1290                         !(len = strnlen_user(compat_ptr(str), bprm->p))) {
1291                         ret = -EFAULT;
1292                         goto out;
1293                 }
1294
1295                 if (bprm->p < len)  {
1296                         ret = -E2BIG;
1297                         goto out;
1298                 }
1299
1300                 bprm->p -= len;
1301                 /* XXX: add architecture specific overflow check here. */
1302                 pos = bprm->p;
1303
1304                 while (len > 0) {
1305                         int i, new, err;
1306                         int offset, bytes_to_copy;
1307                         struct page *page;
1308
1309                         offset = pos % PAGE_SIZE;
1310                         i = pos/PAGE_SIZE;
1311                         page = bprm->page[i];
1312                         new = 0;
1313                         if (!page) {
1314                                 page = alloc_page(GFP_HIGHUSER);
1315                                 bprm->page[i] = page;
1316                                 if (!page) {
1317                                         ret = -ENOMEM;
1318                                         goto out;
1319                                 }
1320                                 new = 1;
1321                         }
1322
1323                         if (page != kmapped_page) {
1324                                 if (kmapped_page)
1325                                         kunmap(kmapped_page);
1326                                 kmapped_page = page;
1327                                 kaddr = kmap(kmapped_page);
1328                         }
1329                         if (new && offset)
1330                                 memset(kaddr, 0, offset);
1331                         bytes_to_copy = PAGE_SIZE - offset;
1332                         if (bytes_to_copy > len) {
1333                                 bytes_to_copy = len;
1334                                 if (new)
1335                                         memset(kaddr+offset+len, 0,
1336                                                 PAGE_SIZE-offset-len);
1337                         }
1338                         err = copy_from_user(kaddr+offset, compat_ptr(str),
1339                                                 bytes_to_copy);
1340                         if (err) {
1341                                 ret = -EFAULT;
1342                                 goto out;
1343                         }
1344
1345                         pos += bytes_to_copy;
1346                         str += bytes_to_copy;
1347                         len -= bytes_to_copy;
1348                 }
1349         }
1350         ret = 0;
1351 out:
1352         if (kmapped_page)
1353                 kunmap(kmapped_page);
1354         return ret;
1355 }
1356
1357 #ifdef CONFIG_MMU
1358
1359 #define free_arg_pages(bprm) do { } while (0)
1360
1361 #else
1362
1363 static inline void free_arg_pages(struct linux_binprm *bprm)
1364 {
1365         int i;
1366
1367         for (i = 0; i < MAX_ARG_PAGES; i++) {
1368                 if (bprm->page[i])
1369                         __free_page(bprm->page[i]);
1370                 bprm->page[i] = NULL;
1371         }
1372 }
1373
1374 #endif /* CONFIG_MMU */
1375
1376 /*
1377  * compat_do_execve() is mostly a copy of do_execve(), with the exception
1378  * that it processes 32 bit argv and envp pointers.
1379  */
1380 int compat_do_execve(char * filename,
1381         compat_uptr_t __user *argv,
1382         compat_uptr_t __user *envp,
1383         struct pt_regs * regs)
1384 {
1385         struct linux_binprm *bprm;
1386         struct file *file;
1387         int retval;
1388         int i;
1389
1390         retval = -ENOMEM;
1391         bprm = kmalloc(sizeof(*bprm), GFP_KERNEL);
1392         if (!bprm)
1393                 goto out_ret;
1394         memset(bprm, 0, sizeof(*bprm));
1395
1396         file = open_exec(filename);
1397         retval = PTR_ERR(file);
1398         if (IS_ERR(file))
1399                 goto out_kfree;
1400
1401         sched_exec();
1402
1403         bprm->p = PAGE_SIZE*MAX_ARG_PAGES-sizeof(void *);
1404         bprm->file = file;
1405         bprm->filename = filename;
1406         bprm->interp = filename;
1407         bprm->mm = mm_alloc();
1408         retval = -ENOMEM;
1409         if (!bprm->mm)
1410                 goto out_file;
1411
1412         retval = init_new_context(current, bprm->mm);
1413         if (retval < 0)
1414                 goto out_mm;
1415
1416         bprm->argc = compat_count(argv, bprm->p / sizeof(compat_uptr_t));
1417         if ((retval = bprm->argc) < 0)
1418                 goto out_mm;
1419
1420         bprm->envc = compat_count(envp, bprm->p / sizeof(compat_uptr_t));
1421         if ((retval = bprm->envc) < 0)
1422                 goto out_mm;
1423
1424         retval = security_bprm_alloc(bprm);
1425         if (retval)
1426                 goto out;
1427
1428         retval = prepare_binprm(bprm);
1429         if (retval < 0)
1430                 goto out;
1431
1432         retval = copy_strings_kernel(1, &bprm->filename, bprm);
1433         if (retval < 0)
1434                 goto out;
1435
1436         bprm->exec = bprm->p;
1437         retval = compat_copy_strings(bprm->envc, envp, bprm);
1438         if (retval < 0)
1439                 goto out;
1440
1441         retval = compat_copy_strings(bprm->argc, argv, bprm);
1442         if (retval < 0)
1443                 goto out;
1444
1445         retval = search_binary_handler(bprm, regs);
1446         if (retval >= 0) {
1447                 free_arg_pages(bprm);
1448
1449                 /* execve success */
1450                 security_bprm_free(bprm);
1451                 kfree(bprm);
1452                 return retval;
1453         }
1454
1455 out:
1456         /* Something went wrong, return the inode and free the argument pages*/
1457         for (i = 0 ; i < MAX_ARG_PAGES ; i++) {
1458                 struct page * page = bprm->page[i];
1459                 if (page)
1460                         __free_page(page);
1461         }
1462
1463         if (bprm->security)
1464                 security_bprm_free(bprm);
1465
1466 out_mm:
1467         if (bprm->mm)
1468                 mmdrop(bprm->mm);
1469
1470 out_file:
1471         if (bprm->file) {
1472                 allow_write_access(bprm->file);
1473                 fput(bprm->file);
1474         }
1475
1476 out_kfree:
1477         kfree(bprm);
1478
1479 out_ret:
1480         return retval;
1481 }
1482
1483 #define __COMPAT_NFDBITS       (8 * sizeof(compat_ulong_t))
1484
1485 #define ROUND_UP(x,y) (((x)+(y)-1)/(y))
1486
1487 /*
1488  * Ooo, nasty.  We need here to frob 32-bit unsigned longs to
1489  * 64-bit unsigned longs.
1490  */
1491 static inline
1492 int compat_get_fd_set(unsigned long nr, compat_ulong_t __user *ufdset,
1493                         unsigned long *fdset)
1494 {
1495         nr = ROUND_UP(nr, __COMPAT_NFDBITS);
1496         if (ufdset) {
1497                 unsigned long odd;
1498
1499                 if (verify_area(VERIFY_WRITE, ufdset, nr*sizeof(compat_ulong_t)))
1500                         return -EFAULT;
1501
1502                 odd = nr & 1UL;
1503                 nr &= ~1UL;
1504                 while (nr) {
1505                         unsigned long h, l;
1506                         __get_user(l, ufdset);
1507                         __get_user(h, ufdset+1);
1508                         ufdset += 2;
1509                         *fdset++ = h << 32 | l;
1510                         nr -= 2;
1511                 }
1512                 if (odd)
1513                         __get_user(*fdset, ufdset);
1514         } else {
1515                 /* Tricky, must clear full unsigned long in the
1516                  * kernel fdset at the end, this makes sure that
1517                  * actually happens.
1518                  */
1519                 memset(fdset, 0, ((nr + 1) & ~1)*sizeof(compat_ulong_t));
1520         }
1521         return 0;
1522 }
1523
1524 static inline
1525 void compat_set_fd_set(unsigned long nr, compat_ulong_t __user *ufdset,
1526                         unsigned long *fdset)
1527 {
1528         unsigned long odd;
1529         nr = ROUND_UP(nr, __COMPAT_NFDBITS);
1530
1531         if (!ufdset)
1532                 return;
1533
1534         odd = nr & 1UL;
1535         nr &= ~1UL;
1536         while (nr) {
1537                 unsigned long h, l;
1538                 l = *fdset++;
1539                 h = l >> 32;
1540                 __put_user(l, ufdset);
1541                 __put_user(h, ufdset+1);
1542                 ufdset += 2;
1543                 nr -= 2;
1544         }
1545         if (odd)
1546                 __put_user(*fdset, ufdset);
1547 }
1548
1549
1550 /*
1551  * This is a virtual copy of sys_select from fs/select.c and probably
1552  * should be compared to it from time to time
1553  */
1554 static void *select_bits_alloc(int size)
1555 {
1556         return kmalloc(6 * size, GFP_KERNEL);
1557 }
1558
1559 static void select_bits_free(void *bits, int size)
1560 {
1561         kfree(bits);
1562 }
1563
1564 /*
1565  * We can actually return ERESTARTSYS instead of EINTR, but I'd
1566  * like to be certain this leads to no problems. So I return
1567  * EINTR just for safety.
1568  *
1569  * Update: ERESTARTSYS breaks at least the xview clock binary, so
1570  * I'm trying ERESTARTNOHAND which restart only when you want to.
1571  */
1572 #define MAX_SELECT_SECONDS \
1573         ((unsigned long) (MAX_SCHEDULE_TIMEOUT / HZ)-1)
1574
1575 asmlinkage long
1576 compat_sys_select(int n, compat_ulong_t __user *inp, compat_ulong_t __user *outp,
1577                 compat_ulong_t __user *exp, struct compat_timeval __user *tvp)
1578 {
1579         fd_set_bits fds;
1580         char *bits;
1581         long timeout;
1582         int ret, size, max_fdset;
1583
1584         timeout = MAX_SCHEDULE_TIMEOUT;
1585         if (tvp) {
1586                 time_t sec, usec;
1587
1588                 if ((ret = verify_area(VERIFY_READ, tvp, sizeof(*tvp)))
1589                     || (ret = __get_user(sec, &tvp->tv_sec))
1590                     || (ret = __get_user(usec, &tvp->tv_usec)))
1591                         goto out_nofds;
1592
1593                 ret = -EINVAL;
1594                 if (sec < 0 || usec < 0)
1595                         goto out_nofds;
1596
1597                 if ((unsigned long) sec < MAX_SELECT_SECONDS) {
1598                         timeout = ROUND_UP(usec, 1000000/HZ);
1599                         timeout += sec * (unsigned long) HZ;
1600                 }
1601         }
1602
1603         ret = -EINVAL;
1604         if (n < 0)
1605                 goto out_nofds;
1606
1607         /* max_fdset can increase, so grab it once to avoid race */
1608         max_fdset = current->files->max_fdset;
1609         if (n > max_fdset)
1610                 n = max_fdset;
1611
1612         /*
1613          * We need 6 bitmaps (in/out/ex for both incoming and outgoing),
1614          * since we used fdset we need to allocate memory in units of
1615          * long-words.
1616          */
1617         ret = -ENOMEM;
1618         size = FDS_BYTES(n);
1619         bits = select_bits_alloc(size);
1620         if (!bits)
1621                 goto out_nofds;
1622         fds.in      = (unsigned long *)  bits;
1623         fds.out     = (unsigned long *) (bits +   size);
1624         fds.ex      = (unsigned long *) (bits + 2*size);
1625         fds.res_in  = (unsigned long *) (bits + 3*size);
1626         fds.res_out = (unsigned long *) (bits + 4*size);
1627         fds.res_ex  = (unsigned long *) (bits + 5*size);
1628
1629         if ((ret = compat_get_fd_set(n, inp, fds.in)) ||
1630             (ret = compat_get_fd_set(n, outp, fds.out)) ||
1631             (ret = compat_get_fd_set(n, exp, fds.ex)))
1632                 goto out;
1633         zero_fd_set(n, fds.res_in);
1634         zero_fd_set(n, fds.res_out);
1635         zero_fd_set(n, fds.res_ex);
1636
1637         ret = do_select(n, &fds, &timeout);
1638
1639         if (tvp && !(current->personality & STICKY_TIMEOUTS)) {
1640                 time_t sec = 0, usec = 0;
1641                 if (timeout) {
1642                         sec = timeout / HZ;
1643                         usec = timeout % HZ;
1644                         usec *= (1000000/HZ);
1645                 }
1646                 if (put_user(sec, &tvp->tv_sec) ||
1647                     put_user(usec, &tvp->tv_usec))
1648                         ret = -EFAULT;
1649         }
1650
1651         if (ret < 0)
1652                 goto out;
1653         if (!ret) {
1654                 ret = -ERESTARTNOHAND;
1655                 if (signal_pending(current))
1656                         goto out;
1657                 ret = 0;
1658         }
1659
1660         compat_set_fd_set(n, inp, fds.res_in);
1661         compat_set_fd_set(n, outp, fds.res_out);
1662         compat_set_fd_set(n, exp, fds.res_ex);
1663
1664 out:
1665         select_bits_free(bits, size);
1666 out_nofds:
1667         return ret;
1668 }
1669
1670 #if defined(CONFIG_NFSD) || defined(CONFIG_NFSD_MODULE)
1671 /* Stuff for NFS server syscalls... */
1672 struct compat_nfsctl_svc {
1673         u16                     svc32_port;
1674         s32                     svc32_nthreads;
1675 };
1676
1677 struct compat_nfsctl_client {
1678         s8                      cl32_ident[NFSCLNT_IDMAX+1];
1679         s32                     cl32_naddr;
1680         struct in_addr          cl32_addrlist[NFSCLNT_ADDRMAX];
1681         s32                     cl32_fhkeytype;
1682         s32                     cl32_fhkeylen;
1683         u8                      cl32_fhkey[NFSCLNT_KEYMAX];
1684 };
1685
1686 struct compat_nfsctl_export {
1687         char            ex32_client[NFSCLNT_IDMAX+1];
1688         char            ex32_path[NFS_MAXPATHLEN+1];
1689         compat_dev_t    ex32_dev;
1690         compat_ino_t    ex32_ino;
1691         compat_int_t    ex32_flags;
1692         compat_uid_t    ex32_anon_uid;
1693         compat_gid_t    ex32_anon_gid;
1694 };
1695
1696 struct compat_nfsctl_fdparm {
1697         struct sockaddr         gd32_addr;
1698         s8                      gd32_path[NFS_MAXPATHLEN+1];
1699         compat_int_t            gd32_version;
1700 };
1701
1702 struct compat_nfsctl_fsparm {
1703         struct sockaddr         gd32_addr;
1704         s8                      gd32_path[NFS_MAXPATHLEN+1];
1705         compat_int_t            gd32_maxlen;
1706 };
1707
1708 struct compat_nfsctl_arg {
1709         compat_int_t            ca32_version;   /* safeguard */
1710         union {
1711                 struct compat_nfsctl_svc        u32_svc;
1712                 struct compat_nfsctl_client     u32_client;
1713                 struct compat_nfsctl_export     u32_export;
1714                 struct compat_nfsctl_fdparm     u32_getfd;
1715                 struct compat_nfsctl_fsparm     u32_getfs;
1716         } u;
1717 #define ca32_svc        u.u32_svc
1718 #define ca32_client     u.u32_client
1719 #define ca32_export     u.u32_export
1720 #define ca32_getfd      u.u32_getfd
1721 #define ca32_getfs      u.u32_getfs
1722 };
1723
1724 union compat_nfsctl_res {
1725         __u8                    cr32_getfh[NFS_FHSIZE];
1726         struct knfsd_fh         cr32_getfs;
1727 };
1728
1729 static int compat_nfs_svc_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
1730 {
1731         int err;
1732
1733         err = access_ok(VERIFY_READ, &arg->ca32_svc, sizeof(arg->ca32_svc));
1734         err |= get_user(karg->ca_version, &arg->ca32_version);
1735         err |= __get_user(karg->ca_svc.svc_port, &arg->ca32_svc.svc32_port);
1736         err |= __get_user(karg->ca_svc.svc_nthreads, &arg->ca32_svc.svc32_nthreads);
1737         return (err) ? -EFAULT : 0;
1738 }
1739
1740 static int compat_nfs_clnt_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
1741 {
1742         int err;
1743
1744         err = access_ok(VERIFY_READ, &arg->ca32_client, sizeof(arg->ca32_client));
1745         err |= get_user(karg->ca_version, &arg->ca32_version);
1746         err |= __copy_from_user(&karg->ca_client.cl_ident[0],
1747                           &arg->ca32_client.cl32_ident[0],
1748                           NFSCLNT_IDMAX);
1749         err |= __get_user(karg->ca_client.cl_naddr, &arg->ca32_client.cl32_naddr);
1750         err |= __copy_from_user(&karg->ca_client.cl_addrlist[0],
1751                           &arg->ca32_client.cl32_addrlist[0],
1752                           (sizeof(struct in_addr) * NFSCLNT_ADDRMAX));
1753         err |= __get_user(karg->ca_client.cl_fhkeytype,
1754                       &arg->ca32_client.cl32_fhkeytype);
1755         err |= __get_user(karg->ca_client.cl_fhkeylen,
1756                       &arg->ca32_client.cl32_fhkeylen);
1757         err |= __copy_from_user(&karg->ca_client.cl_fhkey[0],
1758                           &arg->ca32_client.cl32_fhkey[0],
1759                           NFSCLNT_KEYMAX);
1760
1761         return (err) ? -EFAULT : 0;
1762 }
1763
1764 static int compat_nfs_exp_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
1765 {
1766         int err;
1767
1768         err = access_ok(VERIFY_READ, &arg->ca32_export, sizeof(arg->ca32_export));
1769         err |= get_user(karg->ca_version, &arg->ca32_version);
1770         err |= __copy_from_user(&karg->ca_export.ex_client[0],
1771                           &arg->ca32_export.ex32_client[0],
1772                           NFSCLNT_IDMAX);
1773         err |= __copy_from_user(&karg->ca_export.ex_path[0],
1774                           &arg->ca32_export.ex32_path[0],
1775                           NFS_MAXPATHLEN);
1776         err |= __get_user(karg->ca_export.ex_dev,
1777                       &arg->ca32_export.ex32_dev);
1778         err |= __get_user(karg->ca_export.ex_ino,
1779                       &arg->ca32_export.ex32_ino);
1780         err |= __get_user(karg->ca_export.ex_flags,
1781                       &arg->ca32_export.ex32_flags);
1782         err |= __get_user(karg->ca_export.ex_anon_uid,
1783                       &arg->ca32_export.ex32_anon_uid);
1784         err |= __get_user(karg->ca_export.ex_anon_gid,
1785                       &arg->ca32_export.ex32_anon_gid);
1786         SET_UID(karg->ca_export.ex_anon_uid, karg->ca_export.ex_anon_uid);
1787         SET_GID(karg->ca_export.ex_anon_gid, karg->ca_export.ex_anon_gid);
1788
1789         return (err) ? -EFAULT : 0;
1790 }
1791
1792 static int compat_nfs_getfd_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
1793 {
1794         int err;
1795
1796         err = access_ok(VERIFY_READ, &arg->ca32_getfd, sizeof(arg->ca32_getfd));
1797         err |= get_user(karg->ca_version, &arg->ca32_version);
1798         err |= __copy_from_user(&karg->ca_getfd.gd_addr,
1799                           &arg->ca32_getfd.gd32_addr,
1800                           (sizeof(struct sockaddr)));
1801         err |= __copy_from_user(&karg->ca_getfd.gd_path,
1802                           &arg->ca32_getfd.gd32_path,
1803                           (NFS_MAXPATHLEN+1));
1804         err |= __get_user(karg->ca_getfd.gd_version,
1805                       &arg->ca32_getfd.gd32_version);
1806
1807         return (err) ? -EFAULT : 0;
1808 }
1809
1810 static int compat_nfs_getfs_trans(struct nfsctl_arg *karg, struct compat_nfsctl_arg __user *arg)
1811 {
1812         int err;
1813
1814         err = access_ok(VERIFY_READ, &arg->ca32_getfs, sizeof(arg->ca32_getfs));
1815         err |= get_user(karg->ca_version, &arg->ca32_version);
1816         err |= __copy_from_user(&karg->ca_getfs.gd_addr,
1817                           &arg->ca32_getfs.gd32_addr,
1818                           (sizeof(struct sockaddr)));
1819         err |= __copy_from_user(&karg->ca_getfs.gd_path,
1820                           &arg->ca32_getfs.gd32_path,
1821                           (NFS_MAXPATHLEN+1));
1822         err |= __get_user(karg->ca_getfs.gd_maxlen,
1823                       &arg->ca32_getfs.gd32_maxlen);
1824
1825         return (err) ? -EFAULT : 0;
1826 }
1827
1828 /* This really doesn't need translations, we are only passing
1829  * back a union which contains opaque nfs file handle data.
1830  */
1831 static int compat_nfs_getfh_res_trans(union nfsctl_res *kres, union compat_nfsctl_res __user *res)
1832 {
1833         int err;
1834
1835         err = copy_to_user(res, kres, sizeof(*res));
1836
1837         return (err) ? -EFAULT : 0;
1838 }
1839
1840 asmlinkage long compat_sys_nfsservctl(int cmd, struct compat_nfsctl_arg __user *arg,
1841                                         union compat_nfsctl_res __user *res)
1842 {
1843         struct nfsctl_arg *karg;
1844         union nfsctl_res *kres;
1845         mm_segment_t oldfs;
1846         int err;
1847
1848         karg = kmalloc(sizeof(*karg), GFP_USER);
1849         kres = kmalloc(sizeof(*kres), GFP_USER);
1850         if(!karg || !kres) {
1851                 err = -ENOMEM;
1852                 goto done;
1853         }
1854
1855         switch(cmd) {
1856         case NFSCTL_SVC:
1857                 err = compat_nfs_svc_trans(karg, arg);
1858                 break;
1859
1860         case NFSCTL_ADDCLIENT:
1861                 err = compat_nfs_clnt_trans(karg, arg);
1862                 break;
1863
1864         case NFSCTL_DELCLIENT:
1865                 err = compat_nfs_clnt_trans(karg, arg);
1866                 break;
1867
1868         case NFSCTL_EXPORT:
1869         case NFSCTL_UNEXPORT:
1870                 err = compat_nfs_exp_trans(karg, arg);
1871                 break;
1872
1873         case NFSCTL_GETFD:
1874                 err = compat_nfs_getfd_trans(karg, arg);
1875                 break;
1876
1877         case NFSCTL_GETFS:
1878                 err = compat_nfs_getfs_trans(karg, arg);
1879                 break;
1880
1881         default:
1882                 err = -EINVAL;
1883                 goto done;
1884         }
1885
1886         oldfs = get_fs();
1887         set_fs(KERNEL_DS);
1888         /* The __user pointer casts are valid because of the set_fs() */
1889         err = sys_nfsservctl(cmd, (void __user *) karg, (void __user *) kres);
1890         set_fs(oldfs);
1891
1892         if (err)
1893                 goto done;
1894
1895         if((cmd == NFSCTL_GETFD) ||
1896            (cmd == NFSCTL_GETFS))
1897                 err = compat_nfs_getfh_res_trans(kres, res);
1898
1899 done:
1900         kfree(karg);
1901         kfree(kres);
1902         return err;
1903 }
1904 #else /* !NFSD */
1905 long asmlinkage compat_sys_nfsservctl(int cmd, void *notused, void *notused2)
1906 {
1907         return sys_ni_syscall();
1908 }
1909 #endif