This commit was manufactured by cvs2svn to create branch 'vserver'.
[linux-2.6.git] / kernel / compat.c
index f05cda3..33880d2 100644 (file)
 
 #include <asm/uaccess.h>
 
-int get_compat_timespec(struct timespec *ts, const struct compat_timespec *cts)
+int get_compat_timespec(struct timespec *ts, const struct compat_timespec __user *cts)
 {
        return (verify_area(VERIFY_READ, cts, sizeof(*cts)) ||
                        __get_user(ts->tv_sec, &cts->tv_sec) ||
                        __get_user(ts->tv_nsec, &cts->tv_nsec)) ? -EFAULT : 0;
 }
 
-int put_compat_timespec(const struct timespec *ts, struct compat_timespec *cts)
+int put_compat_timespec(const struct timespec *ts, struct compat_timespec __user *cts)
 {
        return (verify_area(VERIFY_WRITE, cts, sizeof(*cts)) ||
                        __put_user(ts->tv_sec, &cts->tv_sec) ||
@@ -40,7 +40,7 @@ int put_compat_timespec(const struct timespec *ts, struct compat_timespec *cts)
 static long compat_nanosleep_restart(struct restart_block *restart)
 {
        unsigned long expire = restart->arg0, now = jiffies;
-       struct compat_timespec *rmtp;
+       struct compat_timespec __user *rmtp;
 
        /* Did it expire while we handled signals? */
        if (!time_after(expire, now))
@@ -51,7 +51,7 @@ static long compat_nanosleep_restart(struct restart_block *restart)
        if (expire == 0)
                return 0;
 
-       rmtp = (struct compat_timespec *)restart->arg1;
+       rmtp = (struct compat_timespec __user *)restart->arg1;
        if (rmtp) {
                struct compat_timespec ct;
                struct timespec t;
@@ -66,8 +66,8 @@ static long compat_nanosleep_restart(struct restart_block *restart)
        return -ERESTART_RESTARTBLOCK;
 }
 
-asmlinkage long compat_sys_nanosleep(struct compat_timespec *rqtp,
-               struct compat_timespec *rmtp)
+asmlinkage long compat_sys_nanosleep(struct compat_timespec __user *rqtp,
+               struct compat_timespec __user *rmtp)
 {
        struct timespec t;
        struct restart_block *restart;
@@ -98,7 +98,7 @@ asmlinkage long compat_sys_nanosleep(struct compat_timespec *rqtp,
 }
 
 static inline long get_compat_itimerval(struct itimerval *o,
-               struct compat_itimerval *i)
+               struct compat_itimerval __user *i)
 {
        return (!access_ok(VERIFY_READ, i, sizeof(*i)) ||
                (__get_user(o->it_interval.tv_sec, &i->it_interval.tv_sec) |
@@ -107,7 +107,7 @@ static inline long get_compat_itimerval(struct itimerval *o,
                 __get_user(o->it_value.tv_usec, &i->it_value.tv_usec)));
 }
 
-static inline long put_compat_itimerval(struct compat_itimerval *o,
+static inline long put_compat_itimerval(struct compat_itimerval __user *o,
                struct itimerval *i)
 {
        return (!access_ok(VERIFY_WRITE, o, sizeof(*o)) ||
@@ -117,7 +117,8 @@ static inline long put_compat_itimerval(struct compat_itimerval *o,
                 __put_user(i->it_value.tv_usec, &o->it_value.tv_usec)));
 }
 
-asmlinkage long compat_sys_getitimer(int which, struct compat_itimerval *it)
+asmlinkage long compat_sys_getitimer(int which,
+               struct compat_itimerval __user *it)
 {
        struct itimerval kit;
        int error;
@@ -128,8 +129,9 @@ asmlinkage long compat_sys_getitimer(int which, struct compat_itimerval *it)
        return error;
 }
 
-asmlinkage long compat_sys_setitimer(int which, struct compat_itimerval *in,
-               struct compat_itimerval *out)
+asmlinkage long compat_sys_setitimer(int which,
+               struct compat_itimerval __user *in,
+               struct compat_itimerval __user *out)
 {
        struct itimerval kin, kout;
        int error;
@@ -148,7 +150,7 @@ asmlinkage long compat_sys_setitimer(int which, struct compat_itimerval *in,
        return 0;
 }
 
-asmlinkage long compat_sys_times(struct compat_tms *tbuf)
+asmlinkage long compat_sys_times(struct compat_tms __user *tbuf)
 {
        /*
         *      In the SMP world we might just be unlucky and have one of
@@ -158,10 +160,39 @@ asmlinkage long compat_sys_times(struct compat_tms *tbuf)
         */
        if (tbuf) {
                struct compat_tms tmp;
-               tmp.tms_utime = compat_jiffies_to_clock_t(current->utime);
-               tmp.tms_stime = compat_jiffies_to_clock_t(current->stime);
-               tmp.tms_cutime = compat_jiffies_to_clock_t(current->cutime);
-               tmp.tms_cstime = compat_jiffies_to_clock_t(current->cstime);
+               struct task_struct *tsk = current;
+               struct task_struct *t;
+               unsigned long utime, stime, cutime, cstime;
+
+               read_lock(&tasklist_lock);
+               utime = tsk->signal->utime;
+               stime = tsk->signal->stime;
+               t = tsk;
+               do {
+                       utime += t->utime;
+                       stime += t->stime;
+                       t = next_thread(t);
+               } while (t != tsk);
+
+               /*
+                * While we have tasklist_lock read-locked, no dying thread
+                * can be updating current->signal->[us]time.  Instead,
+                * we got their counts included in the live thread loop.
+                * However, another thread can come in right now and
+                * do a wait call that updates current->signal->c[us]time.
+                * To make sure we always see that pair updated atomically,
+                * we take the siglock around fetching them.
+                */
+               spin_lock_irq(&tsk->sighand->siglock);
+               cutime = tsk->signal->cutime;
+               cstime = tsk->signal->cstime;
+               spin_unlock_irq(&tsk->sighand->siglock);
+               read_unlock(&tasklist_lock);
+
+               tmp.tms_utime = compat_jiffies_to_clock_t(utime);
+               tmp.tms_stime = compat_jiffies_to_clock_t(stime);
+               tmp.tms_cutime = compat_jiffies_to_clock_t(cutime);
+               tmp.tms_cstime = compat_jiffies_to_clock_t(cstime);
                if (copy_to_user(tbuf, &tmp, sizeof(tmp)))
                        return -EFAULT;
        }
@@ -173,22 +204,22 @@ asmlinkage long compat_sys_times(struct compat_tms *tbuf)
  * types that can be passed to put_user()/get_user().
  */
 
-asmlinkage long compat_sys_sigpending(compat_old_sigset_t *set)
+asmlinkage long compat_sys_sigpending(compat_old_sigset_t __user *set)
 {
        old_sigset_t s;
        long ret;
        mm_segment_t old_fs = get_fs();
 
        set_fs(KERNEL_DS);
-       ret = sys_sigpending(&s);
+       ret = sys_sigpending((old_sigset_t __user *) &s);
        set_fs(old_fs);
        if (ret == 0)
                ret = put_user(s, set);
        return ret;
 }
 
-asmlinkage long compat_sys_sigprocmask(int how, compat_old_sigset_t *set,
-               compat_old_sigset_t *oset)
+asmlinkage long compat_sys_sigprocmask(int how, compat_old_sigset_t __user *set,
+               compat_old_sigset_t __user *oset)
 {
        old_sigset_t s;
        long ret;
@@ -198,7 +229,9 @@ asmlinkage long compat_sys_sigprocmask(int how, compat_old_sigset_t *set,
                return -EFAULT;
        old_fs = get_fs();
        set_fs(KERNEL_DS);
-       ret = sys_sigprocmask(how, set ? &s : NULL, oset ? &s : NULL);
+       ret = sys_sigprocmask(how,
+                             set ? (old_sigset_t __user *) &s : NULL,
+                             oset ? (old_sigset_t __user *) &s : NULL);
        set_fs(old_fs);
        if (ret == 0)
                if (oset)
@@ -207,8 +240,9 @@ asmlinkage long compat_sys_sigprocmask(int how, compat_old_sigset_t *set,
 }
 
 #ifdef CONFIG_FUTEX
-asmlinkage long compat_sys_futex(u32 *uaddr, int op, int val,
-               struct compat_timespec *utime, u32 *uaddr2)
+asmlinkage long compat_sys_futex(u32 __user *uaddr, int op, int val,
+               struct compat_timespec __user *utime, u32 __user *uaddr2,
+               int val3)
 {
        struct timespec t;
        unsigned long timeout = MAX_SCHEDULE_TIMEOUT;
@@ -219,15 +253,16 @@ asmlinkage long compat_sys_futex(u32 *uaddr, int op, int val,
                        return -EFAULT;
                timeout = timespec_to_jiffies(&t) + 1;
        }
-       if (op == FUTEX_REQUEUE)
-               val2 = (int) (long) utime;
+       if (op >= FUTEX_REQUEUE)
+               val2 = (int) (unsigned long) utime;
 
        return do_futex((unsigned long)uaddr, op, val, timeout,
-                       (unsigned long)uaddr2, val2);
+                       (unsigned long)uaddr2, val2, val3);
 }
 #endif
 
-asmlinkage long compat_sys_setrlimit(unsigned int resource, struct compat_rlimit *rlim)
+asmlinkage long compat_sys_setrlimit(unsigned int resource,
+               struct compat_rlimit __user *rlim)
 {
        struct rlimit r;
        int ret;
@@ -246,14 +281,15 @@ asmlinkage long compat_sys_setrlimit(unsigned int resource, struct compat_rlimit
        if (r.rlim_max == COMPAT_RLIM_INFINITY)
                r.rlim_max = RLIM_INFINITY;
        set_fs(KERNEL_DS);
-       ret = sys_setrlimit(resource, &r);
+       ret = sys_setrlimit(resource, (struct rlimit __user *) &r);
        set_fs(old_fs);
        return ret;
 }
 
 #ifdef COMPAT_RLIM_OLD_INFINITY
 
-asmlinkage long compat_sys_old_getrlimit(unsigned int resource, struct compat_rlimit *rlim)
+asmlinkage long compat_sys_old_getrlimit(unsigned int resource,
+               struct compat_rlimit __user *rlim)
 {
        struct rlimit r;
        int ret;
@@ -279,14 +315,15 @@ asmlinkage long compat_sys_old_getrlimit(unsigned int resource, struct compat_rl
 
 #endif
 
-asmlinkage long compat_sys_getrlimit (unsigned int resource, struct compat_rlimit *rlim)
+asmlinkage long compat_sys_getrlimit (unsigned int resource,
+               struct compat_rlimit __user *rlim)
 {
        struct rlimit r;
        int ret;
        mm_segment_t old_fs = get_fs();
 
        set_fs(KERNEL_DS);
-       ret = sys_getrlimit(resource, &r);
+       ret = sys_getrlimit(resource, (struct rlimit __user *) &r);
        set_fs(old_fs);
        if (!ret) {
                if (r.rlim_cur > COMPAT_RLIM_INFINITY)
@@ -302,7 +339,7 @@ asmlinkage long compat_sys_getrlimit (unsigned int resource, struct compat_rlimi
        return ret;
 }
 
-static long put_compat_rusage (struct compat_rusage *ru, struct rusage *r)
+int put_compat_rusage(const struct rusage *r, struct compat_rusage __user *ru)
 {
        if (!access_ok(VERIFY_WRITE, ru, sizeof(*ru)) ||
            __put_user(r->ru_utime.tv_sec, &ru->ru_utime.tv_sec) ||
@@ -327,28 +364,28 @@ static long put_compat_rusage (struct compat_rusage *ru, struct rusage *r)
        return 0;
 }
 
-asmlinkage long compat_sys_getrusage(int who, struct compat_rusage *ru)
+asmlinkage long compat_sys_getrusage(int who, struct compat_rusage __user *ru)
 {
        struct rusage r;
        int ret;
        mm_segment_t old_fs = get_fs();
 
        set_fs(KERNEL_DS);
-       ret = sys_getrusage(who, &r);
+       ret = sys_getrusage(who, (struct rusage __user *) &r);
        set_fs(old_fs);
 
        if (ret)
                return ret;
 
-       if (put_compat_rusage(ru, &r))
+       if (put_compat_rusage(&r, ru))
                return -EFAULT;
 
        return 0;
 }
 
 asmlinkage long
-compat_sys_wait4(compat_pid_t pid, compat_uint_t stat_addr, int options,
-       struct compat_rusage *ru)
+compat_sys_wait4(compat_pid_t pid, compat_uint_t __user *stat_addr, int options,
+       struct compat_rusage __user *ru)
 {
        if (!ru) {
                return sys_wait4(pid, stat_addr, options, NULL);
@@ -359,11 +396,14 @@ compat_sys_wait4(compat_pid_t pid, compat_uint_t * stat_addr, int options,
                mm_segment_t old_fs = get_fs();
 
                set_fs (KERNEL_DS);
-               ret = sys_wait4(pid, stat_addr ? &status : NULL, options, &r);
+               ret = sys_wait4(pid,
+                               (stat_addr ?
+                                (unsigned int __user *) &status : NULL),
+                               options, (struct rusage __user *) &r);
                set_fs (old_fs);
 
                if (ret > 0) {
-                       if (put_compat_rusage(ru, &r)) 
+                       if (put_compat_rusage(&r, ru))
                                return -EFAULT;
                        if (stat_addr && put_user(status, stat_addr))
                                return -EFAULT;
@@ -372,52 +412,62 @@ compat_sys_wait4(compat_pid_t pid, compat_uint_t * stat_addr, int options,
        }
 }
 
-asmlinkage long compat_sys_sched_setaffinity(compat_pid_t pid, 
-                                            unsigned int len,
-                                            compat_ulong_t *user_mask_ptr)
+static int compat_get_user_cpu_mask(compat_ulong_t __user *user_mask_ptr,
+                                   unsigned len, cpumask_t *new_mask)
 {
-       unsigned long kernel_mask;
-       mm_segment_t old_fs;
-       int ret;
+       unsigned long *k;
 
-       if (get_user(kernel_mask, user_mask_ptr))
-               return -EFAULT;
+       if (len < sizeof(cpumask_t))
+               memset(new_mask, 0, sizeof(cpumask_t));
+       else if (len > sizeof(cpumask_t))
+               len = sizeof(cpumask_t);
 
-       old_fs = get_fs();
-       set_fs(KERNEL_DS);
-       ret = sys_sched_setaffinity(pid,
-                                   sizeof(kernel_mask),
-                                   &kernel_mask);
-       set_fs(old_fs);
+       k = cpus_addr(*new_mask);
+       return compat_get_bitmap(k, user_mask_ptr, len * 8);
+}
 
-       return ret;
+asmlinkage long compat_sys_sched_setaffinity(compat_pid_t pid,
+                                            unsigned int len,
+                                            compat_ulong_t __user *user_mask_ptr)
+{
+       cpumask_t new_mask;
+       int retval;
+
+       retval = compat_get_user_cpu_mask(user_mask_ptr, len, &new_mask);
+       if (retval)
+               return retval;
+
+       return sched_setaffinity(pid, new_mask);
 }
 
-asmlinkage int compat_sys_sched_getaffinity(compat_pid_t pid, unsigned int len,
-                                           compat_ulong_t *user_mask_ptr)
+asmlinkage long compat_sys_sched_getaffinity(compat_pid_t pid, unsigned int len,
+                                            compat_ulong_t __user *user_mask_ptr)
 {
-       unsigned long kernel_mask;
-       mm_segment_t old_fs;
        int ret;
+       cpumask_t mask;
+       unsigned long *k;
+       unsigned int min_length = sizeof(cpumask_t);
 
-       old_fs = get_fs();
-       set_fs(KERNEL_DS);
-       ret = sys_sched_getaffinity(pid,
-                                   sizeof(kernel_mask),
-                                   &kernel_mask);
-       set_fs(old_fs);
+       if (NR_CPUS <= BITS_PER_COMPAT_LONG)
+               min_length = sizeof(compat_ulong_t);
 
-       if (ret > 0) {
-               ret = sizeof(compat_ulong_t);
-               if (put_user(kernel_mask, user_mask_ptr))
-                       return -EFAULT;
-       }
+       if (len < min_length)
+               return -EINVAL;
 
-       return ret;
+       ret = sched_getaffinity(pid, &mask);
+       if (ret < 0)
+               return ret;
+
+       k = cpus_addr(mask);
+       ret = compat_put_bitmap(user_mask_ptr, k, min_length * 8);
+       if (ret)
+               return ret;
+
+       return min_length;
 }
 
 static int get_compat_itimerspec(struct itimerspec *dst, 
-                                struct compat_itimerspec *src)
+                                struct compat_itimerspec __user *src)
 { 
        if (get_compat_timespec(&dst->it_interval, &src->it_interval) ||
            get_compat_timespec(&dst->it_value, &src->it_value))
@@ -425,7 +475,7 @@ static int get_compat_itimerspec(struct itimerspec *dst,
        return 0;
 } 
 
-static int put_compat_itimerspec(struct compat_itimerspec *dst, 
+static int put_compat_itimerspec(struct compat_itimerspec __user *dst, 
                                 struct itimerspec *src)
 { 
        if (put_compat_timespec(&src->it_interval, &dst->it_interval) ||
@@ -435,8 +485,8 @@ static int put_compat_itimerspec(struct compat_itimerspec *dst,
 } 
 
 long compat_timer_settime(timer_t timer_id, int flags, 
-                         struct compat_itimerspec *new, 
-                         struct compat_itimerspec *old)
+                         struct compat_itimerspec __user *new, 
+                         struct compat_itimerspec __user *old)
 { 
        long err;
        mm_segment_t oldfs;
@@ -448,65 +498,79 @@ long compat_timer_settime(timer_t timer_id, int flags,
                return -EFAULT; 
        oldfs = get_fs();
        set_fs(KERNEL_DS);
-       err = sys_timer_settime(timer_id, flags, &newts, &oldts);
+       err = sys_timer_settime(timer_id, flags,
+                               (struct itimerspec __user *) &newts,
+                               (struct itimerspec __user *) &oldts);
        set_fs(oldfs); 
        if (!err && old && put_compat_itimerspec(old, &oldts))
                return -EFAULT;
        return err;
 } 
 
-long compat_timer_gettime(timer_t timer_id, struct compat_itimerspec *setting)
+long compat_timer_gettime(timer_t timer_id,
+               struct compat_itimerspec __user *setting)
 { 
        long err;
        mm_segment_t oldfs;
        struct itimerspec ts; 
+
        oldfs = get_fs();
        set_fs(KERNEL_DS);
-       err = sys_timer_gettime(timer_id, &ts); 
+       err = sys_timer_gettime(timer_id,
+                               (struct itimerspec __user *) &ts); 
        set_fs(oldfs); 
        if (!err && put_compat_itimerspec(setting, &ts))
                return -EFAULT;
        return err;
 } 
 
-long compat_clock_settime(clockid_t which_clock,  struct compat_timespec *tp)
+long compat_clock_settime(clockid_t which_clock,
+               struct compat_timespec __user *tp)
 {
        long err;
        mm_segment_t oldfs;
        struct timespec ts; 
+
        if (get_compat_timespec(&ts, tp))
                return -EFAULT; 
        oldfs = get_fs();
        set_fs(KERNEL_DS);      
-       err = sys_clock_settime(which_clock, &ts); 
+       err = sys_clock_settime(which_clock,
+                               (struct timespec __user *) &ts);
        set_fs(oldfs);
        return err;
 } 
 
-long compat_clock_gettime(clockid_t which_clock,  struct compat_timespec *tp)
+long compat_clock_gettime(clockid_t which_clock,
+               struct compat_timespec __user *tp)
 {
        long err;
        mm_segment_t oldfs;
        struct timespec ts; 
+
        oldfs = get_fs();
        set_fs(KERNEL_DS);
-       err = sys_clock_gettime(which_clock, &ts); 
+       err = sys_clock_gettime(which_clock,
+                               (struct timespec __user *) &ts);
        set_fs(oldfs);
        if (!err && put_compat_timespec(&ts, tp))
                return -EFAULT; 
        return err;
 } 
 
-long compat_clock_getres(clockid_t which_clock,  struct compat_timespec *tp)
+long compat_clock_getres(clockid_t which_clock,
+               struct compat_timespec __user *tp)
 {
        long err;
        mm_segment_t oldfs;
        struct timespec ts; 
+
        oldfs = get_fs();
        set_fs(KERNEL_DS);
-       err = sys_clock_getres(which_clock, &ts); 
+       err = sys_clock_getres(which_clock,
+                              (struct timespec __user *) &ts);
        set_fs(oldfs);
-       if (!err && put_compat_timespec(&ts, tp))
+       if (!err && tp && put_compat_timespec(&ts, tp))
                return -EFAULT; 
        return err;
 } 
@@ -518,11 +582,15 @@ long compat_clock_nanosleep(clockid_t which_clock, int flags,
        long err;
        mm_segment_t oldfs;
        struct timespec in, out; 
+
        if (get_compat_timespec(&in, rqtp)) 
                return -EFAULT;
+
        oldfs = get_fs();
-       set_fs(KERNEL_DS);      
-       err = sys_clock_nanosleep(which_clock, flags, &in, &out);  
+       set_fs(KERNEL_DS);
+       err = sys_clock_nanosleep(which_clock, flags,
+                                 (struct timespec __user *) &in,
+                                 (struct timespec __user *) &out);
        set_fs(oldfs);
        if ((err == -ERESTART_RESTARTBLOCK) && rmtp &&
            put_compat_timespec(&out, rmtp))
@@ -532,3 +600,83 @@ long compat_clock_nanosleep(clockid_t which_clock, int flags,
 
 /* timer_create is architecture specific because it needs sigevent conversion */
 
+long compat_get_bitmap(unsigned long *mask, compat_ulong_t __user *umask,
+                      unsigned long bitmap_size)
+{
+       int i, j;
+       unsigned long m;
+       compat_ulong_t um;
+       unsigned long nr_compat_longs;
+
+       /* align bitmap up to nearest compat_long_t boundary */
+       bitmap_size = ALIGN(bitmap_size, BITS_PER_COMPAT_LONG);
+
+       if (verify_area(VERIFY_READ, umask, bitmap_size / 8))
+               return -EFAULT;
+
+       nr_compat_longs = BITS_TO_COMPAT_LONGS(bitmap_size);
+
+       for (i = 0; i < BITS_TO_LONGS(bitmap_size); i++) {
+               m = 0;
+
+               for (j = 0; j < sizeof(m)/sizeof(um); j++) {
+                       /*
+                        * We dont want to read past the end of the userspace
+                        * bitmap. We must however ensure the end of the
+                        * kernel bitmap is zeroed.
+                        */
+                       if (nr_compat_longs-- > 0) {
+                               if (__get_user(um, umask))
+                                       return -EFAULT;
+                       } else {
+                               um = 0;
+                       }
+
+                       umask++;
+                       m |= (long)um << (j * BITS_PER_COMPAT_LONG);
+               }
+               *mask++ = m;
+       }
+
+       return 0;
+}
+
+long compat_put_bitmap(compat_ulong_t __user *umask, unsigned long *mask,
+                      unsigned long bitmap_size)
+{
+       int i, j;
+       unsigned long m;
+       compat_ulong_t um;
+       unsigned long nr_compat_longs;
+
+       /* align bitmap up to nearest compat_long_t boundary */
+       bitmap_size = ALIGN(bitmap_size, BITS_PER_COMPAT_LONG);
+
+       if (verify_area(VERIFY_WRITE, umask, bitmap_size / 8))
+               return -EFAULT;
+
+       nr_compat_longs = BITS_TO_COMPAT_LONGS(bitmap_size);
+
+       for (i = 0; i < BITS_TO_LONGS(bitmap_size); i++) {
+               m = *mask++;
+
+               for (j = 0; j < sizeof(m)/sizeof(um); j++) {
+                       um = m;
+
+                       /*
+                        * We dont want to write past the end of the userspace
+                        * bitmap.
+                        */
+                       if (nr_compat_longs-- > 0) {
+                               if (__put_user(um, umask))
+                                       return -EFAULT;
+                       }
+
+                       umask++;
+                       m >>= 4*sizeof(um);
+                       m >>= 4*sizeof(um);
+               }
+       }
+
+       return 0;
+}