fedora core 6 1.2949 + vserver 2.2.0
[linux-2.6.git] / arch / ia64 / ia32 / sys_ia32.c
index a1d0080..b327292 100644 (file)
@@ -6,14 +6,14 @@
  * Copyright (C) 1999          Arun Sharma <arun.sharma@intel.com>
  * Copyright (C) 1997,1998     Jakub Jelinek (jj@sunsite.mff.cuni.cz)
  * Copyright (C) 1997          David S. Miller (davem@caip.rutgers.edu)
- * Copyright (C) 2000-2003 Hewlett-Packard Co
+ * Copyright (C) 2000-2003, 2005 Hewlett-Packard Co
  *     David Mosberger-Tang <davidm@hpl.hp.com>
+ * Copyright (C) 2004          Gordon Jin <gordon.jin@intel.com>
  *
  * These routines maintain argument size conversion between 32bit and 64bit
  * environment.
  */
 
-#include <linux/config.h>
 #include <linux/kernel.h>
 #include <linux/syscalls.h>
 #include <linux/sysctl.h>
@@ -24,7 +24,6 @@
 #include <linux/resource.h>
 #include <linux/times.h>
 #include <linux/utsname.h>
-#include <linux/timex.h>
 #include <linux/smp.h>
 #include <linux/smp_lock.h>
 #include <linux/sem.h>
@@ -35,6 +34,7 @@
 #include <linux/uio.h>
 #include <linux/nfs_fs.h>
 #include <linux/quota.h>
+#include <linux/syscalls.h>
 #include <linux/sunrpc/svc.h>
 #include <linux/nfsd/nfsd.h>
 #include <linux/nfsd/cache.h>
 #include <linux/eventpoll.h>
 #include <linux/personality.h>
 #include <linux/ptrace.h>
+#include <linux/tracehook.h>
 #include <linux/stat.h>
 #include <linux/ipc.h>
+#include <linux/capability.h>
 #include <linux/compat.h>
 #include <linux/vfs.h>
+#include <linux/mman.h>
+#include <linux/mutex.h>
 
 #include <asm/intrinsics.h>
-#include <asm/semaphore.h>
 #include <asm/types.h>
 #include <asm/uaccess.h>
 #include <asm/unistd.h>
 # define DBG(fmt...)
 #endif
 
-#define A(__x)         ((unsigned long)(__x))
-#define AA(__x)                ((unsigned long)(__x))
 #define ROUND_UP(x,a)  ((__typeof__(x))(((unsigned long)(x) + ((a) - 1)) & ~((a) - 1)))
-#define NAME_OFFSET(de) ((int) ((de)->d_name - (char *) (de)))
 
 #define OFFSET4K(a)            ((a) & 0xfff)
 #define PAGE_START(addr)       ((addr) & PAGE_MASK)
 #define high2lowuid(uid) ((uid) > 65535 ? 65534 : (uid))
 #define high2lowgid(gid) ((gid) > 65535 ? 65534 : (gid))
 
-extern unsigned long arch_get_unmapped_area (struct file *, unsigned long, unsigned long,
-                                            unsigned long, unsigned long);
-
 /*
  * Anything that modifies or inspects ia32 user virtual memory must hold this semaphore
  * while doing so.
  */
 /* XXX make per-mm: */
-static DECLARE_MUTEX(ia32_mmap_sem);
-
-static int
-nargs (unsigned int arg, char **ap)
-{
-       unsigned int addr;
-       int n, err;
-
-       if (!arg)
-               return 0;
-
-       n = 0;
-       do {
-               err = get_user(addr, (unsigned int *)A(arg));
-               if (err)
-                       return err;
-               if (ap)
-                       *ap++ = (char *) A(addr);
-               arg += sizeof(unsigned int);
-               n++;
-       } while (addr);
-       return n - 1;
-}
+static DEFINE_MUTEX(ia32_mmap_mutex);
 
 asmlinkage long
-sys32_execve (char *filename, unsigned int argv, unsigned int envp,
+sys32_execve (char __user *name, compat_uptr_t __user *argv, compat_uptr_t __user *envp,
              struct pt_regs *regs)
 {
+       long error;
+       char *filename;
        unsigned long old_map_base, old_task_size, tssd;
-       char **av, **ae;
-       int na, ne, len;
-       long r;
-
-       na = nargs(argv, NULL);
-       if (na < 0)
-               return na;
-       ne = nargs(envp, NULL);
-       if (ne < 0)
-               return ne;
-       len = (na + ne + 2) * sizeof(*av);
-       av = kmalloc(len, GFP_KERNEL);
-       if (!av)
-               return -ENOMEM;
 
-       ae = av + na + 1;
-       av[na] = NULL;
-       ae[ne] = NULL;
-
-       r = nargs(argv, av);
-       if (r < 0)
-               goto out;
-       r = nargs(envp, ae);
-       if (r < 0)
-               goto out;
+       filename = getname(name);
+       error = PTR_ERR(filename);
+       if (IS_ERR(filename))
+               return error;
 
        old_map_base  = current->thread.map_base;
        old_task_size = current->thread.task_size;
@@ -153,23 +110,23 @@ sys32_execve (char *filename, unsigned int argv, unsigned int envp,
        ia64_set_kr(IA64_KR_IO_BASE, current->thread.old_iob);
        ia64_set_kr(IA64_KR_TSSD, current->thread.old_k1);
 
-       set_fs(KERNEL_DS);
-       r = sys_execve(filename, av, ae, regs);
-       if (r < 0) {
+       error = compat_do_execve(filename, argv, envp, regs);
+       putname(filename);
+
+       if (error < 0) {
                /* oops, execve failed, switch back to old values... */
                ia64_set_kr(IA64_KR_IO_BASE, IA32_IOBASE);
                ia64_set_kr(IA64_KR_TSSD, tssd);
                current->thread.map_base  = old_map_base;
                current->thread.task_size = old_task_size;
-               set_fs(USER_DS);        /* establish new task-size as the address-limit */
        }
-  out:
-       kfree(av);
-       return r;
+
+       return error;
 }
 
-int cp_compat_stat(struct kstat *stat, struct compat_stat *ubuf)
+int cp_compat_stat(struct kstat *stat, struct compat_stat __user *ubuf)
 {
+       compat_ino_t ino;
        int err;
 
        if ((u64) stat->size > MAX_NON_LFS ||
@@ -177,11 +134,15 @@ int cp_compat_stat(struct kstat *stat, struct compat_stat *ubuf)
            !old_valid_dev(stat->rdev))
                return -EOVERFLOW;
 
+       ino = stat->ino;
+       if (sizeof(ino) < sizeof(stat->ino) && ino != stat->ino)
+               return -EOVERFLOW;
+
        if (clear_user(ubuf, sizeof(*ubuf)))
                return -EFAULT;
 
        err  = __put_user(old_encode_dev(stat->dev), &ubuf->st_dev);
-       err |= __put_user(stat->ino, &ubuf->st_ino);
+       err |= __put_user(ino, &ubuf->st_ino);
        err |= __put_user(stat->mode, &ubuf->st_mode);
        err |= __put_user(stat->nlink, &ubuf->st_nlink);
        err |= __put_user(high2lowuid(stat->uid), &ubuf->st_uid);
@@ -239,7 +200,7 @@ mmap_subpage (struct file *file, unsigned long start, unsigned long end, int pro
 
        /* Optimize the case where the old mmap and the new mmap are both anonymous */
        if ((old_prot & PROT_WRITE) && (flags & MAP_ANONYMOUS) && !vma->vm_file) {
-               if (clear_user((void *) start, end - start)) {
+               if (clear_user((void __user *) start, end - start)) {
                        ret = -EFAULT;
                        goto out;
                }
@@ -251,11 +212,11 @@ mmap_subpage (struct file *file, unsigned long start, unsigned long end, int pro
                return -ENOMEM;
 
        if (old_prot)
-               copy_from_user(page, (void *) PAGE_START(start), PAGE_SIZE);
+               copy_from_user(page, (void __user *) PAGE_START(start), PAGE_SIZE);
 
        down_write(&current->mm->mmap_sem);
        {
-               ret = do_mmap(0, PAGE_START(start), PAGE_SIZE, prot | PROT_WRITE,
+               ret = do_mmap(NULL, PAGE_START(start), PAGE_SIZE, prot | PROT_WRITE,
                              flags | MAP_FIXED | MAP_ANONYMOUS, 0);
        }
        up_write(&current->mm->mmap_sem);
@@ -266,17 +227,18 @@ mmap_subpage (struct file *file, unsigned long start, unsigned long end, int pro
        if (old_prot) {
                /* copy back the old page contents.  */
                if (offset_in_page(start))
-                       copy_to_user((void *) PAGE_START(start), page, offset_in_page(start));
+                       copy_to_user((void __user *) PAGE_START(start), page,
+                                    offset_in_page(start));
                if (offset_in_page(end))
-                       copy_to_user((void *) end, page + offset_in_page(end),
+                       copy_to_user((void __user *) end, page + offset_in_page(end),
                                     PAGE_SIZE - offset_in_page(end));
        }
 
        if (!(flags & MAP_ANONYMOUS)) {
                /* read the file contents */
-               inode = file->f_dentry->d_inode;
+               inode = file->f_path.dentry->d_inode;
                if (!inode->i_fop || !file->f_op->read
-                   || ((*file->f_op->read)(file, (char *) start, end - start, &off) < 0))
+                   || ((*file->f_op->read)(file, (char __user *) start, end - start, &off) < 0))
                {
                        ret = -EINVAL;
                        goto out;
@@ -292,6 +254,508 @@ mmap_subpage (struct file *file, unsigned long start, unsigned long end, int pro
        return ret;
 }
 
+/* SLAB cache for partial_page structures */
+struct kmem_cache *partial_page_cachep;
+
+/*
+ * init partial_page_list.
+ * return 0 means kmalloc fail.
+ */
+struct partial_page_list*
+ia32_init_pp_list(void)
+{
+       struct partial_page_list *p;
+
+       if ((p = kmalloc(sizeof(*p), GFP_KERNEL)) == NULL)
+               return p;
+       p->pp_head = NULL;
+       p->ppl_rb = RB_ROOT;
+       p->pp_hint = NULL;
+       atomic_set(&p->pp_count, 1);
+       return p;
+}
+
+/*
+ * Search for the partial page with @start in partial page list @ppl.
+ * If finds the partial page, return the found partial page.
+ * Else, return 0 and provide @pprev, @rb_link, @rb_parent to
+ * be used by later __ia32_insert_pp().
+ */
+static struct partial_page *
+__ia32_find_pp(struct partial_page_list *ppl, unsigned int start,
+       struct partial_page **pprev, struct rb_node ***rb_link,
+       struct rb_node **rb_parent)
+{
+       struct partial_page *pp;
+       struct rb_node **__rb_link, *__rb_parent, *rb_prev;
+
+       pp = ppl->pp_hint;
+       if (pp && pp->base == start)
+               return pp;
+
+       __rb_link = &ppl->ppl_rb.rb_node;
+       rb_prev = __rb_parent = NULL;
+
+       while (*__rb_link) {
+               __rb_parent = *__rb_link;
+               pp = rb_entry(__rb_parent, struct partial_page, pp_rb);
+
+               if (pp->base == start) {
+                       ppl->pp_hint = pp;
+                       return pp;
+               } else if (pp->base < start) {
+                       rb_prev = __rb_parent;
+                       __rb_link = &__rb_parent->rb_right;
+               } else {
+                       __rb_link = &__rb_parent->rb_left;
+               }
+       }
+
+       *rb_link = __rb_link;
+       *rb_parent = __rb_parent;
+       *pprev = NULL;
+       if (rb_prev)
+               *pprev = rb_entry(rb_prev, struct partial_page, pp_rb);
+       return NULL;
+}
+
+/*
+ * insert @pp into @ppl.
+ */
+static void
+__ia32_insert_pp(struct partial_page_list *ppl, struct partial_page *pp,
+        struct partial_page *prev, struct rb_node **rb_link,
+       struct rb_node *rb_parent)
+{
+       /* link list */
+       if (prev) {
+               pp->next = prev->next;
+               prev->next = pp;
+       } else {
+               ppl->pp_head = pp;
+               if (rb_parent)
+                       pp->next = rb_entry(rb_parent,
+                               struct partial_page, pp_rb);
+               else
+                       pp->next = NULL;
+       }
+
+       /* link rb */
+       rb_link_node(&pp->pp_rb, rb_parent, rb_link);
+       rb_insert_color(&pp->pp_rb, &ppl->ppl_rb);
+
+       ppl->pp_hint = pp;
+}
+
+/*
+ * delete @pp from partial page list @ppl.
+ */
+static void
+__ia32_delete_pp(struct partial_page_list *ppl, struct partial_page *pp,
+       struct partial_page *prev)
+{
+       if (prev) {
+               prev->next = pp->next;
+               if (ppl->pp_hint == pp)
+                       ppl->pp_hint = prev;
+       } else {
+               ppl->pp_head = pp->next;
+               if (ppl->pp_hint == pp)
+                       ppl->pp_hint = pp->next;
+       }
+       rb_erase(&pp->pp_rb, &ppl->ppl_rb);
+       kmem_cache_free(partial_page_cachep, pp);
+}
+
+static struct partial_page *
+__pp_prev(struct partial_page *pp)
+{
+       struct rb_node *prev = rb_prev(&pp->pp_rb);
+       if (prev)
+               return rb_entry(prev, struct partial_page, pp_rb);
+       else
+               return NULL;
+}
+
+/*
+ * Delete partial pages with address between @start and @end.
+ * @start and @end are page aligned.
+ */
+static void
+__ia32_delete_pp_range(unsigned int start, unsigned int end)
+{
+       struct partial_page *pp, *prev;
+       struct rb_node **rb_link, *rb_parent;
+
+       if (start >= end)
+               return;
+
+       pp = __ia32_find_pp(current->thread.ppl, start, &prev,
+                                       &rb_link, &rb_parent);
+       if (pp)
+               prev = __pp_prev(pp);
+       else {
+               if (prev)
+                       pp = prev->next;
+               else
+                       pp = current->thread.ppl->pp_head;
+       }
+
+       while (pp && pp->base < end) {
+               struct partial_page *tmp = pp->next;
+               __ia32_delete_pp(current->thread.ppl, pp, prev);
+               pp = tmp;
+       }
+}
+
+/*
+ * Set the range between @start and @end in bitmap.
+ * @start and @end should be IA32 page aligned and in the same IA64 page.
+ */
+static int
+__ia32_set_pp(unsigned int start, unsigned int end, int flags)
+{
+       struct partial_page *pp, *prev;
+       struct rb_node ** rb_link, *rb_parent;
+       unsigned int pstart, start_bit, end_bit, i;
+
+       pstart = PAGE_START(start);
+       start_bit = (start % PAGE_SIZE) / IA32_PAGE_SIZE;
+       end_bit = (end % PAGE_SIZE) / IA32_PAGE_SIZE;
+       if (end_bit == 0)
+               end_bit = PAGE_SIZE / IA32_PAGE_SIZE;
+       pp = __ia32_find_pp(current->thread.ppl, pstart, &prev,
+                                       &rb_link, &rb_parent);
+       if (pp) {
+               for (i = start_bit; i < end_bit; i++)
+                       set_bit(i, &pp->bitmap);
+               /*
+                * Check: if this partial page has been set to a full page,
+                * then delete it.
+                */
+               if (find_first_zero_bit(&pp->bitmap, sizeof(pp->bitmap)*8) >=
+                               PAGE_SIZE/IA32_PAGE_SIZE) {
+                       __ia32_delete_pp(current->thread.ppl, pp, __pp_prev(pp));
+               }
+               return 0;
+       }
+
+       /*
+        * MAP_FIXED may lead to overlapping mmap.
+        * In this case, the requested mmap area may already mmaped as a full
+        * page. So check vma before adding a new partial page.
+        */
+       if (flags & MAP_FIXED) {
+               struct vm_area_struct *vma = find_vma(current->mm, pstart);
+               if (vma && vma->vm_start <= pstart)
+                       return 0;
+       }
+
+       /* new a partial_page */
+       pp = kmem_cache_alloc(partial_page_cachep, GFP_KERNEL);
+       if (!pp)
+               return -ENOMEM;
+       pp->base = pstart;
+       pp->bitmap = 0;
+       for (i=start_bit; i<end_bit; i++)
+               set_bit(i, &(pp->bitmap));
+       pp->next = NULL;
+       __ia32_insert_pp(current->thread.ppl, pp, prev, rb_link, rb_parent);
+       return 0;
+}
+
+/*
+ * @start and @end should be IA32 page aligned, but don't need to be in the
+ * same IA64 page. Split @start and @end to make sure they're in the same IA64
+ * page, then call __ia32_set_pp().
+ */
+static void
+ia32_set_pp(unsigned int start, unsigned int end, int flags)
+{
+       down_write(&current->mm->mmap_sem);
+       if (flags & MAP_FIXED) {
+               /*
+                * MAP_FIXED may lead to overlapping mmap. When this happens,
+                * a series of complete IA64 pages results in deletion of
+                * old partial pages in that range.
+                */
+               __ia32_delete_pp_range(PAGE_ALIGN(start), PAGE_START(end));
+       }
+
+       if (end < PAGE_ALIGN(start)) {
+               __ia32_set_pp(start, end, flags);
+       } else {
+               if (offset_in_page(start))
+                       __ia32_set_pp(start, PAGE_ALIGN(start), flags);
+               if (offset_in_page(end))
+                       __ia32_set_pp(PAGE_START(end), end, flags);
+       }
+       up_write(&current->mm->mmap_sem);
+}
+
+/*
+ * Unset the range between @start and @end in bitmap.
+ * @start and @end should be IA32 page aligned and in the same IA64 page.
+ * After doing that, if the bitmap is 0, then free the page and return 1,
+ *     else return 0;
+ * If not find the partial page in the list, then
+ *     If the vma exists, then the full page is set to a partial page;
+ *     Else return -ENOMEM.
+ */
+static int
+__ia32_unset_pp(unsigned int start, unsigned int end)
+{
+       struct partial_page *pp, *prev;
+       struct rb_node ** rb_link, *rb_parent;
+       unsigned int pstart, start_bit, end_bit, i;
+       struct vm_area_struct *vma;
+
+       pstart = PAGE_START(start);
+       start_bit = (start % PAGE_SIZE) / IA32_PAGE_SIZE;
+       end_bit = (end % PAGE_SIZE) / IA32_PAGE_SIZE;
+       if (end_bit == 0)
+               end_bit = PAGE_SIZE / IA32_PAGE_SIZE;
+
+       pp = __ia32_find_pp(current->thread.ppl, pstart, &prev,
+                                       &rb_link, &rb_parent);
+       if (pp) {
+               for (i = start_bit; i < end_bit; i++)
+                       clear_bit(i, &pp->bitmap);
+               if (pp->bitmap == 0) {
+                       __ia32_delete_pp(current->thread.ppl, pp, __pp_prev(pp));
+                       return 1;
+               }
+               return 0;
+       }
+
+       vma = find_vma(current->mm, pstart);
+       if (!vma || vma->vm_start > pstart) {
+               return -ENOMEM;
+       }
+
+       /* new a partial_page */
+       pp = kmem_cache_alloc(partial_page_cachep, GFP_KERNEL);
+       if (!pp)
+               return -ENOMEM;
+       pp->base = pstart;
+       pp->bitmap = 0;
+       for (i = 0; i < start_bit; i++)
+               set_bit(i, &(pp->bitmap));
+       for (i = end_bit; i < PAGE_SIZE / IA32_PAGE_SIZE; i++)
+               set_bit(i, &(pp->bitmap));
+       pp->next = NULL;
+       __ia32_insert_pp(current->thread.ppl, pp, prev, rb_link, rb_parent);
+       return 0;
+}
+
+/*
+ * Delete pp between PAGE_ALIGN(start) and PAGE_START(end) by calling
+ * __ia32_delete_pp_range(). Unset possible partial pages by calling
+ * __ia32_unset_pp().
+ * The returned value see __ia32_unset_pp().
+ */
+static int
+ia32_unset_pp(unsigned int *startp, unsigned int *endp)
+{
+       unsigned int start = *startp, end = *endp;
+       int ret = 0;
+
+       down_write(&current->mm->mmap_sem);
+
+       __ia32_delete_pp_range(PAGE_ALIGN(start), PAGE_START(end));
+
+       if (end < PAGE_ALIGN(start)) {
+               ret = __ia32_unset_pp(start, end);
+               if (ret == 1) {
+                       *startp = PAGE_START(start);
+                       *endp = PAGE_ALIGN(end);
+               }
+               if (ret == 0) {
+                       /* to shortcut sys_munmap() in sys32_munmap() */
+                       *startp = PAGE_START(start);
+                       *endp = PAGE_START(end);
+               }
+       } else {
+               if (offset_in_page(start)) {
+                       ret = __ia32_unset_pp(start, PAGE_ALIGN(start));
+                       if (ret == 1)
+                               *startp = PAGE_START(start);
+                       if (ret == 0)
+                               *startp = PAGE_ALIGN(start);
+                       if (ret < 0)
+                               goto out;
+               }
+               if (offset_in_page(end)) {
+                       ret = __ia32_unset_pp(PAGE_START(end), end);
+                       if (ret == 1)
+                               *endp = PAGE_ALIGN(end);
+                       if (ret == 0)
+                               *endp = PAGE_START(end);
+               }
+       }
+
+ out:
+       up_write(&current->mm->mmap_sem);
+       return ret;
+}
+
+/*
+ * Compare the range between @start and @end with bitmap in partial page.
+ * @start and @end should be IA32 page aligned and in the same IA64 page.
+ */
+static int
+__ia32_compare_pp(unsigned int start, unsigned int end)
+{
+       struct partial_page *pp, *prev;
+       struct rb_node ** rb_link, *rb_parent;
+       unsigned int pstart, start_bit, end_bit, size;
+       unsigned int first_bit, next_zero_bit;  /* the first range in bitmap */
+
+       pstart = PAGE_START(start);
+
+       pp = __ia32_find_pp(current->thread.ppl, pstart, &prev,
+                                       &rb_link, &rb_parent);
+       if (!pp)
+               return 1;
+
+       start_bit = (start % PAGE_SIZE) / IA32_PAGE_SIZE;
+       end_bit = (end % PAGE_SIZE) / IA32_PAGE_SIZE;
+       size = sizeof(pp->bitmap) * 8;
+       first_bit = find_first_bit(&pp->bitmap, size);
+       next_zero_bit = find_next_zero_bit(&pp->bitmap, size, first_bit);
+       if ((start_bit < first_bit) || (end_bit > next_zero_bit)) {
+               /* exceeds the first range in bitmap */
+               return -ENOMEM;
+       } else if ((start_bit == first_bit) && (end_bit == next_zero_bit)) {
+               first_bit = find_next_bit(&pp->bitmap, size, next_zero_bit);
+               if ((next_zero_bit < first_bit) && (first_bit < size))
+                       return 1;       /* has next range */
+               else
+                       return 0;       /* no next range */
+       } else
+               return 1;
+}
+
+/*
+ * @start and @end should be IA32 page aligned, but don't need to be in the
+ * same IA64 page. Split @start and @end to make sure they're in the same IA64
+ * page, then call __ia32_compare_pp().
+ *
+ * Take this as example: the range is the 1st and 2nd 4K page.
+ * Return 0 if they fit bitmap exactly, i.e. bitmap = 00000011;
+ * Return 1 if the range doesn't cover whole bitmap, e.g. bitmap = 00001111;
+ * Return -ENOMEM if the range exceeds the bitmap, e.g. bitmap = 00000001 or
+ *     bitmap = 00000101.
+ */
+static int
+ia32_compare_pp(unsigned int *startp, unsigned int *endp)
+{
+       unsigned int start = *startp, end = *endp;
+       int retval = 0;
+
+       down_write(&current->mm->mmap_sem);
+
+       if (end < PAGE_ALIGN(start)) {
+               retval = __ia32_compare_pp(start, end);
+               if (retval == 0) {
+                       *startp = PAGE_START(start);
+                       *endp = PAGE_ALIGN(end);
+               }
+       } else {
+               if (offset_in_page(start)) {
+                       retval = __ia32_compare_pp(start,
+                                                  PAGE_ALIGN(start));
+                       if (retval == 0)
+                               *startp = PAGE_START(start);
+                       if (retval < 0)
+                               goto out;
+               }
+               if (offset_in_page(end)) {
+                       retval = __ia32_compare_pp(PAGE_START(end), end);
+                       if (retval == 0)
+                               *endp = PAGE_ALIGN(end);
+               }
+       }
+
+ out:
+       up_write(&current->mm->mmap_sem);
+       return retval;
+}
+
+static void
+__ia32_drop_pp_list(struct partial_page_list *ppl)
+{
+       struct partial_page *pp = ppl->pp_head;
+
+       while (pp) {
+               struct partial_page *next = pp->next;
+               kmem_cache_free(partial_page_cachep, pp);
+               pp = next;
+       }
+
+       kfree(ppl);
+}
+
+void
+ia32_drop_partial_page_list(struct task_struct *task)
+{
+       struct partial_page_list* ppl = task->thread.ppl;
+
+       if (ppl && atomic_dec_and_test(&ppl->pp_count))
+               __ia32_drop_pp_list(ppl);
+}
+
+/*
+ * Copy current->thread.ppl to ppl (already initialized).
+ */
+static int
+__ia32_copy_pp_list(struct partial_page_list *ppl)
+{
+       struct partial_page *pp, *tmp, *prev;
+       struct rb_node **rb_link, *rb_parent;
+
+       ppl->pp_head = NULL;
+       ppl->pp_hint = NULL;
+       ppl->ppl_rb = RB_ROOT;
+       rb_link = &ppl->ppl_rb.rb_node;
+       rb_parent = NULL;
+       prev = NULL;
+
+       for (pp = current->thread.ppl->pp_head; pp; pp = pp->next) {
+               tmp = kmem_cache_alloc(partial_page_cachep, GFP_KERNEL);
+               if (!tmp)
+                       return -ENOMEM;
+               *tmp = *pp;
+               __ia32_insert_pp(ppl, tmp, prev, rb_link, rb_parent);
+               prev = tmp;
+               rb_link = &tmp->pp_rb.rb_right;
+               rb_parent = &tmp->pp_rb;
+       }
+       return 0;
+}
+
+int
+ia32_copy_partial_page_list(struct task_struct *p, unsigned long clone_flags)
+{
+       int retval = 0;
+
+       if (clone_flags & CLONE_VM) {
+               atomic_inc(&current->thread.ppl->pp_count);
+               p->thread.ppl = current->thread.ppl;
+       } else {
+               p->thread.ppl = ia32_init_pp_list();
+               if (!p->thread.ppl)
+                       return -ENOMEM;
+               down_write(&current->mm->mmap_sem);
+               {
+                       retval = __ia32_copy_pp_list(p->thread.ppl);
+               }
+               up_write(&current->mm->mmap_sem);
+       }
+
+       return retval;
+}
+
 static unsigned long
 emulate_mmap (struct file *file, unsigned long start, unsigned long len, int prot, int flags,
              loff_t off)
@@ -305,6 +769,7 @@ emulate_mmap (struct file *file, unsigned long start, unsigned long len, int pro
        pend = PAGE_ALIGN(end);
 
        if (flags & MAP_FIXED) {
+               ia32_set_pp((unsigned int)start, (unsigned int)end, flags);
                if (start > pstart) {
                        if (flags & MAP_SHARED)
                                printk(KERN_INFO
@@ -316,7 +781,7 @@ emulate_mmap (struct file *file, unsigned long start, unsigned long len, int pro
                                return ret;
                        pstart += PAGE_SIZE;
                        if (pstart >= pend)
-                               return start;   /* done */
+                               goto out;       /* done */
                }
                if (end < pend) {
                        if (flags & MAP_SHARED)
@@ -329,7 +794,7 @@ emulate_mmap (struct file *file, unsigned long start, unsigned long len, int pro
                                return ret;
                        pend -= PAGE_SIZE;
                        if (pstart >= pend)
-                               return start;   /* done */
+                               goto out;       /* done */
                }
        } else {
                /*
@@ -362,7 +827,7 @@ emulate_mmap (struct file *file, unsigned long start, unsigned long len, int pro
                if (!(flags & MAP_ANONYMOUS) && is_congruent)
                        ret = do_mmap(file, pstart, pend - pstart, prot, flags | MAP_FIXED, poff);
                else
-                       ret = do_mmap(0, pstart, pend - pstart,
+                       ret = do_mmap(NULL, pstart, pend - pstart,
                                      prot | ((flags & MAP_ANONYMOUS) ? 0 : PROT_WRITE),
                                      flags | MAP_FIXED | MAP_ANONYMOUS, 0);
        }
@@ -373,9 +838,10 @@ emulate_mmap (struct file *file, unsigned long start, unsigned long len, int pro
 
        if (!is_congruent) {
                /* read the file contents */
-               inode = file->f_dentry->d_inode;
+               inode = file->f_path.dentry->d_inode;
                if (!inode->i_fop || !file->f_op->read
-                   || ((*file->f_op->read)(file, (char *) pstart, pend - pstart, &poff) < 0))
+                   || ((*file->f_op->read)(file, (char __user *) pstart, pend - pstart, &poff)
+                       < 0))
                {
                        sys_munmap(pstart, pend - pstart);
                        return -EINVAL;
@@ -383,6 +849,10 @@ emulate_mmap (struct file *file, unsigned long start, unsigned long len, int pro
                if (!(prot & PROT_WRITE) && sys_mprotect(pstart, pend - pstart, prot) < 0)
                        return -EINVAL;
        }
+
+       if (!(flags & MAP_FIXED))
+               ia32_set_pp((unsigned int)start, (unsigned int)end, flags);
+out:
        return start;
 }
 
@@ -429,11 +899,11 @@ ia32_do_mmap (struct file *file, unsigned long addr, unsigned long len, int prot
        prot = get_prot32(prot);
 
 #if PAGE_SHIFT > IA32_PAGE_SHIFT
-       down(&ia32_mmap_sem);
+       mutex_lock(&ia32_mmap_mutex);
        {
                addr = emulate_mmap(file, addr, len, prot, flags, offset);
        }
-       up(&ia32_mmap_sem);
+       mutex_unlock(&ia32_mmap_mutex);
 #else
        down_write(&current->mm->mmap_sem);
        {
@@ -460,7 +930,7 @@ struct mmap_arg_struct {
 };
 
 asmlinkage long
-sys32_mmap (struct mmap_arg_struct *arg)
+sys32_mmap (struct mmap_arg_struct __user *arg)
 {
        struct mmap_arg_struct a;
        struct file *file = NULL;
@@ -520,20 +990,23 @@ sys32_munmap (unsigned int start, unsigned int len)
 #if PAGE_SHIFT <= IA32_PAGE_SHIFT
        ret = sys_munmap(start, end - start);
 #else
+       if (OFFSET4K(start))
+               return -EINVAL;
+
+       end = IA32_PAGE_ALIGN(end);
        if (start >= end)
                return -EINVAL;
 
-       start = PAGE_ALIGN(start);
-       end = PAGE_START(end);
+       ret = ia32_unset_pp(&start, &end);
+       if (ret < 0)
+               return ret;
 
        if (start >= end)
                return 0;
 
-       down(&ia32_mmap_sem);
-       {
-               ret = sys_munmap(start, end - start);
-       }
-       up(&ia32_mmap_sem);
+       mutex_lock(&ia32_mmap_mutex);
+       ret = sys_munmap(start, end - start);
+       mutex_unlock(&ia32_mmap_mutex);
 #endif
        return ret;
 }
@@ -563,7 +1036,7 @@ mprotect_subpage (unsigned long address, int new_prot)
 asmlinkage long
 sys32_mprotect (unsigned int start, unsigned int len, int prot)
 {
-       unsigned long end = start + len;
+       unsigned int end = start + len;
 #if PAGE_SHIFT > IA32_PAGE_SHIFT
        long retval = 0;
 #endif
@@ -580,7 +1053,12 @@ sys32_mprotect (unsigned int start, unsigned int len, int prot)
        if (end < start)
                return -EINVAL;
 
-       down(&ia32_mmap_sem);
+       retval = ia32_compare_pp(&start, &end);
+
+       if (retval < 0)
+               return retval;
+
+       mutex_lock(&ia32_mmap_mutex);
        {
                if (offset_in_page(start)) {
                        /* start address is 4KB aligned but not page aligned. */
@@ -604,13 +1082,64 @@ sys32_mprotect (unsigned int start, unsigned int len, int prot)
                retval = sys_mprotect(start, end - start, prot);
        }
   out:
-       up(&ia32_mmap_sem);
+       mutex_unlock(&ia32_mmap_mutex);
        return retval;
 #endif
 }
 
 asmlinkage long
-sys32_pipe (int *fd)
+sys32_mremap (unsigned int addr, unsigned int old_len, unsigned int new_len,
+               unsigned int flags, unsigned int new_addr)
+{
+       long ret;
+
+#if PAGE_SHIFT <= IA32_PAGE_SHIFT
+       ret = sys_mremap(addr, old_len, new_len, flags, new_addr);
+#else
+       unsigned int old_end, new_end;
+
+       if (OFFSET4K(addr))
+               return -EINVAL;
+
+       old_len = IA32_PAGE_ALIGN(old_len);
+       new_len = IA32_PAGE_ALIGN(new_len);
+       old_end = addr + old_len;
+       new_end = addr + new_len;
+
+       if (!new_len)
+               return -EINVAL;
+
+       if ((flags & MREMAP_FIXED) && (OFFSET4K(new_addr)))
+               return -EINVAL;
+
+       if (old_len >= new_len) {
+               ret = sys32_munmap(addr + new_len, old_len - new_len);
+               if (ret && old_len != new_len)
+                       return ret;
+               ret = addr;
+               if (!(flags & MREMAP_FIXED) || (new_addr == addr))
+                       return ret;
+               old_len = new_len;
+       }
+
+       addr = PAGE_START(addr);
+       old_len = PAGE_ALIGN(old_end) - addr;
+       new_len = PAGE_ALIGN(new_end) - addr;
+
+       mutex_lock(&ia32_mmap_mutex);
+       ret = sys_mremap(addr, old_len, new_len, flags, new_addr);
+       mutex_unlock(&ia32_mmap_mutex);
+
+       if ((ret >= 0) && (old_len < new_len)) {
+               /* mremap expanded successfully */
+               ia32_set_pp(old_end, new_end, flags);
+       }
+#endif
+       return ret;
+}
+
+asmlinkage long
+sys32_pipe (int __user *fd)
 {
        int retval;
        int fds[2];
@@ -625,14 +1154,14 @@ sys32_pipe (int *fd)
 }
 
 static inline long
-get_tv32 (struct timeval *o, struct compat_timeval *i)
+get_tv32 (struct timeval *o, struct compat_timeval __user *i)
 {
        return (!access_ok(VERIFY_READ, i, sizeof(*i)) ||
                (__get_user(o->tv_sec, &i->tv_sec) | __get_user(o->tv_usec, &i->tv_usec)));
 }
 
 static inline long
-put_tv32 (struct compat_timeval *o, struct timeval *i)
+put_tv32 (struct compat_timeval __user *o, struct timeval *i)
 {
        return (!access_ok(VERIFY_WRITE, o, sizeof(*o)) ||
                (__put_user(i->tv_sec, &o->tv_sec) | __put_user(i->tv_usec, &o->tv_usec)));
@@ -641,19 +1170,7 @@ put_tv32 (struct compat_timeval *o, struct timeval *i)
 asmlinkage unsigned long
 sys32_alarm (unsigned int seconds)
 {
-       struct itimerval it_new, it_old;
-       unsigned int oldalarm;
-
-       it_new.it_interval.tv_sec = it_new.it_interval.tv_usec = 0;
-       it_new.it_value.tv_sec = seconds;
-       it_new.it_value.tv_usec = 0;
-       do_setitimer(ITIMER_REAL, &it_new, &it_old);
-       oldalarm = it_old.it_value.tv_sec;
-       /* ehhh.. We can't return 0 if we have an alarm pending.. */
-       /* And we'd better return too much than too little anyway */
-       if (it_old.it_value.tv_usec)
-               oldalarm++;
-       return oldalarm;
+       return alarm_setitimer(seconds);
 }
 
 /* Translations due to time_t size differences.  Which affects all
@@ -662,11 +1179,11 @@ sys32_alarm (unsigned int seconds)
 extern struct timezone sys_tz;
 
 asmlinkage long
-sys32_gettimeofday (struct compat_timeval *tv, struct timezone *tz)
+sys32_gettimeofday (struct compat_timeval __user *tv, struct timezone __user *tz)
 {
        if (tv) {
                struct timeval ktv;
-               do_gettimeofday(&ktv);
+               vx_gettimeofday(&ktv);
                if (put_tv32(tv, &ktv))
                        return -EFAULT;
        }
@@ -678,7 +1195,7 @@ sys32_gettimeofday (struct compat_timeval *tv, struct timezone *tz)
 }
 
 asmlinkage long
-sys32_settimeofday (struct compat_timeval *tv, struct timezone *tz)
+sys32_settimeofday (struct compat_timeval __user *tv, struct timezone __user *tz)
 {
        struct timeval ktv;
        struct timespec kts;
@@ -699,28 +1216,32 @@ sys32_settimeofday (struct compat_timeval *tv, struct timezone *tz)
 }
 
 struct getdents32_callback {
-       struct compat_dirent current_dir;
-       struct compat_dirent previous;
+       struct compat_dirent __user *current_dir;
+       struct compat_dirent __user *previous;
        int count;
        int error;
 };
 
 struct readdir32_callback {
-       struct old_linux32_dirent * dirent;
+       struct old_linux32_dirent __user * dirent;
        int count;
 };
 
 static int
-filldir32 (void *__buf, const char *name, int namlen, loff_t offset, ino_t ino,
+filldir32 (void *__buf, const char *name, int namlen, loff_t offset, u64 ino,
           unsigned int d_type)
 {
-       struct compat_dirent * dirent;
+       struct compat_dirent __user * dirent;
        struct getdents32_callback * buf = (struct getdents32_callback *) __buf;
-       int reclen = ROUND_UP(NAME_OFFSET(dirent) + namlen + 1, 4);
+       int reclen = ROUND_UP(offsetof(struct compat_dirent, d_name) + namlen + 1, 4);
+       u32 d_ino;
 
        buf->error = -EINVAL;   /* only used if we fail.. */
        if (reclen > buf->count)
                return -EINVAL;
+       d_ino = ino;
+       if (sizeof(d_ino) < sizeof(ino) && d_ino != ino)
+               return -EOVERFLOW;
        buf->error = -EFAULT;   /* only used if we fail.. */
        dirent = buf->previous;
        if (dirent)
@@ -728,22 +1249,22 @@ filldir32 (void *__buf, const char *name, int namlen, loff_t offset, ino_t ino,
                        return -EFAULT;
        dirent = buf->current_dir;
        buf->previous = dirent;
-       if (put_user(ino, &dirent->d_ino)
+       if (put_user(d_ino, &dirent->d_ino)
            || put_user(reclen, &dirent->d_reclen)
            || copy_to_user(dirent->d_name, name, namlen)
            || put_user(0, dirent->d_name + namlen))
                return -EFAULT;
-       dirent = (struct compat_dirent *) ((char *) dirent + reclen);
+       dirent = (struct compat_dirent __user *) ((char __user *) dirent + reclen);
        buf->current_dir = dirent;
        buf->count -= reclen;
        return 0;
 }
 
 asmlinkage long
-sys32_getdents (unsigned int fd, struct compat_dirent *dirent, unsigned int count)
+sys32_getdents (unsigned int fd, struct compat_dirent __user *dirent, unsigned int count)
 {
        struct file * file;
-       struct compat_dirent * lastdirent;
+       struct compat_dirent __user * lastdirent;
        struct getdents32_callback buf;
        int error;
 
@@ -776,17 +1297,21 @@ out:
 }
 
 static int
-fillonedir32 (void * __buf, const char * name, int namlen, loff_t offset, ino_t ino,
+fillonedir32 (void * __buf, const char * name, int namlen, loff_t offset, u64 ino,
              unsigned int d_type)
 {
        struct readdir32_callback * buf = (struct readdir32_callback *) __buf;
-       struct old_linux32_dirent * dirent;
+       struct old_linux32_dirent __user * dirent;
+       u32 d_ino;
 
        if (buf->count)
                return -EINVAL;
+       d_ino = ino;
+       if (sizeof(d_ino) < sizeof(ino) && d_ino != ino)
+               return -EOVERFLOW;
        buf->count++;
        dirent = buf->dirent;
-       if (put_user(ino, &dirent->d_ino)
+       if (put_user(d_ino, &dirent->d_ino)
            || put_user(offset, &dirent->d_offset)
            || put_user(namlen, &dirent->d_namlen)
            || copy_to_user(dirent->d_name, name, namlen)
@@ -796,7 +1321,7 @@ fillonedir32 (void * __buf, const char * name, int namlen, loff_t offset, ino_t
 }
 
 asmlinkage long
-sys32_readdir (unsigned int fd, void *dirent, unsigned int count)
+sys32_readdir (unsigned int fd, void __user *dirent, unsigned int count)
 {
        int error;
        struct file * file;
@@ -818,110 +1343,6 @@ out:
        return error;
 }
 
-/*
- * We can actually return ERESTARTSYS instead of EINTR, but I'd
- * like to be certain this leads to no problems. So I return
- * EINTR just for safety.
- *
- * Update: ERESTARTSYS breaks at least the xview clock binary, so
- * I'm trying ERESTARTNOHAND which restart only when you want to.
- */
-#define MAX_SELECT_SECONDS \
-       ((unsigned long) (MAX_SCHEDULE_TIMEOUT / HZ)-1)
-#define ROUND_UP_TIME(x,y) (((x)+(y)-1)/(y))
-
-asmlinkage long
-sys32_select (int n, fd_set *inp, fd_set *outp, fd_set *exp, struct compat_timeval *tvp32)
-{
-       fd_set_bits fds;
-       char *bits;
-       long timeout;
-       int ret, size;
-
-       timeout = MAX_SCHEDULE_TIMEOUT;
-       if (tvp32) {
-               time_t sec, usec;
-
-               ret = -EFAULT;
-               if (get_user(sec, &tvp32->tv_sec) || get_user(usec, &tvp32->tv_usec))
-                       goto out_nofds;
-
-               ret = -EINVAL;
-               if (sec < 0 || usec < 0)
-                       goto out_nofds;
-
-               if ((unsigned long) sec < MAX_SELECT_SECONDS) {
-                       timeout = ROUND_UP_TIME(usec, 1000000/HZ);
-                       timeout += sec * (unsigned long) HZ;
-               }
-       }
-
-       ret = -EINVAL;
-       if (n < 0)
-               goto out_nofds;
-
-       if (n > current->files->max_fdset)
-               n = current->files->max_fdset;
-
-       /*
-        * We need 6 bitmaps (in/out/ex for both incoming and outgoing),
-        * since we used fdset we need to allocate memory in units of
-        * long-words.
-        */
-       ret = -ENOMEM;
-       size = FDS_BYTES(n);
-       bits = kmalloc(6 * size, GFP_KERNEL);
-       if (!bits)
-               goto out_nofds;
-       fds.in      = (unsigned long *)  bits;
-       fds.out     = (unsigned long *) (bits +   size);
-       fds.ex      = (unsigned long *) (bits + 2*size);
-       fds.res_in  = (unsigned long *) (bits + 3*size);
-       fds.res_out = (unsigned long *) (bits + 4*size);
-       fds.res_ex  = (unsigned long *) (bits + 5*size);
-
-       if ((ret = get_fd_set(n, inp, fds.in)) ||
-           (ret = get_fd_set(n, outp, fds.out)) ||
-           (ret = get_fd_set(n, exp, fds.ex)))
-               goto out;
-       zero_fd_set(n, fds.res_in);
-       zero_fd_set(n, fds.res_out);
-       zero_fd_set(n, fds.res_ex);
-
-       ret = do_select(n, &fds, &timeout);
-
-       if (tvp32 && !(current->personality & STICKY_TIMEOUTS)) {
-               time_t sec = 0, usec = 0;
-               if (timeout) {
-                       sec = timeout / HZ;
-                       usec = timeout % HZ;
-                       usec *= (1000000/HZ);
-               }
-               if (put_user(sec, &tvp32->tv_sec) || put_user(usec, &tvp32->tv_usec)) {
-                       ret = -EFAULT;
-                       goto out;
-               }
-       }
-
-       if (ret < 0)
-               goto out;
-       if (!ret) {
-               ret = -ERESTARTNOHAND;
-               if (signal_pending(current))
-                       goto out;
-               ret = 0;
-       }
-
-       set_fd_set(n, inp, fds.res_in);
-       set_fd_set(n, outp, fds.res_out);
-       set_fd_set(n, exp, fds.res_ex);
-
-out:
-       kfree(bits);
-out_nofds:
-       return ret;
-}
-
 struct sel_arg_struct {
        unsigned int n;
        unsigned int inp;
@@ -931,93 +1352,14 @@ struct sel_arg_struct {
 };
 
 asmlinkage long
-sys32_old_select (struct sel_arg_struct *arg)
-{
-       struct sel_arg_struct a;
-
-       if (copy_from_user(&a, arg, sizeof(a)))
-               return -EFAULT;
-       return sys32_select(a.n, (fd_set *) A(a.inp), (fd_set *) A(a.outp), (fd_set *) A(a.exp),
-                           (struct compat_timeval *) A(a.tvp));
-}
-
-static struct iovec *
-get_compat_iovec (struct compat_iovec *iov32, struct iovec *iov_buf, u32 count, int type)
-{
-       u32 i, buf, len;
-       struct iovec *ivp, *iov;
-
-       /* Get the "struct iovec" from user memory */
-
-       if (!count)
-               return 0;
-       if (verify_area(VERIFY_READ, iov32, sizeof(struct compat_iovec)*count))
-               return NULL;
-       if (count > UIO_MAXIOV)
-               return NULL;
-       if (count > UIO_FASTIOV) {
-               iov = kmalloc(count*sizeof(struct iovec), GFP_KERNEL);
-               if (!iov)
-                       return NULL;
-       } else
-               iov = iov_buf;
-
-       ivp = iov;
-       for (i = 0; i < count; i++) {
-               if (__get_user(len, &iov32->iov_len) || __get_user(buf, &iov32->iov_base)) {
-                       if (iov != iov_buf)
-                               kfree(iov);
-                       return NULL;
-               }
-               if (verify_area(type, (void *)A(buf), len)) {
-                       if (iov != iov_buf)
-                               kfree(iov);
-                       return((struct iovec *)0);
-               }
-               ivp->iov_base = (void *)A(buf);
-               ivp->iov_len = (__kernel_size_t) len;
-               iov32++;
-               ivp++;
-       }
-       return iov;
-}
-
-asmlinkage long
-sys32_readv (int fd, struct compat_iovec *vector, u32 count)
-{
-       struct iovec iovstack[UIO_FASTIOV];
-       struct iovec *iov;
-       long ret;
-       mm_segment_t old_fs = get_fs();
-
-       iov = get_compat_iovec(vector, iovstack, count, VERIFY_WRITE);
-       if (!iov)
-               return -EFAULT;
-       set_fs(KERNEL_DS);
-       ret = sys_readv(fd, iov, count);
-       set_fs(old_fs);
-       if (iov != iovstack)
-               kfree(iov);
-       return ret;
-}
-
-asmlinkage long
-sys32_writev (int fd, struct compat_iovec *vector, u32 count)
+sys32_old_select (struct sel_arg_struct __user *arg)
 {
-       struct iovec iovstack[UIO_FASTIOV];
-       struct iovec *iov;
-       long ret;
-       mm_segment_t old_fs = get_fs();
+       struct sel_arg_struct a;
 
-       iov = get_compat_iovec(vector, iovstack, count, VERIFY_READ);
-       if (!iov)
+       if (copy_from_user(&a, arg, sizeof(a)))
                return -EFAULT;
-       set_fs(KERNEL_DS);
-       ret = sys_writev(fd, iov, count);
-       set_fs(old_fs);
-       if (iov != iovstack)
-               kfree(iov);
-       return ret;
+       return compat_sys_select(a.n, compat_ptr(a.inp), compat_ptr(a.outp),
+                                compat_ptr(a.exp), compat_ptr(a.tvp));
 }
 
 #define SEMOP           1
@@ -1071,7 +1413,7 @@ sys32_ipc(u32 call, int first, int second, int third, u32 ptr, u32 fifth)
              case SHMDT:
                return sys_shmdt(compat_ptr(ptr));
              case SHMGET:
-               return sys_shmget(first, second, third);
+               return sys_shmget(first, (unsigned)second, third);
              case SHMCTL:
                return compat_sys_shmctl(first, second, compat_ptr(ptr));
 
@@ -1081,27 +1423,6 @@ sys32_ipc(u32 call, int first, int second, int third, u32 ptr, u32 fifth)
        return -EINVAL;
 }
 
-/*
- * sys_time() can be implemented in user-level using
- * sys_gettimeofday().  IA64 did this but i386 Linux did not
- * so we have to implement this system call here.
- */
-asmlinkage long
-sys32_time (int *tloc)
-{
-       int i;
-       struct timeval tv;
-
-       do_gettimeofday(&tv);
-       i = tv.tv_sec;
-
-       if (tloc) {
-               if (put_user(i, tloc))
-                       i = -EFAULT;
-       }
-       return i;
-}
-
 asmlinkage long
 compat_sys_wait4 (compat_pid_t pid, compat_uint_t * stat_addr, int options,
                 struct compat_rusage *ru);
@@ -1112,25 +1433,6 @@ sys32_waitpid (int pid, unsigned int *stat_addr, int options)
        return compat_sys_wait4(pid, stat_addr, options, NULL);
 }
 
-static unsigned int
-ia32_peek (struct pt_regs *regs, struct task_struct *child, unsigned long addr, unsigned int *val)
-{
-       size_t copied;
-       unsigned int ret;
-
-       copied = access_process_vm(child, addr, val, sizeof(*val), 0);
-       return (copied != sizeof(ret)) ? -EIO : 0;
-}
-
-static unsigned int
-ia32_poke (struct pt_regs *regs, struct task_struct *child, unsigned long addr, unsigned int val)
-{
-
-       if (access_process_vm(child, addr, &val, sizeof(val), 1) != sizeof(val))
-               return -EIO;
-       return 0;
-}
-
 /*
  *  The order in which registers are stored in the ptrace regs structure
  */
@@ -1157,7 +1459,7 @@ getreg (struct task_struct *child, int regno)
 {
        struct pt_regs *child_regs;
 
-       child_regs = ia64_task_regs(child);
+       child_regs = task_pt_regs(child);
        switch (regno / sizeof(int)) {
              case PT_EBX: return child_regs->r11;
              case PT_ECX: return child_regs->r9;
@@ -1185,7 +1487,7 @@ putreg (struct task_struct *child, int regno, unsigned int value)
 {
        struct pt_regs *child_regs;
 
-       child_regs = ia64_task_regs(child);
+       child_regs = task_pt_regs(child);
        switch (regno / sizeof(int)) {
              case PT_EBX: child_regs->r11 = value; break;
              case PT_ECX: child_regs->r9 = value; break;
@@ -1217,8 +1519,8 @@ putreg (struct task_struct *child, int regno, unsigned int value)
 }
 
 static void
-put_fpreg (int regno, struct _fpreg_ia32 *reg, struct pt_regs *ptp, struct switch_stack *swp,
-          int tos)
+put_fpreg (int regno, struct _fpreg_ia32 __user *reg, struct pt_regs *ptp,
+          struct switch_stack *swp, int tos)
 {
        struct _fpreg_ia32 *f;
        char buf[32];
@@ -1250,8 +1552,8 @@ put_fpreg (int regno, struct _fpreg_ia32 *reg, struct pt_regs *ptp, struct switc
 }
 
 static void
-get_fpreg (int regno, struct _fpreg_ia32 *reg, struct pt_regs *ptp, struct switch_stack *swp,
-          int tos)
+get_fpreg (int regno, struct _fpreg_ia32 __user *reg, struct pt_regs *ptp,
+          struct switch_stack *swp, int tos)
 {
 
        if ((regno += tos) >= 8)
@@ -1280,7 +1582,7 @@ get_fpreg (int regno, struct _fpreg_ia32 *reg, struct pt_regs *ptp, struct switc
 }
 
 int
-save_ia32_fpstate (struct task_struct *tsk, struct ia32_user_i387_struct *save)
+save_ia32_fpstate (struct task_struct *tsk, struct ia32_user_i387_struct __user *save)
 {
        struct switch_stack *swp;
        struct pt_regs *ptp;
@@ -1301,7 +1603,7 @@ save_ia32_fpstate (struct task_struct *tsk, struct ia32_user_i387_struct *save)
         *  Stack frames start with 16-bytes of temp space
         */
        swp = (struct switch_stack *)(tsk->thread.ksp + 16);
-       ptp = ia64_task_regs(tsk);
+       ptp = task_pt_regs(tsk);
        tos = (tsk->thread.fsr >> 11) & 7;
        for (i = 0; i < 8; i++)
                put_fpreg(i, &save->st_space[i], ptp, swp, tos);
@@ -1309,7 +1611,7 @@ save_ia32_fpstate (struct task_struct *tsk, struct ia32_user_i387_struct *save)
 }
 
 static int
-restore_ia32_fpstate (struct task_struct *tsk, struct ia32_user_i387_struct *save)
+restore_ia32_fpstate (struct task_struct *tsk, struct ia32_user_i387_struct __user *save)
 {
        struct switch_stack *swp;
        struct pt_regs *ptp;
@@ -1319,22 +1621,22 @@ restore_ia32_fpstate (struct task_struct *tsk, struct ia32_user_i387_struct *sav
        if (!access_ok(VERIFY_READ, save, sizeof(*save)))
                return(-EFAULT);
 
-       __get_user(num32, (unsigned int *)&save->cwd);
+       __get_user(num32, (unsigned int __user *)&save->cwd);
        tsk->thread.fcr = (tsk->thread.fcr & (~0x1f3f)) | (num32 & 0x1f3f);
-       __get_user(fsrlo, (unsigned int *)&save->swd);
-       __get_user(fsrhi, (unsigned int *)&save->twd);
+       __get_user(fsrlo, (unsigned int __user *)&save->swd);
+       __get_user(fsrhi, (unsigned int __user *)&save->twd);
        num32 = (fsrhi << 16) | fsrlo;
        tsk->thread.fsr = (tsk->thread.fsr & (~0xffffffff)) | num32;
-       __get_user(num32, (unsigned int *)&save->fip);
+       __get_user(num32, (unsigned int __user *)&save->fip);
        tsk->thread.fir = (tsk->thread.fir & (~0xffffffff)) | num32;
-       __get_user(num32, (unsigned int *)&save->foo);
+       __get_user(num32, (unsigned int __user *)&save->foo);
        tsk->thread.fdr = (tsk->thread.fdr & (~0xffffffff)) | num32;
 
        /*
         *  Stack frames start with 16-bytes of temp space
         */
        swp = (struct switch_stack *)(tsk->thread.ksp + 16);
-       ptp = ia64_task_regs(tsk);
+       ptp = task_pt_regs(tsk);
        tos = (tsk->thread.fsr >> 11) & 7;
        for (i = 0; i < 8; i++)
                get_fpreg(i, &save->st_space[i], ptp, swp, tos);
@@ -1342,7 +1644,7 @@ restore_ia32_fpstate (struct task_struct *tsk, struct ia32_user_i387_struct *sav
 }
 
 int
-save_ia32_fpxstate (struct task_struct *tsk, struct ia32_user_fxsr_struct *save)
+save_ia32_fpxstate (struct task_struct *tsk, struct ia32_user_fxsr_struct __user *save)
 {
        struct switch_stack *swp;
        struct pt_regs *ptp;
@@ -1365,10 +1667,10 @@ save_ia32_fpxstate (struct task_struct *tsk, struct ia32_user_fxsr_struct *save)
          *  Stack frames start with 16-bytes of temp space
          */
         swp = (struct switch_stack *)(tsk->thread.ksp + 16);
-        ptp = ia64_task_regs(tsk);
+        ptp = task_pt_regs(tsk);
        tos = (tsk->thread.fsr >> 11) & 7;
         for (i = 0; i < 8; i++)
-               put_fpreg(i, (struct _fpreg_ia32 *)&save->st_space[4*i], ptp, swp, tos);
+               put_fpreg(i, (struct _fpreg_ia32 __user *)&save->st_space[4*i], ptp, swp, tos);
 
        mxcsr = ((tsk->thread.fcr>>32) & 0xff80) | ((tsk->thread.fsr>>32) & 0x3f);
        __put_user(mxcsr & 0xffff, &save->mxcsr);
@@ -1381,7 +1683,7 @@ save_ia32_fpxstate (struct task_struct *tsk, struct ia32_user_fxsr_struct *save)
 }
 
 static int
-restore_ia32_fpxstate (struct task_struct *tsk, struct ia32_user_fxsr_struct *save)
+restore_ia32_fpxstate (struct task_struct *tsk, struct ia32_user_fxsr_struct __user *save)
 {
        struct switch_stack *swp;
        struct pt_regs *ptp;
@@ -1394,31 +1696,31 @@ restore_ia32_fpxstate (struct task_struct *tsk, struct ia32_user_fxsr_struct *sa
        if (!access_ok(VERIFY_READ, save, sizeof(*save)))
                return(-EFAULT);
 
-       __get_user(num32, (unsigned int *)&save->cwd);
+       __get_user(num32, (unsigned int __user *)&save->cwd);
        tsk->thread.fcr = (tsk->thread.fcr & (~0x1f3f)) | (num32 & 0x1f3f);
-       __get_user(fsrlo, (unsigned int *)&save->swd);
-       __get_user(fsrhi, (unsigned int *)&save->twd);
+       __get_user(fsrlo, (unsigned int __user *)&save->swd);
+       __get_user(fsrhi, (unsigned int __user *)&save->twd);
        num32 = (fsrhi << 16) | fsrlo;
        tsk->thread.fsr = (tsk->thread.fsr & (~0xffffffff)) | num32;
-       __get_user(num32, (unsigned int *)&save->fip);
+       __get_user(num32, (unsigned int __user *)&save->fip);
        tsk->thread.fir = (tsk->thread.fir & (~0xffffffff)) | num32;
-       __get_user(num32, (unsigned int *)&save->foo);
+       __get_user(num32, (unsigned int __user *)&save->foo);
        tsk->thread.fdr = (tsk->thread.fdr & (~0xffffffff)) | num32;
 
        /*
         *  Stack frames start with 16-bytes of temp space
         */
        swp = (struct switch_stack *)(tsk->thread.ksp + 16);
-       ptp = ia64_task_regs(tsk);
+       ptp = task_pt_regs(tsk);
        tos = (tsk->thread.fsr >> 11) & 7;
        for (i = 0; i < 8; i++)
-       get_fpreg(i, (struct _fpreg_ia32 *)&save->st_space[4*i], ptp, swp, tos);
+       get_fpreg(i, (struct _fpreg_ia32 __user *)&save->st_space[4*i], ptp, swp, tos);
 
-       __get_user(mxcsr, (unsigned int *)&save->mxcsr);
+       __get_user(mxcsr, (unsigned int __user *)&save->mxcsr);
        num64 = mxcsr & 0xff10;
-       tsk->thread.fcr = (tsk->thread.fcr & (~0xff1000000000)) | (num64<<32);
+       tsk->thread.fcr = (tsk->thread.fcr & (~0xff1000000000UL)) | (num64<<32);
        num64 = mxcsr & 0x3f;
-       tsk->thread.fsr = (tsk->thread.fsr & (~0x3f00000000)) | (num64<<32);
+       tsk->thread.fsr = (tsk->thread.fsr & (~0x3f00000000UL)) | (num64<<32);
 
        for (i = 0; i < 8; i++) {
                copy_from_user(num128, &save->xmm_space[0] + 4*i, sizeof(struct _xmmreg_ia32));
@@ -1428,42 +1730,28 @@ restore_ia32_fpxstate (struct task_struct *tsk, struct ia32_user_fxsr_struct *sa
        return 0;
 }
 
-/*
- *  Note that the IA32 version of `ptrace' calls the IA64 routine for
- *    many of the requests.  This will only work for requests that do
- *    not need access to the calling processes `pt_regs' which is located
- *    at the address of `stack'.  Once we call the IA64 `sys_ptrace' then
- *    the address of `stack' will not be the address of the `pt_regs'.
- */
+#if 0                          /* XXX */
 asmlinkage long
-sys32_ptrace (int request, pid_t pid, unsigned int addr, unsigned int data,
-             long arg4, long arg5, long arg6, long arg7, long stack)
+sys32_ptrace (int request, pid_t pid, unsigned int addr, unsigned int data)
 {
-       struct pt_regs *regs = (struct pt_regs *) &stack;
        struct task_struct *child;
        unsigned int value, tmp;
        long i, ret;
 
        lock_kernel();
        if (request == PTRACE_TRACEME) {
-               ret = sys_ptrace(request, pid, addr, data, arg4, arg5, arg6, arg7, stack);
+               ret = ptrace_traceme();
                goto out;
        }
 
-       ret = -ESRCH;
-       read_lock(&tasklist_lock);
-       child = find_task_by_pid(pid);
-       if (child)
-               get_task_struct(child);
-       read_unlock(&tasklist_lock);
-       if (!child)
+       child = ptrace_get_task_struct(pid);
+       if (IS_ERR(child)) {
+               ret = PTR_ERR(child);
                goto out;
-       ret = -EPERM;
-       if (pid == 1)           /* no messing around with init! */
-               goto out_tsk;
+       }
 
        if (request == PTRACE_ATTACH) {
-               ret = sys_ptrace(request, pid, addr, data, arg4, arg5, arg6, arg7, stack);
+               ret = sys_ptrace(request, pid, addr, data);
                goto out_tsk;
        }
 
@@ -1474,16 +1762,16 @@ sys32_ptrace (int request, pid_t pid, unsigned int addr, unsigned int data,
        switch (request) {
              case PTRACE_PEEKTEXT:
              case PTRACE_PEEKDATA:     /* read word at location addr */
-               ret = ia32_peek(regs, child, addr, &value);
+               ret = ia32_peek(child, addr, &value);
                if (ret == 0)
-                       ret = put_user(value, (unsigned int *) A(data));
+                       ret = put_user(value, (unsigned int __user *) compat_ptr(data));
                else
                        ret = -EIO;
                goto out_tsk;
 
              case PTRACE_POKETEXT:
              case PTRACE_POKEDATA:     /* write the word at location addr */
-               ret = ia32_poke(regs, child, addr, data);
+               ret = ia32_poke(child, addr, data);
                goto out_tsk;
 
              case PTRACE_PEEKUSR:      /* read word at addr in USER area */
@@ -1492,7 +1780,7 @@ sys32_ptrace (int request, pid_t pid, unsigned int addr, unsigned int data,
                        break;
 
                tmp = getreg(child, addr);
-               if (!put_user(tmp, (unsigned int *) A(data)))
+               if (!put_user(tmp, (unsigned int __user *) compat_ptr(data)))
                        ret = 0;
                break;
 
@@ -1506,24 +1794,24 @@ sys32_ptrace (int request, pid_t pid, unsigned int addr, unsigned int data,
                break;
 
              case IA32_PTRACE_GETREGS:
-               if (!access_ok(VERIFY_WRITE, (int *) A(data), 17*sizeof(int))) {
+               if (!access_ok(VERIFY_WRITE, compat_ptr(data), 17*sizeof(int))) {
                        ret = -EIO;
                        break;
                }
                for (i = 0; i < (int) (17*sizeof(int)); i += sizeof(int) ) {
-                       put_user(getreg(child, i), (unsigned int *) A(data));
+                       put_user(getreg(child, i), (unsigned int __user *) compat_ptr(data));
                        data += sizeof(int);
                }
                ret = 0;
                break;
 
              case IA32_PTRACE_SETREGS:
-               if (!access_ok(VERIFY_READ, (int *) A(data), 17*sizeof(int))) {
+               if (!access_ok(VERIFY_READ, compat_ptr(data), 17*sizeof(int))) {
                        ret = -EIO;
                        break;
                }
                for (i = 0; i < (int) (17*sizeof(int)); i += sizeof(int) ) {
-                       get_user(tmp, (unsigned int *) A(data));
+                       get_user(tmp, (unsigned int __user *) compat_ptr(data));
                        putreg(child, i, tmp);
                        data += sizeof(int);
                }
@@ -1531,27 +1819,37 @@ sys32_ptrace (int request, pid_t pid, unsigned int addr, unsigned int data,
                break;
 
              case IA32_PTRACE_GETFPREGS:
-               ret = save_ia32_fpstate(child, (struct ia32_user_i387_struct *) A(data));
+               ret = save_ia32_fpstate(child, (struct ia32_user_i387_struct __user *)
+                                       compat_ptr(data));
                break;
 
              case IA32_PTRACE_GETFPXREGS:
-               ret = save_ia32_fpxstate(child, (struct ia32_user_fxsr_struct *) A(data));
+               ret = save_ia32_fpxstate(child, (struct ia32_user_fxsr_struct __user *)
+                                        compat_ptr(data));
                break;
 
              case IA32_PTRACE_SETFPREGS:
-               ret = restore_ia32_fpstate(child, (struct ia32_user_i387_struct *) A(data));
+               ret = restore_ia32_fpstate(child, (struct ia32_user_i387_struct __user *)
+                                          compat_ptr(data));
                break;
 
              case IA32_PTRACE_SETFPXREGS:
-               ret = restore_ia32_fpxstate(child, (struct ia32_user_fxsr_struct *) A(data));
+               ret = restore_ia32_fpxstate(child, (struct ia32_user_fxsr_struct __user *)
+                                           compat_ptr(data));
+               break;
+
+#if 0                          /* XXX */
+             case PTRACE_GETEVENTMSG:   
+               ret = put_user(child->ptrace_message, (unsigned int __user *) compat_ptr(data));
                break;
+#endif
 
              case PTRACE_SYSCALL:      /* continue, stop after next syscall */
              case PTRACE_CONT:         /* restart after signal. */
              case PTRACE_KILL:
              case PTRACE_SINGLESTEP:   /* execute chile for one instruction */
              case PTRACE_DETACH:       /* detach a process */
-               ret = sys_ptrace(request, pid, addr, data, arg4, arg5, arg6, arg7, stack);
+               ret = sys_ptrace(request, pid, addr, data);
                break;
 
              default:
@@ -1565,74 +1863,520 @@ sys32_ptrace (int request, pid_t pid, unsigned int addr, unsigned int data,
        unlock_kernel();
        return ret;
 }
+#endif
 
-/*
- *  The IA64 maps 4 I/O ports for each 4K page
- */
-#define IOLEN  ((65536 / 4) * 4096)
+#ifdef CONFIG_UTRACE
+typedef struct utrace_get {
+       void *kbuf;
+       void __user *ubuf;
+} utrace_get_t;
 
-asmlinkage long
-sys32_iopl (int level)
+typedef struct utrace_set {
+       const void *kbuf;
+       const void __user *ubuf;
+} utrace_set_t;
+
+typedef struct utrace_getset {
+       struct task_struct *target;
+       const struct utrace_regset *regset;
+       union {
+               utrace_get_t get;
+               utrace_set_t set;
+       } u;
+       unsigned int pos;
+       unsigned int count;
+       int ret;
+} utrace_getset_t;
+
+static void getfpreg(struct task_struct *task, int regno,int *val)
 {
-       extern unsigned long ia64_iobase;
-       int fd;
-       struct file * file;
-       unsigned int old;
-       unsigned long addr;
-       mm_segment_t old_fs = get_fs ();
+       switch (regno / sizeof(int)) {
+               case 0: *val = task->thread.fcr & 0xffff; break;
+               case 1: *val = task->thread.fsr & 0xffff; break;
+               case 2: *val = (task->thread.fsr>>16) & 0xffff; break;
+               case 3: *val = task->thread.fir; break;
+               case 4: *val = (task->thread.fir>>32) & 0xffff; break;
+               case 5: *val = task->thread.fdr; break;
+               case 6: *val = (task->thread.fdr >> 32) & 0xffff; break;
+       }
+}
 
-       if (level != 3)
-               return(-EINVAL);
-       /* Trying to gain more privileges? */
-       old = ia64_getreg(_IA64_REG_AR_EFLAG);
-       if ((unsigned int) level > ((old >> 12) & 3)) {
-               if (!capable(CAP_SYS_RAWIO))
-                       return -EPERM;
+static void setfpreg(struct task_struct *task, int regno, int val)
+{
+       switch (regno / sizeof(int)) {
+               case 0:
+                       task->thread.fcr = (task->thread.fcr & (~0x1f3f))
+                               | (val & 0x1f3f);
+                       break;
+               case 1:
+                       task->thread.fsr = (task->thread.fsr & (~0xffff)) | val;
+                       break;
+               case 2:
+                       task->thread.fsr = (task->thread.fsr & (~0xffff0000))
+                               | (val << 16);
+                       break;
+               case 3:
+                       task->thread.fir = (task->thread.fir & (~0xffffffff)) | val;
+                       break;
+               case 5:
+                       task->thread.fdr = (task->thread.fdr & (~0xffffffff)) | val;
+                       break;
        }
-       set_fs(KERNEL_DS);
-       fd = sys_open("/dev/mem", O_SYNC | O_RDWR, 0);
-       set_fs(old_fs);
-       if (fd < 0)
-               return fd;
-       file = fget(fd);
-       if (file == NULL) {
-               sys_close(fd);
-               return(-EFAULT);
+}
+
+static void access_fpreg_ia32(int regno, void *reg,
+               struct pt_regs *pt, struct switch_stack *sw,
+               int tos, int write)
+{
+       void *f;
+
+       if ((regno += tos) >= 8)
+               regno -= 8;
+       if (regno <= 4)
+               f = &pt->f8 + regno;
+       else if (regno <= 7)
+               f = &sw->f12 + (regno - 4);
+       else {
+               printk(" regno must be less than 7 \n");
+                return;
        }
 
-       down_write(&current->mm->mmap_sem);
-       addr = do_mmap_pgoff(file, IA32_IOBASE,
-                            IOLEN, PROT_READ|PROT_WRITE, MAP_SHARED,
-                            (ia64_iobase & ~PAGE_OFFSET) >> PAGE_SHIFT);
-       up_write(&current->mm->mmap_sem);
+       if (write)
+               memcpy(f, reg, sizeof(struct _fpreg_ia32));
+       else
+               memcpy(reg, f, sizeof(struct _fpreg_ia32));
+}
+
+static void do_fpregs_get(struct unw_frame_info *info, void *arg)
+{
+       utrace_getset_t *dst = arg;
+       struct task_struct *task = dst->target;
+       struct pt_regs *pt;
+       int start, end, tos;
+       char buf[80];
+
+       if (dst->count == 0 || unw_unwind_to_user(info) < 0)
+               return;
+       if (dst->pos < 7 * sizeof(int)) {
+               end = min((dst->pos + dst->count), (unsigned int)(7 * sizeof(int)));
+               for (start = dst->pos; start < end; start += sizeof(int))
+                       getfpreg(task, start,(int *)( buf + start));
+               dst->ret = utrace_regset_copyout(&dst->pos, &dst->count,
+                               &dst->u.get.kbuf, &dst->u.get.ubuf, buf,
+                               0, 7 * sizeof(int));
+               if (dst->ret || dst->count == 0)
+                       return;
+       }
+       if (dst->pos < sizeof(struct ia32_user_i387_struct)) {
+               pt = task_pt_regs(task);
+               tos = (task->thread.fsr >> 11) & 7;
+               end = min(dst->pos + dst->count,
+                               (unsigned int)(sizeof(struct ia32_user_i387_struct)));
+               start = (dst->pos - 7 * sizeof(int)) / sizeof(struct _fpreg_ia32);
+               end = (end - 7 * sizeof(int)) / sizeof(struct _fpreg_ia32);
+               for (; start < end; start++)
+                       access_fpreg_ia32(start, (struct _fpreg_ia32 *)buf + start,
+                                       pt, info->sw, tos, 0);
+               dst->ret = utrace_regset_copyout(&dst->pos, &dst->count,
+                               &dst->u.get.kbuf, &dst->u.get.ubuf,
+                               buf, 7 * sizeof(int),
+                               sizeof(struct ia32_user_i387_struct));
+               if (dst->ret || dst->count == 0)
+                       return;
+       }
+}
 
-       if (addr >= 0) {
-               old = (old & ~0x3000) | (level << 12);
-               ia64_setreg(_IA64_REG_AR_EFLAG, old);
+static void do_fpregs_set(struct unw_frame_info *info, void *arg)
+{
+       utrace_getset_t *dst = arg;
+       struct task_struct *task = dst->target;
+       struct pt_regs *pt;
+       char buf[80];
+       int end, start, tos;
+
+       if (dst->count == 0 || unw_unwind_to_user(info) < 0)
+               return;
+
+       if (dst->pos < 7 * sizeof(int)) {
+               start = dst->pos;
+               dst->ret = utrace_regset_copyin(&dst->pos, &dst->count,
+                               &dst->u.set.kbuf, &dst->u.set.ubuf, buf,
+                               0, 7 * sizeof(int));
+               if (dst->ret)
+                       return;
+               for (; start < dst->pos; start += sizeof(int))
+                       setfpreg(task, start, *((int*)(buf + start)));
+               if (dst->count == 0)
+                       return;
+       }
+       if (dst->pos < sizeof(struct ia32_user_i387_struct)) {
+               start = (dst->pos - 7 * sizeof(int)) / sizeof(struct _fpreg_ia32);
+               dst->ret = utrace_regset_copyin(&dst->pos, &dst->count,
+                               &dst->u.set.kbuf, &dst->u.set.ubuf,
+                               buf, 7 * sizeof(int),
+                               sizeof(struct ia32_user_i387_struct));
+               if (dst->ret)
+                       return;
+               pt = task_pt_regs(task);
+               tos = (task->thread.fsr >> 11) & 7;
+               end = (dst->pos - 7 * sizeof(int)) / sizeof(struct _fpreg_ia32);
+               for (; start < end; start++)
+                       access_fpreg_ia32(start, (struct _fpreg_ia32 *)buf + start,
+                                       pt, info->sw, tos, 0);
+               if (dst->count == 0)
+                       return;
        }
+}
 
-       fput(file);
-       sys_close(fd);
+#define OFFSET(member) ((int)(offsetof(struct ia32_user_fxsr_struct, member)))
+static void getfpxreg(struct task_struct *task, int start, int end, char *buf)
+{
+       int min_val;
+
+       min_val = min(end, OFFSET(fop));
+       while (start < min_val) {
+               if (start == OFFSET(cwd))
+                       *((short *)buf) = task->thread.fcr & 0xffff;
+               else if (start == OFFSET(swd))
+                       *((short *)buf) = task->thread.fsr & 0xffff;
+               else if (start == OFFSET(twd))
+                       *((short *)buf) = (task->thread.fsr>>16) & 0xffff;
+               buf += 2;
+               start += 2;
+       }
+       /* skip fop element */
+       if (start == OFFSET(fop)) {
+               start += 2;
+               buf += 2;
+       }
+       while (start < end) {
+               if (start == OFFSET(fip))
+                       *((int *)buf) = task->thread.fir;
+               else if (start == OFFSET(fcs))
+                       *((int *)buf) = (task->thread.fir>>32) & 0xffff;
+               else if (start == OFFSET(foo))
+                       *((int *)buf) = task->thread.fdr;
+               else if (start == OFFSET(fos))
+                       *((int *)buf) = (task->thread.fdr>>32) & 0xffff;
+               else if (start == OFFSET(mxcsr))
+                       *((int *)buf) = ((task->thread.fcr>>32) & 0xff80)
+                                        | ((task->thread.fsr>>32) & 0x3f);
+               buf += 4;
+               start += 4;
+       }
+}
+
+static void setfpxreg(struct task_struct *task, int start, int end, char *buf)
+{
+       int min_val, num32;
+       short num;
+       unsigned long num64;
+
+       min_val = min(end, OFFSET(fop));
+       while (start < min_val) {
+               num = *((short *)buf);
+               if (start == OFFSET(cwd)) {
+                       task->thread.fcr = (task->thread.fcr & (~0x1f3f))
+                                               | (num & 0x1f3f);
+               } else if (start == OFFSET(swd)) {
+                       task->thread.fsr = (task->thread.fsr & (~0xffff)) | num;
+               } else if (start == OFFSET(twd)) {
+                       task->thread.fsr = (task->thread.fsr & (~0xffff0000)) | num;
+               }
+               buf += 2;
+               start += 2;
+       }
+       /* skip fop element */
+       if (start == OFFSET(fop)) {
+               start += 2;
+               buf += 2;
+       }
+       while (start < end) {
+               num32 = *((int *)buf);
+               if (start == OFFSET(fip))
+                       task->thread.fir = (task->thread.fir & (~0xffffffff))
+                                                | num32;
+               else if (start == OFFSET(foo))
+                       task->thread.fdr = (task->thread.fdr & (~0xffffffff))
+                                                | num32;
+               else if (start == OFFSET(mxcsr)) {
+                       num64 = num32 & 0xff10;
+                       task->thread.fcr = (task->thread.fcr & (~0xff1000000000UL))
+                                                | (num64<<32);
+                       num64 = num32 & 0x3f;
+                       task->thread.fsr = (task->thread.fsr & (~0x3f00000000UL))
+                                                | (num64<<32);
+               }
+               buf += 4;
+               start += 4;
+       }
+}
+
+static void do_fpxregs_get(struct unw_frame_info *info, void *arg)
+{
+       utrace_getset_t *dst = arg;
+       struct task_struct *task = dst->target;
+       struct pt_regs *pt;
+       char buf[128];
+       int start, end, tos;
+
+       if (dst->count == 0 || unw_unwind_to_user(info) < 0)
+               return;
+       if (dst->pos < OFFSET(st_space[0])) {
+               end = min(dst->pos + dst->count, (unsigned int)32);
+               getfpxreg(task, dst->pos, end, buf);
+               dst->ret = utrace_regset_copyout(&dst->pos, &dst->count,
+                               &dst->u.get.kbuf, &dst->u.get.ubuf, buf,
+                               0, OFFSET(st_space[0]));
+               if (dst->ret || dst->count == 0)
+                       return;
+       }
+       if (dst->pos < OFFSET(xmm_space[0])) {
+               pt = task_pt_regs(task);
+               tos = (task->thread.fsr >> 11) & 7;
+               end = min(dst->pos + dst->count,
+                               (unsigned int)OFFSET(xmm_space[0]));
+               start = (dst->pos - OFFSET(st_space[0])) / 16;
+               end = (end - OFFSET(st_space[0])) / 16;
+               for (; start < end; start++)
+                       access_fpreg_ia32(start, buf + 16 * start, pt,
+                                               info->sw, tos, 0);
+               dst->ret = utrace_regset_copyout(&dst->pos, &dst->count,
+                               &dst->u.get.kbuf, &dst->u.get.ubuf,
+                               buf, OFFSET(st_space[0]), OFFSET(xmm_space[0]));
+               if (dst->ret || dst->count == 0)
+                       return;
+       }
+       if (dst->pos < OFFSET(padding[0]))
+               dst->ret = utrace_regset_copyout(&dst->pos, &dst->count,
+                               &dst->u.get.kbuf, &dst->u.get.ubuf,
+                               &info->sw->f16, OFFSET(xmm_space[0]),
+                               OFFSET(padding[0]));
+}
+
+static void do_fpxregs_set(struct unw_frame_info *info, void *arg)
+{
+       utrace_getset_t *dst = arg;
+       struct task_struct *task = dst->target;
+       char buf[128];
+       int start, end;
+
+       if (dst->count == 0 || unw_unwind_to_user(info) < 0)
+               return;
+
+       if (dst->pos < OFFSET(st_space[0])) {
+               start = dst->pos;
+               dst->ret = utrace_regset_copyin(&dst->pos, &dst->count,
+                               &dst->u.set.kbuf, &dst->u.set.ubuf,
+                               buf, 0, OFFSET(st_space[0]));
+               if (dst->ret)
+                       return;
+               setfpxreg(task, start, dst->pos, buf);
+               if (dst->count == 0)
+                       return;
+       }
+       if (dst->pos < OFFSET(xmm_space[0])) {
+               struct pt_regs *pt;
+               int tos;
+               pt = task_pt_regs(task);
+               tos = (task->thread.fsr >> 11) & 7;
+               start = (dst->pos - OFFSET(st_space[0])) / 16;
+               dst->ret = utrace_regset_copyin(&dst->pos, &dst->count,
+                               &dst->u.set.kbuf, &dst->u.set.ubuf,
+                               buf, OFFSET(st_space[0]), OFFSET(xmm_space[0]));
+               if (dst->ret)
+                       return;
+               end = (dst->pos - OFFSET(st_space[0])) / 16;
+               for (; start < end; start++)
+                       access_fpreg_ia32(start, buf + 16 * start, pt, info->sw,
+                                                tos, 1);
+               if (dst->count == 0)
+                       return;
+       }
+       if (dst->pos < OFFSET(padding[0]))
+               dst->ret = utrace_regset_copyin(&dst->pos, &dst->count,
+                               &dst->u.set.kbuf, &dst->u.set.ubuf,
+                               &info->sw->f16, OFFSET(xmm_space[0]),
+                                OFFSET(padding[0]));
+}
+#undef OFFSET
+
+static int do_regset_call(void (*call)(struct unw_frame_info *, void *),
+               struct task_struct *target,
+               const struct utrace_regset *regset,
+               unsigned int pos, unsigned int count,
+               const void *kbuf, const void __user *ubuf)
+{
+       utrace_getset_t info = { .target = target, .regset = regset,
+               .pos = pos, .count = count,
+               .u.set = { .kbuf = kbuf, .ubuf = ubuf },
+               .ret = 0 };
+
+       if (target == current)
+               unw_init_running(call, &info);
+       else {
+               struct unw_frame_info ufi;
+               memset(&ufi, 0, sizeof(ufi));
+               unw_init_from_blocked_task(&ufi, target);
+               (*call)(&ufi, &info);
+       }
+
+       return info.ret;
+}
+
+static int ia32_fpregs_get(struct task_struct *target,
+               const struct utrace_regset *regset,
+               unsigned int pos, unsigned int count,
+               void *kbuf, void __user *ubuf)
+{
+       return do_regset_call(do_fpregs_get, target, regset, pos, count, kbuf, ubuf);
+}
+
+static int ia32_fpregs_set(struct task_struct *target,
+               const struct utrace_regset *regset,
+               unsigned int pos, unsigned int count,
+               const void *kbuf, const void __user *ubuf)
+{
+       return do_regset_call(do_fpregs_set, target, regset, pos, count, kbuf, ubuf);
+}
+
+static int ia32_fpxregs_get(struct task_struct *target,
+               const struct utrace_regset *regset,
+               unsigned int pos, unsigned int count,
+               void *kbuf, void __user *ubuf)
+{
+       return do_regset_call(do_fpxregs_get, target, regset, pos, count, kbuf, ubuf);
+}
+
+static int ia32_fpxregs_set(struct task_struct *target,
+               const struct utrace_regset *regset,
+               unsigned int pos, unsigned int count,
+               const void *kbuf, const void __user *ubuf)
+{
+       return do_regset_call(do_fpxregs_set, target, regset, pos, count, kbuf, ubuf);
+}
+
+static int ia32_genregs_get(struct task_struct *target,
+               const struct utrace_regset *regset,
+               unsigned int pos, unsigned int count,
+               void *kbuf, void __user *ubuf)
+{
+       if (kbuf) {
+               u32 *kp = kbuf;
+               while (count > 0) {
+                       *kp++ = getreg(target, pos);
+                       pos += 4;
+                       count -= 4;
+               }
+       } else {
+               u32 __user *up = ubuf;
+               while (count > 0) {
+                       if (__put_user(getreg(target, pos), up++))
+                               return -EFAULT;
+                       pos += 4;
+                       count -= 4;
+               }
+       }
        return 0;
 }
 
-asmlinkage long
-sys32_ioperm (unsigned int from, unsigned int num, int on)
+static int ia32_genregs_set(struct task_struct *target,
+               const struct utrace_regset *regset,
+               unsigned int pos, unsigned int count,
+               const void *kbuf, const void __user *ubuf)
 {
+       int ret = 0;
 
-       /*
-        *  Since IA64 doesn't have permission bits we'd have to go to
-        *    a lot of trouble to simulate them in software.  There's
-        *    no point, only trusted programs can make this call so we'll
-        *    just turn it into an iopl call and let the process have
-        *    access to all I/O ports.
-        *
-        * XXX proper ioperm() support should be emulated by
-        *      manipulating the page protections...
-        */
-       return sys32_iopl(3);
+       if (kbuf) {
+               const u32 *kp = kbuf;
+               while (!ret && count > 0) {
+                       putreg(target, pos, *kp++);
+                       pos += 4;
+                       count -= 4;
+               }
+       } else {
+               const u32 __user *up = ubuf;
+               u32 val;
+               while (!ret && count > 0) {
+                       ret = __get_user(val, up++);
+                       if (!ret)
+                               putreg(target, pos, val);
+                       pos += 4;
+                       count -= 4;
+               }
+       }
+       return ret;
 }
 
+/*
+ * This should match arch/i386/kernel/ptrace.c:native_regsets.
+ * XXX ioperm? vm86?
+ */
+static const struct utrace_regset ia32_regsets[] = {
+       {
+               .n = sizeof(struct user_regs_struct32)/4,
+               .size = 4, .align = 4,
+               .get = ia32_genregs_get, .set = ia32_genregs_set
+       },
+       {
+               .n = sizeof(struct ia32_user_i387_struct) / 4,
+               .size = 4, .align = 4,
+               .get = ia32_fpregs_get, .set = ia32_fpregs_set
+       },
+       {
+               .n = sizeof(struct ia32_user_fxsr_struct) / 4,
+               .size = 4, .align = 4,
+               .get = ia32_fpxregs_get, .set = ia32_fpxregs_set
+       },
+};
+
+const struct utrace_regset_view utrace_ia32_view = {
+       .name = "i386", .e_machine = EM_386,
+       .regsets = ia32_regsets, .n = ARRAY_SIZE(ia32_regsets)
+};
+EXPORT_SYMBOL_GPL(utrace_ia32_view);
+#endif
+
+#ifdef CONFIG_PTRACE
+/*
+ * This matches the arch/i386/kernel/ptrace.c definitions.
+ */
+
+static const struct ptrace_layout_segment ia32_uarea[] = {
+       {0, sizeof(struct user_regs_struct32), 0, 0},
+       {0, 0, -1, 0}
+};
+
+fastcall int arch_compat_ptrace(compat_long_t *request,
+               struct task_struct *child,
+               struct utrace_attached_engine *engine,
+               compat_ulong_t addr, compat_ulong_t data,
+               compat_long_t *retval)
+{
+       switch (*request) {
+               case PTRACE_PEEKUSR:
+                       return ptrace_compat_peekusr(child, engine, ia32_uarea,
+                                       addr, data);
+               case PTRACE_POKEUSR:
+                       return ptrace_compat_pokeusr(child, engine, ia32_uarea,
+                                       addr, data);
+               case IA32_PTRACE_GETREGS:
+                       return ptrace_whole_regset(child, engine, data, 0, 0);
+               case IA32_PTRACE_SETREGS:
+                       return ptrace_whole_regset(child, engine, data, 0, 1);
+               case IA32_PTRACE_GETFPREGS:
+                       return ptrace_whole_regset(child, engine, data, 1, 0);
+               case IA32_PTRACE_SETFPREGS:
+                       return ptrace_whole_regset(child, engine, data, 1, 1);
+               case IA32_PTRACE_GETFPXREGS:
+                       return ptrace_whole_regset(child, engine, data, 2, 0);
+               case IA32_PTRACE_SETFPXREGS:
+                       return ptrace_whole_regset(child, engine, data, 2, 1);
+       }
+       return -ENOSYS;
+}
+#endif
+
 typedef struct {
        unsigned int    ss_sp;
        unsigned int    ss_flags;
@@ -1640,36 +2384,38 @@ typedef struct {
 } ia32_stack_t;
 
 asmlinkage long
-sys32_sigaltstack (ia32_stack_t *uss32, ia32_stack_t *uoss32,
-                  long arg2, long arg3, long arg4, long arg5, long arg6, long arg7, long stack)
+sys32_sigaltstack (ia32_stack_t __user *uss32, ia32_stack_t __user *uoss32,
+                  long arg2, long arg3, long arg4, long arg5, long arg6,
+                  long arg7, struct pt_regs pt)
 {
-       struct pt_regs *pt = (struct pt_regs *) &stack;
        stack_t uss, uoss;
        ia32_stack_t buf32;
        int ret;
        mm_segment_t old_fs = get_fs();
 
-       if (uss32)
+       if (uss32) {
                if (copy_from_user(&buf32, uss32, sizeof(ia32_stack_t)))
                        return -EFAULT;
-       uss.ss_sp = (void *) (long) buf32.ss_sp;
-       uss.ss_flags = buf32.ss_flags;
-       /* MINSIGSTKSZ is different for ia32 vs ia64. We lie here to pass the 
-           check and set it to the user requested value later */
-       if ((buf32.ss_flags != SS_DISABLE) && (buf32.ss_size < MINSIGSTKSZ_IA32)) {
-               ret = -ENOMEM;
-               goto out;
+               uss.ss_sp = (void __user *) (long) buf32.ss_sp;
+               uss.ss_flags = buf32.ss_flags;
+               /* MINSIGSTKSZ is different for ia32 vs ia64. We lie here to pass the
+                  check and set it to the user requested value later */
+               if ((buf32.ss_flags != SS_DISABLE) && (buf32.ss_size < MINSIGSTKSZ_IA32)) {
+                       ret = -ENOMEM;
+                       goto out;
+               }
+               uss.ss_size = MINSIGSTKSZ;
        }
-       uss.ss_size = MINSIGSTKSZ;
        set_fs(KERNEL_DS);
-       ret = do_sigaltstack(uss32 ? &uss : NULL, &uoss, pt->r12);
-       current->sas_ss_size = buf32.ss_size;   
+       ret = do_sigaltstack(uss32 ? (stack_t __user *) &uss : NULL,
+                            (stack_t __user *) &uoss, pt.r12);
+       current->sas_ss_size = buf32.ss_size;
        set_fs(old_fs);
 out:
        if (ret < 0)
                return(ret);
        if (uoss32) {
-               buf32.ss_sp = (long) uoss.ss_sp;
+               buf32.ss_sp = (long __user) uoss.ss_sp;
                buf32.ss_flags = uoss.ss_flags;
                buf32.ss_size = uoss.ss_size;
                if (copy_to_user(uoss32, &buf32, sizeof(ia32_stack_t)))
@@ -1707,15 +2453,15 @@ struct sysctl32 {
        unsigned int    __unused[4];
 };
 
+#ifdef CONFIG_SYSCTL_SYSCALL
 asmlinkage long
-sys32_sysctl (struct sysctl32 *args)
+sys32_sysctl (struct sysctl32 __user *args)
 {
-#ifdef CONFIG_SYSCTL
        struct sysctl32 a32;
        mm_segment_t old_fs = get_fs ();
-       void *oldvalp, *newvalp;
+       void __user *oldvalp, *newvalp;
        size_t oldlen;
-       int *namep;
+       int __user *namep;
        long ret;
 
        if (copy_from_user(&a32, args, sizeof(a32)))
@@ -1728,11 +2474,11 @@ sys32_sysctl (struct sysctl32 *args)
         * addresses, we KNOW that access_ok() will always succeed, so this is an
         * expensive NOP, but so what...
         */
-       namep = (int *) A(a32.name);
-       oldvalp = (void *) A(a32.oldval);
-       newvalp = (void *) A(a32.newval);
+       namep = (int __user *) compat_ptr(a32.name);
+       oldvalp = compat_ptr(a32.oldval);
+       newvalp = compat_ptr(a32.newval);
 
-       if ((oldvalp && get_user(oldlen, (int *) A(a32.oldlenp)))
+       if ((oldvalp && get_user(oldlen, (int __user *) compat_ptr(a32.oldlenp)))
            || !access_ok(VERIFY_WRITE, namep, 0)
            || !access_ok(VERIFY_WRITE, oldvalp, 0)
            || !access_ok(VERIFY_WRITE, newvalp, 0))
@@ -1740,21 +2486,20 @@ sys32_sysctl (struct sysctl32 *args)
 
        set_fs(KERNEL_DS);
        lock_kernel();
-       ret = do_sysctl(namep, a32.nlen, oldvalp, &oldlen, newvalp, (size_t) a32.newlen);
+       ret = do_sysctl(namep, a32.nlen, oldvalp, (size_t __user *) &oldlen,
+                       newvalp, (size_t) a32.newlen);
        unlock_kernel();
        set_fs(old_fs);
 
-       if (oldvalp && put_user (oldlen, (int *) A(a32.oldlenp)))
+       if (oldvalp && put_user (oldlen, (int __user *) compat_ptr(a32.oldlenp)))
                return -EFAULT;
 
        return ret;
-#else
-       return -ENOSYS;
-#endif
 }
+#endif
 
 asmlinkage long
-sys32_newuname (struct new_utsname *name)
+sys32_newuname (struct new_utsname __user *name)
 {
        int ret = sys_newuname(name);
 
@@ -1765,14 +2510,14 @@ sys32_newuname (struct new_utsname *name)
 }
 
 asmlinkage long
-sys32_getresuid16 (u16 *ruid, u16 *euid, u16 *suid)
+sys32_getresuid16 (u16 __user *ruid, u16 __user *euid, u16 __user *suid)
 {
        uid_t a, b, c;
        int ret;
        mm_segment_t old_fs = get_fs();
 
        set_fs(KERNEL_DS);
-       ret = sys_getresuid(&a, &b, &c);
+       ret = sys_getresuid((uid_t __user *) &a, (uid_t __user *) &b, (uid_t __user *) &c);
        set_fs(old_fs);
 
        if (put_user(a, ruid) || put_user(b, euid) || put_user(c, suid))
@@ -1781,14 +2526,14 @@ sys32_getresuid16 (u16 *ruid, u16 *euid, u16 *suid)
 }
 
 asmlinkage long
-sys32_getresgid16 (u16 *rgid, u16 *egid, u16 *sgid)
+sys32_getresgid16 (u16 __user *rgid, u16 __user *egid, u16 __user *sgid)
 {
        gid_t a, b, c;
        int ret;
        mm_segment_t old_fs = get_fs();
 
        set_fs(KERNEL_DS);
-       ret = sys_getresgid(&a, &b, &c);
+       ret = sys_getresgid((gid_t __user *) &a, (gid_t __user *) &b, (gid_t __user *) &c);
        set_fs(old_fs);
 
        if (ret)
@@ -1805,7 +2550,7 @@ sys32_lseek (unsigned int fd, int offset, unsigned int whence)
 }
 
 static int
-groups16_to_user(short *grouplist, struct group_info *group_info)
+groups16_to_user(short __user *grouplist, struct group_info *group_info)
 {
        int i;
        short group;
@@ -1820,7 +2565,7 @@ groups16_to_user(short *grouplist, struct group_info *group_info)
 }
 
 static int
-groups16_from_user(struct group_info *group_info, short *grouplist)
+groups16_from_user(struct group_info *group_info, short __user *grouplist)
 {
        int i;
        short group;
@@ -1835,7 +2580,7 @@ groups16_from_user(struct group_info *group_info, short *grouplist)
 }
 
 asmlinkage long
-sys32_getgroups16 (int gidsetsize, short *grouplist)
+sys32_getgroups16 (int gidsetsize, short __user *grouplist)
 {
        int i;
 
@@ -1860,7 +2605,7 @@ out:
 }
 
 asmlinkage long
-sys32_setgroups16 (int gidsetsize, short *grouplist)
+sys32_setgroups16 (int gidsetsize, short __user *grouplist)
 {
        struct group_info *group_info;
        int retval;
@@ -1888,7 +2633,7 @@ sys32_setgroups16 (int gidsetsize, short *grouplist)
 asmlinkage long
 sys32_truncate64 (unsigned int path, unsigned int len_lo, unsigned int len_hi)
 {
-       return sys_truncate((const char *) A(path), ((unsigned long) len_hi << 32) | len_lo);
+       return sys_truncate(compat_ptr(path), ((unsigned long) len_hi << 32) | len_lo);
 }
 
 asmlinkage long
@@ -1898,7 +2643,7 @@ sys32_ftruncate64 (int fd, unsigned int len_lo, unsigned int len_hi)
 }
 
 static int
-putstat64 (struct stat64 *ubuf, struct kstat *kbuf)
+putstat64 (struct stat64 __user *ubuf, struct kstat *kbuf)
 {
        int err;
        u64 hdev;
@@ -1907,8 +2652,8 @@ putstat64 (struct stat64 *ubuf, struct kstat *kbuf)
                return -EFAULT;
 
        hdev = huge_encode_dev(kbuf->dev);
-       err  = __put_user(hdev, (u32*)&ubuf->st_dev);
-       err |= __put_user(hdev >> 32, ((u32*)&ubuf->st_dev) + 1);
+       err  = __put_user(hdev, (u32 __user*)&ubuf->st_dev);
+       err |= __put_user(hdev >> 32, ((u32 __user*)&ubuf->st_dev) + 1);
        err |= __put_user(kbuf->ino, &ubuf->__st_ino);
        err |= __put_user(kbuf->ino, &ubuf->st_ino_lo);
        err |= __put_user(kbuf->ino >> 32, &ubuf->st_ino_hi);
@@ -1917,8 +2662,8 @@ putstat64 (struct stat64 *ubuf, struct kstat *kbuf)
        err |= __put_user(kbuf->uid, &ubuf->st_uid);
        err |= __put_user(kbuf->gid, &ubuf->st_gid);
        hdev = huge_encode_dev(kbuf->rdev);
-       err  = __put_user(hdev, (u32*)&ubuf->st_rdev);
-       err |= __put_user(hdev >> 32, ((u32*)&ubuf->st_rdev) + 1);
+       err  = __put_user(hdev, (u32 __user*)&ubuf->st_rdev);
+       err |= __put_user(hdev >> 32, ((u32 __user*)&ubuf->st_rdev) + 1);
        err |= __put_user(kbuf->size, &ubuf->st_size_lo);
        err |= __put_user((kbuf->size >> 32), &ubuf->st_size_hi);
        err |= __put_user(kbuf->atime.tv_sec, &ubuf->st_atime);
@@ -1933,7 +2678,7 @@ putstat64 (struct stat64 *ubuf, struct kstat *kbuf)
 }
 
 asmlinkage long
-sys32_stat64 (char *filename, struct stat64 *statbuf)
+sys32_stat64 (char __user *filename, struct stat64 __user *statbuf)
 {
        struct kstat s;
        long ret = vfs_stat(filename, &s);
@@ -1943,7 +2688,7 @@ sys32_stat64 (char *filename, struct stat64 *statbuf)
 }
 
 asmlinkage long
-sys32_lstat64 (char *filename, struct stat64 *statbuf)
+sys32_lstat64 (char __user *filename, struct stat64 __user *statbuf)
 {
        struct kstat s;
        long ret = vfs_lstat(filename, &s);
@@ -1953,7 +2698,7 @@ sys32_lstat64 (char *filename, struct stat64 *statbuf)
 }
 
 asmlinkage long
-sys32_fstat64 (unsigned int fd, struct stat64 *statbuf)
+sys32_fstat64 (unsigned int fd, struct stat64 __user *statbuf)
 {
        struct kstat s;
        long ret = vfs_fstat(fd, &s);
@@ -1980,7 +2725,7 @@ struct sysinfo32 {
 };
 
 asmlinkage long
-sys32_sysinfo (struct sysinfo32 *info)
+sys32_sysinfo (struct sysinfo32 __user *info)
 {
        struct sysinfo s;
        long ret, err;
@@ -1988,7 +2733,7 @@ sys32_sysinfo (struct sysinfo32 *info)
        mm_segment_t old_fs = get_fs();
 
        set_fs(KERNEL_DS);
-       ret = sys_sysinfo(&s);
+       ret = sys_sysinfo((struct sysinfo __user *) &s);
        set_fs(old_fs);
        /* Check to see if any memory value is too large for 32-bit and
         * scale down if needed.
@@ -2031,14 +2776,14 @@ sys32_sysinfo (struct sysinfo32 *info)
 }
 
 asmlinkage long
-sys32_sched_rr_get_interval (pid_t pid, struct compat_timespec *interval)
+sys32_sched_rr_get_interval (pid_t pid, struct compat_timespec __user *interval)
 {
        mm_segment_t old_fs = get_fs();
        struct timespec t;
        long ret;
 
        set_fs(KERNEL_DS);
-       ret = sys_sched_rr_get_interval(pid, &t);
+       ret = sys_sched_rr_get_interval(pid, (struct timespec __user *) &t);
        set_fs(old_fs);
        if (put_compat_timespec(&t, interval))
                return -EFAULT;
@@ -2046,19 +2791,19 @@ sys32_sched_rr_get_interval (pid_t pid, struct compat_timespec *interval)
 }
 
 asmlinkage long
-sys32_pread (unsigned int fd, void *buf, unsigned int count, u32 pos_lo, u32 pos_hi)
+sys32_pread (unsigned int fd, void __user *buf, unsigned int count, u32 pos_lo, u32 pos_hi)
 {
        return sys_pread64(fd, buf, count, ((unsigned long) pos_hi << 32) | pos_lo);
 }
 
 asmlinkage long
-sys32_pwrite (unsigned int fd, void *buf, unsigned int count, u32 pos_lo, u32 pos_hi)
+sys32_pwrite (unsigned int fd, void __user *buf, unsigned int count, u32 pos_lo, u32 pos_hi)
 {
        return sys_pwrite64(fd, buf, count, ((unsigned long) pos_hi << 32) | pos_lo);
 }
 
 asmlinkage long
-sys32_sendfile (int out_fd, int in_fd, int *offset, unsigned int count)
+sys32_sendfile (int out_fd, int in_fd, int __user *offset, unsigned int count)
 {
        mm_segment_t old_fs = get_fs();
        long ret;
@@ -2068,10 +2813,10 @@ sys32_sendfile (int out_fd, int in_fd, int *offset, unsigned int count)
                return -EFAULT;
 
        set_fs(KERNEL_DS);
-       ret = sys_sendfile(out_fd, in_fd, offset ? &of : NULL, count);
+       ret = sys_sendfile(out_fd, in_fd, offset ? (off_t __user *) &of : NULL, count);
        set_fs(old_fs);
 
-       if (!ret && offset && put_user(of, offset))
+       if (offset && put_user(of, offset))
                return -EFAULT;
 
        return ret;
@@ -2099,59 +2844,27 @@ sys32_brk (unsigned int brk)
        obrk = mm->brk;
        ret = sys_brk(brk);
        if (ret < obrk)
-               clear_user((void *) ret, PAGE_ALIGN(ret) - ret);
+               clear_user(compat_ptr(ret), PAGE_ALIGN(ret) - ret);
        return ret;
 }
 
-/*
- * Exactly like fs/open.c:sys_open(), except that it doesn't set the O_LARGEFILE flag.
- */
-asmlinkage long
-sys32_open (const char * filename, int flags, int mode)
-{
-       char * tmp;
-       int fd, error;
-
-       tmp = getname(filename);
-       fd = PTR_ERR(tmp);
-       if (!IS_ERR(tmp)) {
-               fd = get_unused_fd();
-               if (fd >= 0) {
-                       struct file *f = filp_open(tmp, flags, mode);
-                       error = PTR_ERR(f);
-                       if (IS_ERR(f))
-                               goto out_error;
-                       fd_install(fd, f);
-               }
-out:
-               putname(tmp);
-       }
-       return fd;
-
-out_error:
-       put_unused_fd(fd);
-       fd = error;
-       goto out;
-}
-
 /* Structure for ia32 emulation on ia64 */
 struct epoll_event32
 {
        u32 events;
        u32 data[2];
-}; 
+};
 
 asmlinkage long
-sys32_epoll_ctl(int epfd, int op, int fd, struct epoll_event32 *event)
+sys32_epoll_ctl(int epfd, int op, int fd, struct epoll_event32 __user *event)
 {
        mm_segment_t old_fs = get_fs();
        struct epoll_event event64;
-       int error = -EFAULT;
+       int error;
        u32 data_halfword;
 
-       if ((error = verify_area(VERIFY_READ, event,
-                                sizeof(struct epoll_event32))))
-               return error;
+       if (!access_ok(VERIFY_READ, event, sizeof(struct epoll_event32)))
+               return -EFAULT;
 
        __get_user(event64.events, &event->events);
        __get_user(data_halfword, &event->data[0]);
@@ -2160,19 +2873,19 @@ sys32_epoll_ctl(int epfd, int op, int fd, struct epoll_event32 *event)
        event64.data |= (u64)data_halfword << 32;
 
        set_fs(KERNEL_DS);
-       error = sys_epoll_ctl(epfd, op, fd, &event64);
+       error = sys_epoll_ctl(epfd, op, fd, (struct epoll_event __user *) &event64);
        set_fs(old_fs);
 
        return error;
 }
 
 asmlinkage long
-sys32_epoll_wait(int epfd, struct epoll_event32 *events, int maxevents,
+sys32_epoll_wait(int epfd, struct epoll_event32 __user * events, int maxevents,
                 int timeout)
 {
        struct epoll_event *events64 = NULL;
        mm_segment_t old_fs = get_fs();
-       int error, numevents, size;
+       int numevents, size;
        int evt_idx;
        int do_free_pages = 0;
 
@@ -2181,12 +2894,11 @@ sys32_epoll_wait(int epfd, struct epoll_event32 *events, int maxevents,
        }
 
        /* Verify that the area passed by the user is writeable */
-       if ((error = verify_area(VERIFY_WRITE, events,
-                                maxevents * sizeof(struct epoll_event32))))
-               return error;
+       if (!access_ok(VERIFY_WRITE, events, maxevents * sizeof(struct epoll_event32)))
+               return -EFAULT;
 
-       /* 
-        * Allocate space for the intermediate copy.  If the space needed 
+       /*
+        * Allocate space for the intermediate copy.  If the space needed
         * is large enough to cause kmalloc to fail, then try again with
         * __get_free_pages.
         */
@@ -2195,14 +2907,15 @@ sys32_epoll_wait(int epfd, struct epoll_event32 *events, int maxevents,
        if (events64 == NULL) {
                events64 = (struct epoll_event *)
                                __get_free_pages(GFP_KERNEL, get_order(size));
-               if (events64 == NULL) 
+               if (events64 == NULL)
                        return -ENOMEM;
                do_free_pages = 1;
        }
 
        /* Do the system call */
        set_fs(KERNEL_DS); /* copy_to/from_user should work on kernel mem*/
-       numevents = sys_epoll_wait(epfd, events64, maxevents, timeout);
+       numevents = sys_epoll_wait(epfd, (struct epoll_event __user *) events64,
+                                  maxevents, timeout);
        set_fs(old_fs);
 
        /* Don't modify userspace memory if we're returning an error */
@@ -2245,7 +2958,7 @@ get_free_idx (void)
  * Set a given TLS descriptor:
  */
 asmlinkage int
-sys32_set_thread_area (struct ia32_user_desc *u_info)
+sys32_set_thread_area (struct ia32_user_desc __user *u_info)
 {
        struct thread_struct *t = &current->thread;
        struct ia32_user_desc info;
@@ -2298,7 +3011,7 @@ sys32_set_thread_area (struct ia32_user_desc *u_info)
        ((desc)->a & 0x0ffff) |                 \
         ((desc)->b & 0xf0000) )
 
-#define GET_32BIT(desc)                (((desc)->b >> 23) & 1)
+#define GET_32BIT(desc)                (((desc)->b >> 22) & 1)
 #define GET_CONTENTS(desc)     (((desc)->b >> 10) & 3)
 #define GET_WRITABLE(desc)     (((desc)->b >>  9) & 1)
 #define GET_LIMIT_PAGES(desc)  (((desc)->b >> 23) & 1)
@@ -2306,7 +3019,7 @@ sys32_set_thread_area (struct ia32_user_desc *u_info)
 #define GET_USEABLE(desc)      (((desc)->b >> 20) & 1)
 
 asmlinkage int
-sys32_get_thread_area (struct ia32_user_desc *u_info)
+sys32_get_thread_area (struct ia32_user_desc __user *u_info)
 {
        struct ia32_user_desc info;
        struct desc_struct *desc;
@@ -2334,43 +3047,6 @@ sys32_get_thread_area (struct ia32_user_desc *u_info)
        return 0;
 }
 
-extern asmlinkage long
-sys_timer_create(clockid_t which_clock, struct sigevent *timer_event_spec,
-                timer_t * created_timer_id);
-
-asmlinkage long
-sys32_timer_create(u32 clock, struct sigevent32 *se32, timer_t *timer_id)
-{
-       struct sigevent se;
-       mm_segment_t oldfs;
-       timer_t t;
-       long err;
-
-       if (se32 == NULL)
-               return sys_timer_create(clock, NULL, timer_id);
-
-       memset(&se, 0, sizeof(struct sigevent));
-       if (get_user(se.sigev_value.sival_int,  &se32->sigev_value.sival_int) ||
-           __get_user(se.sigev_signo, &se32->sigev_signo) ||
-           __get_user(se.sigev_notify, &se32->sigev_notify) ||
-           __copy_from_user(&se._sigev_un._pad, &se32->_sigev_un._pad,
-           sizeof(se._sigev_un._pad)))
-               return -EFAULT;
-
-       if (!access_ok(VERIFY_WRITE,timer_id,sizeof(timer_t)))
-               return -EFAULT;
-
-       oldfs = get_fs();
-       set_fs(KERNEL_DS);
-       err = sys_timer_create(clock, &se, &t);
-       set_fs(oldfs);
-
-       if (!err)
-               err = __put_user (t, timer_id);
-
-       return err;
-}
-
 long sys32_fadvise64_64(int fd, __u32 offset_low, __u32 offset_high, 
                        __u32 len_low, __u32 len_high, int advice)
 { 
@@ -2424,248 +3100,4 @@ sys32_setresgid(compat_gid_t rgid, compat_gid_t egid,
        ssgid = (sgid == (compat_gid_t)-1) ? ((gid_t)-1) : ((gid_t)sgid);
        return sys_setresgid(srgid, segid, ssgid);
 }
-
-/* Stuff for NFS server syscalls... */
-struct nfsctl_svc32 {
-       u16                     svc32_port;
-       s32                     svc32_nthreads;
-};
-
-struct nfsctl_client32 {
-       s8                      cl32_ident[NFSCLNT_IDMAX+1];
-       s32                     cl32_naddr;
-       struct in_addr          cl32_addrlist[NFSCLNT_ADDRMAX];
-       s32                     cl32_fhkeytype;
-       s32                     cl32_fhkeylen;
-       u8                      cl32_fhkey[NFSCLNT_KEYMAX];
-};
-
-struct nfsctl_export32 {
-       s8                      ex32_client[NFSCLNT_IDMAX+1];
-       s8                      ex32_path[NFS_MAXPATHLEN+1];
-       compat_dev_t    ex32_dev;
-       compat_ino_t    ex32_ino;
-       s32                     ex32_flags;
-       compat_uid_t    ex32_anon_uid;
-       compat_gid_t    ex32_anon_gid;
-};
-
-struct nfsctl_arg32 {
-       s32                     ca32_version;   /* safeguard */
-       union {
-               struct nfsctl_svc32     u32_svc;
-               struct nfsctl_client32  u32_client;
-               struct nfsctl_export32  u32_export;
-               u32                     u32_debug;
-       } u;
-#define ca32_svc       u.u32_svc
-#define ca32_client    u.u32_client
-#define ca32_export    u.u32_export
-#define ca32_debug     u.u32_debug
-};
-
-union nfsctl_res32 {
-       struct knfs_fh          cr32_getfh;
-       u32                     cr32_debug;
-};
-
-static int
-nfs_svc32_trans(struct nfsctl_arg *karg, struct nfsctl_arg32 *arg32)
-{
-       int err;
-
-       err = __get_user(karg->ca_version, &arg32->ca32_version);
-       err |= __get_user(karg->ca_svc.svc_port, &arg32->ca32_svc.svc32_port);
-       err |= __get_user(karg->ca_svc.svc_nthreads,
-                         &arg32->ca32_svc.svc32_nthreads);
-       return err;
-}
-
-static int
-nfs_clnt32_trans(struct nfsctl_arg *karg, struct nfsctl_arg32 *arg32)
-{
-       int err;
-
-       err = __get_user(karg->ca_version, &arg32->ca32_version);
-       err |= copy_from_user(&karg->ca_client.cl_ident[0],
-                         &arg32->ca32_client.cl32_ident[0],
-                         NFSCLNT_IDMAX);
-       err |= __get_user(karg->ca_client.cl_naddr,
-                         &arg32->ca32_client.cl32_naddr);
-       err |= copy_from_user(&karg->ca_client.cl_addrlist[0],
-                         &arg32->ca32_client.cl32_addrlist[0],
-                         (sizeof(struct in_addr) * NFSCLNT_ADDRMAX));
-       err |= __get_user(karg->ca_client.cl_fhkeytype,
-                     &arg32->ca32_client.cl32_fhkeytype);
-       err |= __get_user(karg->ca_client.cl_fhkeylen,
-                     &arg32->ca32_client.cl32_fhkeylen);
-       err |= copy_from_user(&karg->ca_client.cl_fhkey[0],
-                         &arg32->ca32_client.cl32_fhkey[0],
-                         NFSCLNT_KEYMAX);
-       return err;
-}
-
-static int
-nfs_exp32_trans(struct nfsctl_arg *karg, struct nfsctl_arg32 *arg32)
-{
-       int err;
-
-       err = __get_user(karg->ca_version, &arg32->ca32_version);
-       err |= copy_from_user(&karg->ca_export.ex_client[0],
-                         &arg32->ca32_export.ex32_client[0],
-                         NFSCLNT_IDMAX);
-       err |= copy_from_user(&karg->ca_export.ex_path[0],
-                         &arg32->ca32_export.ex32_path[0],
-                         NFS_MAXPATHLEN);
-       err |= __get_user(karg->ca_export.ex_dev,
-                     &arg32->ca32_export.ex32_dev);
-       err |= __get_user(karg->ca_export.ex_ino,
-                     &arg32->ca32_export.ex32_ino);
-       err |= __get_user(karg->ca_export.ex_flags,
-                     &arg32->ca32_export.ex32_flags);
-       err |= __get_user(karg->ca_export.ex_anon_uid,
-                     &arg32->ca32_export.ex32_anon_uid);
-       err |= __get_user(karg->ca_export.ex_anon_gid,
-                     &arg32->ca32_export.ex32_anon_gid);
-       return err;
-}
-
-static int
-nfs_getfh32_res_trans(union nfsctl_res *kres, union nfsctl_res32 *res32)
-{
-       int err;
-
-       err = copy_to_user(&res32->cr32_getfh,
-                       &kres->cr_getfh,
-                       sizeof(res32->cr32_getfh));
-       err |= __put_user(kres->cr_debug, &res32->cr32_debug);
-       return err;
-}
-
-int asmlinkage
-sys32_nfsservctl(int cmd, struct nfsctl_arg32 *arg32, union nfsctl_res32 *res32)
-{
-       struct nfsctl_arg *karg = NULL;
-       union nfsctl_res *kres = NULL;
-       mm_segment_t oldfs;
-       int err;
-
-       karg = kmalloc(sizeof(*karg), GFP_USER);
-       if(!karg)
-               return -ENOMEM;
-       if(res32) {
-               kres = kmalloc(sizeof(*kres), GFP_USER);
-               if(!kres) {
-                       kfree(karg);
-                       return -ENOMEM;
-               }
-       }
-       switch(cmd) {
-       case NFSCTL_SVC:
-               err = nfs_svc32_trans(karg, arg32);
-               break;
-       case NFSCTL_ADDCLIENT:
-               err = nfs_clnt32_trans(karg, arg32);
-               break;
-       case NFSCTL_DELCLIENT:
-               err = nfs_clnt32_trans(karg, arg32);
-               break;
-       case NFSCTL_EXPORT:
-               err = nfs_exp32_trans(karg, arg32);
-               break;
-       default:
-               err = -EINVAL;
-               break;
-       }
-       if(err)
-               goto done;
-       oldfs = get_fs();
-       set_fs(KERNEL_DS);
-       err = sys_nfsservctl(cmd, karg, kres);
-       set_fs(oldfs);
-
-       if(!err && cmd == NFSCTL_GETFS)
-               err = nfs_getfh32_res_trans(kres, res32);
-
-done:
-       if(karg)
-               kfree(karg);
-       if(kres)
-               kfree(kres);
-       return err;
-}
-
-/* Handle adjtimex compatibility. */
-
-struct timex32 {
-       u32 modes;
-       s32 offset, freq, maxerror, esterror;
-       s32 status, constant, precision, tolerance;
-       struct compat_timeval time;
-       s32 tick;
-       s32 ppsfreq, jitter, shift, stabil;
-       s32 jitcnt, calcnt, errcnt, stbcnt;
-       s32  :32; s32  :32; s32  :32; s32  :32;
-       s32  :32; s32  :32; s32  :32; s32  :32;
-       s32  :32; s32  :32; s32  :32; s32  :32;
-};
-
-extern int do_adjtimex(struct timex *);
-
-asmlinkage long
-sys32_adjtimex(struct timex32 *utp)
-{
-       struct timex txc;
-       int ret;
-
-       memset(&txc, 0, sizeof(struct timex));
-
-       if(get_user(txc.modes, &utp->modes) ||
-          __get_user(txc.offset, &utp->offset) ||
-          __get_user(txc.freq, &utp->freq) ||
-          __get_user(txc.maxerror, &utp->maxerror) ||
-          __get_user(txc.esterror, &utp->esterror) ||
-          __get_user(txc.status, &utp->status) ||
-          __get_user(txc.constant, &utp->constant) ||
-          __get_user(txc.precision, &utp->precision) ||
-          __get_user(txc.tolerance, &utp->tolerance) ||
-          __get_user(txc.time.tv_sec, &utp->time.tv_sec) ||
-          __get_user(txc.time.tv_usec, &utp->time.tv_usec) ||
-          __get_user(txc.tick, &utp->tick) ||
-          __get_user(txc.ppsfreq, &utp->ppsfreq) ||
-          __get_user(txc.jitter, &utp->jitter) ||
-          __get_user(txc.shift, &utp->shift) ||
-          __get_user(txc.stabil, &utp->stabil) ||
-          __get_user(txc.jitcnt, &utp->jitcnt) ||
-          __get_user(txc.calcnt, &utp->calcnt) ||
-          __get_user(txc.errcnt, &utp->errcnt) ||
-          __get_user(txc.stbcnt, &utp->stbcnt))
-               return -EFAULT;
-
-       ret = do_adjtimex(&txc);
-
-       if(put_user(txc.modes, &utp->modes) ||
-          __put_user(txc.offset, &utp->offset) ||
-          __put_user(txc.freq, &utp->freq) ||
-          __put_user(txc.maxerror, &utp->maxerror) ||
-          __put_user(txc.esterror, &utp->esterror) ||
-          __put_user(txc.status, &utp->status) ||
-          __put_user(txc.constant, &utp->constant) ||
-          __put_user(txc.precision, &utp->precision) ||
-          __put_user(txc.tolerance, &utp->tolerance) ||
-          __put_user(txc.time.tv_sec, &utp->time.tv_sec) ||
-          __put_user(txc.time.tv_usec, &utp->time.tv_usec) ||
-          __put_user(txc.tick, &utp->tick) ||
-          __put_user(txc.ppsfreq, &utp->ppsfreq) ||
-          __put_user(txc.jitter, &utp->jitter) ||
-          __put_user(txc.shift, &utp->shift) ||
-          __put_user(txc.stabil, &utp->stabil) ||
-          __put_user(txc.jitcnt, &utp->jitcnt) ||
-          __put_user(txc.calcnt, &utp->calcnt) ||
-          __put_user(txc.errcnt, &utp->errcnt) ||
-          __put_user(txc.stbcnt, &utp->stbcnt))
-               ret = -EFAULT;
-
-       return ret;
-}
 #endif /* NOTYET */