vserver 1.9.3
[linux-2.6.git] / fs / binfmt_elf.c
index 785da46..cb0db6e 100644 (file)
@@ -41,6 +41,7 @@
 
 #include <asm/uaccess.h>
 #include <asm/param.h>
+#include <asm/page.h>
 
 #include <linux/elf.h>
 
@@ -488,25 +489,33 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
        unsigned long elf_entry, interp_load_addr = 0;
        unsigned long start_code, end_code, start_data, end_data;
        unsigned long reloc_func_desc = 0;
-       struct elfhdr elf_ex;
-       struct elfhdr interp_elf_ex;
-       struct exec interp_ex;
        char passed_fileno[6];
        struct files_struct *files;
        int have_pt_gnu_stack, executable_stack = EXSTACK_DEFAULT;
        unsigned long def_flags = 0;
+       struct {
+               struct elfhdr elf_ex;
+               struct elfhdr interp_elf_ex;
+               struct exec interp_ex;
+       } *loc;
+
+       loc = kmalloc(sizeof(*loc), GFP_KERNEL);
+       if (!loc) {
+               retval = -ENOMEM;
+               goto out_ret;
+       }
        
        /* Get the exec-header */
-       elf_ex = *((struct elfhdr *) bprm->buf);
+       loc->elf_ex = *((struct elfhdr *) bprm->buf);
 
        retval = -ENOEXEC;
        /* First of all, some simple consistency checks */
-       if (memcmp(elf_ex.e_ident, ELFMAG, SELFMAG) != 0)
+       if (memcmp(loc->elf_ex.e_ident, ELFMAG, SELFMAG) != 0)
                goto out;
 
-       if (elf_ex.e_type != ET_EXEC && elf_ex.e_type != ET_DYN)
+       if (loc->elf_ex.e_type != ET_EXEC && loc->elf_ex.e_type != ET_DYN)
                goto out;
-       if (!elf_check_arch(&elf_ex))
+       if (!elf_check_arch(&loc->elf_ex))
                goto out;
        if (!bprm->file->f_op||!bprm->file->f_op->mmap)
                goto out;
@@ -514,16 +523,16 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
        /* Now read in all of the header information */
 
        retval = -ENOMEM;
-       if (elf_ex.e_phentsize != sizeof(struct elf_phdr))
+       if (loc->elf_ex.e_phentsize != sizeof(struct elf_phdr))
                goto out;
-       if (elf_ex.e_phnum > 65536U / sizeof(struct elf_phdr))
+       if (loc->elf_ex.e_phnum > 65536U / sizeof(struct elf_phdr))
                goto out;
-       size = elf_ex.e_phnum * sizeof(struct elf_phdr);
+       size = loc->elf_ex.e_phnum * sizeof(struct elf_phdr);
        elf_phdata = (struct elf_phdr *) kmalloc(size, GFP_KERNEL);
        if (!elf_phdata)
                goto out;
 
-       retval = kernel_read(bprm->file, elf_ex.e_phoff, (char *) elf_phdata, size);
+       retval = kernel_read(bprm->file, loc->elf_ex.e_phoff, (char *) elf_phdata, size);
        if (retval < 0)
                goto out_free_ph;
 
@@ -554,7 +563,7 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
        start_data = 0;
        end_data = 0;
 
-       for (i = 0; i < elf_ex.e_phnum; i++) {
+       for (i = 0; i < loc->elf_ex.e_phnum; i++) {
                if (elf_ppnt->p_type == PT_INTERP) {
                        /* This is the program interpreter used for
                         * shared libraries - for now assume that this
@@ -601,7 +610,7 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
                         * switch really is going to happen - do this in
                         * flush_thread().      - akpm
                         */
-                       SET_PERSONALITY(elf_ex, ibcs2_interpreter);
+                       SET_PERSONALITY(loc->elf_ex, ibcs2_interpreter);
 
                        interpreter = open_exec(elf_interpreter);
                        retval = PTR_ERR(interpreter);
@@ -612,15 +621,15 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
                                goto out_free_dentry;
 
                        /* Get the exec headers */
-                       interp_ex = *((struct exec *) bprm->buf);
-                       interp_elf_ex = *((struct elfhdr *) bprm->buf);
+                       loc->interp_ex = *((struct exec *) bprm->buf);
+                       loc->interp_elf_ex = *((struct elfhdr *) bprm->buf);
                        break;
                }
                elf_ppnt++;
        }
 
        elf_ppnt = elf_phdata;
-       for (i = 0; i < elf_ex.e_phnum; i++, elf_ppnt++)
+       for (i = 0; i < loc->elf_ex.e_phnum; i++, elf_ppnt++)
                if (elf_ppnt->p_type == PT_GNU_STACK) {
                        if (elf_ppnt->p_flags & PF_X)
                                executable_stack = EXSTACK_ENABLE_X;
@@ -628,19 +637,19 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
                                executable_stack = EXSTACK_DISABLE_X;
                        break;
                }
-       have_pt_gnu_stack = (i < elf_ex.e_phnum);
+       have_pt_gnu_stack = (i < loc->elf_ex.e_phnum);
 
        /* Some simple consistency checks for the interpreter */
        if (elf_interpreter) {
                interpreter_type = INTERPRETER_ELF | INTERPRETER_AOUT;
 
                /* Now figure out which format our binary is */
-               if ((N_MAGIC(interp_ex) != OMAGIC) &&
-                   (N_MAGIC(interp_ex) != ZMAGIC) &&
-                   (N_MAGIC(interp_ex) != QMAGIC))
+               if ((N_MAGIC(loc->interp_ex) != OMAGIC) &&
+                   (N_MAGIC(loc->interp_ex) != ZMAGIC) &&
+                   (N_MAGIC(loc->interp_ex) != QMAGIC))
                        interpreter_type = INTERPRETER_ELF;
 
-               if (memcmp(interp_elf_ex.e_ident, ELFMAG, SELFMAG) != 0)
+               if (memcmp(loc->interp_elf_ex.e_ident, ELFMAG, SELFMAG) != 0)
                        interpreter_type &= ~INTERPRETER_ELF;
 
                retval = -ELIBBAD;
@@ -656,11 +665,11 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
                }
                /* Verify the interpreter has a valid arch */
                if ((interpreter_type == INTERPRETER_ELF) &&
-                   !elf_check_arch(&interp_elf_ex))
+                   !elf_check_arch(&loc->interp_elf_ex))
                        goto out_free_dentry;
        } else {
                /* Executables without an interpreter also need a personality  */
-               SET_PERSONALITY(elf_ex, ibcs2_interpreter);
+               SET_PERSONALITY(loc->elf_ex, ibcs2_interpreter);
        }
 
        /* OK, we are done with that, now set up the arg stuff,
@@ -700,15 +709,17 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
 
        /* Do this immediately, since STACK_TOP as used in setup_arg_pages
           may depend on the personality.  */
-       SET_PERSONALITY(elf_ex, ibcs2_interpreter);
-       if (elf_read_implies_exec(elf_ex, have_pt_gnu_stack))
+       SET_PERSONALITY(loc->elf_ex, ibcs2_interpreter);
+       if (elf_read_implies_exec(loc->elf_ex, have_pt_gnu_stack))
                current->personality |= READ_IMPLIES_EXEC;
 
+       arch_pick_mmap_layout(current->mm);
+
        /* Do this so that we can load the interpreter, if need be.  We will
           change some of these later */
        // current->mm->rss = 0;
        vx_rsspages_sub(current->mm, current->mm->rss);
-       current->mm->free_area_cache = TASK_UNMAPPED_BASE;
+       current->mm->free_area_cache = current->mm->mmap_base;
        retval = setup_arg_pages(bprm, executable_stack);
        if (retval < 0) {
                send_sig(SIGKILL, current, 0);
@@ -722,7 +733,7 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
           the image should be loaded at fixed address, not at a variable
           address. */
 
-       for(i = 0, elf_ppnt = elf_phdata; i < elf_ex.e_phnum; i++, elf_ppnt++) {
+       for(i = 0, elf_ppnt = elf_phdata; i < loc->elf_ex.e_phnum; i++, elf_ppnt++) {
                int elf_prot = 0, elf_flags;
                unsigned long k, vaddr;
 
@@ -757,9 +768,9 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
                elf_flags = MAP_PRIVATE|MAP_DENYWRITE|MAP_EXECUTABLE;
 
                vaddr = elf_ppnt->p_vaddr;
-               if (elf_ex.e_type == ET_EXEC || load_addr_set) {
+               if (loc->elf_ex.e_type == ET_EXEC || load_addr_set) {
                        elf_flags |= MAP_FIXED;
-               } else if (elf_ex.e_type == ET_DYN) {
+               } else if (loc->elf_ex.e_type == ET_DYN) {
                        /* Try and get dynamic programs out of the way of the default mmap
                           base, as well as whatever program they might try to exec.  This
                           is because the brk will follow the loader, and is not movable.  */
@@ -773,7 +784,7 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
                if (!load_addr_set) {
                        load_addr_set = 1;
                        load_addr = (elf_ppnt->p_vaddr - elf_ppnt->p_offset);
-                       if (elf_ex.e_type == ET_DYN) {
+                       if (loc->elf_ex.e_type == ET_DYN) {
                                load_bias += error -
                                             ELF_PAGESTART(load_bias + vaddr);
                                load_addr += load_bias;
@@ -810,7 +821,7 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
                        elf_brk = k;
        }
 
-       elf_ex.e_entry += load_bias;
+       loc->elf_ex.e_entry += load_bias;
        elf_bss += load_bias;
        elf_brk += load_bias;
        start_code += load_bias;
@@ -832,10 +843,10 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
 
        if (elf_interpreter) {
                if (interpreter_type == INTERPRETER_AOUT)
-                       elf_entry = load_aout_interp(&interp_ex,
+                       elf_entry = load_aout_interp(&loc->interp_ex,
                                                     interpreter);
                else
-                       elf_entry = load_elf_interp(&interp_elf_ex,
+                       elf_entry = load_elf_interp(&loc->interp_elf_ex,
                                                    interpreter,
                                                    &interp_load_addr);
                if (BAD_ADDR(elf_entry)) {
@@ -850,7 +861,7 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
                fput(interpreter);
                kfree(elf_interpreter);
        } else {
-               elf_entry = elf_ex.e_entry;
+               elf_entry = loc->elf_ex.e_entry;
        }
 
        kfree(elf_phdata);
@@ -862,7 +873,7 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
 
        compute_creds(bprm);
        current->flags &= ~PF_FORKNOEXEC;
-       create_elf_tables(bprm, &elf_ex, (interpreter_type == INTERPRETER_AOUT),
+       create_elf_tables(bprm, &loc->elf_ex, (interpreter_type == INTERPRETER_AOUT),
                        load_addr, interp_load_addr);
        /* N.B. passed_fileno might not be initialized? */
        if (interpreter_type == INTERPRETER_AOUT)
@@ -907,6 +918,8 @@ static int load_elf_binary(struct linux_binprm * bprm, struct pt_regs * regs)
        }
        retval = 0;
 out:
+       kfree(loc);
+out_ret:
        return retval;
 
        /* error cleanup */
@@ -1178,10 +1191,27 @@ static void fill_prstatus(struct elf_prstatus *prstatus,
        prstatus->pr_ppid = p->parent->pid;
        prstatus->pr_pgrp = process_group(p);
        prstatus->pr_sid = p->signal->session;
-       jiffies_to_timeval(p->utime, &prstatus->pr_utime);
-       jiffies_to_timeval(p->stime, &prstatus->pr_stime);
-       jiffies_to_timeval(p->cutime, &prstatus->pr_cutime);
-       jiffies_to_timeval(p->cstime, &prstatus->pr_cstime);
+       if (p->pid == p->tgid) {
+               /*
+                * This is the record for the group leader.  Add in the
+                * cumulative times of previous dead threads.  This total
+                * won't include the time of each live thread whose state
+                * is included in the core dump.  The final total reported
+                * to our parent process when it calls wait4 will include
+                * those sums as well as the little bit more time it takes
+                * this and each other thread to finish dying after the
+                * core dump synchronization phase.
+                */
+               jiffies_to_timeval(p->utime + p->signal->utime,
+                                  &prstatus->pr_utime);
+               jiffies_to_timeval(p->stime + p->signal->stime,
+                                  &prstatus->pr_stime);
+       } else {
+               jiffies_to_timeval(p->utime, &prstatus->pr_utime);
+               jiffies_to_timeval(p->stime, &prstatus->pr_stime);
+       }
+       jiffies_to_timeval(p->signal->cutime, &prstatus->pr_cutime);
+       jiffies_to_timeval(p->signal->cstime, &prstatus->pr_cstime);
 }
 
 static void fill_psinfo(struct elf_prpsinfo *psinfo, struct task_struct *p,
@@ -1226,6 +1256,7 @@ struct elf_thread_status
        struct list_head list;
        struct elf_prstatus prstatus;   /* NT_PRSTATUS */
        elf_fpregset_t fpu;             /* NT_PRFPREG */
+       struct task_struct *thread;
 #ifdef ELF_CORE_COPY_XFPREGS
        elf_fpxregset_t xfpu;           /* NT_PRXFPREG */
 #endif
@@ -1238,18 +1269,10 @@ struct elf_thread_status
  * we need to keep a linked list of every threads pr_status and then
  * create a single section for them in the final core file.
  */
-static int elf_dump_thread_status(long signr, struct task_struct * p, struct list_head * thread_list)
+static int elf_dump_thread_status(long signr, struct elf_thread_status *t)
 {
-
-       struct elf_thread_status *t;
        int sz = 0;
-
-       t = kmalloc(sizeof(*t), GFP_ATOMIC);
-       if (!t)
-               return 0;
-       memset(t, 0, sizeof(*t));
-
-       INIT_LIST_HEAD(&t->list);
+       struct task_struct *p = t->thread;
        t->num_notes = 0;
 
        fill_prstatus(&t->prstatus, p, signr);
@@ -1272,7 +1295,6 @@ static int elf_dump_thread_status(long signr, struct task_struct * p, struct lis
                sz += notesize(&t->notes[2]);
        }
 #endif 
-       list_add(&t->list, thread_list);
        return sz;
 }
 
@@ -1343,22 +1365,32 @@ static int elf_core_dump(long signr, struct pt_regs * regs, struct file * file)
                goto cleanup;
 #endif
 
-       /* capture the status of all other threads */
        if (signr) {
+               struct elf_thread_status *tmp;
                read_lock(&tasklist_lock);
                do_each_thread(g,p)
                        if (current->mm == p->mm && current != p) {
-                               int sz = elf_dump_thread_status(signr, p, &thread_list);
-                               if (!sz) {
+                               tmp = kmalloc(sizeof(*tmp), GFP_ATOMIC);
+                               if (!tmp) {
                                        read_unlock(&tasklist_lock);
                                        goto cleanup;
-                               } else
-                                       thread_status_size += sz;
+                               }
+                               memset(tmp, 0, sizeof(*tmp));
+                               INIT_LIST_HEAD(&tmp->list);
+                               tmp->thread = p;
+                               list_add(&tmp->list, &thread_list);
                        }
                while_each_thread(g,p);
                read_unlock(&tasklist_lock);
-       }
+               list_for_each(t, &thread_list) {
+                       struct elf_thread_status *tmp;
+                       int sz;
 
+                       tmp = list_entry(t, struct elf_thread_status, list);
+                       sz = elf_dump_thread_status(signr, tmp);
+                       thread_status_size += sz;
+               }
+       }
        /* now collect the dump for the current */
        memset(prstatus, 0, sizeof(*prstatus));
        fill_prstatus(prstatus, current, signr);