fedora core 6 1.2949 + vserver 2.2.0
[linux-2.6.git] / arch / s390 / kernel / process.c
index 63818a5..f864430 100644 (file)
@@ -15,8 +15,8 @@
  * This file handles the architecture-dependent parts of process handling..
  */
 
-#include <linux/config.h>
 #include <linux/compiler.h>
+#include <linux/cpu.h>
 #include <linux/errno.h>
 #include <linux/sched.h>
 #include <linux/kernel.h>
@@ -34,6 +34,8 @@
 #include <linux/delay.h>
 #include <linux/reboot.h>
 #include <linux/init.h>
+#include <linux/module.h>
+#include <linux/notifier.h>
 
 #include <asm/uaccess.h>
 #include <asm/pgtable.h>
 #include <asm/io.h>
 #include <asm/processor.h>
 #include <asm/irq.h>
-#if defined(CONFIG_VIRT_TIMER) || defined (CONFIG_NO_IDLE_HZ)
 #include <asm/timer.h>
-#endif
 
-asmlinkage void ret_from_fork(void) __asm__("ret_from_fork");
+asmlinkage void ret_from_fork(void) asm ("ret_from_fork");
 
 /*
  * Return saved PC of a blocked thread. used in kernel/sched.
@@ -57,142 +57,148 @@ asmlinkage void ret_from_fork(void) __asm__("ret_from_fork");
  */
 unsigned long thread_saved_pc(struct task_struct *tsk)
 {
-       unsigned long bc;
+       struct stack_frame *sf, *low, *high;
 
-       bc = *((unsigned long *) tsk->thread.ksp);
-#ifndef CONFIG_ARCH_S390X
-       return *((unsigned long *) (bc+56));
-#else
-       return *((unsigned long *) (bc+112));
-#endif
+       if (!tsk || !task_stack_page(tsk))
+               return 0;
+       low = task_stack_page(tsk);
+       high = (struct stack_frame *) task_pt_regs(tsk);
+       sf = (struct stack_frame *) (tsk->thread.ksp & PSW_ADDR_INSN);
+       if (sf <= low || sf > high)
+               return 0;
+       sf = (struct stack_frame *) (sf->back_chain & PSW_ADDR_INSN);
+       if (sf <= low || sf > high)
+               return 0;
+       return sf->gprs[8];
 }
 
 /*
- * The idle loop on a S390...
+ * Need to know about CPUs going idle?
  */
+static ATOMIC_NOTIFIER_HEAD(idle_chain);
+
+int register_idle_notifier(struct notifier_block *nb)
+{
+       return atomic_notifier_chain_register(&idle_chain, nb);
+}
+EXPORT_SYMBOL(register_idle_notifier);
+
+int unregister_idle_notifier(struct notifier_block *nb)
+{
+       return atomic_notifier_chain_unregister(&idle_chain, nb);
+}
+EXPORT_SYMBOL(unregister_idle_notifier);
+
+void do_monitor_call(struct pt_regs *regs, long interruption_code)
+{
+       /* disable monitor call class 0 */
+       __ctl_clear_bit(8, 15);
+
+       atomic_notifier_call_chain(&idle_chain, CPU_NOT_IDLE,
+                           (void *)(long) smp_processor_id());
+}
 
-void default_idle(void)
+extern void s390_handle_mcck(void);
+/*
+ * The idle loop on a S390...
+ */
+static void default_idle(void)
 {
-       psw_t wait_psw;
-       unsigned long reg;
+       int cpu, rc;
+
+       /* CPU is going idle. */
+       cpu = smp_processor_id();
 
        local_irq_disable();
-        if (need_resched()) {
+       if (need_resched()) {
                local_irq_enable();
-                schedule();
-                return;
-        }
+               return;
+       }
 
-#if defined(CONFIG_VIRT_TIMER) || defined (CONFIG_NO_IDLE_HZ)
-       /*
-        * hook to stop timers that should not tick while CPU is idle
-        */
-       if (stop_timers()) {
+       rc = atomic_notifier_call_chain(&idle_chain,
+                       CPU_IDLE, (void *)(long) cpu);
+       if (rc != NOTIFY_OK && rc != NOTIFY_DONE)
+               BUG();
+       if (rc != NOTIFY_OK) {
                local_irq_enable();
                return;
        }
+
+       /* enable monitor call class 0 */
+       __ctl_set_bit(8, 15);
+
+#ifdef CONFIG_HOTPLUG_CPU
+       if (cpu_is_offline(cpu)) {
+               preempt_enable_no_resched();
+               cpu_die();
+       }
 #endif
 
-       /* 
-        * Wait for external, I/O or machine check interrupt and
-        * switch off machine check bit after the wait has ended.
-        */
-       wait_psw.mask = PSW_KERNEL_BITS | PSW_MASK_MCHECK | PSW_MASK_WAIT |
-               PSW_MASK_IO | PSW_MASK_EXT;
-#ifndef CONFIG_ARCH_S390X
-       asm volatile (
-               "    basr %0,0\n"
-               "0:  la   %0,1f-0b(%0)\n"
-               "    st   %0,4(%1)\n"
-               "    oi   4(%1),0x80\n"
-               "    lpsw 0(%1)\n"
-               "1:  la   %0,2f-1b(%0)\n"
-               "    st   %0,4(%1)\n"
-               "    oi   4(%1),0x80\n"
-               "    ni   1(%1),0xf9\n"
-               "    lpsw 0(%1)\n"
-               "2:"
-               : "=&a" (reg) : "a" (&wait_psw) : "memory", "cc" );
-#else /* CONFIG_ARCH_S390X */
-       asm volatile (
-               "    larl  %0,0f\n"
-               "    stg   %0,8(%1)\n"
-               "    lpswe 0(%1)\n"
-               "0:  larl  %0,1f\n"
-               "    stg   %0,8(%1)\n"
-               "    ni    1(%1),0xf9\n"
-               "    lpswe 0(%1)\n"
-               "1:"
-               : "=&a" (reg) : "a" (&wait_psw) : "memory", "cc" );
-#endif /* CONFIG_ARCH_S390X */
+       local_mcck_disable();
+       if (test_thread_flag(TIF_MCCK_PENDING)) {
+               local_mcck_enable();
+               local_irq_enable();
+               s390_handle_mcck();
+               return;
+       }
+
+       trace_hardirqs_on();
+       /* Wait for external, I/O or machine check interrupt. */
+       __load_psw_mask(PSW_KERNEL_BITS | PSW_MASK_WAIT |
+                       PSW_MASK_IO | PSW_MASK_EXT);
 }
 
-int cpu_idle(void)
+void cpu_idle(void)
 {
-       for (;;)
-               default_idle();
-       return 0;
+       for (;;) {
+               while (!need_resched())
+                       default_idle();
+
+               preempt_enable_no_resched();
+               schedule();
+               preempt_disable();
+       }
 }
 
 void show_regs(struct pt_regs *regs)
 {
        struct task_struct *tsk = current;
 
-        printk("CPU:    %d    %s\n", tsk->thread_info->cpu, print_tainted());
-        printk("Process %s (pid: %d, task: %p, ksp: %p)\n",
-              current->comm, current->pid, (void *) tsk,
-              (void *) tsk->thread.ksp);
+        printk("CPU:    %d    %s\n", task_thread_info(tsk)->cpu, print_tainted());
+       printk("Process %s (pid: %d[#%u], task: %p, ksp: %p)\n",
+              current->comm, current->pid, current->xid,
+              (void *) tsk, (void *) tsk->thread.ksp);
 
        show_registers(regs);
        /* Show stack backtrace if pt_regs is from kernel mode */
        if (!(regs->psw.mask & PSW_MASK_PSTATE))
-               show_trace(0,(unsigned long *) regs->gprs[15]);
+               show_trace(NULL, (unsigned long *) regs->gprs[15]);
 }
 
 extern void kernel_thread_starter(void);
 
-#ifndef CONFIG_ARCH_S390X
-
-__asm__(".align 4\n"
+asm(
+       ".align 4\n"
        "kernel_thread_starter:\n"
-       "    l     15,0(8)\n"
-       "    sr    15,7\n"
-       "    stosm 24(15),3\n"
-       "    lr    2,10\n"
+       "    la    2,0(10)\n"
        "    basr  14,9\n"
-       "    sr    2,2\n"
+       "    la    2,0\n"
        "    br    11\n");
 
-#else /* CONFIG_ARCH_S390X */
-
-__asm__(".align 4\n"
-       "kernel_thread_starter:\n"
-       "    lg    15,0(8)\n"
-       "    sgr   15,7\n"
-       "    stosm 48(15),3\n"
-       "    lgr   2,10\n"
-       "    basr  14,9\n"
-       "    sgr   2,2\n"
-       "    br    11\n");
-
-#endif /* CONFIG_ARCH_S390X */
-
 int kernel_thread(int (*fn)(void *), void * arg, unsigned long flags)
 {
        struct pt_regs regs;
 
        memset(&regs, 0, sizeof(regs));
-       regs.psw.mask = PSW_KERNEL_BITS;
+       regs.psw.mask = PSW_KERNEL_BITS | PSW_MASK_IO | PSW_MASK_EXT;
        regs.psw.addr = (unsigned long) kernel_thread_starter | PSW_ADDR_AMODE;
-       regs.gprs[7] = STACK_FRAME_OVERHEAD + sizeof(struct pt_regs);
-       regs.gprs[8] = __LC_KERNEL_STACK;
        regs.gprs[9] = (unsigned long) fn;
        regs.gprs[10] = (unsigned long) arg;
        regs.gprs[11] = (unsigned long) do_exit;
        regs.orig_gpr2 = -1;
 
        /* Ok, create the new process.. */
-       return do_fork(flags | CLONE_VM | CLONE_UNTRACED,
+       return do_fork(flags | CLONE_VM | CLONE_UNTRACED | CLONE_KTHREAD,
                       0, &regs, 0, NULL, NULL);
 }
 
@@ -205,8 +211,7 @@ void exit_thread(void)
 
 void flush_thread(void)
 {
-
-        current->used_math = 0;
+       clear_used_math();
        clear_tsk_thread_flag(current, TIF_USEDFPU);
 }
 
@@ -218,39 +223,30 @@ int copy_thread(int nr, unsigned long clone_flags, unsigned long new_stackp,
        unsigned long unused,
         struct task_struct * p, struct pt_regs * regs)
 {
-        struct stack_frame
+        struct fake_frame
           {
-            unsigned long back_chain;
-            unsigned long eos;
-            unsigned long glue1;
-            unsigned long glue2;
-            unsigned long scratch[2];
-            unsigned long gprs[10];    /* gprs 6 -15                       */
-            unsigned int  fprs[4];     /* fpr 4 and 6                      */
-            unsigned int  empty[4];
+           struct stack_frame sf;
             struct pt_regs childregs;
           } *frame;
 
-        frame = ((struct stack_frame *)
-                (THREAD_SIZE + (unsigned long) p->thread_info)) - 1;
+        frame = container_of(task_pt_regs(p), struct fake_frame, childregs);
         p->thread.ksp = (unsigned long) frame;
-       p->set_child_tid = p->clear_child_tid = NULL;
        /* Store access registers to kernel stack of new process. */
         frame->childregs = *regs;
        frame->childregs.gprs[2] = 0;   /* child returns 0 on fork. */
         frame->childregs.gprs[15] = new_stackp;
-        frame->back_chain = frame->eos = 0;
+        frame->sf.back_chain = 0;
 
         /* new return point is ret_from_fork */
-        frame->gprs[8] = (unsigned long) ret_from_fork;
+        frame->sf.gprs[8] = (unsigned long) ret_from_fork;
 
         /* fake return stack for resume(), don't go back to schedule */
-        frame->gprs[9] = (unsigned long) frame;
+        frame->sf.gprs[9] = (unsigned long) frame;
 
        /* Save access registers to new thread structure. */
        save_access_regs(&p->thread.acrs[0]);
 
-#ifndef CONFIG_ARCH_S390X
+#ifndef CONFIG_64BIT
         /*
         * save fprs to current->thread.fp_regs to merge them with
         * the emulated registers and then copy the result to the child.
@@ -262,7 +258,7 @@ int copy_thread(int nr, unsigned long clone_flags, unsigned long new_stackp,
        /* Set a new TLS ?  */
        if (clone_flags & CLONE_SETTLS)
                p->thread.acrs[0] = regs->gprs[6];
-#else /* CONFIG_ARCH_S390X */
+#else /* CONFIG_64BIT */
        /* Save the fpu registers to new thread structure. */
        save_fp_regs(&p->thread.fp_regs);
         p->thread.user_seg = __pa((unsigned long) p->mm->pgd) | _REGION_TABLE;
@@ -275,7 +271,7 @@ int copy_thread(int nr, unsigned long clone_flags, unsigned long new_stackp,
                        p->thread.acrs[1] = (unsigned int) regs->gprs[6];
                }
        }
-#endif /* CONFIG_ARCH_S390X */
+#endif /* CONFIG_64BIT */
        /* start new process with ar4 pointing to the correct address space */
        p->thread.mm_segment = get_fs();
         /* Don't copy debug registers */
@@ -301,7 +297,7 @@ asmlinkage long sys_clone(struct pt_regs regs)
        child_tidptr = (int __user *) regs.gprs[5];
         if (!newsp)
                 newsp = regs.gprs[15];
-        return do_fork(clone_flags & ~CLONE_IDLETASK, newsp, &regs, 0,
+        return do_fork(clone_flags, newsp, &regs, 0,
                       parent_tidptr, child_tidptr);
 }
 
@@ -336,7 +332,6 @@ asmlinkage long sys_execve(struct pt_regs regs)
         error = do_execve(filename, (char __user * __user *) regs.gprs[3],
                          (char __user * __user *) regs.gprs[4], &regs);
        if (error == 0) {
-               current->ptrace &= ~PT_DTRACE;
                current->thread.fp_regs.fpc = 0;
                if (MACHINE_HAS_IEEE)
                        asm volatile("sfpc %0,%0" : : "d" (0));
@@ -352,66 +347,40 @@ out:
  */
 int dump_fpu (struct pt_regs * regs, s390_fp_regs *fpregs)
 {
-#ifndef CONFIG_ARCH_S390X
+#ifndef CONFIG_64BIT
         /*
         * save fprs to current->thread.fp_regs to merge them with
         * the emulated registers and then copy the result to the dump.
         */
        save_fp_regs(&current->thread.fp_regs);
        memcpy(fpregs, &current->thread.fp_regs, sizeof(s390_fp_regs));
-#else /* CONFIG_ARCH_S390X */
+#else /* CONFIG_64BIT */
        save_fp_regs(fpregs);
-#endif /* CONFIG_ARCH_S390X */
+#endif /* CONFIG_64BIT */
        return 1;
 }
 
-/*
- * fill in the user structure for a core dump..
- */
-void dump_thread(struct pt_regs * regs, struct user * dump)
-{
-
-/* changed the size calculations - should hopefully work better. lbt */
-       dump->magic = CMAGIC;
-       dump->start_code = 0;
-       dump->start_stack = regs->gprs[15] & ~(PAGE_SIZE - 1);
-       dump->u_tsize = current->mm->end_code >> PAGE_SHIFT;
-       dump->u_dsize = (current->mm->brk + PAGE_SIZE - 1) >> PAGE_SHIFT;
-       dump->u_dsize -= dump->u_tsize;
-       dump->u_ssize = 0;
-       if (dump->start_stack < TASK_SIZE)
-               dump->u_ssize = (TASK_SIZE - dump->start_stack) >> PAGE_SHIFT;
-       memcpy(&dump->regs, regs, sizeof(s390_regs));
-       dump_fpu (regs, &dump->regs.fp_regs);
-       dump->regs.per_info = current->thread.per_info;
-}
-
 unsigned long get_wchan(struct task_struct *p)
 {
-       unsigned long r14, r15, bc;
-       unsigned long stack_page;
-       int count = 0;
-       if (!p || p == current || p->state == TASK_RUNNING)
+       struct stack_frame *sf, *low, *high;
+       unsigned long return_address;
+       int count;
+
+       if (!p || p == current || p->state == TASK_RUNNING || !task_stack_page(p))
                return 0;
-       stack_page = (unsigned long) p->thread_info;
-       r15 = p->thread.ksp;
-       if (!stack_page || r15 < stack_page ||
-           r15 >= THREAD_SIZE - sizeof(unsigned long) + stack_page)
+       low = task_stack_page(p);
+       high = (struct stack_frame *) task_pt_regs(p);
+       sf = (struct stack_frame *) (p->thread.ksp & PSW_ADDR_INSN);
+       if (sf <= low || sf > high)
                return 0;
-       bc = (*(unsigned long *) r15) & PSW_ADDR_INSN;
-       do {
-               if (bc < stack_page ||
-                   bc >= THREAD_SIZE - sizeof(unsigned long) + stack_page)
+       for (count = 0; count < 16; count++) {
+               sf = (struct stack_frame *) (sf->back_chain & PSW_ADDR_INSN);
+               if (sf <= low || sf > high)
                        return 0;
-#ifndef CONFIG_ARCH_S390X
-               r14 = (*(unsigned long *) (bc+56)) & PSW_ADDR_INSN;
-#else
-               r14 = *(unsigned long *) (bc+112);
-#endif
-               if (!in_sched_functions(r14))
-                       return r14;
-               bc = (*(unsigned long *) bc) & PSW_ADDR_INSN;
-       } while (count++ < 16);
+               return_address = sf->gprs[8] & PSW_ADDR_INSN;
+               if (!in_sched_functions(return_address))
+                       return return_address;
+       }
        return 0;
 }