vserver 2.0 rc7
[linux-2.6.git] / arch / ia64 / kernel / signal.c
1 /*
2  * Architecture-specific signal handling support.
3  *
4  * Copyright (C) 1999-2004 Hewlett-Packard Co
5  *      David Mosberger-Tang <davidm@hpl.hp.com>
6  *
7  * Derived from i386 and Alpha versions.
8  */
9
10 #include <linux/config.h>
11 #include <linux/errno.h>
12 #include <linux/kernel.h>
13 #include <linux/mm.h>
14 #include <linux/ptrace.h>
15 #include <linux/sched.h>
16 #include <linux/signal.h>
17 #include <linux/smp.h>
18 #include <linux/smp_lock.h>
19 #include <linux/stddef.h>
20 #include <linux/tty.h>
21 #include <linux/binfmts.h>
22 #include <linux/unistd.h>
23 #include <linux/wait.h>
24
25 #include <asm/ia32.h>
26 #include <asm/intrinsics.h>
27 #include <asm/uaccess.h>
28 #include <asm/rse.h>
29 #include <asm/sigcontext.h>
30
31 #include "sigframe.h"
32
33 #define DEBUG_SIG       0
34 #define STACK_ALIGN     16              /* minimal alignment for stack pointer */
35 #define _BLOCKABLE      (~(sigmask(SIGKILL) | sigmask(SIGSTOP)))
36
37 #if _NSIG_WORDS > 1
38 # define PUT_SIGSET(k,u)        __copy_to_user((u)->sig, (k)->sig, sizeof(sigset_t))
39 # define GET_SIGSET(k,u)        __copy_from_user((k)->sig, (u)->sig, sizeof(sigset_t))
40 #else
41 # define PUT_SIGSET(k,u)        __put_user((k)->sig[0], &(u)->sig[0])
42 # define GET_SIGSET(k,u)        __get_user((k)->sig[0], &(u)->sig[0])
43 #endif
44
45 long
46 ia64_rt_sigsuspend (sigset_t __user *uset, size_t sigsetsize, struct sigscratch *scr)
47 {
48         sigset_t oldset, set;
49
50         /* XXX: Don't preclude handling different sized sigset_t's.  */
51         if (sigsetsize != sizeof(sigset_t))
52                 return -EINVAL;
53
54         if (!access_ok(VERIFY_READ, uset, sigsetsize))
55                 return -EFAULT;
56
57         if (GET_SIGSET(&set, uset))
58                 return -EFAULT;
59
60         sigdelsetmask(&set, ~_BLOCKABLE);
61
62         spin_lock_irq(&current->sighand->siglock);
63         {
64                 oldset = current->blocked;
65                 current->blocked = set;
66                 recalc_sigpending();
67         }
68         spin_unlock_irq(&current->sighand->siglock);
69
70         /*
71          * The return below usually returns to the signal handler.  We need to
72          * pre-set the correct error code here to ensure that the right values
73          * get saved in sigcontext by ia64_do_signal.
74          */
75         scr->pt.r8 = EINTR;
76         scr->pt.r10 = -1;
77
78         while (1) {
79                 current->state = TASK_INTERRUPTIBLE;
80                 schedule();
81                 if (ia64_do_signal(&oldset, scr, 1))
82                         return -EINTR;
83         }
84 }
85
86 asmlinkage long
87 sys_sigaltstack (const stack_t __user *uss, stack_t __user *uoss, long arg2,
88                  long arg3, long arg4, long arg5, long arg6, long arg7,
89                  struct pt_regs regs)
90 {
91         return do_sigaltstack(uss, uoss, regs.r12);
92 }
93
94 static long
95 restore_sigcontext (struct sigcontext __user *sc, struct sigscratch *scr)
96 {
97         unsigned long ip, flags, nat, um, cfm, rsc;
98         long err;
99
100         /* Always make any pending restarted system calls return -EINTR */
101         current_thread_info()->restart_block.fn = do_no_restart_syscall;
102
103         /* restore scratch that always needs gets updated during signal delivery: */
104         err  = __get_user(flags, &sc->sc_flags);
105         err |= __get_user(nat, &sc->sc_nat);
106         err |= __get_user(ip, &sc->sc_ip);                      /* instruction pointer */
107         err |= __get_user(cfm, &sc->sc_cfm);
108         err |= __get_user(um, &sc->sc_um);                      /* user mask */
109         err |= __get_user(rsc, &sc->sc_ar_rsc);
110         err |= __get_user(scr->pt.ar_unat, &sc->sc_ar_unat);
111         err |= __get_user(scr->pt.ar_fpsr, &sc->sc_ar_fpsr);
112         err |= __get_user(scr->pt.ar_pfs, &sc->sc_ar_pfs);
113         err |= __get_user(scr->pt.pr, &sc->sc_pr);              /* predicates */
114         err |= __get_user(scr->pt.b0, &sc->sc_br[0]);           /* b0 (rp) */
115         err |= __get_user(scr->pt.b6, &sc->sc_br[6]);           /* b6 */
116         err |= __copy_from_user(&scr->pt.r1, &sc->sc_gr[1], 8); /* r1 */
117         err |= __copy_from_user(&scr->pt.r8, &sc->sc_gr[8], 4*8);       /* r8-r11 */
118         err |= __copy_from_user(&scr->pt.r12, &sc->sc_gr[12], 2*8);     /* r12-r13 */
119         err |= __copy_from_user(&scr->pt.r15, &sc->sc_gr[15], 8);       /* r15 */
120
121         scr->pt.cr_ifs = cfm | (1UL << 63);
122         scr->pt.ar_rsc = rsc | (3 << 2); /* force PL3 */
123
124         /* establish new instruction pointer: */
125         scr->pt.cr_iip = ip & ~0x3UL;
126         ia64_psr(&scr->pt)->ri = ip & 0x3;
127         scr->pt.cr_ipsr = (scr->pt.cr_ipsr & ~IA64_PSR_UM) | (um & IA64_PSR_UM);
128
129         scr->scratch_unat = ia64_put_scratch_nat_bits(&scr->pt, nat);
130
131         if (!(flags & IA64_SC_FLAG_IN_SYSCALL)) {
132                 /* Restore most scratch-state only when not in syscall. */
133                 err |= __get_user(scr->pt.ar_ccv, &sc->sc_ar_ccv);              /* ar.ccv */
134                 err |= __get_user(scr->pt.b7, &sc->sc_br[7]);                   /* b7 */
135                 err |= __get_user(scr->pt.r14, &sc->sc_gr[14]);                 /* r14 */
136                 err |= __copy_from_user(&scr->pt.ar_csd, &sc->sc_ar25, 2*8); /* ar.csd & ar.ssd */
137                 err |= __copy_from_user(&scr->pt.r2, &sc->sc_gr[2], 2*8);       /* r2-r3 */
138                 err |= __copy_from_user(&scr->pt.r16, &sc->sc_gr[16], 16*8);    /* r16-r31 */
139         }
140
141         if ((flags & IA64_SC_FLAG_FPH_VALID) != 0) {
142                 struct ia64_psr *psr = ia64_psr(&scr->pt);
143
144                 __copy_from_user(current->thread.fph, &sc->sc_fr[32], 96*16);
145                 psr->mfh = 0;   /* drop signal handler's fph contents... */
146                 if (psr->dfh)
147                         ia64_drop_fpu(current);
148                 else {
149                         /* We already own the local fph, otherwise psr->dfh wouldn't be 0.  */
150                         __ia64_load_fpu(current->thread.fph);
151                         ia64_set_local_fpu_owner(current);
152                 }
153         }
154         return err;
155 }
156
157 int
158 copy_siginfo_to_user (siginfo_t __user *to, siginfo_t *from)
159 {
160         if (!access_ok(VERIFY_WRITE, to, sizeof(siginfo_t)))
161                 return -EFAULT;
162         if (from->si_code < 0) {
163                 if (__copy_to_user(to, from, sizeof(siginfo_t)))
164                         return -EFAULT;
165                 return 0;
166         } else {
167                 int err;
168
169                 /*
170                  * If you change siginfo_t structure, please be sure this code is fixed
171                  * accordingly.  It should never copy any pad contained in the structure
172                  * to avoid security leaks, but must copy the generic 3 ints plus the
173                  * relevant union member.
174                  */
175                 err = __put_user(from->si_signo, &to->si_signo);
176                 err |= __put_user(from->si_errno, &to->si_errno);
177                 err |= __put_user((short)from->si_code, &to->si_code);
178                 switch (from->si_code >> 16) {
179                       case __SI_FAULT >> 16:
180                         err |= __put_user(from->si_flags, &to->si_flags);
181                         err |= __put_user(from->si_isr, &to->si_isr);
182                       case __SI_POLL >> 16:
183                         err |= __put_user(from->si_addr, &to->si_addr);
184                         err |= __put_user(from->si_imm, &to->si_imm);
185                         break;
186                       case __SI_TIMER >> 16:
187                         err |= __put_user(from->si_tid, &to->si_tid);
188                         err |= __put_user(from->si_overrun, &to->si_overrun);
189                         err |= __put_user(from->si_ptr, &to->si_ptr);
190                         break;
191                       case __SI_RT >> 16:       /* Not generated by the kernel as of now.  */
192                       case __SI_MESGQ >> 16:
193                         err |= __put_user(from->si_uid, &to->si_uid);
194                         err |= __put_user(from->si_pid, &to->si_pid);
195                         err |= __put_user(from->si_ptr, &to->si_ptr);
196                         break;
197                       case __SI_CHLD >> 16:
198                         err |= __put_user(from->si_utime, &to->si_utime);
199                         err |= __put_user(from->si_stime, &to->si_stime);
200                         err |= __put_user(from->si_status, &to->si_status);
201                       default:
202                         err |= __put_user(from->si_uid, &to->si_uid);
203                         err |= __put_user(from->si_pid, &to->si_pid);
204                         break;
205                 }
206                 return err;
207         }
208 }
209
210 long
211 ia64_rt_sigreturn (struct sigscratch *scr)
212 {
213         extern char ia64_strace_leave_kernel, ia64_leave_kernel;
214         struct sigcontext __user *sc;
215         struct siginfo si;
216         sigset_t set;
217         long retval;
218
219         sc = &((struct sigframe __user *) (scr->pt.r12 + 16))->sc;
220
221         /*
222          * When we return to the previously executing context, r8 and r10 have already
223          * been setup the way we want them.  Indeed, if the signal wasn't delivered while
224          * in a system call, we must not touch r8 or r10 as otherwise user-level state
225          * could be corrupted.
226          */
227         retval = (long) &ia64_leave_kernel;
228         if (test_thread_flag(TIF_SYSCALL_TRACE)
229             || test_thread_flag(TIF_SYSCALL_AUDIT))
230                 /*
231                  * strace expects to be notified after sigreturn returns even though the
232                  * context to which we return may not be in the middle of a syscall.
233                  * Thus, the return-value that strace displays for sigreturn is
234                  * meaningless.
235                  */
236                 retval = (long) &ia64_strace_leave_kernel;
237
238         if (!access_ok(VERIFY_READ, sc, sizeof(*sc)))
239                 goto give_sigsegv;
240
241         if (GET_SIGSET(&set, &sc->sc_mask))
242                 goto give_sigsegv;
243
244         sigdelsetmask(&set, ~_BLOCKABLE);
245
246         spin_lock_irq(&current->sighand->siglock);
247         {
248                 current->blocked = set;
249                 recalc_sigpending();
250         }
251         spin_unlock_irq(&current->sighand->siglock);
252
253         if (restore_sigcontext(sc, scr))
254                 goto give_sigsegv;
255
256 #if DEBUG_SIG
257         printk("SIG return (%s:%d): sp=%lx ip=%lx\n",
258                current->comm, current->pid, scr->pt.r12, scr->pt.cr_iip);
259 #endif
260         /*
261          * It is more difficult to avoid calling this function than to
262          * call it and ignore errors.
263          */
264         do_sigaltstack(&sc->sc_stack, NULL, scr->pt.r12);
265         return retval;
266
267   give_sigsegv:
268         si.si_signo = SIGSEGV;
269         si.si_errno = 0;
270         si.si_code = SI_KERNEL;
271         si.si_pid = current->pid;
272         si.si_uid = current->uid;
273         si.si_addr = sc;
274         force_sig_info(SIGSEGV, &si, current);
275         return retval;
276 }
277
278 /*
279  * This does just the minimum required setup of sigcontext.
280  * Specifically, it only installs data that is either not knowable at
281  * the user-level or that gets modified before execution in the
282  * trampoline starts.  Everything else is done at the user-level.
283  */
284 static long
285 setup_sigcontext (struct sigcontext __user *sc, sigset_t *mask, struct sigscratch *scr)
286 {
287         unsigned long flags = 0, ifs, cfm, nat;
288         long err;
289
290         ifs = scr->pt.cr_ifs;
291
292         if (on_sig_stack((unsigned long) sc))
293                 flags |= IA64_SC_FLAG_ONSTACK;
294         if ((ifs & (1UL << 63)) == 0)
295                 /* if cr_ifs doesn't have the valid bit set, we got here through a syscall */
296                 flags |= IA64_SC_FLAG_IN_SYSCALL;
297         cfm = ifs & ((1UL << 38) - 1);
298         ia64_flush_fph(current);
299         if ((current->thread.flags & IA64_THREAD_FPH_VALID)) {
300                 flags |= IA64_SC_FLAG_FPH_VALID;
301                 __copy_to_user(&sc->sc_fr[32], current->thread.fph, 96*16);
302         }
303
304         nat = ia64_get_scratch_nat_bits(&scr->pt, scr->scratch_unat);
305
306         err  = __put_user(flags, &sc->sc_flags);
307         err |= __put_user(nat, &sc->sc_nat);
308         err |= PUT_SIGSET(mask, &sc->sc_mask);
309         err |= __put_user(cfm, &sc->sc_cfm);
310         err |= __put_user(scr->pt.cr_ipsr & IA64_PSR_UM, &sc->sc_um);
311         err |= __put_user(scr->pt.ar_rsc, &sc->sc_ar_rsc);
312         err |= __put_user(scr->pt.ar_unat, &sc->sc_ar_unat);            /* ar.unat */
313         err |= __put_user(scr->pt.ar_fpsr, &sc->sc_ar_fpsr);            /* ar.fpsr */
314         err |= __put_user(scr->pt.ar_pfs, &sc->sc_ar_pfs);
315         err |= __put_user(scr->pt.pr, &sc->sc_pr);                      /* predicates */
316         err |= __put_user(scr->pt.b0, &sc->sc_br[0]);                   /* b0 (rp) */
317         err |= __put_user(scr->pt.b6, &sc->sc_br[6]);                   /* b6 */
318         err |= __copy_to_user(&sc->sc_gr[1], &scr->pt.r1, 8);           /* r1 */
319         err |= __copy_to_user(&sc->sc_gr[8], &scr->pt.r8, 4*8);         /* r8-r11 */
320         err |= __copy_to_user(&sc->sc_gr[12], &scr->pt.r12, 2*8);       /* r12-r13 */
321         err |= __copy_to_user(&sc->sc_gr[15], &scr->pt.r15, 8);         /* r15 */
322         err |= __put_user(scr->pt.cr_iip + ia64_psr(&scr->pt)->ri, &sc->sc_ip);
323
324         if (flags & IA64_SC_FLAG_IN_SYSCALL) {
325                 /* Clear scratch registers if the signal interrupted a system call. */
326                 err |= __put_user(0, &sc->sc_ar_ccv);                           /* ar.ccv */
327                 err |= __put_user(0, &sc->sc_br[7]);                            /* b7 */
328                 err |= __put_user(0, &sc->sc_gr[14]);                           /* r14 */
329                 err |= __clear_user(&sc->sc_ar25, 2*8);                 /* ar.csd & ar.ssd */
330                 err |= __clear_user(&sc->sc_gr[2], 2*8);                        /* r2-r3 */
331                 err |= __clear_user(&sc->sc_gr[16], 16*8);                      /* r16-r31 */
332         } else {
333                 /* Copy scratch regs to sigcontext if the signal didn't interrupt a syscall. */
334                 err |= __put_user(scr->pt.ar_ccv, &sc->sc_ar_ccv);              /* ar.ccv */
335                 err |= __put_user(scr->pt.b7, &sc->sc_br[7]);                   /* b7 */
336                 err |= __put_user(scr->pt.r14, &sc->sc_gr[14]);                 /* r14 */
337                 err |= __copy_to_user(&sc->sc_ar25, &scr->pt.ar_csd, 2*8); /* ar.csd & ar.ssd */
338                 err |= __copy_to_user(&sc->sc_gr[2], &scr->pt.r2, 2*8);         /* r2-r3 */
339                 err |= __copy_to_user(&sc->sc_gr[16], &scr->pt.r16, 16*8);      /* r16-r31 */
340         }
341         return err;
342 }
343
344 /*
345  * Check whether the register-backing store is already on the signal stack.
346  */
347 static inline int
348 rbs_on_sig_stack (unsigned long bsp)
349 {
350         return (bsp - current->sas_ss_sp < current->sas_ss_size);
351 }
352
353 static long
354 force_sigsegv_info (int sig, void __user *addr)
355 {
356         unsigned long flags;
357         struct siginfo si;
358
359         if (sig == SIGSEGV) {
360                 /*
361                  * Acquiring siglock around the sa_handler-update is almost
362                  * certainly overkill, but this isn't a
363                  * performance-critical path and I'd rather play it safe
364                  * here than having to debug a nasty race if and when
365                  * something changes in kernel/signal.c that would make it
366                  * no longer safe to modify sa_handler without holding the
367                  * lock.
368                  */
369                 spin_lock_irqsave(&current->sighand->siglock, flags);
370                 current->sighand->action[sig - 1].sa.sa_handler = SIG_DFL;
371                 spin_unlock_irqrestore(&current->sighand->siglock, flags);
372         }
373         si.si_signo = SIGSEGV;
374         si.si_errno = 0;
375         si.si_code = SI_KERNEL;
376         si.si_pid = current->pid;
377         si.si_uid = current->uid;
378         si.si_addr = addr;
379         force_sig_info(SIGSEGV, &si, current);
380         return 0;
381 }
382
383 static long
384 setup_frame (int sig, struct k_sigaction *ka, siginfo_t *info, sigset_t *set,
385              struct sigscratch *scr)
386 {
387         extern char __kernel_sigtramp[];
388         unsigned long tramp_addr, new_rbs = 0;
389         struct sigframe __user *frame;
390         long err;
391
392         frame = (void __user *) scr->pt.r12;
393         tramp_addr = (unsigned long) __kernel_sigtramp;
394         if ((ka->sa.sa_flags & SA_ONSTACK) && sas_ss_flags((unsigned long) frame) == 0) {
395                 frame = (void __user *) ((current->sas_ss_sp + current->sas_ss_size)
396                                          & ~(STACK_ALIGN - 1));
397                 /*
398                  * We need to check for the register stack being on the signal stack
399                  * separately, because it's switched separately (memory stack is switched
400                  * in the kernel, register stack is switched in the signal trampoline).
401                  */
402                 if (!rbs_on_sig_stack(scr->pt.ar_bspstore))
403                         new_rbs = (current->sas_ss_sp + sizeof(long) - 1) & ~(sizeof(long) - 1);
404         }
405         frame = (void __user *) frame - ((sizeof(*frame) + STACK_ALIGN - 1) & ~(STACK_ALIGN - 1));
406
407         if (!access_ok(VERIFY_WRITE, frame, sizeof(*frame)))
408                 return force_sigsegv_info(sig, frame);
409
410         err  = __put_user(sig, &frame->arg0);
411         err |= __put_user(&frame->info, &frame->arg1);
412         err |= __put_user(&frame->sc, &frame->arg2);
413         err |= __put_user(new_rbs, &frame->sc.sc_rbs_base);
414         err |= __put_user(0, &frame->sc.sc_loadrs);     /* initialize to zero */
415         err |= __put_user(ka->sa.sa_handler, &frame->handler);
416
417         err |= copy_siginfo_to_user(&frame->info, info);
418
419         err |= __put_user(current->sas_ss_sp, &frame->sc.sc_stack.ss_sp);
420         err |= __put_user(current->sas_ss_size, &frame->sc.sc_stack.ss_size);
421         err |= __put_user(sas_ss_flags(scr->pt.r12), &frame->sc.sc_stack.ss_flags);
422         err |= setup_sigcontext(&frame->sc, set, scr);
423
424         if (unlikely(err))
425                 return force_sigsegv_info(sig, frame);
426
427         scr->pt.r12 = (unsigned long) frame - 16;       /* new stack pointer */
428         scr->pt.ar_fpsr = FPSR_DEFAULT;                 /* reset fpsr for signal handler */
429         scr->pt.cr_iip = tramp_addr;
430         ia64_psr(&scr->pt)->ri = 0;                     /* start executing in first slot */
431         ia64_psr(&scr->pt)->be = 0;                     /* force little-endian byte-order */
432         /*
433          * Force the interruption function mask to zero.  This has no effect when a
434          * system-call got interrupted by a signal (since, in that case, scr->pt_cr_ifs is
435          * ignored), but it has the desirable effect of making it possible to deliver a
436          * signal with an incomplete register frame (which happens when a mandatory RSE
437          * load faults).  Furthermore, it has no negative effect on the getting the user's
438          * dirty partition preserved, because that's governed by scr->pt.loadrs.
439          */
440         scr->pt.cr_ifs = (1UL << 63);
441
442         /*
443          * Note: this affects only the NaT bits of the scratch regs (the ones saved in
444          * pt_regs), which is exactly what we want.
445          */
446         scr->scratch_unat = 0; /* ensure NaT bits of r12 is clear */
447
448 #if DEBUG_SIG
449         printk("SIG deliver (%s:%d): sig=%d sp=%lx ip=%lx handler=%p\n",
450                current->comm, current->pid, sig, scr->pt.r12, frame->sc.sc_ip, frame->handler);
451 #endif
452         return 1;
453 }
454
455 static long
456 handle_signal (unsigned long sig, struct k_sigaction *ka, siginfo_t *info, sigset_t *oldset,
457                struct sigscratch *scr)
458 {
459         if (IS_IA32_PROCESS(&scr->pt)) {
460                 /* send signal to IA-32 process */
461                 if (!ia32_setup_frame1(sig, ka, info, oldset, &scr->pt))
462                         return 0;
463         } else
464                 /* send signal to IA-64 process */
465                 if (!setup_frame(sig, ka, info, oldset, scr))
466                         return 0;
467
468         if (!(ka->sa.sa_flags & SA_NODEFER)) {
469                 spin_lock_irq(&current->sighand->siglock);
470                 {
471                         sigorsets(&current->blocked, &current->blocked, &ka->sa.sa_mask);
472                         sigaddset(&current->blocked, sig);
473                         recalc_sigpending();
474                 }
475                 spin_unlock_irq(&current->sighand->siglock);
476         }
477         return 1;
478 }
479
480 /*
481  * Note that `init' is a special process: it doesn't get signals it doesn't want to
482  * handle.  Thus you cannot kill init even with a SIGKILL even by mistake.
483  */
484 long
485 ia64_do_signal (sigset_t *oldset, struct sigscratch *scr, long in_syscall)
486 {
487         struct k_sigaction ka;
488         siginfo_t info;
489         long restart = in_syscall;
490         long errno = scr->pt.r8;
491 #       define ERR_CODE(c)      (IS_IA32_PROCESS(&scr->pt) ? -(c) : (c))
492
493         /*
494          * In the ia64_leave_kernel code path, we want the common case to go fast, which
495          * is why we may in certain cases get here from kernel mode. Just return without
496          * doing anything if so.
497          */
498         if (!user_mode(&scr->pt))
499                 return 0;
500
501         if (!oldset)
502                 oldset = &current->blocked;
503
504         /*
505          * This only loops in the rare cases of handle_signal() failing, in which case we
506          * need to push through a forced SIGSEGV.
507          */
508         while (1) {
509                 int signr = get_signal_to_deliver(&info, &ka, &scr->pt, NULL);
510
511                 /*
512                  * get_signal_to_deliver() may have run a debugger (via notify_parent())
513                  * and the debugger may have modified the state (e.g., to arrange for an
514                  * inferior call), thus it's important to check for restarting _after_
515                  * get_signal_to_deliver().
516                  */
517                 if (IS_IA32_PROCESS(&scr->pt)) {
518                         if (in_syscall) {
519                                 if (errno >= 0)
520                                         restart = 0;
521                                 else
522                                         errno = -errno;
523                         }
524                 } else if ((long) scr->pt.r10 != -1)
525                         /*
526                          * A system calls has to be restarted only if one of the error codes
527                          * ERESTARTNOHAND, ERESTARTSYS, or ERESTARTNOINTR is returned.  If r10
528                          * isn't -1 then r8 doesn't hold an error code and we don't need to
529                          * restart the syscall, so we can clear the "restart" flag here.
530                          */
531                         restart = 0;
532
533                 if (signr <= 0)
534                         break;
535
536                 if (unlikely(restart)) {
537                         switch (errno) {
538                               case ERESTART_RESTARTBLOCK:
539                               case ERESTARTNOHAND:
540                                 scr->pt.r8 = ERR_CODE(EINTR);
541                                 /* note: scr->pt.r10 is already -1 */
542                                 break;
543
544                               case ERESTARTSYS:
545                                 if ((ka.sa.sa_flags & SA_RESTART) == 0) {
546                                         scr->pt.r8 = ERR_CODE(EINTR);
547                                         /* note: scr->pt.r10 is already -1 */
548                                         break;
549                                 }
550                               case ERESTARTNOINTR:
551                                 if (IS_IA32_PROCESS(&scr->pt)) {
552                                         scr->pt.r8 = scr->pt.r1;
553                                         scr->pt.cr_iip -= 2;
554                                 } else
555                                         ia64_decrement_ip(&scr->pt);
556                                 restart = 0; /* don't restart twice if handle_signal() fails... */
557                         }
558                 }
559
560                 /*
561                  * Whee!  Actually deliver the signal.  If the delivery failed, we need to
562                  * continue to iterate in this loop so we can deliver the SIGSEGV...
563                  */
564                 if (handle_signal(signr, &ka, &info, oldset, scr))
565                         return 1;
566         }
567
568         /* Did we come from a system call? */
569         if (restart) {
570                 /* Restart the system call - no handlers present */
571                 if (errno == ERESTARTNOHAND || errno == ERESTARTSYS || errno == ERESTARTNOINTR
572                     || errno == ERESTART_RESTARTBLOCK)
573                 {
574                         if (IS_IA32_PROCESS(&scr->pt)) {
575                                 scr->pt.r8 = scr->pt.r1;
576                                 scr->pt.cr_iip -= 2;
577                                 if (errno == ERESTART_RESTARTBLOCK)
578                                         scr->pt.r8 = 0; /* x86 version of __NR_restart_syscall */
579                         } else {
580                                 /*
581                                  * Note: the syscall number is in r15 which is saved in
582                                  * pt_regs so all we need to do here is adjust ip so that
583                                  * the "break" instruction gets re-executed.
584                                  */
585                                 ia64_decrement_ip(&scr->pt);
586                                 if (errno == ERESTART_RESTARTBLOCK)
587                                         scr->pt.r15 = __NR_restart_syscall;
588                         }
589                 }
590         }
591         return 0;
592 }
593
594 /* Set a delayed signal that was detected in MCA/INIT/NMI/PMI context where it
595  * could not be delivered.  It is important that the target process is not
596  * allowed to do any more work in user space.  Possible cases for the target
597  * process:
598  *
599  * - It is sleeping and will wake up soon.  Store the data in the current task,
600  *   the signal will be sent when the current task returns from the next
601  *   interrupt.
602  *
603  * - It is running in user context.  Store the data in the current task, the
604  *   signal will be sent when the current task returns from the next interrupt.
605  *
606  * - It is running in kernel context on this or another cpu and will return to
607  *   user context.  Store the data in the target task, the signal will be sent
608  *   to itself when the target task returns to user space.
609  *
610  * - It is running in kernel context on this cpu and will sleep before
611  *   returning to user context.  Because this is also the current task, the
612  *   signal will not get delivered and the task could sleep indefinitely.
613  *   Store the data in the idle task for this cpu, the signal will be sent
614  *   after the idle task processes its next interrupt.
615  *
616  * To cover all cases, store the data in the target task, the current task and
617  * the idle task on this cpu.  Whatever happens, the signal will be delivered
618  * to the target task before it can do any useful user space work.  Multiple
619  * deliveries have no unwanted side effects.
620  *
621  * Note: This code is executed in MCA/INIT/NMI/PMI context, with interrupts
622  * disabled.  It must not take any locks nor use kernel structures or services
623  * that require locks.
624  */
625
626 /* To ensure that we get the right pid, check its start time.  To avoid extra
627  * include files in thread_info.h, convert the task start_time to unsigned long,
628  * giving us a cycle time of > 580 years.
629  */
630 static inline unsigned long
631 start_time_ul(const struct task_struct *t)
632 {
633         return t->start_time.tv_sec * NSEC_PER_SEC + t->start_time.tv_nsec;
634 }
635
636 void
637 set_sigdelayed(pid_t pid, int signo, int code, void __user *addr)
638 {
639         struct task_struct *t;
640         unsigned long start_time =  0;
641         int i;
642
643         for (i = 1; i <= 3; ++i) {
644                 switch (i) {
645                 case 1:
646                         t = find_task_by_pid(pid);
647                         if (t)
648                                 start_time = start_time_ul(t);
649                         break;
650                 case 2:
651                         t = current;
652                         break;
653                 default:
654                         t = idle_task(smp_processor_id());
655                         break;
656                 }
657
658                 if (!t)
659                         return;
660                 t->thread_info->sigdelayed.signo = signo;
661                 t->thread_info->sigdelayed.code = code;
662                 t->thread_info->sigdelayed.addr = addr;
663                 t->thread_info->sigdelayed.start_time = start_time;
664                 t->thread_info->sigdelayed.pid = pid;
665                 wmb();
666                 set_tsk_thread_flag(t, TIF_SIGDELAYED);
667         }
668 }
669
670 /* Called from entry.S when it detects TIF_SIGDELAYED, a delayed signal that
671  * was detected in MCA/INIT/NMI/PMI context where it could not be delivered.
672  */
673
674 void
675 do_sigdelayed(void)
676 {
677         struct siginfo siginfo;
678         pid_t pid;
679         struct task_struct *t;
680
681         clear_thread_flag(TIF_SIGDELAYED);
682         memset(&siginfo, 0, sizeof(siginfo));
683         siginfo.si_signo = current_thread_info()->sigdelayed.signo;
684         siginfo.si_code = current_thread_info()->sigdelayed.code;
685         siginfo.si_addr = current_thread_info()->sigdelayed.addr;
686         pid = current_thread_info()->sigdelayed.pid;
687         t = find_task_by_pid(pid);
688         if (!t)
689                 return;
690         if (current_thread_info()->sigdelayed.start_time != start_time_ul(t))
691                 return;
692         force_sig_info(siginfo.si_signo, &siginfo, t);
693 }