linux 2.6.16.38 w/ vs2.0.3-rc1
[linux-2.6.git] / arch / ia64 / kernel / signal.c
1 /*
2  * Architecture-specific signal handling support.
3  *
4  * Copyright (C) 1999-2004 Hewlett-Packard Co
5  *      David Mosberger-Tang <davidm@hpl.hp.com>
6  *
7  * Derived from i386 and Alpha versions.
8  */
9
10 #include <linux/config.h>
11 #include <linux/errno.h>
12 #include <linux/kernel.h>
13 #include <linux/mm.h>
14 #include <linux/ptrace.h>
15 #include <linux/sched.h>
16 #include <linux/signal.h>
17 #include <linux/smp.h>
18 #include <linux/smp_lock.h>
19 #include <linux/stddef.h>
20 #include <linux/tty.h>
21 #include <linux/binfmts.h>
22 #include <linux/unistd.h>
23 #include <linux/wait.h>
24 #include <linux/vs_cvirt.h>
25
26 #include <asm/ia32.h>
27 #include <asm/intrinsics.h>
28 #include <asm/uaccess.h>
29 #include <asm/rse.h>
30 #include <asm/sigcontext.h>
31
32 #include "sigframe.h"
33
34 #define DEBUG_SIG       0
35 #define STACK_ALIGN     16              /* minimal alignment for stack pointer */
36 #define _BLOCKABLE      (~(sigmask(SIGKILL) | sigmask(SIGSTOP)))
37
38 #if _NSIG_WORDS > 1
39 # define PUT_SIGSET(k,u)        __copy_to_user((u)->sig, (k)->sig, sizeof(sigset_t))
40 # define GET_SIGSET(k,u)        __copy_from_user((k)->sig, (u)->sig, sizeof(sigset_t))
41 #else
42 # define PUT_SIGSET(k,u)        __put_user((k)->sig[0], &(u)->sig[0])
43 # define GET_SIGSET(k,u)        __get_user((k)->sig[0], &(u)->sig[0])
44 #endif
45
46 long
47 ia64_rt_sigsuspend (sigset_t __user *uset, size_t sigsetsize, struct sigscratch *scr)
48 {
49         sigset_t oldset, set;
50
51         /* XXX: Don't preclude handling different sized sigset_t's.  */
52         if (sigsetsize != sizeof(sigset_t))
53                 return -EINVAL;
54
55         if (!access_ok(VERIFY_READ, uset, sigsetsize))
56                 return -EFAULT;
57
58         if (GET_SIGSET(&set, uset))
59                 return -EFAULT;
60
61         sigdelsetmask(&set, ~_BLOCKABLE);
62
63         spin_lock_irq(&current->sighand->siglock);
64         {
65                 oldset = current->blocked;
66                 current->blocked = set;
67                 recalc_sigpending();
68         }
69         spin_unlock_irq(&current->sighand->siglock);
70
71         /*
72          * The return below usually returns to the signal handler.  We need to
73          * pre-set the correct error code here to ensure that the right values
74          * get saved in sigcontext by ia64_do_signal.
75          */
76         scr->pt.r8 = EINTR;
77         scr->pt.r10 = -1;
78
79         while (1) {
80                 current->state = TASK_INTERRUPTIBLE;
81                 schedule();
82                 if (ia64_do_signal(&oldset, scr, 1))
83                         return -EINTR;
84         }
85 }
86
87 asmlinkage long
88 sys_sigaltstack (const stack_t __user *uss, stack_t __user *uoss, long arg2,
89                  long arg3, long arg4, long arg5, long arg6, long arg7,
90                  struct pt_regs regs)
91 {
92         return do_sigaltstack(uss, uoss, regs.r12);
93 }
94
95 static long
96 restore_sigcontext (struct sigcontext __user *sc, struct sigscratch *scr)
97 {
98         unsigned long ip, flags, nat, um, cfm, rsc;
99         long err;
100
101         /* Always make any pending restarted system calls return -EINTR */
102         current_thread_info()->restart_block.fn = do_no_restart_syscall;
103
104         /* restore scratch that always needs gets updated during signal delivery: */
105         err  = __get_user(flags, &sc->sc_flags);
106         err |= __get_user(nat, &sc->sc_nat);
107         err |= __get_user(ip, &sc->sc_ip);                      /* instruction pointer */
108         err |= __get_user(cfm, &sc->sc_cfm);
109         err |= __get_user(um, &sc->sc_um);                      /* user mask */
110         err |= __get_user(rsc, &sc->sc_ar_rsc);
111         err |= __get_user(scr->pt.ar_unat, &sc->sc_ar_unat);
112         err |= __get_user(scr->pt.ar_fpsr, &sc->sc_ar_fpsr);
113         err |= __get_user(scr->pt.ar_pfs, &sc->sc_ar_pfs);
114         err |= __get_user(scr->pt.pr, &sc->sc_pr);              /* predicates */
115         err |= __get_user(scr->pt.b0, &sc->sc_br[0]);           /* b0 (rp) */
116         err |= __get_user(scr->pt.b6, &sc->sc_br[6]);           /* b6 */
117         err |= __copy_from_user(&scr->pt.r1, &sc->sc_gr[1], 8); /* r1 */
118         err |= __copy_from_user(&scr->pt.r8, &sc->sc_gr[8], 4*8);       /* r8-r11 */
119         err |= __copy_from_user(&scr->pt.r12, &sc->sc_gr[12], 2*8);     /* r12-r13 */
120         err |= __copy_from_user(&scr->pt.r15, &sc->sc_gr[15], 8);       /* r15 */
121
122         scr->pt.cr_ifs = cfm | (1UL << 63);
123         scr->pt.ar_rsc = rsc | (3 << 2); /* force PL3 */
124
125         /* establish new instruction pointer: */
126         scr->pt.cr_iip = ip & ~0x3UL;
127         ia64_psr(&scr->pt)->ri = ip & 0x3;
128         scr->pt.cr_ipsr = (scr->pt.cr_ipsr & ~IA64_PSR_UM) | (um & IA64_PSR_UM);
129
130         scr->scratch_unat = ia64_put_scratch_nat_bits(&scr->pt, nat);
131
132         if (!(flags & IA64_SC_FLAG_IN_SYSCALL)) {
133                 /* Restore most scratch-state only when not in syscall. */
134                 err |= __get_user(scr->pt.ar_ccv, &sc->sc_ar_ccv);              /* ar.ccv */
135                 err |= __get_user(scr->pt.b7, &sc->sc_br[7]);                   /* b7 */
136                 err |= __get_user(scr->pt.r14, &sc->sc_gr[14]);                 /* r14 */
137                 err |= __copy_from_user(&scr->pt.ar_csd, &sc->sc_ar25, 2*8); /* ar.csd & ar.ssd */
138                 err |= __copy_from_user(&scr->pt.r2, &sc->sc_gr[2], 2*8);       /* r2-r3 */
139                 err |= __copy_from_user(&scr->pt.r16, &sc->sc_gr[16], 16*8);    /* r16-r31 */
140         }
141
142         if ((flags & IA64_SC_FLAG_FPH_VALID) != 0) {
143                 struct ia64_psr *psr = ia64_psr(&scr->pt);
144
145                 __copy_from_user(current->thread.fph, &sc->sc_fr[32], 96*16);
146                 psr->mfh = 0;   /* drop signal handler's fph contents... */
147                 preempt_disable();
148                 if (psr->dfh)
149                         ia64_drop_fpu(current);
150                 else {
151                         /* We already own the local fph, otherwise psr->dfh wouldn't be 0.  */
152                         __ia64_load_fpu(current->thread.fph);
153                         ia64_set_local_fpu_owner(current);
154                 }
155                 preempt_enable();
156         }
157         return err;
158 }
159
160 int
161 copy_siginfo_to_user (siginfo_t __user *to, siginfo_t *from)
162 {
163         if (!access_ok(VERIFY_WRITE, to, sizeof(siginfo_t)))
164                 return -EFAULT;
165         if (from->si_code < 0) {
166                 if (__copy_to_user(to, from, sizeof(siginfo_t)))
167                         return -EFAULT;
168                 return 0;
169         } else {
170                 int err;
171
172                 /*
173                  * If you change siginfo_t structure, please be sure this code is fixed
174                  * accordingly.  It should never copy any pad contained in the structure
175                  * to avoid security leaks, but must copy the generic 3 ints plus the
176                  * relevant union member.
177                  */
178                 err = __put_user(from->si_signo, &to->si_signo);
179                 err |= __put_user(from->si_errno, &to->si_errno);
180                 err |= __put_user((short)from->si_code, &to->si_code);
181                 switch (from->si_code >> 16) {
182                       case __SI_FAULT >> 16:
183                         err |= __put_user(from->si_flags, &to->si_flags);
184                         err |= __put_user(from->si_isr, &to->si_isr);
185                       case __SI_POLL >> 16:
186                         err |= __put_user(from->si_addr, &to->si_addr);
187                         err |= __put_user(from->si_imm, &to->si_imm);
188                         break;
189                       case __SI_TIMER >> 16:
190                         err |= __put_user(from->si_tid, &to->si_tid);
191                         err |= __put_user(from->si_overrun, &to->si_overrun);
192                         err |= __put_user(from->si_ptr, &to->si_ptr);
193                         break;
194                       case __SI_RT >> 16:       /* Not generated by the kernel as of now.  */
195                       case __SI_MESGQ >> 16:
196                         err |= __put_user(from->si_uid, &to->si_uid);
197                         err |= __put_user(from->si_pid, &to->si_pid);
198                         err |= __put_user(from->si_ptr, &to->si_ptr);
199                         break;
200                       case __SI_CHLD >> 16:
201                         err |= __put_user(from->si_utime, &to->si_utime);
202                         err |= __put_user(from->si_stime, &to->si_stime);
203                         err |= __put_user(from->si_status, &to->si_status);
204                       default:
205                         err |= __put_user(from->si_uid, &to->si_uid);
206                         err |= __put_user(from->si_pid, &to->si_pid);
207                         break;
208                 }
209                 return err;
210         }
211 }
212
213 long
214 ia64_rt_sigreturn (struct sigscratch *scr)
215 {
216         extern char ia64_strace_leave_kernel, ia64_leave_kernel;
217         struct sigcontext __user *sc;
218         struct siginfo si;
219         sigset_t set;
220         long retval;
221
222         sc = &((struct sigframe __user *) (scr->pt.r12 + 16))->sc;
223
224         /*
225          * When we return to the previously executing context, r8 and r10 have already
226          * been setup the way we want them.  Indeed, if the signal wasn't delivered while
227          * in a system call, we must not touch r8 or r10 as otherwise user-level state
228          * could be corrupted.
229          */
230         retval = (long) &ia64_leave_kernel;
231         if (test_thread_flag(TIF_SYSCALL_TRACE)
232             || test_thread_flag(TIF_SYSCALL_AUDIT))
233                 /*
234                  * strace expects to be notified after sigreturn returns even though the
235                  * context to which we return may not be in the middle of a syscall.
236                  * Thus, the return-value that strace displays for sigreturn is
237                  * meaningless.
238                  */
239                 retval = (long) &ia64_strace_leave_kernel;
240
241         if (!access_ok(VERIFY_READ, sc, sizeof(*sc)))
242                 goto give_sigsegv;
243
244         if (GET_SIGSET(&set, &sc->sc_mask))
245                 goto give_sigsegv;
246
247         sigdelsetmask(&set, ~_BLOCKABLE);
248
249         spin_lock_irq(&current->sighand->siglock);
250         {
251                 current->blocked = set;
252                 recalc_sigpending();
253         }
254         spin_unlock_irq(&current->sighand->siglock);
255
256         if (restore_sigcontext(sc, scr))
257                 goto give_sigsegv;
258
259 #if DEBUG_SIG
260         printk("SIG return (%s:%d): sp=%lx ip=%lx\n",
261                current->comm, current->pid, scr->pt.r12, scr->pt.cr_iip);
262 #endif
263         /*
264          * It is more difficult to avoid calling this function than to
265          * call it and ignore errors.
266          */
267         do_sigaltstack(&sc->sc_stack, NULL, scr->pt.r12);
268         return retval;
269
270   give_sigsegv:
271         si.si_signo = SIGSEGV;
272         si.si_errno = 0;
273         si.si_code = SI_KERNEL;
274         si.si_pid = current->pid;
275         si.si_uid = current->uid;
276         si.si_addr = sc;
277         force_sig_info(SIGSEGV, &si, current);
278         return retval;
279 }
280
281 /*
282  * This does just the minimum required setup of sigcontext.
283  * Specifically, it only installs data that is either not knowable at
284  * the user-level or that gets modified before execution in the
285  * trampoline starts.  Everything else is done at the user-level.
286  */
287 static long
288 setup_sigcontext (struct sigcontext __user *sc, sigset_t *mask, struct sigscratch *scr)
289 {
290         unsigned long flags = 0, ifs, cfm, nat;
291         long err;
292
293         ifs = scr->pt.cr_ifs;
294
295         if (on_sig_stack((unsigned long) sc))
296                 flags |= IA64_SC_FLAG_ONSTACK;
297         if ((ifs & (1UL << 63)) == 0)
298                 /* if cr_ifs doesn't have the valid bit set, we got here through a syscall */
299                 flags |= IA64_SC_FLAG_IN_SYSCALL;
300         cfm = ifs & ((1UL << 38) - 1);
301         ia64_flush_fph(current);
302         if ((current->thread.flags & IA64_THREAD_FPH_VALID)) {
303                 flags |= IA64_SC_FLAG_FPH_VALID;
304                 __copy_to_user(&sc->sc_fr[32], current->thread.fph, 96*16);
305         }
306
307         nat = ia64_get_scratch_nat_bits(&scr->pt, scr->scratch_unat);
308
309         err  = __put_user(flags, &sc->sc_flags);
310         err |= __put_user(nat, &sc->sc_nat);
311         err |= PUT_SIGSET(mask, &sc->sc_mask);
312         err |= __put_user(cfm, &sc->sc_cfm);
313         err |= __put_user(scr->pt.cr_ipsr & IA64_PSR_UM, &sc->sc_um);
314         err |= __put_user(scr->pt.ar_rsc, &sc->sc_ar_rsc);
315         err |= __put_user(scr->pt.ar_unat, &sc->sc_ar_unat);            /* ar.unat */
316         err |= __put_user(scr->pt.ar_fpsr, &sc->sc_ar_fpsr);            /* ar.fpsr */
317         err |= __put_user(scr->pt.ar_pfs, &sc->sc_ar_pfs);
318         err |= __put_user(scr->pt.pr, &sc->sc_pr);                      /* predicates */
319         err |= __put_user(scr->pt.b0, &sc->sc_br[0]);                   /* b0 (rp) */
320         err |= __put_user(scr->pt.b6, &sc->sc_br[6]);                   /* b6 */
321         err |= __copy_to_user(&sc->sc_gr[1], &scr->pt.r1, 8);           /* r1 */
322         err |= __copy_to_user(&sc->sc_gr[8], &scr->pt.r8, 4*8);         /* r8-r11 */
323         err |= __copy_to_user(&sc->sc_gr[12], &scr->pt.r12, 2*8);       /* r12-r13 */
324         err |= __copy_to_user(&sc->sc_gr[15], &scr->pt.r15, 8);         /* r15 */
325         err |= __put_user(scr->pt.cr_iip + ia64_psr(&scr->pt)->ri, &sc->sc_ip);
326
327         if (flags & IA64_SC_FLAG_IN_SYSCALL) {
328                 /* Clear scratch registers if the signal interrupted a system call. */
329                 err |= __put_user(0, &sc->sc_ar_ccv);                           /* ar.ccv */
330                 err |= __put_user(0, &sc->sc_br[7]);                            /* b7 */
331                 err |= __put_user(0, &sc->sc_gr[14]);                           /* r14 */
332                 err |= __clear_user(&sc->sc_ar25, 2*8);                 /* ar.csd & ar.ssd */
333                 err |= __clear_user(&sc->sc_gr[2], 2*8);                        /* r2-r3 */
334                 err |= __clear_user(&sc->sc_gr[16], 16*8);                      /* r16-r31 */
335         } else {
336                 /* Copy scratch regs to sigcontext if the signal didn't interrupt a syscall. */
337                 err |= __put_user(scr->pt.ar_ccv, &sc->sc_ar_ccv);              /* ar.ccv */
338                 err |= __put_user(scr->pt.b7, &sc->sc_br[7]);                   /* b7 */
339                 err |= __put_user(scr->pt.r14, &sc->sc_gr[14]);                 /* r14 */
340                 err |= __copy_to_user(&sc->sc_ar25, &scr->pt.ar_csd, 2*8); /* ar.csd & ar.ssd */
341                 err |= __copy_to_user(&sc->sc_gr[2], &scr->pt.r2, 2*8);         /* r2-r3 */
342                 err |= __copy_to_user(&sc->sc_gr[16], &scr->pt.r16, 16*8);      /* r16-r31 */
343         }
344         return err;
345 }
346
347 /*
348  * Check whether the register-backing store is already on the signal stack.
349  */
350 static inline int
351 rbs_on_sig_stack (unsigned long bsp)
352 {
353         return (bsp - current->sas_ss_sp < current->sas_ss_size);
354 }
355
356 static long
357 force_sigsegv_info (int sig, void __user *addr)
358 {
359         unsigned long flags;
360         struct siginfo si;
361
362         if (sig == SIGSEGV) {
363                 /*
364                  * Acquiring siglock around the sa_handler-update is almost
365                  * certainly overkill, but this isn't a
366                  * performance-critical path and I'd rather play it safe
367                  * here than having to debug a nasty race if and when
368                  * something changes in kernel/signal.c that would make it
369                  * no longer safe to modify sa_handler without holding the
370                  * lock.
371                  */
372                 spin_lock_irqsave(&current->sighand->siglock, flags);
373                 current->sighand->action[sig - 1].sa.sa_handler = SIG_DFL;
374                 spin_unlock_irqrestore(&current->sighand->siglock, flags);
375         }
376         si.si_signo = SIGSEGV;
377         si.si_errno = 0;
378         si.si_code = SI_KERNEL;
379         si.si_pid = current->pid;
380         si.si_uid = current->uid;
381         si.si_addr = addr;
382         force_sig_info(SIGSEGV, &si, current);
383         return 0;
384 }
385
386 static long
387 setup_frame (int sig, struct k_sigaction *ka, siginfo_t *info, sigset_t *set,
388              struct sigscratch *scr)
389 {
390         extern char __kernel_sigtramp[];
391         unsigned long tramp_addr, new_rbs = 0, new_sp;
392         struct sigframe __user *frame;
393         long err;
394
395         new_sp = scr->pt.r12;
396         tramp_addr = (unsigned long) __kernel_sigtramp;
397         if ((ka->sa.sa_flags & SA_ONSTACK) && sas_ss_flags(new_sp) == 0) {
398                 new_sp = current->sas_ss_sp + current->sas_ss_size;
399                 /*
400                  * We need to check for the register stack being on the signal stack
401                  * separately, because it's switched separately (memory stack is switched
402                  * in the kernel, register stack is switched in the signal trampoline).
403                  */
404                 if (!rbs_on_sig_stack(scr->pt.ar_bspstore))
405                         new_rbs = (current->sas_ss_sp + sizeof(long) - 1) & ~(sizeof(long) - 1);
406         }
407         frame = (void __user *) ((new_sp - sizeof(*frame)) & -STACK_ALIGN);
408
409         if (!access_ok(VERIFY_WRITE, frame, sizeof(*frame)))
410                 return force_sigsegv_info(sig, frame);
411
412         err  = __put_user(sig, &frame->arg0);
413         err |= __put_user(&frame->info, &frame->arg1);
414         err |= __put_user(&frame->sc, &frame->arg2);
415         err |= __put_user(new_rbs, &frame->sc.sc_rbs_base);
416         err |= __put_user(0, &frame->sc.sc_loadrs);     /* initialize to zero */
417         err |= __put_user(ka->sa.sa_handler, &frame->handler);
418
419         err |= copy_siginfo_to_user(&frame->info, info);
420
421         err |= __put_user(current->sas_ss_sp, &frame->sc.sc_stack.ss_sp);
422         err |= __put_user(current->sas_ss_size, &frame->sc.sc_stack.ss_size);
423         err |= __put_user(sas_ss_flags(scr->pt.r12), &frame->sc.sc_stack.ss_flags);
424         err |= setup_sigcontext(&frame->sc, set, scr);
425
426         if (unlikely(err))
427                 return force_sigsegv_info(sig, frame);
428
429         scr->pt.r12 = (unsigned long) frame - 16;       /* new stack pointer */
430         scr->pt.ar_fpsr = FPSR_DEFAULT;                 /* reset fpsr for signal handler */
431         scr->pt.cr_iip = tramp_addr;
432         ia64_psr(&scr->pt)->ri = 0;                     /* start executing in first slot */
433         ia64_psr(&scr->pt)->be = 0;                     /* force little-endian byte-order */
434         /*
435          * Force the interruption function mask to zero.  This has no effect when a
436          * system-call got interrupted by a signal (since, in that case, scr->pt_cr_ifs is
437          * ignored), but it has the desirable effect of making it possible to deliver a
438          * signal with an incomplete register frame (which happens when a mandatory RSE
439          * load faults).  Furthermore, it has no negative effect on the getting the user's
440          * dirty partition preserved, because that's governed by scr->pt.loadrs.
441          */
442         scr->pt.cr_ifs = (1UL << 63);
443
444         /*
445          * Note: this affects only the NaT bits of the scratch regs (the ones saved in
446          * pt_regs), which is exactly what we want.
447          */
448         scr->scratch_unat = 0; /* ensure NaT bits of r12 is clear */
449
450 #if DEBUG_SIG
451         printk("SIG deliver (%s:%d): sig=%d sp=%lx ip=%lx handler=%p\n",
452                current->comm, current->pid, sig, scr->pt.r12, frame->sc.sc_ip, frame->handler);
453 #endif
454         return 1;
455 }
456
457 static long
458 handle_signal (unsigned long sig, struct k_sigaction *ka, siginfo_t *info, sigset_t *oldset,
459                struct sigscratch *scr)
460 {
461         if (IS_IA32_PROCESS(&scr->pt)) {
462                 /* send signal to IA-32 process */
463                 if (!ia32_setup_frame1(sig, ka, info, oldset, &scr->pt))
464                         return 0;
465         } else
466                 /* send signal to IA-64 process */
467                 if (!setup_frame(sig, ka, info, oldset, scr))
468                         return 0;
469
470         spin_lock_irq(&current->sighand->siglock);
471         sigorsets(&current->blocked, &current->blocked, &ka->sa.sa_mask);
472         if (!(ka->sa.sa_flags & SA_NODEFER))
473                 sigaddset(&current->blocked, sig);
474         recalc_sigpending();
475         spin_unlock_irq(&current->sighand->siglock);
476         return 1;
477 }
478
479 /*
480  * Note that `init' is a special process: it doesn't get signals it doesn't want to
481  * handle.  Thus you cannot kill init even with a SIGKILL even by mistake.
482  */
483 long
484 ia64_do_signal (sigset_t *oldset, struct sigscratch *scr, long in_syscall)
485 {
486         struct k_sigaction ka;
487         siginfo_t info;
488         long restart = in_syscall;
489         long errno = scr->pt.r8;
490 #       define ERR_CODE(c)      (IS_IA32_PROCESS(&scr->pt) ? -(c) : (c))
491
492         /*
493          * In the ia64_leave_kernel code path, we want the common case to go fast, which
494          * is why we may in certain cases get here from kernel mode. Just return without
495          * doing anything if so.
496          */
497         if (!user_mode(&scr->pt))
498                 return 0;
499
500         if (!oldset)
501                 oldset = &current->blocked;
502
503         /*
504          * This only loops in the rare cases of handle_signal() failing, in which case we
505          * need to push through a forced SIGSEGV.
506          */
507         while (1) {
508                 int signr = get_signal_to_deliver(&info, &ka, &scr->pt, NULL);
509
510                 /*
511                  * get_signal_to_deliver() may have run a debugger (via notify_parent())
512                  * and the debugger may have modified the state (e.g., to arrange for an
513                  * inferior call), thus it's important to check for restarting _after_
514                  * get_signal_to_deliver().
515                  */
516                 if (IS_IA32_PROCESS(&scr->pt)) {
517                         if (in_syscall) {
518                                 if (errno >= 0)
519                                         restart = 0;
520                                 else
521                                         errno = -errno;
522                         }
523                 } else if ((long) scr->pt.r10 != -1)
524                         /*
525                          * A system calls has to be restarted only if one of the error codes
526                          * ERESTARTNOHAND, ERESTARTSYS, or ERESTARTNOINTR is returned.  If r10
527                          * isn't -1 then r8 doesn't hold an error code and we don't need to
528                          * restart the syscall, so we can clear the "restart" flag here.
529                          */
530                         restart = 0;
531
532                 if (signr <= 0)
533                         break;
534
535                 if (unlikely(restart)) {
536                         switch (errno) {
537                               case ERESTART_RESTARTBLOCK:
538                               case ERESTARTNOHAND:
539                                 scr->pt.r8 = ERR_CODE(EINTR);
540                                 /* note: scr->pt.r10 is already -1 */
541                                 break;
542
543                               case ERESTARTSYS:
544                                 if ((ka.sa.sa_flags & SA_RESTART) == 0) {
545                                         scr->pt.r8 = ERR_CODE(EINTR);
546                                         /* note: scr->pt.r10 is already -1 */
547                                         break;
548                                 }
549                               case ERESTARTNOINTR:
550                                 if (IS_IA32_PROCESS(&scr->pt)) {
551                                         scr->pt.r8 = scr->pt.r1;
552                                         scr->pt.cr_iip -= 2;
553                                 } else
554                                         ia64_decrement_ip(&scr->pt);
555                                 restart = 0; /* don't restart twice if handle_signal() fails... */
556                         }
557                 }
558
559                 /*
560                  * Whee!  Actually deliver the signal.  If the delivery failed, we need to
561                  * continue to iterate in this loop so we can deliver the SIGSEGV...
562                  */
563                 if (handle_signal(signr, &ka, &info, oldset, scr))
564                         return 1;
565         }
566
567         /* Did we come from a system call? */
568         if (restart) {
569                 /* Restart the system call - no handlers present */
570                 if (errno == ERESTARTNOHAND || errno == ERESTARTSYS || errno == ERESTARTNOINTR
571                     || errno == ERESTART_RESTARTBLOCK)
572                 {
573                         if (IS_IA32_PROCESS(&scr->pt)) {
574                                 scr->pt.r8 = scr->pt.r1;
575                                 scr->pt.cr_iip -= 2;
576                                 if (errno == ERESTART_RESTARTBLOCK)
577                                         scr->pt.r8 = 0; /* x86 version of __NR_restart_syscall */
578                         } else {
579                                 /*
580                                  * Note: the syscall number is in r15 which is saved in
581                                  * pt_regs so all we need to do here is adjust ip so that
582                                  * the "break" instruction gets re-executed.
583                                  */
584                                 ia64_decrement_ip(&scr->pt);
585                                 if (errno == ERESTART_RESTARTBLOCK)
586                                         scr->pt.r15 = __NR_restart_syscall;
587                         }
588                 }
589         }
590         return 0;
591 }
592
593 /* Set a delayed signal that was detected in MCA/INIT/NMI/PMI context where it
594  * could not be delivered.  It is important that the target process is not
595  * allowed to do any more work in user space.  Possible cases for the target
596  * process:
597  *
598  * - It is sleeping and will wake up soon.  Store the data in the current task,
599  *   the signal will be sent when the current task returns from the next
600  *   interrupt.
601  *
602  * - It is running in user context.  Store the data in the current task, the
603  *   signal will be sent when the current task returns from the next interrupt.
604  *
605  * - It is running in kernel context on this or another cpu and will return to
606  *   user context.  Store the data in the target task, the signal will be sent
607  *   to itself when the target task returns to user space.
608  *
609  * - It is running in kernel context on this cpu and will sleep before
610  *   returning to user context.  Because this is also the current task, the
611  *   signal will not get delivered and the task could sleep indefinitely.
612  *   Store the data in the idle task for this cpu, the signal will be sent
613  *   after the idle task processes its next interrupt.
614  *
615  * To cover all cases, store the data in the target task, the current task and
616  * the idle task on this cpu.  Whatever happens, the signal will be delivered
617  * to the target task before it can do any useful user space work.  Multiple
618  * deliveries have no unwanted side effects.
619  *
620  * Note: This code is executed in MCA/INIT/NMI/PMI context, with interrupts
621  * disabled.  It must not take any locks nor use kernel structures or services
622  * that require locks.
623  */
624
625 /* To ensure that we get the right pid, check its start time.  To avoid extra
626  * include files in thread_info.h, convert the task start_time to unsigned long,
627  * giving us a cycle time of > 580 years.
628  */
629 static inline unsigned long
630 start_time_ul(const struct task_struct *t)
631 {
632         return t->start_time.tv_sec * NSEC_PER_SEC + t->start_time.tv_nsec;
633 }
634
635 void
636 set_sigdelayed(pid_t pid, int signo, int code, void __user *addr)
637 {
638         struct task_struct *t;
639         unsigned long start_time =  0;
640         int i;
641
642         for (i = 1; i <= 3; ++i) {
643                 switch (i) {
644                 case 1:
645                         t = find_task_by_pid(pid);
646                         if (t)
647                                 start_time = start_time_ul(t);
648                         break;
649                 case 2:
650                         t = current;
651                         break;
652                 default:
653                         t = idle_task(smp_processor_id());
654                         break;
655                 }
656
657                 if (!t)
658                         return;
659                 task_thread_info(t)->sigdelayed.signo = signo;
660                 task_thread_info(t)->sigdelayed.code = code;
661                 task_thread_info(t)->sigdelayed.addr = addr;
662                 task_thread_info(t)->sigdelayed.start_time = start_time;
663                 task_thread_info(t)->sigdelayed.pid = pid;
664                 wmb();
665                 set_tsk_thread_flag(t, TIF_SIGDELAYED);
666         }
667 }
668
669 /* Called from entry.S when it detects TIF_SIGDELAYED, a delayed signal that
670  * was detected in MCA/INIT/NMI/PMI context where it could not be delivered.
671  */
672
673 void
674 do_sigdelayed(void)
675 {
676         struct siginfo siginfo;
677         pid_t pid;
678         struct task_struct *t;
679
680         clear_thread_flag(TIF_SIGDELAYED);
681         memset(&siginfo, 0, sizeof(siginfo));
682         siginfo.si_signo = current_thread_info()->sigdelayed.signo;
683         siginfo.si_code = current_thread_info()->sigdelayed.code;
684         siginfo.si_addr = current_thread_info()->sigdelayed.addr;
685         pid = current_thread_info()->sigdelayed.pid;
686         t = find_task_by_pid(pid);
687         if (!t)
688                 return;
689         if (current_thread_info()->sigdelayed.start_time != start_time_ul(t))
690                 return;
691         force_sig_info(siginfo.si_signo, &siginfo, t);
692 }