ftp://ftp.kernel.org/pub/linux/kernel/v2.6/linux-2.6.6.tar.bz2
[linux-2.6.git] / arch / x86_64 / kernel / signal.c
1 /*
2  *  linux/arch/x86_64/kernel/signal.c
3  *
4  *  Copyright (C) 1991, 1992  Linus Torvalds
5  *  Copyright (C) 2000, 2001, 2002 Andi Kleen SuSE Labs
6  *
7  *  1997-11-28  Modified for POSIX.1b signals by Richard Henderson
8  *  2000-06-20  Pentium III FXSR, SSE support by Gareth Hughes
9  *  2000-2002   x86-64 support by Andi Kleen
10  * 
11  *  $Id: signal.c,v 1.18 2001/10/17 22:30:37 ak Exp $
12  */
13
14 #include <linux/sched.h>
15 #include <linux/mm.h>
16 #include <linux/smp.h>
17 #include <linux/smp_lock.h>
18 #include <linux/kernel.h>
19 #include <linux/signal.h>
20 #include <linux/errno.h>
21 #include <linux/wait.h>
22 #include <linux/ptrace.h>
23 #include <linux/unistd.h>
24 #include <linux/stddef.h>
25 #include <linux/personality.h>
26 #include <linux/compiler.h>
27 #include <linux/suspend.h>
28 #include <asm/ucontext.h>
29 #include <asm/uaccess.h>
30 #include <asm/i387.h>
31 #include <asm/proto.h>
32
33 /* #define DEBUG_SIG 1 */
34
35 #define _BLOCKABLE (~(sigmask(SIGKILL) | sigmask(SIGSTOP)))
36
37 void ia32_setup_rt_frame(int sig, struct k_sigaction *ka, siginfo_t *info,
38                sigset_t *set, struct pt_regs * regs); 
39 void ia32_setup_frame(int sig, struct k_sigaction *ka,
40             sigset_t *set, struct pt_regs * regs); 
41
42 asmlinkage long
43 sys_rt_sigsuspend(sigset_t *unewset, size_t sigsetsize, struct pt_regs regs)
44 {
45         sigset_t saveset, newset;
46
47         /* XXX: Don't preclude handling different sized sigset_t's.  */
48         if (sigsetsize != sizeof(sigset_t))
49                 return -EINVAL;
50
51         if (copy_from_user(&newset, unewset, sizeof(newset)))
52                 return -EFAULT;
53         sigdelsetmask(&newset, ~_BLOCKABLE);
54
55         spin_lock_irq(&current->sighand->siglock);
56         saveset = current->blocked;
57         current->blocked = newset;
58         recalc_sigpending();
59         spin_unlock_irq(&current->sighand->siglock);
60 #if DEBUG_SIG
61         printk("rt_sigsuspend savset(%lx) newset(%lx) regs(%p) rip(%lx)\n",
62                 saveset, newset, &regs, regs.rip);
63 #endif 
64         regs.rax = -EINTR;
65         while (1) {
66                 current->state = TASK_INTERRUPTIBLE;
67                 schedule();
68                 if (do_signal(&regs, &saveset))
69                         return -EINTR;
70         }
71 }
72
73 asmlinkage long
74 sys_sigaltstack(const stack_t *uss, stack_t *uoss, struct pt_regs regs)
75 {
76         return do_sigaltstack(uss, uoss, regs.rsp);
77 }
78
79
80 /*
81  * Do a signal return; undo the signal stack.
82  */
83
84 struct rt_sigframe
85 {
86         char *pretcode;
87         struct ucontext uc;
88         struct siginfo info;
89 };
90
91 static int
92 restore_sigcontext(struct pt_regs *regs, struct sigcontext *sc, unsigned long *prax)
93 {
94         unsigned int err = 0;
95
96         /* Always make any pending restarted system calls return -EINTR */
97         current_thread_info()->restart_block.fn = do_no_restart_syscall;
98
99 #define COPY(x)         err |= __get_user(regs->x, &sc->x)
100
101         COPY(rdi); COPY(rsi); COPY(rbp); COPY(rsp); COPY(rbx);
102         COPY(rdx); COPY(rcx); COPY(rip);
103         COPY(r8);
104         COPY(r9);
105         COPY(r10);
106         COPY(r11);
107         COPY(r12);
108         COPY(r13);
109         COPY(r14);
110         COPY(r15);
111
112         {
113                 unsigned int tmpflags;
114                 err |= __get_user(tmpflags, &sc->eflags);
115                 regs->eflags = (regs->eflags & ~0x40DD5) | (tmpflags & 0x40DD5);
116                 regs->orig_rax = -1;            /* disable syscall checks */
117         }
118
119         {
120                 struct _fpstate * buf;
121                 err |= __get_user(buf, &sc->fpstate);
122
123                 if (buf) {
124                         if (verify_area(VERIFY_READ, buf, sizeof(*buf)))
125                                 goto badframe;
126                         err |= restore_i387(buf);
127                 }
128         }
129
130         err |= __get_user(*prax, &sc->rax);
131         return err;
132
133 badframe:
134         return 1;
135 }
136
137 asmlinkage long sys_rt_sigreturn(struct pt_regs regs)
138 {
139         struct rt_sigframe *frame = (struct rt_sigframe *)(regs.rsp - 8);
140         sigset_t set;
141         stack_t st;
142         long eax;
143
144         if (verify_area(VERIFY_READ, frame, sizeof(*frame))) { 
145                 goto badframe;
146         } 
147         if (__copy_from_user(&set, &frame->uc.uc_sigmask, sizeof(set))) { 
148                 goto badframe;
149         } 
150
151         sigdelsetmask(&set, ~_BLOCKABLE);
152         spin_lock_irq(&current->sighand->siglock);
153         current->blocked = set;
154         recalc_sigpending();
155         spin_unlock_irq(&current->sighand->siglock);
156         
157         if (restore_sigcontext(&regs, &frame->uc.uc_mcontext, &eax)) { 
158                 goto badframe;
159         } 
160
161 #if DEBUG_SIG
162         printk("%d sigreturn rip:%lx rsp:%lx frame:%p rax:%lx\n",current->pid,regs.rip,regs.rsp,frame,eax);
163 #endif
164
165         if (__copy_from_user(&st, &frame->uc.uc_stack, sizeof(st))) {
166                 goto badframe;
167         } 
168         /* It is more difficult to avoid calling this function than to
169            call it and ignore errors.  */
170         do_sigaltstack(&st, NULL, regs.rsp);
171
172         return eax;
173
174 badframe:
175         signal_fault(&regs,frame,"sigreturn");
176         return 0;
177 }       
178
179 /*
180  * Set up a signal frame.
181  */
182
183 static inline int
184 setup_sigcontext(struct sigcontext *sc, struct pt_regs *regs, unsigned long mask, struct task_struct *me)
185 {
186         int err = 0;
187
188         err |= __put_user(0, &sc->gs);
189         err |= __put_user(0, &sc->fs);
190
191         err |= __put_user(regs->rdi, &sc->rdi);
192         err |= __put_user(regs->rsi, &sc->rsi);
193         err |= __put_user(regs->rbp, &sc->rbp);
194         err |= __put_user(regs->rsp, &sc->rsp);
195         err |= __put_user(regs->rbx, &sc->rbx);
196         err |= __put_user(regs->rdx, &sc->rdx);
197         err |= __put_user(regs->rcx, &sc->rcx);
198         err |= __put_user(regs->rax, &sc->rax);
199         err |= __put_user(regs->r8, &sc->r8);
200         err |= __put_user(regs->r9, &sc->r9);
201         err |= __put_user(regs->r10, &sc->r10);
202         err |= __put_user(regs->r11, &sc->r11);
203         err |= __put_user(regs->r12, &sc->r12);
204         err |= __put_user(regs->r13, &sc->r13);
205         err |= __put_user(regs->r14, &sc->r14);
206         err |= __put_user(regs->r15, &sc->r15);
207         err |= __put_user(me->thread.trap_no, &sc->trapno);
208         err |= __put_user(me->thread.error_code, &sc->err);
209         err |= __put_user(regs->rip, &sc->rip);
210         err |= __put_user(regs->eflags, &sc->eflags);
211         err |= __put_user(mask, &sc->oldmask);
212         err |= __put_user(me->thread.cr2, &sc->cr2);
213
214         return err;
215 }
216
217 /*
218  * Determine which stack to use..
219  */
220
221 static void *
222 get_stack(struct k_sigaction *ka, struct pt_regs *regs, unsigned long size)
223 {
224         unsigned long rsp;
225
226         /* Default to using normal stack - redzone*/
227         rsp = regs->rsp - 128;
228
229         /* This is the X/Open sanctioned signal stack switching.  */
230         /* RED-PEN: redzone on that stack? */
231         if (ka->sa.sa_flags & SA_ONSTACK) {
232                 if (sas_ss_flags(rsp) == 0)
233                         rsp = current->sas_ss_sp + current->sas_ss_size;
234         }
235
236         return (void *)round_down(rsp - size, 16); 
237 }
238
239 static void setup_rt_frame(int sig, struct k_sigaction *ka, siginfo_t *info,
240                            sigset_t *set, struct pt_regs * regs)
241 {
242         struct rt_sigframe *frame;
243         struct _fpstate *fp = NULL; 
244         int err = 0;
245         struct task_struct *me = current;
246
247         if (me->used_math) {
248                 fp = get_stack(ka, regs, sizeof(struct _fpstate)); 
249                 frame = (void *)round_down((u64)fp - sizeof(struct rt_sigframe), 16) - 8;
250
251                 if (!access_ok(VERIFY_WRITE, fp, sizeof(struct _fpstate))) { 
252                 goto give_sigsegv;
253                 }
254
255                 if (save_i387(fp) < 0) 
256                         err |= -1; 
257         } else {
258                 frame = get_stack(ka, regs, sizeof(struct rt_sigframe)) - 8;
259         }
260
261         if (!access_ok(VERIFY_WRITE, frame, sizeof(*frame))) {
262                 goto give_sigsegv;
263         }
264
265         if (ka->sa.sa_flags & SA_SIGINFO) { 
266                 err |= copy_siginfo_to_user(&frame->info, info);
267                 if (err) { 
268                         goto give_sigsegv;
269         }
270         }
271                 
272         /* Create the ucontext.  */
273         err |= __put_user(0, &frame->uc.uc_flags);
274         err |= __put_user(0, &frame->uc.uc_link);
275         err |= __put_user(me->sas_ss_sp, &frame->uc.uc_stack.ss_sp);
276         err |= __put_user(sas_ss_flags(regs->rsp),
277                           &frame->uc.uc_stack.ss_flags);
278         err |= __put_user(me->sas_ss_size, &frame->uc.uc_stack.ss_size);
279         err |= setup_sigcontext(&frame->uc.uc_mcontext, regs, set->sig[0], me);
280         err |= __put_user(fp, &frame->uc.uc_mcontext.fpstate);
281         if (sizeof(*set) == 16) { 
282                 __put_user(set->sig[0], &frame->uc.uc_sigmask.sig[0]);
283                 __put_user(set->sig[1], &frame->uc.uc_sigmask.sig[1]); 
284         } else {                
285         err |= __copy_to_user(&frame->uc.uc_sigmask, set, sizeof(*set));
286         }
287
288         /* Set up to return from userspace.  If provided, use a stub
289            already in userspace.  */
290         /* x86-64 should always use SA_RESTORER. */
291         if (ka->sa.sa_flags & SA_RESTORER) {
292                 err |= __put_user(ka->sa.sa_restorer, &frame->pretcode);
293         } else {
294                 printk("%s forgot to set SA_RESTORER for signal %d.\n", me->comm, sig); 
295                 goto give_sigsegv; 
296         }
297
298         if (err) { 
299                 goto give_sigsegv;
300         } 
301
302 #if DEBUG_SIG
303         printk("%d old rip %lx old rsp %lx old rax %lx\n", current->pid,regs->rip,regs->rsp,regs->rax);
304 #endif
305
306         /* Set up registers for signal handler */
307         { 
308                 struct exec_domain *ed = current_thread_info()->exec_domain;
309                 if (unlikely(ed && ed->signal_invmap && sig < 32))
310                         sig = ed->signal_invmap[sig];
311         } 
312         regs->rdi = sig;
313         /* In case the signal handler was declared without prototypes */ 
314         regs->rax = 0;  
315
316         /* This also works for non SA_SIGINFO handlers because they expect the
317            next argument after the signal number on the stack. */
318         regs->rsi = (unsigned long)&frame->info; 
319         regs->rdx = (unsigned long)&frame->uc; 
320         regs->rip = (unsigned long) ka->sa.sa_handler;
321
322         regs->rsp = (unsigned long)frame;
323
324         set_fs(USER_DS);
325         regs->eflags &= ~TF_MASK;
326
327 #if DEBUG_SIG
328         printk("SIG deliver (%s:%d): sp=%p pc=%p ra=%p\n",
329                 current->comm, current->pid, frame, regs->rip, frame->pretcode);
330 #endif
331
332         return;
333
334 give_sigsegv:
335         if (sig == SIGSEGV)
336                 ka->sa.sa_handler = SIG_DFL;
337         signal_fault(regs,frame,"signal deliver");
338 }
339
340 /*
341  * OK, we're invoking a handler
342  */     
343
344 static void
345 handle_signal(unsigned long sig, siginfo_t *info, sigset_t *oldset,
346         struct pt_regs * regs)
347 {
348         struct k_sigaction *ka = &current->sighand->action[sig-1];
349
350 #if DEBUG_SIG
351         printk("handle_signal pid:%d sig:%lu rip:%lx rsp:%lx regs=%p\n", current->pid, sig, 
352                 regs->rip, regs->rsp, regs);
353 #endif
354
355         /* Are we from a system call? */
356         if (regs->orig_rax >= 0) {
357                 /* If so, check system call restarting.. */
358                 switch (regs->rax) {
359                         case -ERESTART_RESTARTBLOCK:
360                         case -ERESTARTNOHAND:
361                                 regs->rax = -EINTR;
362                                 break;
363
364                         case -ERESTARTSYS:
365                                 if (!(ka->sa.sa_flags & SA_RESTART)) {
366                                         regs->rax = -EINTR;
367                                         break;
368                                 }
369                         /* fallthrough */
370                         case -ERESTARTNOINTR:
371                                 regs->rax = regs->orig_rax;
372                                 regs->rip -= 2;
373                 }
374         }
375
376 #ifdef CONFIG_IA32_EMULATION
377         if (test_thread_flag(TIF_IA32)) {
378                 if (ka->sa.sa_flags & SA_SIGINFO)
379                         ia32_setup_rt_frame(sig, ka, info, oldset, regs);
380                 else
381                         ia32_setup_frame(sig, ka, oldset, regs);
382         } else 
383 #endif
384         setup_rt_frame(sig, ka, info, oldset, regs);
385
386         if (ka->sa.sa_flags & SA_ONESHOT)
387                 ka->sa.sa_handler = SIG_DFL;
388
389         if (!(ka->sa.sa_flags & SA_NODEFER)) {
390                 spin_lock_irq(&current->sighand->siglock);
391                 sigorsets(&current->blocked,&current->blocked,&ka->sa.sa_mask);
392                 sigaddset(&current->blocked,sig);
393                 recalc_sigpending();
394                 spin_unlock_irq(&current->sighand->siglock);
395         }
396 }
397
398 /*
399  * Note that 'init' is a special process: it doesn't get signals it doesn't
400  * want to handle. Thus you cannot kill init even with a SIGKILL even by
401  * mistake.
402  */
403 int do_signal(struct pt_regs *regs, sigset_t *oldset)
404 {
405         siginfo_t info;
406         int signr;
407
408         /*
409          * We want the common case to go fast, which
410          * is why we may in certain cases get here from
411          * kernel mode. Just return without doing anything
412          * if so.
413          */
414         if ((regs->cs & 3) != 3) {
415                 return 1;
416         }       
417
418         if (current->flags & PF_FREEZE) {
419                 refrigerator(0);
420                 goto no_signal;
421         }
422
423         if (!oldset)
424                 oldset = &current->blocked;
425
426         signr = get_signal_to_deliver(&info, regs, NULL);
427         if (signr > 0) {
428                 /* Reenable any watchpoints before delivering the
429                  * signal to user space. The processor register will
430                  * have been cleared if the watchpoint triggered
431                  * inside the kernel.
432                  */
433                 if (current->thread.debugreg7)
434                         asm volatile("movq %0,%%db7"    : : "r" (current->thread.debugreg7));
435
436                 /* Whee!  Actually deliver the signal.  */
437                 handle_signal(signr, &info, oldset, regs);
438                 return 1;
439         }
440
441  no_signal:
442         /* Did we come from a system call? */
443         if (regs->orig_rax >= 0) {
444                 /* Restart the system call - no handlers present */
445                 long res = regs->rax;
446                 if (res == -ERESTARTNOHAND ||
447                     res == -ERESTARTSYS ||
448                     res == -ERESTARTNOINTR) {
449                         regs->rax = regs->orig_rax;
450                         regs->rip -= 2;
451                 }
452                 if (regs->rax == (unsigned long)-ERESTART_RESTARTBLOCK) {
453                         regs->rax = __NR_restart_syscall;
454                         regs->rip -= 2;
455                 }
456         }
457         return 0;
458 }
459
460 void do_notify_resume(struct pt_regs *regs, sigset_t *oldset, __u32 thread_info_flags)
461 {
462 #if DEBUG_SIG
463         printk("do_notify_resume flags:%x rip:%lx rsp:%lx caller:%lx pending:%lx\n",
464                thread_info_flags, regs->rip, regs->rsp, __builtin_return_address(0),signal_pending(current)); 
465 #endif
466                
467         /* Pending single-step? */
468         if (thread_info_flags & _TIF_SINGLESTEP) {
469                 regs->eflags |= TF_MASK;
470                 clear_thread_flag(TIF_SINGLESTEP);
471         }
472
473         /* deal with pending signal delivery */
474         if (thread_info_flags & _TIF_SIGPENDING)
475                 do_signal(regs,oldset);
476 }
477
478 void signal_fault(struct pt_regs *regs, void *frame, char *where)
479
480         struct task_struct *me = current; 
481         if (exception_trace)
482                 printk("%s[%d] bad frame in %s frame:%p rip:%lx rsp:%lx orax:%lx\n",
483                me->comm,me->pid,where,frame,regs->rip,regs->rsp,regs->orig_rax); 
484
485         force_sig(SIGSEGV, me); 
486