backported vs2.1.x fix to irq handling, which caused incorrect scheduler behavior
[linux-2.6.git] / kernel / signal.c
1 /*
2  *  linux/kernel/signal.c
3  *
4  *  Copyright (C) 1991, 1992  Linus Torvalds
5  *
6  *  1997-11-02  Modified for POSIX.1b signals by Richard Henderson
7  *
8  *  2003-06-02  Jim Houston - Concurrent Computer Corp.
9  *              Changes to use preallocated sigqueue structures
10  *              to allow signals to be sent reliably.
11  */
12
13 #include <linux/slab.h>
14 #include <linux/module.h>
15 #include <linux/smp_lock.h>
16 #include <linux/init.h>
17 #include <linux/sched.h>
18 #include <linux/fs.h>
19 #include <linux/tty.h>
20 #include <linux/binfmts.h>
21 #include <linux/security.h>
22 #include <linux/syscalls.h>
23 #include <linux/tracehook.h>
24 #include <linux/signal.h>
25 #include <linux/capability.h>
26 #include <asm/param.h>
27 #include <asm/uaccess.h>
28 #include <asm/unistd.h>
29 #include <asm/siginfo.h>
30 #include "audit.h"      /* audit_signal_info() */
31 #include <linux/vs_base.h>
32
33 /*
34  * SLAB caches for signal bits.
35  */
36
37 static kmem_cache_t *sigqueue_cachep;
38
39 /*
40  * In POSIX a signal is sent either to a specific thread (Linux task)
41  * or to the process as a whole (Linux thread group).  How the signal
42  * is sent determines whether it's to one thread or the whole group,
43  * which determines which signal mask(s) are involved in blocking it
44  * from being delivered until later.  When the signal is delivered,
45  * either it's caught or ignored by a user handler or it has a default
46  * effect that applies to the whole thread group (POSIX process).
47  *
48  * The possible effects an unblocked signal set to SIG_DFL can have are:
49  *   ignore     - Nothing Happens
50  *   terminate  - kill the process, i.e. all threads in the group,
51  *                similar to exit_group.  The group leader (only) reports
52  *                WIFSIGNALED status to its parent.
53  *   coredump   - write a core dump file describing all threads using
54  *                the same mm and then kill all those threads
55  *   stop       - stop all the threads in the group, i.e. TASK_STOPPED state
56  *
57  * SIGKILL and SIGSTOP cannot be caught, blocked, or ignored.
58  * Other signals when not blocked and set to SIG_DFL behaves as follows.
59  * The job control signals also have other special effects.
60  *
61  *      +--------------------+------------------+
62  *      |  POSIX signal      |  default action  |
63  *      +--------------------+------------------+
64  *      |  SIGHUP            |  terminate       |
65  *      |  SIGINT            |  terminate       |
66  *      |  SIGQUIT           |  coredump        |
67  *      |  SIGILL            |  coredump        |
68  *      |  SIGTRAP           |  coredump        |
69  *      |  SIGABRT/SIGIOT    |  coredump        |
70  *      |  SIGBUS            |  coredump        |
71  *      |  SIGFPE            |  coredump        |
72  *      |  SIGKILL           |  terminate(+)    |
73  *      |  SIGUSR1           |  terminate       |
74  *      |  SIGSEGV           |  coredump        |
75  *      |  SIGUSR2           |  terminate       |
76  *      |  SIGPIPE           |  terminate       |
77  *      |  SIGALRM           |  terminate       |
78  *      |  SIGTERM           |  terminate       |
79  *      |  SIGCHLD           |  ignore          |
80  *      |  SIGCONT           |  ignore(*)       |
81  *      |  SIGSTOP           |  stop(*)(+)      |
82  *      |  SIGTSTP           |  stop(*)         |
83  *      |  SIGTTIN           |  stop(*)         |
84  *      |  SIGTTOU           |  stop(*)         |
85  *      |  SIGURG            |  ignore          |
86  *      |  SIGXCPU           |  coredump        |
87  *      |  SIGXFSZ           |  coredump        |
88  *      |  SIGVTALRM         |  terminate       |
89  *      |  SIGPROF           |  terminate       |
90  *      |  SIGPOLL/SIGIO     |  terminate       |
91  *      |  SIGSYS/SIGUNUSED  |  coredump        |
92  *      |  SIGSTKFLT         |  terminate       |
93  *      |  SIGWINCH          |  ignore          |
94  *      |  SIGPWR            |  terminate       |
95  *      |  SIGRTMIN-SIGRTMAX |  terminate       |
96  *      +--------------------+------------------+
97  *      |  non-POSIX signal  |  default action  |
98  *      +--------------------+------------------+
99  *      |  SIGEMT            |  coredump        |
100  *      +--------------------+------------------+
101  *
102  * (+) For SIGKILL and SIGSTOP the action is "always", not just "default".
103  * (*) Special job control effects:
104  * When SIGCONT is sent, it resumes the process (all threads in the group)
105  * from TASK_STOPPED state and also clears any pending/queued stop signals
106  * (any of those marked with "stop(*)").  This happens regardless of blocking,
107  * catching, or ignoring SIGCONT.  When any stop signal is sent, it clears
108  * any pending/queued SIGCONT signals; this happens regardless of blocking,
109  * catching, or ignored the stop signal, though (except for SIGSTOP) the
110  * default action of stopping the process may happen later or never.
111  */
112
113 #ifdef SIGEMT
114 #define M_SIGEMT        M(SIGEMT)
115 #else
116 #define M_SIGEMT        0
117 #endif
118
119 #if SIGRTMIN > BITS_PER_LONG
120 #define M(sig) (1ULL << ((sig)-1))
121 #else
122 #define M(sig) (1UL << ((sig)-1))
123 #endif
124 #define T(sig, mask) (M(sig) & (mask))
125
126 #define SIG_KERNEL_ONLY_MASK (\
127         M(SIGKILL)   |  M(SIGSTOP)                                   )
128
129 #define SIG_KERNEL_STOP_MASK (\
130         M(SIGSTOP)   |  M(SIGTSTP)   |  M(SIGTTIN)   |  M(SIGTTOU)   )
131
132 #define SIG_KERNEL_COREDUMP_MASK (\
133         M(SIGQUIT)   |  M(SIGILL)    |  M(SIGTRAP)   |  M(SIGABRT)   | \
134         M(SIGFPE)    |  M(SIGSEGV)   |  M(SIGBUS)    |  M(SIGSYS)    | \
135         M(SIGXCPU)   |  M(SIGXFSZ)   |  M_SIGEMT                     )
136
137 #define SIG_KERNEL_IGNORE_MASK (\
138         M(SIGCONT)   |  M(SIGCHLD)   |  M(SIGWINCH)  |  M(SIGURG)    )
139
140 #define sig_kernel_only(sig) \
141                 (((sig) < SIGRTMIN)  && T(sig, SIG_KERNEL_ONLY_MASK))
142 #define sig_kernel_coredump(sig) \
143                 (((sig) < SIGRTMIN)  && T(sig, SIG_KERNEL_COREDUMP_MASK))
144 #define sig_kernel_ignore(sig) \
145                 (((sig) < SIGRTMIN)  && T(sig, SIG_KERNEL_IGNORE_MASK))
146 #define sig_kernel_stop(sig) \
147                 (((sig) < SIGRTMIN)  && T(sig, SIG_KERNEL_STOP_MASK))
148
149 #define sig_needs_tasklist(sig) ((sig) == SIGCONT)
150
151 #define sig_user_defined(t, signr) \
152         (((t)->sighand->action[(signr)-1].sa.sa_handler != SIG_DFL) &&  \
153          ((t)->sighand->action[(signr)-1].sa.sa_handler != SIG_IGN))
154
155 #define sig_fatal(t, signr) \
156         (!T(signr, SIG_KERNEL_IGNORE_MASK|SIG_KERNEL_STOP_MASK) && \
157          (t)->sighand->action[(signr)-1].sa.sa_handler == SIG_DFL)
158
159 static int sig_ignored(struct task_struct *t, int sig)
160 {
161         void __user * handler;
162
163         /*
164          * Blocked signals are never ignored, since the
165          * signal handler may change by the time it is
166          * unblocked.
167          */
168         if (sigismember(&t->blocked, sig))
169                 return 0;
170
171         /* Is it explicitly or implicitly ignored? */
172         handler = t->sighand->action[sig-1].sa.sa_handler;
173         if (handler != SIG_IGN &&
174             (handler != SIG_DFL || !sig_kernel_ignore(sig)))
175                 return 0;
176
177         /* It's ignored, we can short-circuit unless a debugger wants it.  */
178         return !tracehook_consider_ignored_signal(t, sig, handler);
179 }
180
181 /*
182  * Re-calculate pending state from the set of locally pending
183  * signals, globally pending signals, and blocked signals.
184  */
185 static inline int has_pending_signals(sigset_t *signal, sigset_t *blocked)
186 {
187         unsigned long ready;
188         long i;
189
190         switch (_NSIG_WORDS) {
191         default:
192                 for (i = _NSIG_WORDS, ready = 0; --i >= 0 ;)
193                         ready |= signal->sig[i] &~ blocked->sig[i];
194                 break;
195
196         case 4: ready  = signal->sig[3] &~ blocked->sig[3];
197                 ready |= signal->sig[2] &~ blocked->sig[2];
198                 ready |= signal->sig[1] &~ blocked->sig[1];
199                 ready |= signal->sig[0] &~ blocked->sig[0];
200                 break;
201
202         case 2: ready  = signal->sig[1] &~ blocked->sig[1];
203                 ready |= signal->sig[0] &~ blocked->sig[0];
204                 break;
205
206         case 1: ready  = signal->sig[0] &~ blocked->sig[0];
207         }
208         return ready != 0;
209 }
210
211 #define PENDING(p,b) has_pending_signals(&(p)->signal, (b))
212
213 fastcall void recalc_sigpending_tsk(struct task_struct *t)
214 {
215         if (t->signal->group_stop_count > 0 ||
216             (freezing(t)) ||
217             PENDING(&t->pending, &t->blocked) ||
218             PENDING(&t->signal->shared_pending, &t->blocked) ||
219             tracehook_induce_sigpending(t))
220                 set_tsk_thread_flag(t, TIF_SIGPENDING);
221         else
222                 clear_tsk_thread_flag(t, TIF_SIGPENDING);
223 }
224
225 void recalc_sigpending(void)
226 {
227         recalc_sigpending_tsk(current);
228 }
229
230 /* Given the mask, find the first available signal that should be serviced. */
231
232 static int
233 next_signal(struct sigpending *pending, sigset_t *mask)
234 {
235         unsigned long i, *s, *m, x;
236         int sig = 0;
237         
238         s = pending->signal.sig;
239         m = mask->sig;
240         switch (_NSIG_WORDS) {
241         default:
242                 for (i = 0; i < _NSIG_WORDS; ++i, ++s, ++m)
243                         if ((x = *s &~ *m) != 0) {
244                                 sig = ffz(~x) + i*_NSIG_BPW + 1;
245                                 break;
246                         }
247                 break;
248
249         case 2: if ((x = s[0] &~ m[0]) != 0)
250                         sig = 1;
251                 else if ((x = s[1] &~ m[1]) != 0)
252                         sig = _NSIG_BPW + 1;
253                 else
254                         break;
255                 sig += ffz(~x);
256                 break;
257
258         case 1: if ((x = *s &~ *m) != 0)
259                         sig = ffz(~x) + 1;
260                 break;
261         }
262         
263         return sig;
264 }
265
266 static struct sigqueue *__sigqueue_alloc(struct task_struct *t, gfp_t flags,
267                                          int override_rlimit)
268 {
269         struct sigqueue *q = NULL;
270
271         atomic_inc(&t->user->sigpending);
272         if (override_rlimit ||
273             atomic_read(&t->user->sigpending) <=
274                         t->signal->rlim[RLIMIT_SIGPENDING].rlim_cur)
275                 q = kmem_cache_alloc(sigqueue_cachep, flags);
276         if (unlikely(q == NULL)) {
277                 atomic_dec(&t->user->sigpending);
278         } else {
279                 INIT_LIST_HEAD(&q->list);
280                 q->flags = 0;
281                 q->user = get_uid(t->user);
282         }
283         return(q);
284 }
285
286 static void __sigqueue_free(struct sigqueue *q)
287 {
288         if (q->flags & SIGQUEUE_PREALLOC)
289                 return;
290         atomic_dec(&q->user->sigpending);
291         free_uid(q->user);
292         kmem_cache_free(sigqueue_cachep, q);
293 }
294
295 void flush_sigqueue(struct sigpending *queue)
296 {
297         struct sigqueue *q;
298
299         sigemptyset(&queue->signal);
300         while (!list_empty(&queue->list)) {
301                 q = list_entry(queue->list.next, struct sigqueue , list);
302                 list_del_init(&q->list);
303                 __sigqueue_free(q);
304         }
305 }
306
307 /*
308  * Flush all pending signals for a task.
309  */
310 void flush_signals(struct task_struct *t)
311 {
312         unsigned long flags;
313
314         spin_lock_irqsave(&t->sighand->siglock, flags);
315         clear_tsk_thread_flag(t,TIF_SIGPENDING);
316         flush_sigqueue(&t->pending);
317         flush_sigqueue(&t->signal->shared_pending);
318         spin_unlock_irqrestore(&t->sighand->siglock, flags);
319 }
320
321 /*
322  * Flush all handlers for a task.
323  */
324
325 void
326 flush_signal_handlers(struct task_struct *t, int force_default)
327 {
328         int i;
329         struct k_sigaction *ka = &t->sighand->action[0];
330         for (i = _NSIG ; i != 0 ; i--) {
331                 if (force_default || ka->sa.sa_handler != SIG_IGN)
332                         ka->sa.sa_handler = SIG_DFL;
333                 ka->sa.sa_flags = 0;
334                 sigemptyset(&ka->sa.sa_mask);
335                 ka++;
336         }
337 }
338
339 EXPORT_SYMBOL_GPL(flush_signal_handlers);
340
341 /* Notify the system that a driver wants to block all signals for this
342  * process, and wants to be notified if any signals at all were to be
343  * sent/acted upon.  If the notifier routine returns non-zero, then the
344  * signal will be acted upon after all.  If the notifier routine returns 0,
345  * then then signal will be blocked.  Only one block per process is
346  * allowed.  priv is a pointer to private data that the notifier routine
347  * can use to determine if the signal should be blocked or not.  */
348
349 void
350 block_all_signals(int (*notifier)(void *priv), void *priv, sigset_t *mask)
351 {
352         unsigned long flags;
353
354         spin_lock_irqsave(&current->sighand->siglock, flags);
355         current->notifier_mask = mask;
356         current->notifier_data = priv;
357         current->notifier = notifier;
358         spin_unlock_irqrestore(&current->sighand->siglock, flags);
359 }
360
361 /* Notify the system that blocking has ended. */
362
363 void
364 unblock_all_signals(void)
365 {
366         unsigned long flags;
367
368         spin_lock_irqsave(&current->sighand->siglock, flags);
369         current->notifier = NULL;
370         current->notifier_data = NULL;
371         recalc_sigpending();
372         spin_unlock_irqrestore(&current->sighand->siglock, flags);
373 }
374
375 static int collect_signal(int sig, struct sigpending *list, siginfo_t *info)
376 {
377         struct sigqueue *q, *first = NULL;
378         int still_pending = 0;
379
380         if (unlikely(!sigismember(&list->signal, sig)))
381                 return 0;
382
383         /*
384          * Collect the siginfo appropriate to this signal.  Check if
385          * there is another siginfo for the same signal.
386         */
387         list_for_each_entry(q, &list->list, list) {
388                 if (q->info.si_signo == sig) {
389                         if (first) {
390                                 still_pending = 1;
391                                 break;
392                         }
393                         first = q;
394                 }
395         }
396         if (first) {
397                 list_del_init(&first->list);
398                 copy_siginfo(info, &first->info);
399                 __sigqueue_free(first);
400                 if (!still_pending)
401                         sigdelset(&list->signal, sig);
402         } else {
403
404                 /* Ok, it wasn't in the queue.  This must be
405                    a fast-pathed signal or we must have been
406                    out of queue space.  So zero out the info.
407                  */
408                 sigdelset(&list->signal, sig);
409                 info->si_signo = sig;
410                 info->si_errno = 0;
411                 info->si_code = 0;
412                 info->si_pid = 0;
413                 info->si_uid = 0;
414         }
415         return 1;
416 }
417
418 static int __dequeue_signal(struct sigpending *pending, sigset_t *mask,
419                         siginfo_t *info)
420 {
421         int sig = 0;
422
423         sig = next_signal(pending, mask);
424         if (sig) {
425                 if (current->notifier) {
426                         if (sigismember(current->notifier_mask, sig)) {
427                                 if (!(current->notifier)(current->notifier_data)) {
428                                         clear_thread_flag(TIF_SIGPENDING);
429                                         return 0;
430                                 }
431                         }
432                 }
433
434                 if (!collect_signal(sig, pending, info))
435                         sig = 0;
436                                 
437         }
438         recalc_sigpending();
439
440         return sig;
441 }
442
443 /*
444  * Dequeue a signal and return the element to the caller, which is 
445  * expected to free it.
446  *
447  * All callers have to hold the siglock.
448  */
449 int dequeue_signal(struct task_struct *tsk, sigset_t *mask, siginfo_t *info)
450 {
451         int signr = __dequeue_signal(&tsk->pending, mask, info);
452         if (!signr)
453                 signr = __dequeue_signal(&tsk->signal->shared_pending,
454                                          mask, info);
455         if (signr && unlikely(sig_kernel_stop(signr))) {
456                 /*
457                  * Set a marker that we have dequeued a stop signal.  Our
458                  * caller might release the siglock and then the pending
459                  * stop signal it is about to process is no longer in the
460                  * pending bitmasks, but must still be cleared by a SIGCONT
461                  * (and overruled by a SIGKILL).  So those cases clear this
462                  * shared flag after we've set it.  Note that this flag may
463                  * remain set after the signal we return is ignored or
464                  * handled.  That doesn't matter because its only purpose
465                  * is to alert stop-signal processing code when another
466                  * processor has come along and cleared the flag.
467                  */
468                 if (!(tsk->signal->flags & SIGNAL_GROUP_EXIT))
469                         tsk->signal->flags |= SIGNAL_STOP_DEQUEUED;
470         }
471         if ( signr &&
472              ((info->si_code & __SI_MASK) == __SI_TIMER) &&
473              info->si_sys_private){
474                 /*
475                  * Release the siglock to ensure proper locking order
476                  * of timer locks outside of siglocks.  Note, we leave
477                  * irqs disabled here, since the posix-timers code is
478                  * about to disable them again anyway.
479                  */
480                 spin_unlock(&tsk->sighand->siglock);
481                 do_schedule_next_timer(info);
482                 spin_lock(&tsk->sighand->siglock);
483         }
484         return signr;
485 }
486
487 /*
488  * Tell a process that it has a new active signal..
489  *
490  * NOTE! we rely on the previous spin_lock to
491  * lock interrupts for us! We can only be called with
492  * "siglock" held, and the local interrupt must
493  * have been disabled when that got acquired!
494  *
495  * No need to set need_resched since signal event passing
496  * goes through ->blocked
497  */
498 void signal_wake_up(struct task_struct *t, int resume)
499 {
500         unsigned int mask;
501
502         set_tsk_thread_flag(t, TIF_SIGPENDING);
503
504         /*
505          * For SIGKILL, we want to wake it up in the stopped/traced case.
506          * We don't check t->state here because there is a race with it
507          * executing another processor and just now entering stopped state.
508          * By using wake_up_state, we ensure the process will wake up and
509          * handle its death signal.
510          */
511         mask = TASK_INTERRUPTIBLE;
512         if (resume)
513                 mask |= TASK_STOPPED | TASK_TRACED;
514         if (!wake_up_state(t, mask))
515                 kick_process(t);
516 }
517
518 /*
519  * Remove signals in mask from the pending set and queue.
520  * Returns 1 if any signals were found.
521  *
522  * All callers must be holding the siglock.
523  *
524  * This version takes a sigset mask and looks at all signals,
525  * not just those in the first mask word.
526  */
527 static int rm_from_queue_full(sigset_t *mask, struct sigpending *s)
528 {
529         struct sigqueue *q, *n;
530         sigset_t m;
531
532         sigandsets(&m, mask, &s->signal);
533         if (sigisemptyset(&m))
534                 return 0;
535
536         signandsets(&s->signal, &s->signal, mask);
537         list_for_each_entry_safe(q, n, &s->list, list) {
538                 if (sigismember(mask, q->info.si_signo)) {
539                         list_del_init(&q->list);
540                         __sigqueue_free(q);
541                 }
542         }
543         return 1;
544 }
545 /*
546  * Remove signals in mask from the pending set and queue.
547  * Returns 1 if any signals were found.
548  *
549  * All callers must be holding the siglock.
550  */
551 static int rm_from_queue(unsigned long mask, struct sigpending *s)
552 {
553         struct sigqueue *q, *n;
554
555         if (!sigtestsetmask(&s->signal, mask))
556                 return 0;
557
558         sigdelsetmask(&s->signal, mask);
559         list_for_each_entry_safe(q, n, &s->list, list) {
560                 if (q->info.si_signo < SIGRTMIN &&
561                     (mask & sigmask(q->info.si_signo))) {
562                         list_del_init(&q->list);
563                         __sigqueue_free(q);
564                 }
565         }
566         return 1;
567 }
568
569 /*
570  * Bad permissions for sending the signal
571  */
572 static int check_kill_permission(int sig, struct siginfo *info,
573                                  struct task_struct *t)
574 {
575         int user;
576         int error = -EINVAL;
577
578         if (!valid_signal(sig))
579                 return error;
580
581         user = ((info == SEND_SIG_NOINFO) ||
582                 (!is_si_special(info) && SI_FROMUSER(info)));
583
584         error = -EPERM;
585         if (user && ((sig != SIGCONT) ||
586                 (current->signal->session != t->signal->session))
587             && (current->euid ^ t->suid) && (current->euid ^ t->uid)
588             && (current->uid ^ t->suid) && (current->uid ^ t->uid)
589             && !capable(CAP_KILL))
590                 return error;
591
592         error = -ESRCH;
593         if (user && !vx_check(vx_task_xid(t), VX_ADMIN|VX_IDENT))
594                 return error;
595
596         error = security_task_kill(t, info, sig, 0);
597         if (!error)
598                 audit_signal_info(sig, t); /* Let audit system see the signal */
599         return error;
600 }
601
602
603 /*
604  * Handle magic process-wide effects of stop/continue signals.
605  * Unlike the signal actions, these happen immediately at signal-generation
606  * time regardless of blocking, ignoring, or handling.  This does the
607  * actual continuing for SIGCONT, but not the actual stopping for stop
608  * signals.  The process stop is done as a signal action for SIG_DFL.
609  */
610 static void handle_stop_signal(int sig, struct task_struct *p)
611 {
612         struct task_struct *t;
613
614         if (p->signal->flags & SIGNAL_GROUP_EXIT)
615                 /*
616                  * The process is in the middle of dying already.
617                  */
618                 return;
619
620         if (sig_kernel_stop(sig)) {
621                 /*
622                  * This is a stop signal.  Remove SIGCONT from all queues.
623                  */
624                 rm_from_queue(sigmask(SIGCONT), &p->signal->shared_pending);
625                 t = p;
626                 do {
627                         rm_from_queue(sigmask(SIGCONT), &t->pending);
628                         t = next_thread(t);
629                 } while (t != p);
630         } else if (sig == SIGCONT) {
631                 /*
632                  * Remove all stop signals from all queues,
633                  * and wake all threads.
634                  */
635                 if (unlikely(p->signal->group_stop_count > 0)) {
636                         /*
637                          * There was a group stop in progress.  We'll
638                          * pretend it finished before we got here.  We are
639                          * obliged to report it to the parent: if the
640                          * SIGSTOP happened "after" this SIGCONT, then it
641                          * would have cleared this pending SIGCONT.  If it
642                          * happened "before" this SIGCONT, then the parent
643                          * got the SIGCHLD about the stop finishing before
644                          * the continue happened.  We do the notification
645                          * now, and it's as if the stop had finished and
646                          * the SIGCHLD was pending on entry to this kill.
647                          */
648                         p->signal->group_stop_count = 0;
649                         p->signal->flags = SIGNAL_STOP_CONTINUED;
650                         spin_unlock(&p->sighand->siglock);
651                         do_notify_parent_cldstop(p, CLD_STOPPED);
652                         spin_lock(&p->sighand->siglock);
653                 }
654                 rm_from_queue(SIG_KERNEL_STOP_MASK, &p->signal->shared_pending);
655                 t = p;
656                 do {
657                         unsigned int state;
658                         rm_from_queue(SIG_KERNEL_STOP_MASK, &t->pending);
659                         
660                         /*
661                          * If there is a handler for SIGCONT, we must make
662                          * sure that no thread returns to user mode before
663                          * we post the signal, in case it was the only
664                          * thread eligible to run the signal handler--then
665                          * it must not do anything between resuming and
666                          * running the handler.  With the TIF_SIGPENDING
667                          * flag set, the thread will pause and acquire the
668                          * siglock that we hold now and until we've queued
669                          * the pending signal. 
670                          *
671                          * Wake up the stopped thread _after_ setting
672                          * TIF_SIGPENDING
673                          */
674                         state = TASK_STOPPED;
675                         if (sig_user_defined(t, SIGCONT) && !sigismember(&t->blocked, SIGCONT)) {
676                                 set_tsk_thread_flag(t, TIF_SIGPENDING);
677                                 state |= TASK_INTERRUPTIBLE;
678                         }
679                         wake_up_state(t, state);
680
681                         t = next_thread(t);
682                 } while (t != p);
683
684                 if (p->signal->flags & SIGNAL_STOP_STOPPED) {
685                         /*
686                          * We were in fact stopped, and are now continued.
687                          * Notify the parent with CLD_CONTINUED.
688                          */
689                         p->signal->flags = SIGNAL_STOP_CONTINUED;
690                         p->signal->group_exit_code = 0;
691                         spin_unlock(&p->sighand->siglock);
692                         do_notify_parent_cldstop(p, CLD_CONTINUED);
693                         spin_lock(&p->sighand->siglock);
694                 } else {
695                         /*
696                          * We are not stopped, but there could be a stop
697                          * signal in the middle of being processed after
698                          * being removed from the queue.  Clear that too.
699                          */
700                         p->signal->flags = 0;
701                 }
702         } else if (sig == SIGKILL) {
703                 /*
704                  * Make sure that any pending stop signal already dequeued
705                  * is undone by the wakeup for SIGKILL.
706                  */
707                 p->signal->flags = 0;
708         }
709 }
710
711 static int send_signal(int sig, struct siginfo *info, struct task_struct *t,
712                         struct sigpending *signals)
713 {
714         struct sigqueue * q = NULL;
715         int ret = 0;
716
717         /*
718          * fast-pathed signals for kernel-internal things like SIGSTOP
719          * or SIGKILL.
720          */
721         if (info == SEND_SIG_FORCED)
722                 goto out_set;
723
724         /* Real-time signals must be queued if sent by sigqueue, or
725            some other real-time mechanism.  It is implementation
726            defined whether kill() does so.  We attempt to do so, on
727            the principle of least surprise, but since kill is not
728            allowed to fail with EAGAIN when low on memory we just
729            make sure at least one signal gets delivered and don't
730            pass on the info struct.  */
731
732         q = __sigqueue_alloc(t, GFP_ATOMIC, (sig < SIGRTMIN &&
733                                              (is_si_special(info) ||
734                                               info->si_code >= 0)));
735         if (q) {
736                 list_add_tail(&q->list, &signals->list);
737                 switch ((unsigned long) info) {
738                 case (unsigned long) SEND_SIG_NOINFO:
739                         q->info.si_signo = sig;
740                         q->info.si_errno = 0;
741                         q->info.si_code = SI_USER;
742                         q->info.si_pid = current->pid;
743                         q->info.si_uid = current->uid;
744                         break;
745                 case (unsigned long) SEND_SIG_PRIV:
746                         q->info.si_signo = sig;
747                         q->info.si_errno = 0;
748                         q->info.si_code = SI_KERNEL;
749                         q->info.si_pid = 0;
750                         q->info.si_uid = 0;
751                         break;
752                 default:
753                         copy_siginfo(&q->info, info);
754                         break;
755                 }
756         } else if (!is_si_special(info)) {
757                 if (sig >= SIGRTMIN && info->si_code != SI_USER)
758                 /*
759                  * Queue overflow, abort.  We may abort if the signal was rt
760                  * and sent by user using something other than kill().
761                  */
762                         return -EAGAIN;
763         }
764
765 out_set:
766         sigaddset(&signals->signal, sig);
767         return ret;
768 }
769
770 #define LEGACY_QUEUE(sigptr, sig) \
771         (((sig) < SIGRTMIN) && sigismember(&(sigptr)->signal, (sig)))
772
773 int print_fatal_signals = 0;
774
775 static void print_fatal_signal(struct pt_regs *regs, int signr)
776 {
777         printk("%s/%d: potentially unexpected fatal signal %d.\n",
778                 current->comm, current->pid, signr);
779
780 #ifdef __i386__
781         printk("code at %08lx: ", regs->eip);
782         {
783                 int i;
784                 for (i = 0; i < 16; i++) {
785                         unsigned char insn;
786
787                         __get_user(insn, (unsigned char *)(regs->eip + i));
788                         printk("%02x ", insn);
789                 }
790         }
791 #endif
792         printk("\n");
793         show_regs(regs);
794 }
795
796 static int __init setup_print_fatal_signals(char *str)
797 {
798         get_option (&str, &print_fatal_signals);
799
800         return 1;
801 }
802
803 __setup("print-fatal-signals=", setup_print_fatal_signals);
804
805 static int
806 specific_send_sig_info(int sig, struct siginfo *info, struct task_struct *t)
807 {
808         int ret = 0;
809
810         BUG_ON(!irqs_disabled());
811         assert_spin_locked(&t->sighand->siglock);
812
813         /* Short-circuit ignored signals.  */
814         if (sig_ignored(t, sig))
815                 goto out;
816
817         /* Support queueing exactly one non-rt signal, so that we
818            can get more detailed information about the cause of
819            the signal. */
820         if (LEGACY_QUEUE(&t->pending, sig))
821                 goto out;
822
823         ret = send_signal(sig, info, t, &t->pending);
824         if (!ret && !sigismember(&t->blocked, sig))
825                 signal_wake_up(t, sig == SIGKILL);
826 out:
827         return ret;
828 }
829
830 /*
831  * Force a signal that the process can't ignore: if necessary
832  * we unblock the signal and change any SIG_IGN to SIG_DFL.
833  *
834  * Note: If we unblock the signal, we always reset it to SIG_DFL,
835  * since we do not want to have a signal handler that was blocked
836  * be invoked when user space had explicitly blocked it.
837  *
838  * We don't want to have recursive SIGSEGV's etc, for example.
839  */
840 int
841 force_sig_info(int sig, struct siginfo *info, struct task_struct *t)
842 {
843         unsigned long int flags;
844         int ret, blocked, ignored;
845         struct k_sigaction *action;
846
847         spin_lock_irqsave(&t->sighand->siglock, flags);
848         action = &t->sighand->action[sig-1];
849         ignored = action->sa.sa_handler == SIG_IGN;
850         blocked = sigismember(&t->blocked, sig);
851         if (blocked || ignored) {
852                 action->sa.sa_handler = SIG_DFL;
853                 if (blocked) {
854                         sigdelset(&t->blocked, sig);
855                         recalc_sigpending_tsk(t);
856                 }
857         }
858         ret = specific_send_sig_info(sig, info, t);
859         spin_unlock_irqrestore(&t->sighand->siglock, flags);
860
861         return ret;
862 }
863
864 void
865 force_sig_specific(int sig, struct task_struct *t)
866 {
867         force_sig_info(sig, SEND_SIG_FORCED, t);
868 }
869
870 /*
871  * Test if P wants to take SIG.  After we've checked all threads with this,
872  * it's equivalent to finding no threads not blocking SIG.  Any threads not
873  * blocking SIG were ruled out because they are not running and already
874  * have pending signals.  Such threads will dequeue from the shared queue
875  * as soon as they're available, so putting the signal on the shared queue
876  * will be equivalent to sending it to one such thread.
877  */
878 static inline int wants_signal(int sig, struct task_struct *p)
879 {
880         if (sigismember(&p->blocked, sig))
881                 return 0;
882         if (p->flags & PF_EXITING)
883                 return 0;
884         if (sig == SIGKILL)
885                 return 1;
886         if (p->state & (TASK_STOPPED | TASK_TRACED))
887                 return 0;
888         return task_curr(p) || !signal_pending(p);
889 }
890
891 static void
892 __group_complete_signal(int sig, struct task_struct *p)
893 {
894         struct task_struct *t;
895
896         /*
897          * Now find a thread we can wake up to take the signal off the queue.
898          *
899          * If the main thread wants the signal, it gets first crack.
900          * Probably the least surprising to the average bear.
901          */
902         if (wants_signal(sig, p))
903                 t = p;
904         else if (thread_group_empty(p))
905                 /*
906                  * There is just one thread and it does not need to be woken.
907                  * It will dequeue unblocked signals before it runs again.
908                  */
909                 return;
910         else {
911                 /*
912                  * Otherwise try to find a suitable thread.
913                  */
914                 t = p->signal->curr_target;
915                 if (t == NULL)
916                         /* restart balancing at this thread */
917                         t = p->signal->curr_target = p;
918
919                 while (!wants_signal(sig, t)) {
920                         t = next_thread(t);
921                         if (t == p->signal->curr_target)
922                                 /*
923                                  * No thread needs to be woken.
924                                  * Any eligible threads will see
925                                  * the signal in the queue soon.
926                                  */
927                                 return;
928                 }
929                 p->signal->curr_target = t;
930         }
931
932         /*
933          * Found a killable thread.  If the signal will be fatal,
934          * then start taking the whole group down immediately.
935          */
936         if (sig_fatal(p, sig) && !(p->signal->flags & SIGNAL_GROUP_EXIT) &&
937             !sigismember(&t->real_blocked, sig) &&
938             (sig == SIGKILL || !tracehook_consider_fatal_signal(t, sig))) {
939                 /*
940                  * This signal will be fatal to the whole group.
941                  */
942                 if (!sig_kernel_coredump(sig)) {
943                         /*
944                          * Start a group exit and wake everybody up.
945                          * This way we don't have other threads
946                          * running and doing things after a slower
947                          * thread has the fatal signal pending.
948                          */
949                         p->signal->flags = SIGNAL_GROUP_EXIT;
950                         p->signal->group_exit_code = sig;
951                         p->signal->group_stop_count = 0;
952                         t = p;
953                         do {
954                                 sigaddset(&t->pending.signal, SIGKILL);
955                                 signal_wake_up(t, 1);
956                                 t = next_thread(t);
957                         } while (t != p);
958                         return;
959                 }
960
961                 /*
962                  * There will be a core dump.  We make all threads other
963                  * than the chosen one go into a group stop so that nothing
964                  * happens until it gets scheduled, takes the signal off
965                  * the shared queue, and does the core dump.  This is a
966                  * little more complicated than strictly necessary, but it
967                  * keeps the signal state that winds up in the core dump
968                  * unchanged from the death state, e.g. which thread had
969                  * the core-dump signal unblocked.
970                  */
971                 rm_from_queue(SIG_KERNEL_STOP_MASK, &t->pending);
972                 rm_from_queue(SIG_KERNEL_STOP_MASK, &p->signal->shared_pending);
973                 p->signal->group_stop_count = 0;
974                 p->signal->group_exit_task = t;
975                 t = p;
976                 do {
977                         p->signal->group_stop_count++;
978                         signal_wake_up(t, 0);
979                         t = next_thread(t);
980                 } while (t != p);
981                 wake_up_process(p->signal->group_exit_task);
982                 return;
983         }
984
985         /*
986          * The signal is already in the shared-pending queue.
987          * Tell the chosen thread to wake up and dequeue it.
988          */
989         signal_wake_up(t, sig == SIGKILL);
990         return;
991 }
992
993 int
994 __group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
995 {
996         int ret = 0;
997
998         assert_spin_locked(&p->sighand->siglock);
999         handle_stop_signal(sig, p);
1000
1001         /* Short-circuit ignored signals.  */
1002         if (sig_ignored(p, sig))
1003                 return ret;
1004
1005         if (LEGACY_QUEUE(&p->signal->shared_pending, sig))
1006                 /* This is a non-RT signal and we already have one queued.  */
1007                 return ret;
1008
1009         /*
1010          * Put this signal on the shared-pending queue, or fail with EAGAIN.
1011          * We always use the shared queue for process-wide signals,
1012          * to avoid several races.
1013          */
1014         ret = send_signal(sig, info, p, &p->signal->shared_pending);
1015         if (unlikely(ret))
1016                 return ret;
1017
1018         __group_complete_signal(sig, p);
1019         return 0;
1020 }
1021
1022 /*
1023  * Nuke all other threads in the group.
1024  */
1025 void zap_other_threads(struct task_struct *p)
1026 {
1027         struct task_struct *t;
1028
1029         p->signal->flags = SIGNAL_GROUP_EXIT;
1030         p->signal->group_stop_count = 0;
1031
1032         if (thread_group_empty(p))
1033                 return;
1034
1035         for (t = next_thread(p); t != p; t = next_thread(t)) {
1036                 /*
1037                  * Don't bother with already dead threads
1038                  */
1039                 if (t->exit_state)
1040                         continue;
1041
1042                 /*
1043                  * We don't want to notify the parent, since we are
1044                  * killed as part of a thread group due to another
1045                  * thread doing an execve() or similar. So set the
1046                  * exit signal to -1 to allow immediate reaping of
1047                  * the process.  But don't detach the thread group
1048                  * leader.
1049                  */
1050                 if (t != p->group_leader)
1051                         t->exit_signal = -1;
1052
1053                 /* SIGKILL will be handled before any pending SIGSTOP */
1054                 sigaddset(&t->pending.signal, SIGKILL);
1055                 signal_wake_up(t, 1);
1056         }
1057 }
1058
1059 /*
1060  * Must be called under rcu_read_lock() or with tasklist_lock read-held.
1061  */
1062 struct sighand_struct *lock_task_sighand(struct task_struct *tsk, unsigned long *flags)
1063 {
1064         struct sighand_struct *sighand;
1065
1066         for (;;) {
1067                 sighand = rcu_dereference(tsk->sighand);
1068                 if (unlikely(sighand == NULL))
1069                         break;
1070
1071                 spin_lock_irqsave(&sighand->siglock, *flags);
1072                 if (likely(sighand == tsk->sighand))
1073                         break;
1074                 spin_unlock_irqrestore(&sighand->siglock, *flags);
1075         }
1076
1077         return sighand;
1078 }
1079
1080 int group_send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1081 {
1082         unsigned long flags;
1083         int ret;
1084
1085         ret = check_kill_permission(sig, info, p);
1086
1087         if (!ret && sig) {
1088                 ret = -ESRCH;
1089                 if (lock_task_sighand(p, &flags)) {
1090                         ret = __group_send_sig_info(sig, info, p);
1091                         unlock_task_sighand(p, &flags);
1092                 }
1093         }
1094
1095         return ret;
1096 }
1097
1098 /*
1099  * kill_pg_info() sends a signal to a process group: this is what the tty
1100  * control characters do (^C, ^Z etc)
1101  */
1102
1103 int __kill_pg_info(int sig, struct siginfo *info, pid_t pgrp)
1104 {
1105         struct task_struct *p = NULL;
1106         int retval, success;
1107
1108         if (pgrp <= 0)
1109                 return -EINVAL;
1110
1111         success = 0;
1112         retval = -ESRCH;
1113         do_each_task_pid(pgrp, PIDTYPE_PGID, p) {
1114                 int err = group_send_sig_info(sig, info, p);
1115                 success |= !err;
1116                 retval = err;
1117         } while_each_task_pid(pgrp, PIDTYPE_PGID, p);
1118         return success ? 0 : retval;
1119 }
1120
1121 int
1122 kill_pg_info(int sig, struct siginfo *info, pid_t pgrp)
1123 {
1124         int retval;
1125
1126         read_lock(&tasklist_lock);
1127         retval = __kill_pg_info(sig, info, pgrp);
1128         read_unlock(&tasklist_lock);
1129
1130         return retval;
1131 }
1132
1133 int
1134 kill_proc_info(int sig, struct siginfo *info, pid_t pid)
1135 {
1136         int error;
1137         int acquired_tasklist_lock = 0;
1138         struct task_struct *p;
1139
1140         rcu_read_lock();
1141         if (unlikely(sig_needs_tasklist(sig))) {
1142                 read_lock(&tasklist_lock);
1143                 acquired_tasklist_lock = 1;
1144         }
1145         p = find_task_by_pid(pid);
1146         error = -ESRCH;
1147         if (p && vx_check(vx_task_xid(p), VX_IDENT))
1148                 error = group_send_sig_info(sig, info, p);
1149         if (unlikely(acquired_tasklist_lock))
1150                 read_unlock(&tasklist_lock);
1151         rcu_read_unlock();
1152         return error;
1153 }
1154
1155 /* like kill_proc_info(), but doesn't use uid/euid of "current" */
1156 int kill_proc_info_as_uid(int sig, struct siginfo *info, pid_t pid,
1157                       uid_t uid, uid_t euid, u32 secid)
1158 {
1159         int ret = -EINVAL;
1160         struct task_struct *p;
1161
1162         if (!valid_signal(sig))
1163                 return ret;
1164
1165         read_lock(&tasklist_lock);
1166         p = find_task_by_pid(pid);
1167         if (!p) {
1168                 ret = -ESRCH;
1169                 goto out_unlock;
1170         }
1171         if ((info == SEND_SIG_NOINFO || (!is_si_special(info) && SI_FROMUSER(info)))
1172             && (euid != p->suid) && (euid != p->uid)
1173             && (uid != p->suid) && (uid != p->uid)) {
1174                 ret = -EPERM;
1175                 goto out_unlock;
1176         }
1177         ret = security_task_kill(p, info, sig, secid);
1178         if (ret)
1179                 goto out_unlock;
1180         if (sig && p->sighand) {
1181                 unsigned long flags;
1182                 spin_lock_irqsave(&p->sighand->siglock, flags);
1183                 ret = __group_send_sig_info(sig, info, p);
1184                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1185         }
1186 out_unlock:
1187         read_unlock(&tasklist_lock);
1188         return ret;
1189 }
1190 EXPORT_SYMBOL_GPL(kill_proc_info_as_uid);
1191
1192 /*
1193  * kill_something_info() interprets pid in interesting ways just like kill(2).
1194  *
1195  * POSIX specifies that kill(-1,sig) is unspecified, but what we have
1196  * is probably wrong.  Should make it like BSD or SYSV.
1197  */
1198
1199 static int kill_something_info(int sig, struct siginfo *info, int pid)
1200 {
1201         if (!pid) {
1202                 return kill_pg_info(sig, info, process_group(current));
1203         } else if (pid == -1) {
1204                 int retval = 0, count = 0;
1205                 struct task_struct * p;
1206
1207                 read_lock(&tasklist_lock);
1208                 for_each_process(p) {
1209                         if (vx_check(vx_task_xid(p), VX_ADMIN|VX_IDENT) &&
1210                                 p->pid > 1 && p->tgid != current->tgid) {
1211                                 int err = group_send_sig_info(sig, info, p);
1212                                 ++count;
1213                                 if (err != -EPERM)
1214                                         retval = err;
1215                         }
1216                 }
1217                 read_unlock(&tasklist_lock);
1218                 return count ? retval : -ESRCH;
1219         } else if (pid < 0) {
1220                 return kill_pg_info(sig, info, -pid);
1221         } else {
1222                 return kill_proc_info(sig, info, pid);
1223         }
1224 }
1225
1226 /*
1227  * These are for backward compatibility with the rest of the kernel source.
1228  */
1229
1230 /*
1231  * These two are the most common entry points.  They send a signal
1232  * just to the specific thread.
1233  */
1234 int
1235 send_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1236 {
1237         int ret;
1238         unsigned long flags;
1239
1240         /*
1241          * Make sure legacy kernel users don't send in bad values
1242          * (normal paths check this in check_kill_permission).
1243          */
1244         if (!valid_signal(sig))
1245                 return -EINVAL;
1246
1247         /*
1248          * We need the tasklist lock even for the specific
1249          * thread case (when we don't need to follow the group
1250          * lists) in order to avoid races with "p->sighand"
1251          * going away or changing from under us.
1252          */
1253         read_lock(&tasklist_lock);  
1254         spin_lock_irqsave(&p->sighand->siglock, flags);
1255         ret = specific_send_sig_info(sig, info, p);
1256         spin_unlock_irqrestore(&p->sighand->siglock, flags);
1257         read_unlock(&tasklist_lock);
1258         return ret;
1259 }
1260
1261 #define __si_special(priv) \
1262         ((priv) ? SEND_SIG_PRIV : SEND_SIG_NOINFO)
1263
1264 int
1265 send_sig(int sig, struct task_struct *p, int priv)
1266 {
1267         return send_sig_info(sig, __si_special(priv), p);
1268 }
1269
1270 /*
1271  * This is the entry point for "process-wide" signals.
1272  * They will go to an appropriate thread in the thread group.
1273  */
1274 int
1275 send_group_sig_info(int sig, struct siginfo *info, struct task_struct *p)
1276 {
1277         int ret;
1278         read_lock(&tasklist_lock);
1279         ret = group_send_sig_info(sig, info, p);
1280         read_unlock(&tasklist_lock);
1281         return ret;
1282 }
1283
1284 void
1285 force_sig(int sig, struct task_struct *p)
1286 {
1287         force_sig_info(sig, SEND_SIG_PRIV, p);
1288 }
1289
1290 /*
1291  * When things go south during signal handling, we
1292  * will force a SIGSEGV. And if the signal that caused
1293  * the problem was already a SIGSEGV, we'll want to
1294  * make sure we don't even try to deliver the signal..
1295  */
1296 int
1297 force_sigsegv(int sig, struct task_struct *p)
1298 {
1299         if (sig == SIGSEGV) {
1300                 unsigned long flags;
1301                 spin_lock_irqsave(&p->sighand->siglock, flags);
1302                 p->sighand->action[sig - 1].sa.sa_handler = SIG_DFL;
1303                 spin_unlock_irqrestore(&p->sighand->siglock, flags);
1304         }
1305         force_sig(SIGSEGV, p);
1306         return 0;
1307 }
1308
1309 int
1310 kill_pg(pid_t pgrp, int sig, int priv)
1311 {
1312         return kill_pg_info(sig, __si_special(priv), pgrp);
1313 }
1314
1315 int
1316 kill_proc(pid_t pid, int sig, int priv)
1317 {
1318         return kill_proc_info(sig, __si_special(priv), pid);
1319 }
1320
1321 /*
1322  * These functions support sending signals using preallocated sigqueue
1323  * structures.  This is needed "because realtime applications cannot
1324  * afford to lose notifications of asynchronous events, like timer
1325  * expirations or I/O completions".  In the case of Posix Timers 
1326  * we allocate the sigqueue structure from the timer_create.  If this
1327  * allocation fails we are able to report the failure to the application
1328  * with an EAGAIN error.
1329  */
1330  
1331 struct sigqueue *sigqueue_alloc(void)
1332 {
1333         struct sigqueue *q;
1334
1335         if ((q = __sigqueue_alloc(current, GFP_KERNEL, 0)))
1336                 q->flags |= SIGQUEUE_PREALLOC;
1337         return(q);
1338 }
1339
1340 void sigqueue_free(struct sigqueue *q)
1341 {
1342         unsigned long flags;
1343         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1344         /*
1345          * If the signal is still pending remove it from the
1346          * pending queue.
1347          */
1348         if (unlikely(!list_empty(&q->list))) {
1349                 spinlock_t *lock = &current->sighand->siglock;
1350                 read_lock(&tasklist_lock);
1351                 spin_lock_irqsave(lock, flags);
1352                 if (!list_empty(&q->list))
1353                         list_del_init(&q->list);
1354                 spin_unlock_irqrestore(lock, flags);
1355                 read_unlock(&tasklist_lock);
1356         }
1357         q->flags &= ~SIGQUEUE_PREALLOC;
1358         __sigqueue_free(q);
1359 }
1360
1361 int send_sigqueue(int sig, struct sigqueue *q, struct task_struct *p)
1362 {
1363         unsigned long flags;
1364         int ret = 0;
1365
1366         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1367
1368         /*
1369          * The rcu based delayed sighand destroy makes it possible to
1370          * run this without tasklist lock held. The task struct itself
1371          * cannot go away as create_timer did get_task_struct().
1372          *
1373          * We return -1, when the task is marked exiting, so
1374          * posix_timer_event can redirect it to the group leader
1375          */
1376         rcu_read_lock();
1377
1378         if (!likely(lock_task_sighand(p, &flags))) {
1379                 ret = -1;
1380                 goto out_err;
1381         }
1382
1383         if (unlikely(!list_empty(&q->list))) {
1384                 /*
1385                  * If an SI_TIMER entry is already queue just increment
1386                  * the overrun count.
1387                  */
1388                 BUG_ON(q->info.si_code != SI_TIMER);
1389                 q->info.si_overrun++;
1390                 goto out;
1391         }
1392         /* Short-circuit ignored signals.  */
1393         if (sig_ignored(p, sig)) {
1394                 ret = 1;
1395                 goto out;
1396         }
1397
1398         list_add_tail(&q->list, &p->pending.list);
1399         sigaddset(&p->pending.signal, sig);
1400         if (!sigismember(&p->blocked, sig))
1401                 signal_wake_up(p, sig == SIGKILL);
1402
1403 out:
1404         unlock_task_sighand(p, &flags);
1405 out_err:
1406         rcu_read_unlock();
1407
1408         return ret;
1409 }
1410
1411 int
1412 send_group_sigqueue(int sig, struct sigqueue *q, struct task_struct *p)
1413 {
1414         unsigned long flags;
1415         int ret = 0;
1416
1417         BUG_ON(!(q->flags & SIGQUEUE_PREALLOC));
1418
1419         read_lock(&tasklist_lock);
1420         /* Since it_lock is held, p->sighand cannot be NULL. */
1421         spin_lock_irqsave(&p->sighand->siglock, flags);
1422         handle_stop_signal(sig, p);
1423
1424         /* Short-circuit ignored signals.  */
1425         if (sig_ignored(p, sig)) {
1426                 ret = 1;
1427                 goto out;
1428         }
1429
1430         if (unlikely(!list_empty(&q->list))) {
1431                 /*
1432                  * If an SI_TIMER entry is already queue just increment
1433                  * the overrun count.  Other uses should not try to
1434                  * send the signal multiple times.
1435                  */
1436                 BUG_ON(q->info.si_code != SI_TIMER);
1437                 q->info.si_overrun++;
1438                 goto out;
1439         } 
1440
1441         /*
1442          * Put this signal on the shared-pending queue.
1443          * We always use the shared queue for process-wide signals,
1444          * to avoid several races.
1445          */
1446         list_add_tail(&q->list, &p->signal->shared_pending.list);
1447         sigaddset(&p->signal->shared_pending.signal, sig);
1448
1449         __group_complete_signal(sig, p);
1450 out:
1451         spin_unlock_irqrestore(&p->sighand->siglock, flags);
1452         read_unlock(&tasklist_lock);
1453         return ret;
1454 }
1455
1456 /*
1457  * Wake up any threads in the parent blocked in wait* syscalls.
1458  */
1459 static inline void __wake_up_parent(struct task_struct *p,
1460                                     struct task_struct *parent)
1461 {
1462         wake_up_interruptible_sync(&parent->signal->wait_chldexit);
1463 }
1464
1465 /*
1466  * Let a parent know about the death of a child.
1467  * For a stopped/continued status change, use do_notify_parent_cldstop instead.
1468  */
1469
1470 void do_notify_parent(struct task_struct *tsk, int sig)
1471 {
1472         struct siginfo info;
1473         unsigned long flags;
1474         struct sighand_struct *psig;
1475
1476         BUG_ON(sig == -1);
1477
1478         /* do_notify_parent_cldstop should have been called instead.  */
1479         BUG_ON(tsk->state & (TASK_STOPPED|TASK_TRACED));
1480
1481         BUG_ON(tsk->group_leader != tsk || !thread_group_empty(tsk));
1482
1483         info.si_signo = sig;
1484         info.si_errno = 0;
1485         info.si_pid = tsk->pid;
1486         info.si_uid = tsk->uid;
1487
1488         /* FIXME: find out whether or not this is supposed to be c*time. */
1489         info.si_utime = cputime_to_jiffies(cputime_add(tsk->utime,
1490                                                        tsk->signal->utime));
1491         info.si_stime = cputime_to_jiffies(cputime_add(tsk->stime,
1492                                                        tsk->signal->stime));
1493
1494         info.si_status = tsk->exit_code & 0x7f;
1495         if (tsk->exit_code & 0x80)
1496                 info.si_code = CLD_DUMPED;
1497         else if (tsk->exit_code & 0x7f)
1498                 info.si_code = CLD_KILLED;
1499         else {
1500                 info.si_code = CLD_EXITED;
1501                 info.si_status = tsk->exit_code >> 8;
1502         }
1503
1504         psig = tsk->parent->sighand;
1505         spin_lock_irqsave(&psig->siglock, flags);
1506         if (sig == SIGCHLD &&
1507             (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN ||
1508              (psig->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDWAIT))) {
1509                 /*
1510                  * We are exiting and our parent doesn't care.  POSIX.1
1511                  * defines special semantics for setting SIGCHLD to SIG_IGN
1512                  * or setting the SA_NOCLDWAIT flag: we should be reaped
1513                  * automatically and not left for our parent's wait4 call.
1514                  * Rather than having the parent do it as a magic kind of
1515                  * signal handler, we just set this to tell do_exit that we
1516                  * can be cleaned up without becoming a zombie.  Note that
1517                  * we still call __wake_up_parent in this case, because a
1518                  * blocked sys_wait4 might now return -ECHILD.
1519                  *
1520                  * Whether we send SIGCHLD or not for SA_NOCLDWAIT
1521                  * is implementation-defined: we do (if you don't want
1522                  * it, just use SIG_IGN instead).
1523                  */
1524                 tsk->exit_signal = -1;
1525                 if (psig->action[SIGCHLD-1].sa.sa_handler == SIG_IGN)
1526                         sig = 0;
1527         }
1528         if (valid_signal(sig) && sig > 0)
1529                 __group_send_sig_info(sig, &info, tsk->parent);
1530         __wake_up_parent(tsk, tsk->parent);
1531         spin_unlock_irqrestore(&psig->siglock, flags);
1532 }
1533
1534 void do_notify_parent_cldstop(struct task_struct *tsk, int why)
1535 {
1536         struct siginfo info;
1537         unsigned long flags;
1538         struct task_struct *parent;
1539         struct sighand_struct *sighand;
1540
1541         info.si_signo = SIGCHLD;
1542         info.si_errno = 0;
1543         info.si_pid = tsk->pid;
1544         info.si_uid = tsk->uid;
1545
1546         /* FIXME: find out whether or not this is supposed to be c*time. */
1547         info.si_utime = cputime_to_jiffies(tsk->utime);
1548         info.si_stime = cputime_to_jiffies(tsk->stime);
1549
1550         info.si_code = why;
1551         switch (why) {
1552         case CLD_CONTINUED:
1553                 info.si_status = SIGCONT;
1554                 break;
1555         case CLD_STOPPED:
1556                 info.si_status = tsk->signal->group_exit_code & 0x7f;
1557                 break;
1558         case CLD_TRAPPED:
1559                 info.si_status = tsk->exit_code & 0x7f;
1560                 break;
1561         default:
1562                 BUG();
1563         }
1564
1565         /*
1566          * Tracing can decide that we should not do the normal notification.
1567          */
1568         if (tracehook_notify_cldstop(tsk, &info))
1569                 return;
1570
1571         tsk = tsk->group_leader;
1572         parent = tsk->parent;
1573
1574         sighand = parent->sighand;
1575         spin_lock_irqsave(&sighand->siglock, flags);
1576         if (sighand->action[SIGCHLD-1].sa.sa_handler != SIG_IGN &&
1577             !(sighand->action[SIGCHLD-1].sa.sa_flags & SA_NOCLDSTOP))
1578                 __group_send_sig_info(SIGCHLD, &info, parent);
1579         /*
1580          * Even if SIGCHLD is not generated, we must wake up wait4 calls.
1581          */
1582         __wake_up_parent(tsk, parent);
1583         spin_unlock_irqrestore(&sighand->siglock, flags);
1584 }
1585
1586 static void
1587 finish_stop(int stop_count)
1588 {
1589         /*
1590          * If there are no other threads in the group, or if there is
1591          * a group stop in progress and we are the last to stop,
1592          * report to the parent.  When ptraced, every thread reports itself.
1593          */
1594         if (!tracehook_finish_stop(stop_count <= 0) && stop_count <= 0) {
1595                 read_lock(&tasklist_lock);
1596                 do_notify_parent_cldstop(current, CLD_STOPPED);
1597                 read_unlock(&tasklist_lock);
1598         }
1599
1600         schedule();
1601         /*
1602          * Now we don't run again until continued.
1603          */
1604         current->exit_code = 0;
1605 }
1606
1607 /*
1608  * This performs the stopping for SIGSTOP and other stop signals.
1609  * We have to stop all threads in the thread group.
1610  * Returns nonzero if we've actually stopped and released the siglock.
1611  * Returns zero if we didn't stop and still hold the siglock.
1612  */
1613 static int do_signal_stop(int signr)
1614 {
1615         struct signal_struct *sig = current->signal;
1616         int stop_count;
1617
1618         if (!likely(sig->flags & SIGNAL_STOP_DEQUEUED))
1619                 return 0;
1620
1621         if (sig->group_stop_count > 0) {
1622                 /*
1623                  * There is a group stop in progress.  We don't need to
1624                  * start another one.
1625                  */
1626                 stop_count = --sig->group_stop_count;
1627         } else {
1628                 /*
1629                  * There is no group stop already in progress.
1630                  * We must initiate one now.
1631                  */
1632                 struct task_struct *t;
1633
1634                 sig->group_exit_code = signr;
1635
1636                 stop_count = 0;
1637                 for (t = next_thread(current); t != current; t = next_thread(t))
1638                         /*
1639                          * Setting state to TASK_STOPPED for a group
1640                          * stop is always done with the siglock held,
1641                          * so this check has no races.
1642                          */
1643                         if (!t->exit_state &&
1644                             !(t->state & (TASK_STOPPED|TASK_TRACED))) {
1645                                 stop_count++;
1646                                 signal_wake_up(t, 0);
1647                         }
1648                 sig->group_stop_count = stop_count;
1649         }
1650
1651         if (stop_count == 0)
1652                 sig->flags = SIGNAL_STOP_STOPPED;
1653         current->exit_code = sig->group_exit_code;
1654         __set_current_state(TASK_STOPPED);
1655
1656         spin_unlock_irq(&current->sighand->siglock);
1657         finish_stop(stop_count);
1658         return 1;
1659 }
1660
1661 /*
1662  * Do appropriate magic when group_stop_count > 0.
1663  * We return nonzero if we stopped, after releasing the siglock.
1664  * We return zero if we still hold the siglock and should look
1665  * for another signal without checking group_stop_count again.
1666  */
1667 static int handle_group_stop(void)
1668 {
1669         int stop_count;
1670
1671         if (current->signal->group_exit_task == current) {
1672                 /*
1673                  * Group stop is so we can do a core dump,
1674                  * We are the initiating thread, so get on with it.
1675                  */
1676                 current->signal->group_exit_task = NULL;
1677                 return 0;
1678         }
1679
1680         if (current->signal->flags & SIGNAL_GROUP_EXIT)
1681                 /*
1682                  * Group stop is so another thread can do a core dump,
1683                  * or else we are racing against a death signal.
1684                  * Just punt the stop so we can get the next signal.
1685                  */
1686                 return 0;
1687
1688         /*
1689          * There is a group stop in progress.  We stop
1690          * without any associated signal being in our queue.
1691          */
1692         stop_count = --current->signal->group_stop_count;
1693         if (stop_count == 0)
1694                 current->signal->flags = SIGNAL_STOP_STOPPED;
1695         current->exit_code = current->signal->group_exit_code;
1696         set_current_state(TASK_STOPPED);
1697         spin_unlock_irq(&current->sighand->siglock);
1698         finish_stop(stop_count);
1699         return 1;
1700 }
1701
1702 int get_signal_to_deliver(siginfo_t *info, struct k_sigaction *return_ka,
1703                           struct pt_regs *regs, void *cookie)
1704 {
1705         sigset_t *mask = &current->blocked;
1706         int signr = 0;
1707
1708         try_to_freeze();
1709
1710 relock:
1711         spin_lock_irq(&current->sighand->siglock);
1712         for (;;) {
1713                 struct k_sigaction *ka;
1714
1715                 if (unlikely(current->signal->group_stop_count > 0) &&
1716                     handle_group_stop())
1717                         goto relock;
1718
1719                 /*
1720                  * Tracing can induce an artifical signal and choose sigaction.
1721                  * The return value in signr determines the default action,
1722                  * but info->si_signo is the signal number we will report.
1723                  */
1724                 signr = tracehook_get_signal(current, regs, info, return_ka);
1725                 if (unlikely(signr < 0))
1726                         goto relock;
1727                 if (unlikely(signr != 0))
1728                         ka = return_ka;
1729                 else {
1730                         signr = dequeue_signal(current, mask, info);
1731
1732                         if (!signr)
1733                                 break; /* will return 0 */
1734                         ka = &current->sighand->action[signr-1];
1735                 }
1736
1737                 if (ka->sa.sa_handler == SIG_IGN) /* Do nothing.  */
1738                         continue;
1739                 if (ka->sa.sa_handler != SIG_DFL) {
1740                         /* Run the handler.  */
1741                         *return_ka = *ka;
1742
1743                         if (ka->sa.sa_flags & SA_ONESHOT)
1744                                 ka->sa.sa_handler = SIG_DFL;
1745
1746                         break; /* will return non-zero "signr" value */
1747                 }
1748
1749                 /*
1750                  * Now we are doing the default action for this signal.
1751                  */
1752                 if (sig_kernel_ignore(signr)) /* Default is nothing. */
1753                         continue;
1754
1755                 /* Init gets no signals it doesn't want.  */
1756                 if (current == child_reaper)
1757                         continue;
1758
1759                 /* virtual init is protected against user signals */
1760                 if ((info->si_code == SI_USER) &&
1761                         vx_current_initpid(current->pid))
1762                         continue;
1763
1764                 if (sig_kernel_stop(signr)) {
1765                         /*
1766                          * The default action is to stop all threads in
1767                          * the thread group.  The job control signals
1768                          * do nothing in an orphaned pgrp, but SIGSTOP
1769                          * always works.  Note that siglock needs to be
1770                          * dropped during the call to is_orphaned_pgrp()
1771                          * because of lock ordering with tasklist_lock.
1772                          * This allows an intervening SIGCONT to be posted.
1773                          * We need to check for that and bail out if necessary.
1774                          */
1775                         if (signr != SIGSTOP) {
1776                                 spin_unlock_irq(&current->sighand->siglock);
1777
1778                                 /* signals can be posted during this window */
1779
1780                                 if (is_orphaned_pgrp(process_group(current)))
1781                                         goto relock;
1782
1783                                 spin_lock_irq(&current->sighand->siglock);
1784                         }
1785
1786                         if (likely(do_signal_stop(info->si_signo))) {
1787                                 /* It released the siglock.  */
1788                                 goto relock;
1789                         }
1790
1791                         /*
1792                          * We didn't actually stop, due to a race
1793                          * with SIGCONT or something like that.
1794                          */
1795                         continue;
1796                 }
1797
1798                 spin_unlock_irq(&current->sighand->siglock);
1799
1800                 /*
1801                  * Anything else is fatal, maybe with a core dump.
1802                  */
1803                 current->flags |= PF_SIGNALED;
1804                 if (print_fatal_signals)
1805                         print_fatal_signal(regs, signr);
1806                 if (sig_kernel_coredump(signr)) {
1807                         /*
1808                          * If it was able to dump core, this kills all
1809                          * other threads in the group and synchronizes with
1810                          * their demise.  If we lost the race with another
1811                          * thread getting here, it set group_exit_code
1812                          * first and our do_group_exit call below will use
1813                          * that value and ignore the one we pass it.
1814                          */
1815                         do_coredump(info->si_signo, info->si_signo, regs);
1816                 }
1817
1818                 /*
1819                  * Death signals, no core dump.
1820                  */
1821                 do_group_exit(info->si_signo);
1822                 /* NOTREACHED */
1823         }
1824         spin_unlock_irq(&current->sighand->siglock);
1825         return signr;
1826 }
1827
1828 EXPORT_SYMBOL(recalc_sigpending);
1829 EXPORT_SYMBOL_GPL(dequeue_signal);
1830 EXPORT_SYMBOL(flush_signals);
1831 EXPORT_SYMBOL(force_sig);
1832 EXPORT_SYMBOL(kill_pg);
1833 EXPORT_SYMBOL(kill_proc);
1834 EXPORT_SYMBOL(send_sig);
1835 EXPORT_SYMBOL(send_sig_info);
1836 EXPORT_SYMBOL(sigprocmask);
1837 EXPORT_SYMBOL(block_all_signals);
1838 EXPORT_SYMBOL(unblock_all_signals);
1839
1840
1841 /*
1842  * System call entry points.
1843  */
1844
1845 asmlinkage long sys_restart_syscall(void)
1846 {
1847         struct restart_block *restart = &current_thread_info()->restart_block;
1848         return restart->fn(restart);
1849 }
1850
1851 long do_no_restart_syscall(struct restart_block *param)
1852 {
1853         return -EINTR;
1854 }
1855
1856 /*
1857  * We don't need to get the kernel lock - this is all local to this
1858  * particular thread.. (and that's good, because this is _heavily_
1859  * used by various programs)
1860  */
1861
1862 /*
1863  * This is also useful for kernel threads that want to temporarily
1864  * (or permanently) block certain signals.
1865  *
1866  * NOTE! Unlike the user-mode sys_sigprocmask(), the kernel
1867  * interface happily blocks "unblockable" signals like SIGKILL
1868  * and friends.
1869  */
1870 int sigprocmask(int how, sigset_t *set, sigset_t *oldset)
1871 {
1872         int error;
1873
1874         spin_lock_irq(&current->sighand->siglock);
1875         if (oldset)
1876                 *oldset = current->blocked;
1877
1878         error = 0;
1879         switch (how) {
1880         case SIG_BLOCK:
1881                 sigorsets(&current->blocked, &current->blocked, set);
1882                 break;
1883         case SIG_UNBLOCK:
1884                 signandsets(&current->blocked, &current->blocked, set);
1885                 break;
1886         case SIG_SETMASK:
1887                 current->blocked = *set;
1888                 break;
1889         default:
1890                 error = -EINVAL;
1891         }
1892         recalc_sigpending();
1893         spin_unlock_irq(&current->sighand->siglock);
1894
1895         return error;
1896 }
1897
1898 asmlinkage long
1899 sys_rt_sigprocmask(int how, sigset_t __user *set, sigset_t __user *oset, size_t sigsetsize)
1900 {
1901         int error = -EINVAL;
1902         sigset_t old_set, new_set;
1903
1904         /* XXX: Don't preclude handling different sized sigset_t's.  */
1905         if (sigsetsize != sizeof(sigset_t))
1906                 goto out;
1907
1908         if (set) {
1909                 error = -EFAULT;
1910                 if (copy_from_user(&new_set, set, sizeof(*set)))
1911                         goto out;
1912                 sigdelsetmask(&new_set, sigmask(SIGKILL)|sigmask(SIGSTOP));
1913
1914                 error = sigprocmask(how, &new_set, &old_set);
1915                 if (error)
1916                         goto out;
1917                 if (oset)
1918                         goto set_old;
1919         } else if (oset) {
1920                 spin_lock_irq(&current->sighand->siglock);
1921                 old_set = current->blocked;
1922                 spin_unlock_irq(&current->sighand->siglock);
1923
1924         set_old:
1925                 error = -EFAULT;
1926                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
1927                         goto out;
1928         }
1929         error = 0;
1930 out:
1931         return error;
1932 }
1933
1934 long do_sigpending(void __user *set, unsigned long sigsetsize)
1935 {
1936         long error = -EINVAL;
1937         sigset_t pending;
1938
1939         if (sigsetsize > sizeof(sigset_t))
1940                 goto out;
1941
1942         spin_lock_irq(&current->sighand->siglock);
1943         sigorsets(&pending, &current->pending.signal,
1944                   &current->signal->shared_pending.signal);
1945         spin_unlock_irq(&current->sighand->siglock);
1946
1947         /* Outside the lock because only this thread touches it.  */
1948         sigandsets(&pending, &current->blocked, &pending);
1949
1950         error = -EFAULT;
1951         if (!copy_to_user(set, &pending, sigsetsize))
1952                 error = 0;
1953
1954 out:
1955         return error;
1956 }       
1957
1958 asmlinkage long
1959 sys_rt_sigpending(sigset_t __user *set, size_t sigsetsize)
1960 {
1961         return do_sigpending(set, sigsetsize);
1962 }
1963
1964 #ifndef HAVE_ARCH_COPY_SIGINFO_TO_USER
1965
1966 int copy_siginfo_to_user(siginfo_t __user *to, siginfo_t *from)
1967 {
1968         int err;
1969
1970         if (!access_ok (VERIFY_WRITE, to, sizeof(siginfo_t)))
1971                 return -EFAULT;
1972         if (from->si_code < 0)
1973                 return __copy_to_user(to, from, sizeof(siginfo_t))
1974                         ? -EFAULT : 0;
1975         /*
1976          * If you change siginfo_t structure, please be sure
1977          * this code is fixed accordingly.
1978          * It should never copy any pad contained in the structure
1979          * to avoid security leaks, but must copy the generic
1980          * 3 ints plus the relevant union member.
1981          */
1982         err = __put_user(from->si_signo, &to->si_signo);
1983         err |= __put_user(from->si_errno, &to->si_errno);
1984         err |= __put_user((short)from->si_code, &to->si_code);
1985         switch (from->si_code & __SI_MASK) {
1986         case __SI_KILL:
1987                 err |= __put_user(from->si_pid, &to->si_pid);
1988                 err |= __put_user(from->si_uid, &to->si_uid);
1989                 break;
1990         case __SI_TIMER:
1991                  err |= __put_user(from->si_tid, &to->si_tid);
1992                  err |= __put_user(from->si_overrun, &to->si_overrun);
1993                  err |= __put_user(from->si_ptr, &to->si_ptr);
1994                 break;
1995         case __SI_POLL:
1996                 err |= __put_user(from->si_band, &to->si_band);
1997                 err |= __put_user(from->si_fd, &to->si_fd);
1998                 break;
1999         case __SI_FAULT:
2000                 err |= __put_user(from->si_addr, &to->si_addr);
2001 #ifdef __ARCH_SI_TRAPNO
2002                 err |= __put_user(from->si_trapno, &to->si_trapno);
2003 #endif
2004                 break;
2005         case __SI_CHLD:
2006                 err |= __put_user(from->si_pid, &to->si_pid);
2007                 err |= __put_user(from->si_uid, &to->si_uid);
2008                 err |= __put_user(from->si_status, &to->si_status);
2009                 err |= __put_user(from->si_utime, &to->si_utime);
2010                 err |= __put_user(from->si_stime, &to->si_stime);
2011                 break;
2012         case __SI_RT: /* This is not generated by the kernel as of now. */
2013         case __SI_MESGQ: /* But this is */
2014                 err |= __put_user(from->si_pid, &to->si_pid);
2015                 err |= __put_user(from->si_uid, &to->si_uid);
2016                 err |= __put_user(from->si_ptr, &to->si_ptr);
2017                 break;
2018         default: /* this is just in case for now ... */
2019                 err |= __put_user(from->si_pid, &to->si_pid);
2020                 err |= __put_user(from->si_uid, &to->si_uid);
2021                 break;
2022         }
2023         return err;
2024 }
2025
2026 #endif
2027
2028 asmlinkage long
2029 sys_rt_sigtimedwait(const sigset_t __user *uthese,
2030                     siginfo_t __user *uinfo,
2031                     const struct timespec __user *uts,
2032                     size_t sigsetsize)
2033 {
2034         int ret, sig;
2035         sigset_t these;
2036         struct timespec ts;
2037         siginfo_t info;
2038         long timeout = 0;
2039
2040         /* XXX: Don't preclude handling different sized sigset_t's.  */
2041         if (sigsetsize != sizeof(sigset_t))
2042                 return -EINVAL;
2043
2044         if (copy_from_user(&these, uthese, sizeof(these)))
2045                 return -EFAULT;
2046                 
2047         /*
2048          * Invert the set of allowed signals to get those we
2049          * want to block.
2050          */
2051         sigdelsetmask(&these, sigmask(SIGKILL)|sigmask(SIGSTOP));
2052         signotset(&these);
2053
2054         if (uts) {
2055                 if (copy_from_user(&ts, uts, sizeof(ts)))
2056                         return -EFAULT;
2057                 if (ts.tv_nsec >= 1000000000L || ts.tv_nsec < 0
2058                     || ts.tv_sec < 0)
2059                         return -EINVAL;
2060         }
2061
2062         spin_lock_irq(&current->sighand->siglock);
2063         sig = dequeue_signal(current, &these, &info);
2064         if (!sig) {
2065                 timeout = MAX_SCHEDULE_TIMEOUT;
2066                 if (uts)
2067                         timeout = (timespec_to_jiffies(&ts)
2068                                    + (ts.tv_sec || ts.tv_nsec));
2069
2070                 if (timeout) {
2071                         /* None ready -- temporarily unblock those we're
2072                          * interested while we are sleeping in so that we'll
2073                          * be awakened when they arrive.  */
2074                         current->real_blocked = current->blocked;
2075                         sigandsets(&current->blocked, &current->blocked, &these);
2076                         recalc_sigpending();
2077                         spin_unlock_irq(&current->sighand->siglock);
2078
2079                         timeout = schedule_timeout_interruptible(timeout);
2080
2081                         spin_lock_irq(&current->sighand->siglock);
2082                         sig = dequeue_signal(current, &these, &info);
2083                         current->blocked = current->real_blocked;
2084                         siginitset(&current->real_blocked, 0);
2085                         recalc_sigpending();
2086                 }
2087         }
2088         spin_unlock_irq(&current->sighand->siglock);
2089
2090         if (sig) {
2091                 ret = sig;
2092                 if (uinfo) {
2093                         if (copy_siginfo_to_user(uinfo, &info))
2094                                 ret = -EFAULT;
2095                 }
2096         } else {
2097                 ret = -EAGAIN;
2098                 if (timeout)
2099                         ret = -EINTR;
2100         }
2101
2102         return ret;
2103 }
2104
2105 asmlinkage long
2106 sys_kill(int pid, int sig)
2107 {
2108         struct siginfo info;
2109
2110         info.si_signo = sig;
2111         info.si_errno = 0;
2112         info.si_code = SI_USER;
2113         info.si_pid = current->tgid;
2114         info.si_uid = current->uid;
2115
2116         return kill_something_info(sig, &info, pid);
2117 }
2118
2119 static int do_tkill(int tgid, int pid, int sig)
2120 {
2121         int error;
2122         struct siginfo info;
2123         struct task_struct *p;
2124
2125         error = -ESRCH;
2126         info.si_signo = sig;
2127         info.si_errno = 0;
2128         info.si_code = SI_TKILL;
2129         info.si_pid = current->tgid;
2130         info.si_uid = current->uid;
2131
2132         read_lock(&tasklist_lock);
2133         p = find_task_by_pid(pid);
2134         if (p && (tgid <= 0 || p->tgid == tgid)) {
2135                 error = check_kill_permission(sig, &info, p);
2136                 /*
2137                  * The null signal is a permissions and process existence
2138                  * probe.  No signal is actually delivered.
2139                  */
2140                 if (!error && sig && p->sighand) {
2141                         spin_lock_irq(&p->sighand->siglock);
2142                         handle_stop_signal(sig, p);
2143                         error = specific_send_sig_info(sig, &info, p);
2144                         spin_unlock_irq(&p->sighand->siglock);
2145                 }
2146         }
2147         read_unlock(&tasklist_lock);
2148
2149         return error;
2150 }
2151
2152 /**
2153  *  sys_tgkill - send signal to one specific thread
2154  *  @tgid: the thread group ID of the thread
2155  *  @pid: the PID of the thread
2156  *  @sig: signal to be sent
2157  *
2158  *  This syscall also checks the tgid and returns -ESRCH even if the PID
2159  *  exists but it's not belonging to the target process anymore. This
2160  *  method solves the problem of threads exiting and PIDs getting reused.
2161  */
2162 asmlinkage long sys_tgkill(int tgid, int pid, int sig)
2163 {
2164         /* This is only valid for single tasks */
2165         if (pid <= 0 || tgid <= 0)
2166                 return -EINVAL;
2167
2168         return do_tkill(tgid, pid, sig);
2169 }
2170
2171 /*
2172  *  Send a signal to only one task, even if it's a CLONE_THREAD task.
2173  */
2174 asmlinkage long
2175 sys_tkill(int pid, int sig)
2176 {
2177         /* This is only valid for single tasks */
2178         if (pid <= 0)
2179                 return -EINVAL;
2180
2181         return do_tkill(0, pid, sig);
2182 }
2183
2184 asmlinkage long
2185 sys_rt_sigqueueinfo(int pid, int sig, siginfo_t __user *uinfo)
2186 {
2187         siginfo_t info;
2188
2189         if (copy_from_user(&info, uinfo, sizeof(siginfo_t)))
2190                 return -EFAULT;
2191
2192         /* Not even root can pretend to send signals from the kernel.
2193            Nor can they impersonate a kill(), which adds source info.  */
2194         if (info.si_code >= 0)
2195                 return -EPERM;
2196         info.si_signo = sig;
2197
2198         /* POSIX.1b doesn't mention process groups.  */
2199         return kill_proc_info(sig, &info, pid);
2200 }
2201
2202 int do_sigaction(int sig, struct k_sigaction *act, struct k_sigaction *oact)
2203 {
2204         struct k_sigaction *k;
2205         sigset_t mask;
2206
2207         if (!valid_signal(sig) || sig < 1 || (act && sig_kernel_only(sig)))
2208                 return -EINVAL;
2209
2210         k = &current->sighand->action[sig-1];
2211
2212         spin_lock_irq(&current->sighand->siglock);
2213         if (signal_pending(current)) {
2214                 /*
2215                  * If there might be a fatal signal pending on multiple
2216                  * threads, make sure we take it before changing the action.
2217                  */
2218                 spin_unlock_irq(&current->sighand->siglock);
2219                 return -ERESTARTNOINTR;
2220         }
2221
2222         if (oact)
2223                 *oact = *k;
2224
2225         if (act) {
2226                 sigdelsetmask(&act->sa.sa_mask,
2227                               sigmask(SIGKILL) | sigmask(SIGSTOP));
2228                 *k = *act;
2229                 /*
2230                  * POSIX 3.3.1.3:
2231                  *  "Setting a signal action to SIG_IGN for a signal that is
2232                  *   pending shall cause the pending signal to be discarded,
2233                  *   whether or not it is blocked."
2234                  *
2235                  *  "Setting a signal action to SIG_DFL for a signal that is
2236                  *   pending and whose default action is to ignore the signal
2237                  *   (for example, SIGCHLD), shall cause the pending signal to
2238                  *   be discarded, whether or not it is blocked"
2239                  */
2240                 if (act->sa.sa_handler == SIG_IGN ||
2241                    (act->sa.sa_handler == SIG_DFL && sig_kernel_ignore(sig))) {
2242                         struct task_struct *t = current;
2243                         sigemptyset(&mask);
2244                         sigaddset(&mask, sig);
2245                         rm_from_queue_full(&mask, &t->signal->shared_pending);
2246                         do {
2247                                 rm_from_queue_full(&mask, &t->pending);
2248                                 recalc_sigpending_tsk(t);
2249                                 t = next_thread(t);
2250                         } while (t != current);
2251                 }
2252         }
2253
2254         spin_unlock_irq(&current->sighand->siglock);
2255         return 0;
2256 }
2257
2258 int 
2259 do_sigaltstack (const stack_t __user *uss, stack_t __user *uoss, unsigned long sp)
2260 {
2261         stack_t oss;
2262         int error;
2263
2264         if (uoss) {
2265                 oss.ss_sp = (void __user *) current->sas_ss_sp;
2266                 oss.ss_size = current->sas_ss_size;
2267                 oss.ss_flags = sas_ss_flags(sp);
2268         }
2269
2270         if (uss) {
2271                 void __user *ss_sp;
2272                 size_t ss_size;
2273                 int ss_flags;
2274
2275                 error = -EFAULT;
2276                 if (!access_ok(VERIFY_READ, uss, sizeof(*uss))
2277                     || __get_user(ss_sp, &uss->ss_sp)
2278                     || __get_user(ss_flags, &uss->ss_flags)
2279                     || __get_user(ss_size, &uss->ss_size))
2280                         goto out;
2281
2282                 error = -EPERM;
2283                 if (on_sig_stack(sp))
2284                         goto out;
2285
2286                 error = -EINVAL;
2287                 /*
2288                  *
2289                  * Note - this code used to test ss_flags incorrectly
2290                  *        old code may have been written using ss_flags==0
2291                  *        to mean ss_flags==SS_ONSTACK (as this was the only
2292                  *        way that worked) - this fix preserves that older
2293                  *        mechanism
2294                  */
2295                 if (ss_flags != SS_DISABLE && ss_flags != SS_ONSTACK && ss_flags != 0)
2296                         goto out;
2297
2298                 if (ss_flags == SS_DISABLE) {
2299                         ss_size = 0;
2300                         ss_sp = NULL;
2301                 } else {
2302                         error = -ENOMEM;
2303                         if (ss_size < MINSIGSTKSZ)
2304                                 goto out;
2305                 }
2306
2307                 current->sas_ss_sp = (unsigned long) ss_sp;
2308                 current->sas_ss_size = ss_size;
2309         }
2310
2311         if (uoss) {
2312                 error = -EFAULT;
2313                 if (copy_to_user(uoss, &oss, sizeof(oss)))
2314                         goto out;
2315         }
2316
2317         error = 0;
2318 out:
2319         return error;
2320 }
2321
2322 #ifdef __ARCH_WANT_SYS_SIGPENDING
2323
2324 asmlinkage long
2325 sys_sigpending(old_sigset_t __user *set)
2326 {
2327         return do_sigpending(set, sizeof(*set));
2328 }
2329
2330 #endif
2331
2332 #ifdef __ARCH_WANT_SYS_SIGPROCMASK
2333 /* Some platforms have their own version with special arguments others
2334    support only sys_rt_sigprocmask.  */
2335
2336 asmlinkage long
2337 sys_sigprocmask(int how, old_sigset_t __user *set, old_sigset_t __user *oset)
2338 {
2339         int error;
2340         old_sigset_t old_set, new_set;
2341
2342         if (set) {
2343                 error = -EFAULT;
2344                 if (copy_from_user(&new_set, set, sizeof(*set)))
2345                         goto out;
2346                 new_set &= ~(sigmask(SIGKILL) | sigmask(SIGSTOP));
2347
2348                 spin_lock_irq(&current->sighand->siglock);
2349                 old_set = current->blocked.sig[0];
2350
2351                 error = 0;
2352                 switch (how) {
2353                 default:
2354                         error = -EINVAL;
2355                         break;
2356                 case SIG_BLOCK:
2357                         sigaddsetmask(&current->blocked, new_set);
2358                         break;
2359                 case SIG_UNBLOCK:
2360                         sigdelsetmask(&current->blocked, new_set);
2361                         break;
2362                 case SIG_SETMASK:
2363                         current->blocked.sig[0] = new_set;
2364                         break;
2365                 }
2366
2367                 recalc_sigpending();
2368                 spin_unlock_irq(&current->sighand->siglock);
2369                 if (error)
2370                         goto out;
2371                 if (oset)
2372                         goto set_old;
2373         } else if (oset) {
2374                 old_set = current->blocked.sig[0];
2375         set_old:
2376                 error = -EFAULT;
2377                 if (copy_to_user(oset, &old_set, sizeof(*oset)))
2378                         goto out;
2379         }
2380         error = 0;
2381 out:
2382         return error;
2383 }
2384 #endif /* __ARCH_WANT_SYS_SIGPROCMASK */
2385
2386 #ifdef __ARCH_WANT_SYS_RT_SIGACTION
2387 asmlinkage long
2388 sys_rt_sigaction(int sig,
2389                  const struct sigaction __user *act,
2390                  struct sigaction __user *oact,
2391                  size_t sigsetsize)
2392 {
2393         struct k_sigaction new_sa, old_sa;
2394         int ret = -EINVAL;
2395
2396         /* XXX: Don't preclude handling different sized sigset_t's.  */
2397         if (sigsetsize != sizeof(sigset_t))
2398                 goto out;
2399
2400         if (act) {
2401                 if (copy_from_user(&new_sa.sa, act, sizeof(new_sa.sa)))
2402                         return -EFAULT;
2403         }
2404
2405         ret = do_sigaction(sig, act ? &new_sa : NULL, oact ? &old_sa : NULL);
2406
2407         if (!ret && oact) {
2408                 if (copy_to_user(oact, &old_sa.sa, sizeof(old_sa.sa)))
2409                         return -EFAULT;
2410         }
2411 out:
2412         return ret;
2413 }
2414 #endif /* __ARCH_WANT_SYS_RT_SIGACTION */
2415
2416 #ifdef __ARCH_WANT_SYS_SGETMASK
2417
2418 /*
2419  * For backwards compatibility.  Functionality superseded by sigprocmask.
2420  */
2421 asmlinkage long
2422 sys_sgetmask(void)
2423 {
2424         /* SMP safe */
2425         return current->blocked.sig[0];
2426 }
2427
2428 asmlinkage long
2429 sys_ssetmask(int newmask)
2430 {
2431         int old;
2432
2433         spin_lock_irq(&current->sighand->siglock);
2434         old = current->blocked.sig[0];
2435
2436         siginitset(&current->blocked, newmask & ~(sigmask(SIGKILL)|
2437                                                   sigmask(SIGSTOP)));
2438         recalc_sigpending();
2439         spin_unlock_irq(&current->sighand->siglock);
2440
2441         return old;
2442 }
2443 #endif /* __ARCH_WANT_SGETMASK */
2444
2445 #ifdef __ARCH_WANT_SYS_SIGNAL
2446 /*
2447  * For backwards compatibility.  Functionality superseded by sigaction.
2448  */
2449 asmlinkage unsigned long
2450 sys_signal(int sig, __sighandler_t handler)
2451 {
2452         struct k_sigaction new_sa, old_sa;
2453         int ret;
2454
2455         new_sa.sa.sa_handler = handler;
2456         new_sa.sa.sa_flags = SA_ONESHOT | SA_NOMASK;
2457         sigemptyset(&new_sa.sa.sa_mask);
2458
2459         ret = do_sigaction(sig, &new_sa, &old_sa);
2460
2461         return ret ? ret : (unsigned long)old_sa.sa.sa_handler;
2462 }
2463 #endif /* __ARCH_WANT_SYS_SIGNAL */
2464
2465 #ifdef __ARCH_WANT_SYS_PAUSE
2466
2467 asmlinkage long
2468 sys_pause(void)
2469 {
2470         current->state = TASK_INTERRUPTIBLE;
2471         schedule();
2472         return -ERESTARTNOHAND;
2473 }
2474
2475 #endif
2476
2477 #ifdef __ARCH_WANT_SYS_RT_SIGSUSPEND
2478 asmlinkage long sys_rt_sigsuspend(sigset_t __user *unewset, size_t sigsetsize)
2479 {
2480         sigset_t newset;
2481
2482         /* XXX: Don't preclude handling different sized sigset_t's.  */
2483         if (sigsetsize != sizeof(sigset_t))
2484                 return -EINVAL;
2485
2486         if (copy_from_user(&newset, unewset, sizeof(newset)))
2487                 return -EFAULT;
2488         sigdelsetmask(&newset, sigmask(SIGKILL)|sigmask(SIGSTOP));
2489
2490         spin_lock_irq(&current->sighand->siglock);
2491         current->saved_sigmask = current->blocked;
2492         current->blocked = newset;
2493         recalc_sigpending();
2494         spin_unlock_irq(&current->sighand->siglock);
2495
2496         current->state = TASK_INTERRUPTIBLE;
2497         schedule();
2498         set_thread_flag(TIF_RESTORE_SIGMASK);
2499         return -ERESTARTNOHAND;
2500 }
2501 #endif /* __ARCH_WANT_SYS_RT_SIGSUSPEND */
2502
2503 void __init signals_init(void)
2504 {
2505         sigqueue_cachep =
2506                 kmem_cache_create("sigqueue",
2507                                   sizeof(struct sigqueue),
2508                                   __alignof__(struct sigqueue),
2509                                   SLAB_PANIC, NULL, NULL);
2510 }