fedora core 6 1.2949 + vserver 2.2.0
[linux-2.6.git] / kernel / module.c
1 /*
2    Copyright (C) 2002 Richard Henderson
3    Copyright (C) 2001 Rusty Russell, 2002 Rusty Russell IBM.
4
5     This program is free software; you can redistribute it and/or modify
6     it under the terms of the GNU General Public License as published by
7     the Free Software Foundation; either version 2 of the License, or
8     (at your option) any later version.
9
10     This program is distributed in the hope that it will be useful,
11     but WITHOUT ANY WARRANTY; without even the implied warranty of
12     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13     GNU General Public License for more details.
14
15     You should have received a copy of the GNU General Public License
16     along with this program; if not, write to the Free Software
17     Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
18 */
19 #include <linux/module.h>
20 #include <linux/moduleloader.h>
21 #include <linux/init.h>
22 #include <linux/kernel.h>
23 #include <linux/slab.h>
24 #include <linux/vmalloc.h>
25 #include <linux/elf.h>
26 #include <linux/seq_file.h>
27 #include <linux/syscalls.h>
28 #include <linux/fcntl.h>
29 #include <linux/rcupdate.h>
30 #include <linux/capability.h>
31 #include <linux/cpu.h>
32 #include <linux/moduleparam.h>
33 #include <linux/errno.h>
34 #include <linux/err.h>
35 #include <linux/vermagic.h>
36 #include <linux/notifier.h>
37 #include <linux/sched.h>
38 #include <linux/stop_machine.h>
39 #include <linux/device.h>
40 #include <linux/string.h>
41 #include <linux/mutex.h>
42 #include <linux/unwind.h>
43 #include <asm/uaccess.h>
44 #include <asm/semaphore.h>
45 #include <asm/cacheflush.h>
46 #include <linux/license.h>
47 #include "module-verify.h"
48
49 #if 0
50 #define DEBUGP printk
51 #else
52 #define DEBUGP(fmt , a...)
53 #endif
54
55 #ifndef ARCH_SHF_SMALL
56 #define ARCH_SHF_SMALL 0
57 #endif
58
59 /* If this is set, the section belongs in the init part of the module */
60 #define INIT_OFFSET_MASK (1UL << (BITS_PER_LONG-1))
61
62 /* Protects module list */
63 static DEFINE_SPINLOCK(modlist_lock);
64
65 /* List of modules, protected by module_mutex AND modlist_lock */
66 static DEFINE_MUTEX(module_mutex);
67 static LIST_HEAD(modules);
68
69 static BLOCKING_NOTIFIER_HEAD(module_notify_list);
70
71 int register_module_notifier(struct notifier_block * nb)
72 {
73         return blocking_notifier_chain_register(&module_notify_list, nb);
74 }
75 EXPORT_SYMBOL(register_module_notifier);
76
77 int unregister_module_notifier(struct notifier_block * nb)
78 {
79         return blocking_notifier_chain_unregister(&module_notify_list, nb);
80 }
81 EXPORT_SYMBOL(unregister_module_notifier);
82
83 /* We require a truly strong try_module_get() */
84 static inline int strong_try_module_get(struct module *mod)
85 {
86         if (mod && mod->state == MODULE_STATE_COMING)
87                 return 0;
88         return try_module_get(mod);
89 }
90
91 static inline void add_taint_module(struct module *mod, unsigned flag)
92 {
93         add_taint(flag);
94         mod->taints |= flag;
95 }
96
97 /* A thread that wants to hold a reference to a module only while it
98  * is running can call ths to safely exit.
99  * nfsd and lockd use this.
100  */
101 void __module_put_and_exit(struct module *mod, long code)
102 {
103         module_put(mod);
104         do_exit(code);
105 }
106 EXPORT_SYMBOL(__module_put_and_exit);
107         
108 /* Find a module section: 0 means not found. */
109 static unsigned int find_sec(Elf_Ehdr *hdr,
110                              Elf_Shdr *sechdrs,
111                              const char *secstrings,
112                              const char *name)
113 {
114         unsigned int i;
115
116         for (i = 1; i < hdr->e_shnum; i++)
117                 /* Alloc bit cleared means "ignore it." */
118                 if ((sechdrs[i].sh_flags & SHF_ALLOC)
119                     && strcmp(secstrings+sechdrs[i].sh_name, name) == 0)
120                         return i;
121         return 0;
122 }
123
124 /* Provided by the linker */
125 extern const struct kernel_symbol __start___ksymtab[];
126 extern const struct kernel_symbol __stop___ksymtab[];
127 extern const struct kernel_symbol __start___ksymtab_gpl[];
128 extern const struct kernel_symbol __stop___ksymtab_gpl[];
129 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
130 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
131 extern const struct kernel_symbol __start___ksymtab_unused[];
132 extern const struct kernel_symbol __stop___ksymtab_unused[];
133 extern const struct kernel_symbol __start___ksymtab_unused_gpl[];
134 extern const struct kernel_symbol __stop___ksymtab_unused_gpl[];
135 extern const struct kernel_symbol __start___ksymtab_gpl_future[];
136 extern const struct kernel_symbol __stop___ksymtab_gpl_future[];
137 extern const unsigned long __start___kcrctab[];
138 extern const unsigned long __start___kcrctab_gpl[];
139 extern const unsigned long __start___kcrctab_gpl_future[];
140 extern const unsigned long __start___kcrctab_unused[];
141 extern const unsigned long __start___kcrctab_unused_gpl[];
142
143 #ifndef CONFIG_MODVERSIONS
144 #define symversion(base, idx) NULL
145 #else
146 #define symversion(base, idx) ((base != NULL) ? ((base) + (idx)) : NULL)
147 #endif
148
149 /* lookup symbol in given range of kernel_symbols */
150 static const struct kernel_symbol *lookup_symbol(const char *name,
151         const struct kernel_symbol *start,
152         const struct kernel_symbol *stop)
153 {
154         const struct kernel_symbol *ks = start;
155         for (; ks < stop; ks++)
156                 if (strcmp(ks->name, name) == 0)
157                         return ks;
158         return NULL;
159 }
160
161 static void printk_unused_warning(const char *name)
162 {
163         printk(KERN_WARNING "Symbol %s is marked as UNUSED, "
164                 "however this module is using it.\n", name);
165         printk(KERN_WARNING "This symbol will go away in the future.\n");
166         printk(KERN_WARNING "Please evalute if this is the right api to use, "
167                 "and if it really is, submit a report the linux kernel "
168                 "mailinglist together with submitting your code for "
169                 "inclusion.\n");
170 }
171
172 /* Find a symbol, return value, crc and module which owns it */
173 static unsigned long __find_symbol(const char *name,
174                                    struct module **owner,
175                                    const unsigned long **crc,
176                                    int gplok)
177 {
178         struct module *mod;
179         const struct kernel_symbol *ks;
180
181         /* Core kernel first. */ 
182         *owner = NULL;
183         ks = lookup_symbol(name, __start___ksymtab, __stop___ksymtab);
184         if (ks) {
185                 *crc = symversion(__start___kcrctab, (ks - __start___ksymtab));
186                 return ks->value;
187         }
188         if (gplok) {
189                 ks = lookup_symbol(name, __start___ksymtab_gpl,
190                                          __stop___ksymtab_gpl);
191                 if (ks) {
192                         *crc = symversion(__start___kcrctab_gpl,
193                                           (ks - __start___ksymtab_gpl));
194                         return ks->value;
195                 }
196         }
197         ks = lookup_symbol(name, __start___ksymtab_gpl_future,
198                                  __stop___ksymtab_gpl_future);
199         if (ks) {
200                 if (!gplok) {
201                         printk(KERN_WARNING "Symbol %s is being used "
202                                "by a non-GPL module, which will not "
203                                "be allowed in the future\n", name);
204                         printk(KERN_WARNING "Please see the file "
205                                "Documentation/feature-removal-schedule.txt "
206                                "in the kernel source tree for more "
207                                "details.\n");
208                 }
209                 *crc = symversion(__start___kcrctab_gpl_future,
210                                   (ks - __start___ksymtab_gpl_future));
211                 return ks->value;
212         }
213
214         ks = lookup_symbol(name, __start___ksymtab_unused,
215                                  __stop___ksymtab_unused);
216         if (ks) {
217                 printk_unused_warning(name);
218                 *crc = symversion(__start___kcrctab_unused,
219                                   (ks - __start___ksymtab_unused));
220                 return ks->value;
221         }
222
223         if (gplok)
224                 ks = lookup_symbol(name, __start___ksymtab_unused_gpl,
225                                  __stop___ksymtab_unused_gpl);
226         if (ks) {
227                 printk_unused_warning(name);
228                 *crc = symversion(__start___kcrctab_unused_gpl,
229                                   (ks - __start___ksymtab_unused_gpl));
230                 return ks->value;
231         }
232
233         /* Now try modules. */ 
234         list_for_each_entry(mod, &modules, list) {
235                 *owner = mod;
236                 ks = lookup_symbol(name, mod->syms, mod->syms + mod->num_syms);
237                 if (ks) {
238                         *crc = symversion(mod->crcs, (ks - mod->syms));
239                         return ks->value;
240                 }
241
242                 if (gplok) {
243                         ks = lookup_symbol(name, mod->gpl_syms,
244                                            mod->gpl_syms + mod->num_gpl_syms);
245                         if (ks) {
246                                 *crc = symversion(mod->gpl_crcs,
247                                                   (ks - mod->gpl_syms));
248                                 return ks->value;
249                         }
250                 }
251                 ks = lookup_symbol(name, mod->unused_syms, mod->unused_syms + mod->num_unused_syms);
252                 if (ks) {
253                         printk_unused_warning(name);
254                         *crc = symversion(mod->unused_crcs, (ks - mod->unused_syms));
255                         return ks->value;
256                 }
257
258                 if (gplok) {
259                         ks = lookup_symbol(name, mod->unused_gpl_syms,
260                                            mod->unused_gpl_syms + mod->num_unused_gpl_syms);
261                         if (ks) {
262                                 printk_unused_warning(name);
263                                 *crc = symversion(mod->unused_gpl_crcs,
264                                                   (ks - mod->unused_gpl_syms));
265                                 return ks->value;
266                         }
267                 }
268                 ks = lookup_symbol(name, mod->gpl_future_syms,
269                                    (mod->gpl_future_syms +
270                                     mod->num_gpl_future_syms));
271                 if (ks) {
272                         if (!gplok) {
273                                 printk(KERN_WARNING "Symbol %s is being used "
274                                        "by a non-GPL module, which will not "
275                                        "be allowed in the future\n", name);
276                                 printk(KERN_WARNING "Please see the file "
277                                        "Documentation/feature-removal-schedule.txt "
278                                        "in the kernel source tree for more "
279                                        "details.\n");
280                         }
281                         *crc = symversion(mod->gpl_future_crcs,
282                                           (ks - mod->gpl_future_syms));
283                         return ks->value;
284                 }
285         }
286         DEBUGP("Failed to find symbol %s\n", name);
287         return 0;
288 }
289
290 /* Search for module by name: must hold module_mutex. */
291 static struct module *find_module(const char *name)
292 {
293         struct module *mod;
294
295         list_for_each_entry(mod, &modules, list) {
296                 if (strcmp(mod->name, name) == 0)
297                         return mod;
298         }
299         return NULL;
300 }
301
302 #ifdef CONFIG_SMP
303 /* Number of blocks used and allocated. */
304 static unsigned int pcpu_num_used, pcpu_num_allocated;
305 /* Size of each block.  -ve means used. */
306 static int *pcpu_size;
307
308 static int split_block(unsigned int i, unsigned short size)
309 {
310         /* Reallocation required? */
311         if (pcpu_num_used + 1 > pcpu_num_allocated) {
312                 int *new = kmalloc(sizeof(new[0]) * pcpu_num_allocated*2,
313                                    GFP_KERNEL);
314                 if (!new)
315                         return 0;
316
317                 memcpy(new, pcpu_size, sizeof(new[0])*pcpu_num_allocated);
318                 pcpu_num_allocated *= 2;
319                 kfree(pcpu_size);
320                 pcpu_size = new;
321         }
322
323         /* Insert a new subblock */
324         memmove(&pcpu_size[i+1], &pcpu_size[i],
325                 sizeof(pcpu_size[0]) * (pcpu_num_used - i));
326         pcpu_num_used++;
327
328         pcpu_size[i+1] -= size;
329         pcpu_size[i] = size;
330         return 1;
331 }
332
333 static inline unsigned int block_size(int val)
334 {
335         if (val < 0)
336                 return -val;
337         return val;
338 }
339
340 /* Created by linker magic */
341 extern char __per_cpu_start[], __per_cpu_end[];
342
343 static void *percpu_modalloc(unsigned long size, unsigned long align,
344                              const char *name)
345 {
346         unsigned long extra;
347         unsigned int i;
348         void *ptr;
349
350         if (align > SMP_CACHE_BYTES) {
351                 printk(KERN_WARNING "%s: per-cpu alignment %li > %i\n",
352                        name, align, SMP_CACHE_BYTES);
353                 align = SMP_CACHE_BYTES;
354         }
355
356         ptr = __per_cpu_start;
357         for (i = 0; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
358                 /* Extra for alignment requirement. */
359                 extra = ALIGN((unsigned long)ptr, align) - (unsigned long)ptr;
360                 BUG_ON(i == 0 && extra != 0);
361
362                 if (pcpu_size[i] < 0 || pcpu_size[i] < extra + size)
363                         continue;
364
365                 /* Transfer extra to previous block. */
366                 if (pcpu_size[i-1] < 0)
367                         pcpu_size[i-1] -= extra;
368                 else
369                         pcpu_size[i-1] += extra;
370                 pcpu_size[i] -= extra;
371                 ptr += extra;
372
373                 /* Split block if warranted */
374                 if (pcpu_size[i] - size > sizeof(unsigned long))
375                         if (!split_block(i, size))
376                                 return NULL;
377
378                 /* Mark allocated */
379                 pcpu_size[i] = -pcpu_size[i];
380                 return ptr;
381         }
382
383         printk(KERN_WARNING "Could not allocate %lu bytes percpu data\n",
384                size);
385         return NULL;
386 }
387
388 static void percpu_modfree(void *freeme)
389 {
390         unsigned int i;
391         void *ptr = __per_cpu_start + block_size(pcpu_size[0]);
392
393         /* First entry is core kernel percpu data. */
394         for (i = 1; i < pcpu_num_used; ptr += block_size(pcpu_size[i]), i++) {
395                 if (ptr == freeme) {
396                         pcpu_size[i] = -pcpu_size[i];
397                         goto free;
398                 }
399         }
400         BUG();
401
402  free:
403         /* Merge with previous? */
404         if (pcpu_size[i-1] >= 0) {
405                 pcpu_size[i-1] += pcpu_size[i];
406                 pcpu_num_used--;
407                 memmove(&pcpu_size[i], &pcpu_size[i+1],
408                         (pcpu_num_used - i) * sizeof(pcpu_size[0]));
409                 i--;
410         }
411         /* Merge with next? */
412         if (i+1 < pcpu_num_used && pcpu_size[i+1] >= 0) {
413                 pcpu_size[i] += pcpu_size[i+1];
414                 pcpu_num_used--;
415                 memmove(&pcpu_size[i+1], &pcpu_size[i+2],
416                         (pcpu_num_used - (i+1)) * sizeof(pcpu_size[0]));
417         }
418 }
419
420 static unsigned int find_pcpusec(Elf_Ehdr *hdr,
421                                  Elf_Shdr *sechdrs,
422                                  const char *secstrings)
423 {
424         return find_sec(hdr, sechdrs, secstrings, ".data.percpu");
425 }
426
427 static int percpu_modinit(void)
428 {
429         pcpu_num_used = 2;
430         pcpu_num_allocated = 2;
431         pcpu_size = kmalloc(sizeof(pcpu_size[0]) * pcpu_num_allocated,
432                             GFP_KERNEL);
433         /* Static in-kernel percpu data (used). */
434         pcpu_size[0] = -ALIGN(__per_cpu_end-__per_cpu_start, SMP_CACHE_BYTES);
435         /* Free room. */
436         pcpu_size[1] = PERCPU_ENOUGH_ROOM + pcpu_size[0];
437         if (pcpu_size[1] < 0) {
438                 printk(KERN_ERR "No per-cpu room for modules.\n");
439                 pcpu_num_used = 1;
440         }
441
442         return 0;
443 }       
444 __initcall(percpu_modinit);
445 #else /* ... !CONFIG_SMP */
446 static inline void *percpu_modalloc(unsigned long size, unsigned long align,
447                                     const char *name)
448 {
449         return NULL;
450 }
451 static inline void percpu_modfree(void *pcpuptr)
452 {
453         BUG();
454 }
455 static inline unsigned int find_pcpusec(Elf_Ehdr *hdr,
456                                         Elf_Shdr *sechdrs,
457                                         const char *secstrings)
458 {
459         return 0;
460 }
461 static inline void percpu_modcopy(void *pcpudst, const void *src,
462                                   unsigned long size)
463 {
464         /* pcpusec should be 0, and size of that section should be 0. */
465         BUG_ON(size != 0);
466 }
467 #endif /* CONFIG_SMP */
468
469 #define MODINFO_ATTR(field)     \
470 static void setup_modinfo_##field(struct module *mod, const char *s)  \
471 {                                                                     \
472         mod->field = kstrdup(s, GFP_KERNEL);                          \
473 }                                                                     \
474 static ssize_t show_modinfo_##field(struct module_attribute *mattr,   \
475                         struct module *mod, char *buffer)             \
476 {                                                                     \
477         return sprintf(buffer, "%s\n", mod->field);                   \
478 }                                                                     \
479 static int modinfo_##field##_exists(struct module *mod)               \
480 {                                                                     \
481         return mod->field != NULL;                                    \
482 }                                                                     \
483 static void free_modinfo_##field(struct module *mod)                  \
484 {                                                                     \
485         kfree(mod->field);                                            \
486         mod->field = NULL;                                            \
487 }                                                                     \
488 static struct module_attribute modinfo_##field = {                    \
489         .attr = { .name = __stringify(field), .mode = 0444,           \
490                   .owner = THIS_MODULE },                             \
491         .show = show_modinfo_##field,                                 \
492         .setup = setup_modinfo_##field,                               \
493         .test = modinfo_##field##_exists,                             \
494         .free = free_modinfo_##field,                                 \
495 };
496
497 MODINFO_ATTR(version);
498 MODINFO_ATTR(srcversion);
499
500 #ifdef CONFIG_MODULE_UNLOAD
501 /* Init the unload section of the module. */
502 static void module_unload_init(struct module *mod)
503 {
504         unsigned int i;
505
506         INIT_LIST_HEAD(&mod->modules_which_use_me);
507         for (i = 0; i < NR_CPUS; i++)
508                 local_set(&mod->ref[i].count, 0);
509         /* Hold reference count during initialization. */
510         local_set(&mod->ref[raw_smp_processor_id()].count, 1);
511         /* Backwards compatibility macros put refcount during init. */
512         mod->waiter = current;
513 }
514
515 /* modules using other modules */
516 struct module_use
517 {
518         struct list_head list;
519         struct module *module_which_uses;
520 };
521
522 /* Does a already use b? */
523 static int already_uses(struct module *a, struct module *b)
524 {
525         struct module_use *use;
526
527         list_for_each_entry(use, &b->modules_which_use_me, list) {
528                 if (use->module_which_uses == a) {
529                         DEBUGP("%s uses %s!\n", a->name, b->name);
530                         return 1;
531                 }
532         }
533         DEBUGP("%s does not use %s!\n", a->name, b->name);
534         return 0;
535 }
536
537 /* Module a uses b */
538 static int use_module(struct module *a, struct module *b)
539 {
540         struct module_use *use;
541         if (b == NULL || already_uses(a, b)) return 1;
542
543         if (!strong_try_module_get(b))
544                 return 0;
545
546         DEBUGP("Allocating new usage for %s.\n", a->name);
547         use = kmalloc(sizeof(*use), GFP_ATOMIC);
548         if (!use) {
549                 printk("%s: out of memory loading\n", a->name);
550                 module_put(b);
551                 return 0;
552         }
553
554         use->module_which_uses = a;
555         list_add(&use->list, &b->modules_which_use_me);
556         return 1;
557 }
558
559 /* Clear the unload stuff of the module. */
560 static void module_unload_free(struct module *mod)
561 {
562         struct module *i;
563
564         list_for_each_entry(i, &modules, list) {
565                 struct module_use *use;
566
567                 list_for_each_entry(use, &i->modules_which_use_me, list) {
568                         if (use->module_which_uses == mod) {
569                                 DEBUGP("%s unusing %s\n", mod->name, i->name);
570                                 module_put(i);
571                                 list_del(&use->list);
572                                 kfree(use);
573                                 /* There can be at most one match. */
574                                 break;
575                         }
576                 }
577         }
578 }
579
580 #ifdef CONFIG_MODULE_FORCE_UNLOAD
581 static inline int try_force_unload(unsigned int flags)
582 {
583         int ret = (flags & O_TRUNC);
584         if (ret)
585                 add_taint(TAINT_FORCED_RMMOD);
586         return ret;
587 }
588 #else
589 static inline int try_force_unload(unsigned int flags)
590 {
591         return 0;
592 }
593 #endif /* CONFIG_MODULE_FORCE_UNLOAD */
594
595 struct stopref
596 {
597         struct module *mod;
598         int flags;
599         int *forced;
600 };
601
602 /* Whole machine is stopped with interrupts off when this runs. */
603 static int __try_stop_module(void *_sref)
604 {
605         struct stopref *sref = _sref;
606
607         /* If it's not unused, quit unless we are told to block. */
608         if ((sref->flags & O_NONBLOCK) && module_refcount(sref->mod) != 0) {
609                 if (!(*sref->forced = try_force_unload(sref->flags)))
610                         return -EWOULDBLOCK;
611         }
612
613         /* Mark it as dying. */
614         sref->mod->state = MODULE_STATE_GOING;
615         return 0;
616 }
617
618 static int try_stop_module(struct module *mod, int flags, int *forced)
619 {
620         struct stopref sref = { mod, flags, forced };
621
622         return stop_machine_run(__try_stop_module, &sref, NR_CPUS);
623 }
624
625 unsigned int module_refcount(struct module *mod)
626 {
627         unsigned int i, total = 0;
628
629         for (i = 0; i < NR_CPUS; i++)
630                 total += local_read(&mod->ref[i].count);
631         return total;
632 }
633 EXPORT_SYMBOL(module_refcount);
634
635 /* This exists whether we can unload or not */
636 static void free_module(struct module *mod);
637
638 static void wait_for_zero_refcount(struct module *mod)
639 {
640         /* Since we might sleep for some time, drop the semaphore first */
641         mutex_unlock(&module_mutex);
642         for (;;) {
643                 DEBUGP("Looking at refcount...\n");
644                 set_current_state(TASK_UNINTERRUPTIBLE);
645                 if (module_refcount(mod) == 0)
646                         break;
647                 schedule();
648         }
649         current->state = TASK_RUNNING;
650         mutex_lock(&module_mutex);
651 }
652
653 asmlinkage long
654 sys_delete_module(const char __user *name_user, unsigned int flags)
655 {
656         struct module *mod;
657         char name[MODULE_NAME_LEN];
658         int ret, forced = 0;
659
660         if (!capable(CAP_SYS_MODULE))
661                 return -EPERM;
662
663         if (strncpy_from_user(name, name_user, MODULE_NAME_LEN-1) < 0)
664                 return -EFAULT;
665         name[MODULE_NAME_LEN-1] = '\0';
666
667         if (mutex_lock_interruptible(&module_mutex) != 0)
668                 return -EINTR;
669
670         mod = find_module(name);
671         if (!mod) {
672                 ret = -ENOENT;
673                 goto out;
674         }
675
676         if (!list_empty(&mod->modules_which_use_me)) {
677                 /* Other modules depend on us: get rid of them first. */
678                 ret = -EWOULDBLOCK;
679                 goto out;
680         }
681
682         /* Doing init or already dying? */
683         if (mod->state != MODULE_STATE_LIVE) {
684                 /* FIXME: if (force), slam module count and wake up
685                    waiter --RR */
686                 DEBUGP("%s already dying\n", mod->name);
687                 ret = -EBUSY;
688                 goto out;
689         }
690
691         /* If it has an init func, it must have an exit func to unload */
692         if ((mod->init != NULL && mod->exit == NULL)
693             || mod->unsafe) {
694                 forced = try_force_unload(flags);
695                 if (!forced) {
696                         /* This module can't be removed */
697                         ret = -EBUSY;
698                         goto out;
699                 }
700         }
701
702         /* Set this up before setting mod->state */
703         mod->waiter = current;
704
705         /* Stop the machine so refcounts can't move and disable module. */
706         ret = try_stop_module(mod, flags, &forced);
707         if (ret != 0)
708                 goto out;
709
710         /* Never wait if forced. */
711         if (!forced && module_refcount(mod) != 0)
712                 wait_for_zero_refcount(mod);
713
714         /* Final destruction now noone is using it. */
715         if (mod->exit != NULL) {
716                 mutex_unlock(&module_mutex);
717                 mod->exit();
718                 mutex_lock(&module_mutex);
719         }
720         free_module(mod);
721
722  out:
723         mutex_unlock(&module_mutex);
724         return ret;
725 }
726
727 static void print_unload_info(struct seq_file *m, struct module *mod)
728 {
729         struct module_use *use;
730         int printed_something = 0;
731
732         seq_printf(m, " %u ", module_refcount(mod));
733
734         /* Always include a trailing , so userspace can differentiate
735            between this and the old multi-field proc format. */
736         list_for_each_entry(use, &mod->modules_which_use_me, list) {
737                 printed_something = 1;
738                 seq_printf(m, "%s,", use->module_which_uses->name);
739         }
740
741         if (mod->unsafe) {
742                 printed_something = 1;
743                 seq_printf(m, "[unsafe],");
744         }
745
746         if (mod->init != NULL && mod->exit == NULL) {
747                 printed_something = 1;
748                 seq_printf(m, "[permanent],");
749         }
750
751         if (!printed_something)
752                 seq_printf(m, "-");
753 }
754
755 void __symbol_put(const char *symbol)
756 {
757         struct module *owner;
758         unsigned long flags;
759         const unsigned long *crc;
760
761         spin_lock_irqsave(&modlist_lock, flags);
762         if (!__find_symbol(symbol, &owner, &crc, 1))
763                 BUG();
764         module_put(owner);
765         spin_unlock_irqrestore(&modlist_lock, flags);
766 }
767 EXPORT_SYMBOL(__symbol_put);
768
769 void symbol_put_addr(void *addr)
770 {
771         struct module *modaddr;
772
773         if (core_kernel_text((unsigned long)addr))
774                 return;
775
776         if (!(modaddr = module_text_address((unsigned long)addr)))
777                 BUG();
778         module_put(modaddr);
779 }
780 EXPORT_SYMBOL_GPL(symbol_put_addr);
781
782 static ssize_t show_refcnt(struct module_attribute *mattr,
783                            struct module *mod, char *buffer)
784 {
785         /* sysfs holds a reference */
786         return sprintf(buffer, "%u\n", module_refcount(mod)-1);
787 }
788
789 static struct module_attribute refcnt = {
790         .attr = { .name = "refcnt", .mode = 0444, .owner = THIS_MODULE },
791         .show = show_refcnt,
792 };
793
794 void module_put(struct module *module)
795 {
796         if (module) {
797                 unsigned int cpu = get_cpu();
798                 local_dec(&module->ref[cpu].count);
799                 /* Maybe they're waiting for us to drop reference? */
800                 if (unlikely(!module_is_live(module)))
801                         wake_up_process(module->waiter);
802                 put_cpu();
803         }
804 }
805 EXPORT_SYMBOL(module_put);
806
807 #else /* !CONFIG_MODULE_UNLOAD */
808 static void print_unload_info(struct seq_file *m, struct module *mod)
809 {
810         /* We don't know the usage count, or what modules are using. */
811         seq_printf(m, " - -");
812 }
813
814 static inline void module_unload_free(struct module *mod)
815 {
816 }
817
818 static inline int use_module(struct module *a, struct module *b)
819 {
820         return strong_try_module_get(b);
821 }
822
823 static inline void module_unload_init(struct module *mod)
824 {
825 }
826 #endif /* CONFIG_MODULE_UNLOAD */
827
828 static ssize_t show_initstate(struct module_attribute *mattr,
829                            struct module *mod, char *buffer)
830 {
831         const char *state = "unknown";
832
833         switch (mod->state) {
834         case MODULE_STATE_LIVE:
835                 state = "live";
836                 break;
837         case MODULE_STATE_COMING:
838                 state = "coming";
839                 break;
840         case MODULE_STATE_GOING:
841                 state = "going";
842                 break;
843         }
844         return sprintf(buffer, "%s\n", state);
845 }
846
847 static struct module_attribute initstate = {
848         .attr = { .name = "initstate", .mode = 0444, .owner = THIS_MODULE },
849         .show = show_initstate,
850 };
851
852 static struct module_attribute *modinfo_attrs[] = {
853         &modinfo_version,
854         &modinfo_srcversion,
855         &initstate,
856 #ifdef CONFIG_MODULE_UNLOAD
857         &refcnt,
858 #endif
859         NULL,
860 };
861
862 static const char vermagic[] = VERMAGIC_STRING;
863
864 #ifdef CONFIG_MODVERSIONS
865 static int check_version(Elf_Shdr *sechdrs,
866                          unsigned int versindex,
867                          const char *symname,
868                          struct module *mod, 
869                          const unsigned long *crc)
870 {
871         unsigned int i, num_versions;
872         struct modversion_info *versions;
873
874         /* Exporting module didn't supply crcs?  OK, we're already tainted. */
875         if (!crc)
876                 return 1;
877
878         versions = (void *) sechdrs[versindex].sh_addr;
879         num_versions = sechdrs[versindex].sh_size
880                 / sizeof(struct modversion_info);
881
882         for (i = 0; i < num_versions; i++) {
883                 if (strcmp(versions[i].name, symname) != 0)
884                         continue;
885
886                 if (versions[i].crc == *crc)
887                         return 1;
888                 printk("%s: disagrees about version of symbol %s\n",
889                        mod->name, symname);
890                 DEBUGP("Found checksum %lX vs module %lX\n",
891                        *crc, versions[i].crc);
892                 return 0;
893         }
894         /* Not in module's version table.  OK, but that taints the kernel. */
895         if (!(tainted & TAINT_FORCED_MODULE))
896                 printk("%s: no version for \"%s\" found: kernel tainted.\n",
897                        mod->name, symname);
898         add_taint_module(mod, TAINT_FORCED_MODULE);
899         return 1;
900 }
901
902 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
903                                           unsigned int versindex,
904                                           struct module *mod)
905 {
906         const unsigned long *crc;
907         struct module *owner;
908
909         if (!__find_symbol("struct_module", &owner, &crc, 1))
910                 BUG();
911         return check_version(sechdrs, versindex, "struct_module", mod,
912                              crc);
913 }
914
915 /* First part is kernel version, which we ignore. */
916 static inline int same_magic(const char *amagic, const char *bmagic)
917 {
918         amagic += strcspn(amagic, " ");
919         bmagic += strcspn(bmagic, " ");
920         return strcmp(amagic, bmagic) == 0;
921 }
922 #else
923 static inline int check_version(Elf_Shdr *sechdrs,
924                                 unsigned int versindex,
925                                 const char *symname,
926                                 struct module *mod, 
927                                 const unsigned long *crc)
928 {
929         return 1;
930 }
931
932 static inline int check_modstruct_version(Elf_Shdr *sechdrs,
933                                           unsigned int versindex,
934                                           struct module *mod)
935 {
936         return 1;
937 }
938
939 static inline int same_magic(const char *amagic, const char *bmagic)
940 {
941         return strcmp(amagic, bmagic) == 0;
942 }
943 #endif /* CONFIG_MODVERSIONS */
944
945 /* Resolve a symbol for this module.  I.e. if we find one, record usage.
946    Must be holding module_mutex. */
947 static unsigned long resolve_symbol(Elf_Shdr *sechdrs,
948                                     unsigned int versindex,
949                                     const char *name,
950                                     struct module *mod)
951 {
952         struct module *owner;
953         unsigned long ret;
954         const unsigned long *crc;
955
956         ret = __find_symbol(name, &owner, &crc,
957                         !(mod->taints & TAINT_PROPRIETARY_MODULE));
958         if (ret) {
959                 /* use_module can fail due to OOM, or module unloading */
960                 if (!check_version(sechdrs, versindex, name, mod, crc) ||
961                     !use_module(mod, owner))
962                         ret = 0;
963         }
964         return ret;
965 }
966
967
968 /*
969  * /sys/module/foo/sections stuff
970  * J. Corbet <corbet@lwn.net>
971  */
972 #ifdef CONFIG_KALLSYMS
973 static ssize_t module_sect_show(struct module_attribute *mattr,
974                                 struct module *mod, char *buf)
975 {
976         struct module_sect_attr *sattr =
977                 container_of(mattr, struct module_sect_attr, mattr);
978         return sprintf(buf, "0x%lx\n", sattr->address);
979 }
980
981 static void free_sect_attrs(struct module_sect_attrs *sect_attrs)
982 {
983         int section;
984
985         for (section = 0; section < sect_attrs->nsections; section++)
986                 kfree(sect_attrs->attrs[section].name);
987         kfree(sect_attrs);
988 }
989
990 static void add_sect_attrs(struct module *mod, unsigned int nsect,
991                 char *secstrings, Elf_Shdr *sechdrs)
992 {
993         unsigned int nloaded = 0, i, size[2];
994         struct module_sect_attrs *sect_attrs;
995         struct module_sect_attr *sattr;
996         struct attribute **gattr;
997         
998         /* Count loaded sections and allocate structures */
999         for (i = 0; i < nsect; i++)
1000                 if (sechdrs[i].sh_flags & SHF_ALLOC)
1001                         nloaded++;
1002         size[0] = ALIGN(sizeof(*sect_attrs)
1003                         + nloaded * sizeof(sect_attrs->attrs[0]),
1004                         sizeof(sect_attrs->grp.attrs[0]));
1005         size[1] = (nloaded + 1) * sizeof(sect_attrs->grp.attrs[0]);
1006         sect_attrs = kzalloc(size[0] + size[1], GFP_KERNEL);
1007         if (sect_attrs == NULL)
1008                 return;
1009
1010         /* Setup section attributes. */
1011         sect_attrs->grp.name = "sections";
1012         sect_attrs->grp.attrs = (void *)sect_attrs + size[0];
1013
1014         sect_attrs->nsections = 0;
1015         sattr = &sect_attrs->attrs[0];
1016         gattr = &sect_attrs->grp.attrs[0];
1017         for (i = 0; i < nsect; i++) {
1018                 if (! (sechdrs[i].sh_flags & SHF_ALLOC))
1019                         continue;
1020                 sattr->address = sechdrs[i].sh_addr;
1021                 sattr->name = kstrdup(secstrings + sechdrs[i].sh_name,
1022                                         GFP_KERNEL);
1023                 if (sattr->name == NULL)
1024                         goto out;
1025                 sect_attrs->nsections++;
1026                 sattr->mattr.show = module_sect_show;
1027                 sattr->mattr.store = NULL;
1028                 sattr->mattr.attr.name = sattr->name;
1029                 sattr->mattr.attr.owner = mod;
1030                 sattr->mattr.attr.mode = S_IRUGO;
1031                 *(gattr++) = &(sattr++)->mattr.attr;
1032         }
1033         *gattr = NULL;
1034
1035         if (sysfs_create_group(&mod->mkobj.kobj, &sect_attrs->grp))
1036                 goto out;
1037
1038         mod->sect_attrs = sect_attrs;
1039         return;
1040   out:
1041         free_sect_attrs(sect_attrs);
1042 }
1043
1044 static void remove_sect_attrs(struct module *mod)
1045 {
1046         if (mod->sect_attrs) {
1047                 sysfs_remove_group(&mod->mkobj.kobj,
1048                                    &mod->sect_attrs->grp);
1049                 /* We are positive that no one is using any sect attrs
1050                  * at this point.  Deallocate immediately. */
1051                 free_sect_attrs(mod->sect_attrs);
1052                 mod->sect_attrs = NULL;
1053         }
1054 }
1055
1056 #else
1057
1058 static inline void add_sect_attrs(struct module *mod, unsigned int nsect,
1059                 char *sectstrings, Elf_Shdr *sechdrs)
1060 {
1061 }
1062
1063 static inline void remove_sect_attrs(struct module *mod)
1064 {
1065 }
1066 #endif /* CONFIG_KALLSYMS */
1067
1068 static int module_add_modinfo_attrs(struct module *mod)
1069 {
1070         struct module_attribute *attr;
1071         struct module_attribute *temp_attr;
1072         int error = 0;
1073         int i;
1074
1075         mod->modinfo_attrs = kzalloc((sizeof(struct module_attribute) *
1076                                         (ARRAY_SIZE(modinfo_attrs) + 1)),
1077                                         GFP_KERNEL);
1078         if (!mod->modinfo_attrs)
1079                 return -ENOMEM;
1080
1081         temp_attr = mod->modinfo_attrs;
1082         for (i = 0; (attr = modinfo_attrs[i]) && !error; i++) {
1083                 if (!attr->test ||
1084                     (attr->test && attr->test(mod))) {
1085                         memcpy(temp_attr, attr, sizeof(*temp_attr));
1086                         temp_attr->attr.owner = mod;
1087                         error = sysfs_create_file(&mod->mkobj.kobj,&temp_attr->attr);
1088                         ++temp_attr;
1089                 }
1090         }
1091         return error;
1092 }
1093
1094 static void module_remove_modinfo_attrs(struct module *mod)
1095 {
1096         struct module_attribute *attr;
1097         int i;
1098
1099         for (i = 0; (attr = &mod->modinfo_attrs[i]); i++) {
1100                 /* pick a field to test for end of list */
1101                 if (!attr->attr.name)
1102                         break;
1103                 sysfs_remove_file(&mod->mkobj.kobj,&attr->attr);
1104                 if (attr->free)
1105                         attr->free(mod);
1106         }
1107         kfree(mod->modinfo_attrs);
1108 }
1109
1110 static int mod_sysfs_setup(struct module *mod,
1111                            struct kernel_param *kparam,
1112                            unsigned int num_params)
1113 {
1114         int err;
1115
1116         if (!module_subsys.kset.subsys) {
1117                 printk(KERN_ERR "%s: module_subsys not initialized\n",
1118                        mod->name);
1119                 err = -EINVAL;
1120                 goto out;
1121         }
1122         memset(&mod->mkobj.kobj, 0, sizeof(mod->mkobj.kobj));
1123         err = kobject_set_name(&mod->mkobj.kobj, "%s", mod->name);
1124         if (err)
1125                 goto out;
1126         kobj_set_kset_s(&mod->mkobj, module_subsys);
1127         mod->mkobj.mod = mod;
1128
1129         /* delay uevent until full sysfs population */
1130         kobject_init(&mod->mkobj.kobj);
1131         err = kobject_add(&mod->mkobj.kobj);
1132         if (err)
1133                 goto out;
1134
1135         mod->drivers_dir = kobject_add_dir(&mod->mkobj.kobj, "drivers");
1136         if (!mod->drivers_dir) {
1137                 err = -ENOMEM;
1138                 goto out_unreg;
1139         }
1140
1141         err = module_param_sysfs_setup(mod, kparam, num_params);
1142         if (err)
1143                 goto out_unreg_drivers;
1144
1145         err = module_add_modinfo_attrs(mod);
1146         if (err)
1147                 goto out_unreg_param;
1148
1149         kobject_uevent(&mod->mkobj.kobj, KOBJ_ADD);
1150         return 0;
1151
1152 out_unreg_param:
1153         module_param_sysfs_remove(mod);
1154 out_unreg_drivers:
1155         kobject_unregister(mod->drivers_dir);
1156 out_unreg:
1157         kobject_del(&mod->mkobj.kobj);
1158         kobject_put(&mod->mkobj.kobj);
1159 out:
1160         return err;
1161 }
1162
1163 static void mod_kobject_remove(struct module *mod)
1164 {
1165         module_remove_modinfo_attrs(mod);
1166         module_param_sysfs_remove(mod);
1167         kobject_unregister(mod->drivers_dir);
1168
1169         kobject_unregister(&mod->mkobj.kobj);
1170 }
1171
1172 /*
1173  * unlink the module with the whole machine is stopped with interrupts off
1174  * - this defends against kallsyms not taking locks
1175  */
1176 static int __unlink_module(void *_mod)
1177 {
1178         struct module *mod = _mod;
1179         list_del(&mod->list);
1180         return 0;
1181 }
1182
1183 /* Free a module, remove from lists, etc (must hold module mutex). */
1184 static void free_module(struct module *mod)
1185 {
1186         /* Delete from various lists */
1187         stop_machine_run(__unlink_module, mod, NR_CPUS);
1188         remove_sect_attrs(mod);
1189         mod_kobject_remove(mod);
1190
1191         unwind_remove_table(mod->unwind_info, 0);
1192
1193         /* Arch-specific cleanup. */
1194         module_arch_cleanup(mod);
1195
1196         /* Module unload stuff */
1197         module_unload_free(mod);
1198
1199         /* This may be NULL, but that's OK */
1200         module_free(mod, mod->module_init);
1201         kfree(mod->args);
1202         if (mod->percpu)
1203                 percpu_modfree(mod->percpu);
1204
1205         /* Free lock-classes: */
1206         lockdep_free_key_range(mod->module_core, mod->core_size);
1207
1208         /* Finally, free the core (containing the module structure) */
1209         module_free(mod, mod->module_core);
1210 }
1211
1212 void *__symbol_get(const char *symbol)
1213 {
1214         struct module *owner;
1215         unsigned long value, flags;
1216         const unsigned long *crc;
1217
1218         spin_lock_irqsave(&modlist_lock, flags);
1219         value = __find_symbol(symbol, &owner, &crc, 1);
1220         if (value && !strong_try_module_get(owner))
1221                 value = 0;
1222         spin_unlock_irqrestore(&modlist_lock, flags);
1223
1224         return (void *)value;
1225 }
1226 EXPORT_SYMBOL_GPL(__symbol_get);
1227
1228 /*
1229  * Ensure that an exported symbol [global namespace] does not already exist
1230  * in the Kernel or in some other modules exported symbol table.
1231  */
1232 static int verify_export_symbols(struct module *mod)
1233 {
1234         const char *name = NULL;
1235         unsigned long i, ret = 0;
1236         struct module *owner;
1237         const unsigned long *crc;
1238
1239         for (i = 0; i < mod->num_syms; i++)
1240                 if (__find_symbol(mod->syms[i].name, &owner, &crc, 1)) {
1241                         name = mod->syms[i].name;
1242                         ret = -ENOEXEC;
1243                         goto dup;
1244                 }
1245
1246         for (i = 0; i < mod->num_gpl_syms; i++)
1247                 if (__find_symbol(mod->gpl_syms[i].name, &owner, &crc, 1)) {
1248                         name = mod->gpl_syms[i].name;
1249                         ret = -ENOEXEC;
1250                         goto dup;
1251                 }
1252
1253 dup:
1254         if (ret)
1255                 printk(KERN_ERR "%s: exports duplicate symbol %s (owned by %s)\n",
1256                         mod->name, name, module_name(owner));
1257
1258         return ret;
1259 }
1260
1261 /* Change all symbols so that sh_value encodes the pointer directly. */
1262 static int simplify_symbols(Elf_Shdr *sechdrs,
1263                             unsigned int symindex,
1264                             const char *strtab,
1265                             unsigned int versindex,
1266                             unsigned int pcpuindex,
1267                             struct module *mod)
1268 {
1269         Elf_Sym *sym = (void *)sechdrs[symindex].sh_addr;
1270         unsigned long secbase;
1271         unsigned int i, n = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1272         int ret = 0;
1273
1274         for (i = 1; i < n; i++) {
1275                 switch (sym[i].st_shndx) {
1276                 case SHN_COMMON:
1277                         /* We compiled with -fno-common.  These are not
1278                            supposed to happen.  */
1279                         DEBUGP("Common symbol: %s\n", strtab + sym[i].st_name);
1280                         printk("%s: please compile with -fno-common\n",
1281                                mod->name);
1282                         ret = -ENOEXEC;
1283                         break;
1284
1285                 case SHN_ABS:
1286                         /* Don't need to do anything */
1287                         DEBUGP("Absolute symbol: 0x%08lx\n",
1288                                (long)sym[i].st_value);
1289                         break;
1290
1291                 case SHN_UNDEF:
1292                         sym[i].st_value
1293                           = resolve_symbol(sechdrs, versindex,
1294                                            strtab + sym[i].st_name, mod);
1295
1296                         /* Ok if resolved.  */
1297                         if (sym[i].st_value != 0)
1298                                 break;
1299                         /* Ok if weak.  */
1300                         if (ELF_ST_BIND(sym[i].st_info) == STB_WEAK)
1301                                 break;
1302
1303                         printk(KERN_WARNING "%s: Unknown symbol %s\n",
1304                                mod->name, strtab + sym[i].st_name);
1305                         ret = -ENOENT;
1306                         break;
1307
1308                 default:
1309                         /* Divert to percpu allocation if a percpu var. */
1310                         if (sym[i].st_shndx == pcpuindex)
1311                                 secbase = (unsigned long)mod->percpu;
1312                         else
1313                                 secbase = sechdrs[sym[i].st_shndx].sh_addr;
1314                         sym[i].st_value += secbase;
1315                         break;
1316                 }
1317         }
1318
1319         return ret;
1320 }
1321
1322 /* Update size with this section: return offset. */
1323 static long get_offset(unsigned long *size, Elf_Shdr *sechdr)
1324 {
1325         long ret;
1326
1327         ret = ALIGN(*size, sechdr->sh_addralign ?: 1);
1328         *size = ret + sechdr->sh_size;
1329         return ret;
1330 }
1331
1332 /* Lay out the SHF_ALLOC sections in a way not dissimilar to how ld
1333    might -- code, read-only data, read-write data, small data.  Tally
1334    sizes, and place the offsets into sh_entsize fields: high bit means it
1335    belongs in init. */
1336 static void layout_sections(struct module *mod,
1337                             const Elf_Ehdr *hdr,
1338                             Elf_Shdr *sechdrs,
1339                             const char *secstrings)
1340 {
1341         static unsigned long const masks[][2] = {
1342                 /* NOTE: all executable code must be the first section
1343                  * in this array; otherwise modify the text_size
1344                  * finder in the two loops below */
1345                 { SHF_EXECINSTR | SHF_ALLOC, ARCH_SHF_SMALL },
1346                 { SHF_ALLOC, SHF_WRITE | ARCH_SHF_SMALL },
1347                 { SHF_WRITE | SHF_ALLOC, ARCH_SHF_SMALL },
1348                 { ARCH_SHF_SMALL | SHF_ALLOC, 0 }
1349         };
1350         unsigned int m, i;
1351
1352         for (i = 0; i < hdr->e_shnum; i++)
1353                 sechdrs[i].sh_entsize = ~0UL;
1354
1355         DEBUGP("Core section allocation order:\n");
1356         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1357                 for (i = 0; i < hdr->e_shnum; ++i) {
1358                         Elf_Shdr *s = &sechdrs[i];
1359
1360                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1361                             || (s->sh_flags & masks[m][1])
1362                             || s->sh_entsize != ~0UL
1363                             || strncmp(secstrings + s->sh_name,
1364                                        ".init", 5) == 0)
1365                                 continue;
1366                         s->sh_entsize = get_offset(&mod->core_size, s);
1367                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1368                 }
1369                 if (m == 0)
1370                         mod->core_text_size = mod->core_size;
1371         }
1372
1373         DEBUGP("Init section allocation order:\n");
1374         for (m = 0; m < ARRAY_SIZE(masks); ++m) {
1375                 for (i = 0; i < hdr->e_shnum; ++i) {
1376                         Elf_Shdr *s = &sechdrs[i];
1377
1378                         if ((s->sh_flags & masks[m][0]) != masks[m][0]
1379                             || (s->sh_flags & masks[m][1])
1380                             || s->sh_entsize != ~0UL
1381                             || strncmp(secstrings + s->sh_name,
1382                                        ".init", 5) != 0)
1383                                 continue;
1384                         s->sh_entsize = (get_offset(&mod->init_size, s)
1385                                          | INIT_OFFSET_MASK);
1386                         DEBUGP("\t%s\n", secstrings + s->sh_name);
1387                 }
1388                 if (m == 0)
1389                         mod->init_text_size = mod->init_size;
1390         }
1391 }
1392
1393 static void set_license(struct module *mod, const char *license)
1394 {
1395         if (!license)
1396                 license = "unspecified";
1397
1398         if (!license_is_gpl_compatible(license)) {
1399                 if (!(tainted & TAINT_PROPRIETARY_MODULE))
1400                         printk(KERN_WARNING "%s: module license '%s' taints "
1401                                 "kernel.\n", mod->name, license);
1402                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1403         }
1404 }
1405
1406 /* Parse tag=value strings from .modinfo section */
1407 static char *next_string(char *string, unsigned long *secsize)
1408 {
1409         /* Skip non-zero chars */
1410         while (string[0]) {
1411                 string++;
1412                 if ((*secsize)-- <= 1)
1413                         return NULL;
1414         }
1415
1416         /* Skip any zero padding. */
1417         while (!string[0]) {
1418                 string++;
1419                 if ((*secsize)-- <= 1)
1420                         return NULL;
1421         }
1422         return string;
1423 }
1424
1425 static char *get_modinfo(Elf_Shdr *sechdrs,
1426                          unsigned int info,
1427                          const char *tag)
1428 {
1429         char *p;
1430         unsigned int taglen = strlen(tag);
1431         unsigned long size = sechdrs[info].sh_size;
1432
1433         for (p = (char *)sechdrs[info].sh_addr; p; p = next_string(p, &size)) {
1434                 if (strncmp(p, tag, taglen) == 0 && p[taglen] == '=')
1435                         return p + taglen + 1;
1436         }
1437         return NULL;
1438 }
1439
1440 static void setup_modinfo(struct module *mod, Elf_Shdr *sechdrs,
1441                           unsigned int infoindex)
1442 {
1443         struct module_attribute *attr;
1444         int i;
1445
1446         for (i = 0; (attr = modinfo_attrs[i]); i++) {
1447                 if (attr->setup)
1448                         attr->setup(mod,
1449                                     get_modinfo(sechdrs,
1450                                                 infoindex,
1451                                                 attr->attr.name));
1452         }
1453 }
1454
1455 #ifdef CONFIG_KALLSYMS
1456 int is_exported(const char *name, const struct module *mod)
1457 {
1458         if (!mod && lookup_symbol(name, __start___ksymtab, __stop___ksymtab))
1459                 return 1;
1460         else
1461                 if (mod && lookup_symbol(name, mod->syms, mod->syms + mod->num_syms))
1462                         return 1;
1463                 else
1464                         return 0;
1465 }
1466
1467 /* As per nm */
1468 static char elf_type(const Elf_Sym *sym,
1469                      Elf_Shdr *sechdrs,
1470                      const char *secstrings,
1471                      struct module *mod)
1472 {
1473         if (ELF_ST_BIND(sym->st_info) == STB_WEAK) {
1474                 if (ELF_ST_TYPE(sym->st_info) == STT_OBJECT)
1475                         return 'v';
1476                 else
1477                         return 'w';
1478         }
1479         if (sym->st_shndx == SHN_UNDEF)
1480                 return 'U';
1481         if (sym->st_shndx == SHN_ABS)
1482                 return 'a';
1483         if (sym->st_shndx >= SHN_LORESERVE)
1484                 return '?';
1485         if (sechdrs[sym->st_shndx].sh_flags & SHF_EXECINSTR)
1486                 return 't';
1487         if (sechdrs[sym->st_shndx].sh_flags & SHF_ALLOC
1488             && sechdrs[sym->st_shndx].sh_type != SHT_NOBITS) {
1489                 if (!(sechdrs[sym->st_shndx].sh_flags & SHF_WRITE))
1490                         return 'r';
1491                 else if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1492                         return 'g';
1493                 else
1494                         return 'd';
1495         }
1496         if (sechdrs[sym->st_shndx].sh_type == SHT_NOBITS) {
1497                 if (sechdrs[sym->st_shndx].sh_flags & ARCH_SHF_SMALL)
1498                         return 's';
1499                 else
1500                         return 'b';
1501         }
1502         if (strncmp(secstrings + sechdrs[sym->st_shndx].sh_name,
1503                     ".debug", strlen(".debug")) == 0)
1504                 return 'n';
1505         return '?';
1506 }
1507
1508 static void add_kallsyms(struct module *mod,
1509                          Elf_Shdr *sechdrs,
1510                          unsigned int symindex,
1511                          unsigned int strindex,
1512                          const char *secstrings)
1513 {
1514         unsigned int i;
1515
1516         mod->symtab = (void *)sechdrs[symindex].sh_addr;
1517         mod->num_symtab = sechdrs[symindex].sh_size / sizeof(Elf_Sym);
1518         mod->strtab = (void *)sechdrs[strindex].sh_addr;
1519
1520         /* Set types up while we still have access to sections. */
1521         for (i = 0; i < mod->num_symtab; i++)
1522                 mod->symtab[i].st_info
1523                         = elf_type(&mod->symtab[i], sechdrs, secstrings, mod);
1524 }
1525 #else
1526 static inline void add_kallsyms(struct module *mod,
1527                                 Elf_Shdr *sechdrs,
1528                                 unsigned int symindex,
1529                                 unsigned int strindex,
1530                                 const char *secstrings)
1531 {
1532 }
1533 #endif /* CONFIG_KALLSYMS */
1534
1535 /* Allocate and load the module: note that size of section 0 is always
1536    zero, and we rely on this for optional sections. */
1537 static struct module *load_module(void __user *umod,
1538                                   unsigned long len,
1539                                   const char __user *uargs)
1540 {
1541         Elf_Ehdr *hdr;
1542         Elf_Shdr *sechdrs;
1543         char *secstrings, *args, *modmagic, *strtab = NULL;
1544         unsigned int i;
1545         unsigned int symindex = 0;
1546         unsigned int strindex = 0;
1547         unsigned int setupindex;
1548         unsigned int exindex;
1549         unsigned int exportindex;
1550         unsigned int modindex;
1551         unsigned int obsparmindex;
1552         unsigned int infoindex;
1553         unsigned int gplindex;
1554         unsigned int crcindex;
1555         unsigned int gplcrcindex;
1556         unsigned int versindex;
1557         unsigned int pcpuindex;
1558         unsigned int gplfutureindex;
1559         unsigned int gplfuturecrcindex;
1560         unsigned int unwindex = 0;
1561         unsigned int unusedindex;
1562         unsigned int unusedcrcindex;
1563         unsigned int unusedgplindex;
1564         unsigned int unusedgplcrcindex;
1565         struct module *mod;
1566         long err = 0;
1567         void *percpu = NULL, *ptr = NULL; /* Stops spurious gcc warning */
1568         struct exception_table_entry *extable;
1569         mm_segment_t old_fs;
1570         int gpgsig_ok;
1571
1572         DEBUGP("load_module: umod=%p, len=%lu, uargs=%p\n",
1573                umod, len, uargs);
1574         if (len < sizeof(*hdr))
1575                 return ERR_PTR(-ENOEXEC);
1576
1577         /* Suck in entire file: we'll want most of it. */
1578         /* vmalloc barfs on "unusual" numbers.  Check here */
1579         if (len > 64 * 1024 * 1024 || (hdr = vmalloc(len)) == NULL)
1580                 return ERR_PTR(-ENOMEM);
1581         if (copy_from_user(hdr, umod, len) != 0) {
1582                 err = -EFAULT;
1583                 goto free_hdr;
1584         }
1585
1586         /* Sanity checks against insmoding binaries or wrong arch,
1587            weird elf version */
1588         if (memcmp(hdr->e_ident, ELFMAG, 4) != 0
1589             || hdr->e_type != ET_REL
1590             || !elf_check_arch(hdr)
1591             || hdr->e_shentsize != sizeof(*sechdrs)) {
1592                 err = -ENOEXEC;
1593                 goto free_hdr;
1594         }
1595
1596         /* Verify the module's contents */
1597         gpgsig_ok = 0;
1598         err = module_verify(hdr, len);
1599         if (err < 0)
1600                 goto free_hdr;
1601         if (err == 1)
1602                 gpgsig_ok = 1;
1603
1604         /* Convenience variables */
1605         sechdrs = (void *)hdr + hdr->e_shoff;
1606         secstrings = (void *)hdr + sechdrs[hdr->e_shstrndx].sh_offset;
1607         sechdrs[0].sh_addr = 0;
1608
1609         for (i = 1; i < hdr->e_shnum; i++) {
1610                 if (sechdrs[i].sh_type != SHT_NOBITS
1611                     && len < sechdrs[i].sh_offset + sechdrs[i].sh_size)
1612                         goto truncated;
1613
1614                 /* Mark all sections sh_addr with their address in the
1615                    temporary image. */
1616                 sechdrs[i].sh_addr = (size_t)hdr + sechdrs[i].sh_offset;
1617
1618                 /* Internal symbols and strings. */
1619                 if (sechdrs[i].sh_type == SHT_SYMTAB) {
1620                         symindex = i;
1621                         strindex = sechdrs[i].sh_link;
1622                         strtab = (char *)hdr + sechdrs[strindex].sh_offset;
1623                 }
1624 #ifndef CONFIG_MODULE_UNLOAD
1625                 /* Don't load .exit sections */
1626                 if (strncmp(secstrings+sechdrs[i].sh_name, ".exit", 5) == 0)
1627                         sechdrs[i].sh_flags &= ~(unsigned long)SHF_ALLOC;
1628 #endif
1629         }
1630
1631         modindex = find_sec(hdr, sechdrs, secstrings,
1632                             ".gnu.linkonce.this_module");
1633         if (!modindex) {
1634                 printk(KERN_WARNING "No module found in object\n");
1635                 err = -ENOEXEC;
1636                 goto free_hdr;
1637         }
1638         mod = (void *)sechdrs[modindex].sh_addr;
1639         mod->gpgsig_ok = gpgsig_ok;
1640
1641         if (symindex == 0) {
1642                 printk(KERN_WARNING "%s: module has no symbols (stripped?)\n",
1643                        mod->name);
1644                 err = -ENOEXEC;
1645                 goto free_hdr;
1646         }
1647
1648         /* Optional sections */
1649         exportindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab");
1650         gplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl");
1651         gplfutureindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_gpl_future");
1652         unusedindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused");
1653         unusedgplindex = find_sec(hdr, sechdrs, secstrings, "__ksymtab_unused_gpl");
1654         crcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab");
1655         gplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl");
1656         gplfuturecrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_gpl_future");
1657         unusedcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused");
1658         unusedgplcrcindex = find_sec(hdr, sechdrs, secstrings, "__kcrctab_unused_gpl");
1659         setupindex = find_sec(hdr, sechdrs, secstrings, "__param");
1660         exindex = find_sec(hdr, sechdrs, secstrings, "__ex_table");
1661         obsparmindex = find_sec(hdr, sechdrs, secstrings, "__obsparm");
1662         versindex = find_sec(hdr, sechdrs, secstrings, "__versions");
1663         infoindex = find_sec(hdr, sechdrs, secstrings, ".modinfo");
1664         pcpuindex = find_pcpusec(hdr, sechdrs, secstrings);
1665 #ifdef ARCH_UNWIND_SECTION_NAME
1666         unwindex = find_sec(hdr, sechdrs, secstrings, ARCH_UNWIND_SECTION_NAME);
1667 #endif
1668
1669         /* Don't keep modinfo section */
1670         sechdrs[infoindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1671 #ifdef CONFIG_KALLSYMS
1672         /* Keep symbol and string tables for decoding later. */
1673         sechdrs[symindex].sh_flags |= SHF_ALLOC;
1674         sechdrs[strindex].sh_flags |= SHF_ALLOC;
1675 #endif
1676         if (unwindex)
1677                 sechdrs[unwindex].sh_flags |= SHF_ALLOC;
1678
1679         /* Check module struct version now, before we try to use module. */
1680         if (!check_modstruct_version(sechdrs, versindex, mod)) {
1681                 err = -ENOEXEC;
1682                 goto free_hdr;
1683         }
1684
1685         modmagic = get_modinfo(sechdrs, infoindex, "vermagic");
1686         /* This is allowed: modprobe --force will invalidate it. */
1687         if (!modmagic) {
1688                 add_taint_module(mod, TAINT_FORCED_MODULE);
1689                 printk(KERN_WARNING "%s: no version magic, tainting kernel.\n",
1690                        mod->name);
1691         } else if (!same_magic(modmagic, vermagic)) {
1692                 printk(KERN_ERR "%s: version magic '%s' should be '%s'\n",
1693                        mod->name, modmagic, vermagic);
1694                 err = -ENOEXEC;
1695                 goto free_hdr;
1696         }
1697
1698         /* Now copy in args */
1699         args = strndup_user(uargs, ~0UL >> 1);
1700         if (IS_ERR(args)) {
1701                 err = PTR_ERR(args);
1702                 goto free_hdr;
1703         }
1704
1705         if (find_module(mod->name)) {
1706                 err = -EEXIST;
1707                 goto free_mod;
1708         }
1709
1710         mod->state = MODULE_STATE_COMING;
1711
1712         /* Allow arches to frob section contents and sizes.  */
1713         err = module_frob_arch_sections(hdr, sechdrs, secstrings, mod);
1714         if (err < 0)
1715                 goto free_mod;
1716
1717         if (pcpuindex) {
1718                 /* We have a special allocation for this section. */
1719                 percpu = percpu_modalloc(sechdrs[pcpuindex].sh_size,
1720                                          sechdrs[pcpuindex].sh_addralign,
1721                                          mod->name);
1722                 if (!percpu) {
1723                         err = -ENOMEM;
1724                         goto free_mod;
1725                 }
1726                 sechdrs[pcpuindex].sh_flags &= ~(unsigned long)SHF_ALLOC;
1727                 mod->percpu = percpu;
1728         }
1729
1730         /* Determine total sizes, and put offsets in sh_entsize.  For now
1731            this is done generically; there doesn't appear to be any
1732            special cases for the architectures. */
1733         layout_sections(mod, hdr, sechdrs, secstrings);
1734
1735         /* Do the allocs. */
1736         ptr = module_alloc(mod->core_size);
1737         if (!ptr) {
1738                 err = -ENOMEM;
1739                 goto free_percpu;
1740         }
1741         memset(ptr, 0, mod->core_size);
1742         mod->module_core = ptr;
1743
1744         ptr = module_alloc(mod->init_size);
1745         if (!ptr && mod->init_size) {
1746                 err = -ENOMEM;
1747                 goto free_core;
1748         }
1749         memset(ptr, 0, mod->init_size);
1750         mod->module_init = ptr;
1751
1752         /* Transfer each section which specifies SHF_ALLOC */
1753         DEBUGP("final section addresses:\n");
1754         for (i = 0; i < hdr->e_shnum; i++) {
1755                 void *dest;
1756
1757                 if (!(sechdrs[i].sh_flags & SHF_ALLOC))
1758                         continue;
1759
1760                 if (sechdrs[i].sh_entsize & INIT_OFFSET_MASK)
1761                         dest = mod->module_init
1762                                 + (sechdrs[i].sh_entsize & ~INIT_OFFSET_MASK);
1763                 else
1764                         dest = mod->module_core + sechdrs[i].sh_entsize;
1765
1766                 if (sechdrs[i].sh_type != SHT_NOBITS)
1767                         memcpy(dest, (void *)sechdrs[i].sh_addr,
1768                                sechdrs[i].sh_size);
1769                 /* Update sh_addr to point to copy in image. */
1770                 sechdrs[i].sh_addr = (unsigned long)dest;
1771                 DEBUGP("\t0x%lx %s\n", sechdrs[i].sh_addr, secstrings + sechdrs[i].sh_name);
1772         }
1773         /* Module has been moved. */
1774         mod = (void *)sechdrs[modindex].sh_addr;
1775
1776         /* Now we've moved module, initialize linked lists, etc. */
1777         module_unload_init(mod);
1778
1779         /* Set up license info based on the info section */
1780         set_license(mod, get_modinfo(sechdrs, infoindex, "license"));
1781
1782         if (strcmp(mod->name, "ndiswrapper") == 0)
1783                 add_taint(TAINT_PROPRIETARY_MODULE);
1784         if (strcmp(mod->name, "driverloader") == 0)
1785                 add_taint_module(mod, TAINT_PROPRIETARY_MODULE);
1786
1787         /* Set up MODINFO_ATTR fields */
1788         setup_modinfo(mod, sechdrs, infoindex);
1789
1790         /* Fix up syms, so that st_value is a pointer to location. */
1791         err = simplify_symbols(sechdrs, symindex, strtab, versindex, pcpuindex,
1792                                mod);
1793         if (err < 0)
1794                 goto cleanup;
1795
1796         /* Set up EXPORTed & EXPORT_GPLed symbols (section 0 is 0 length) */
1797         mod->num_syms = sechdrs[exportindex].sh_size / sizeof(*mod->syms);
1798         mod->syms = (void *)sechdrs[exportindex].sh_addr;
1799         if (crcindex)
1800                 mod->crcs = (void *)sechdrs[crcindex].sh_addr;
1801         mod->num_gpl_syms = sechdrs[gplindex].sh_size / sizeof(*mod->gpl_syms);
1802         mod->gpl_syms = (void *)sechdrs[gplindex].sh_addr;
1803         if (gplcrcindex)
1804                 mod->gpl_crcs = (void *)sechdrs[gplcrcindex].sh_addr;
1805         mod->num_gpl_future_syms = sechdrs[gplfutureindex].sh_size /
1806                                         sizeof(*mod->gpl_future_syms);
1807         mod->num_unused_syms = sechdrs[unusedindex].sh_size /
1808                                         sizeof(*mod->unused_syms);
1809         mod->num_unused_gpl_syms = sechdrs[unusedgplindex].sh_size /
1810                                         sizeof(*mod->unused_gpl_syms);
1811         mod->gpl_future_syms = (void *)sechdrs[gplfutureindex].sh_addr;
1812         if (gplfuturecrcindex)
1813                 mod->gpl_future_crcs = (void *)sechdrs[gplfuturecrcindex].sh_addr;
1814
1815         mod->unused_syms = (void *)sechdrs[unusedindex].sh_addr;
1816         if (unusedcrcindex)
1817                 mod->unused_crcs = (void *)sechdrs[unusedcrcindex].sh_addr;
1818         mod->unused_gpl_syms = (void *)sechdrs[unusedgplindex].sh_addr;
1819         if (unusedgplcrcindex)
1820                 mod->unused_crcs = (void *)sechdrs[unusedgplcrcindex].sh_addr;
1821
1822 #ifdef CONFIG_MODVERSIONS
1823         if ((mod->num_syms && !crcindex) || 
1824             (mod->num_gpl_syms && !gplcrcindex) ||
1825             (mod->num_gpl_future_syms && !gplfuturecrcindex) ||
1826             (mod->num_unused_syms && !unusedcrcindex) ||
1827             (mod->num_unused_gpl_syms && !unusedgplcrcindex)) {
1828                 printk(KERN_WARNING "%s: No versions for exported symbols."
1829                        " Tainting kernel.\n", mod->name);
1830                 add_taint_module(mod, TAINT_FORCED_MODULE);
1831         }
1832 #endif
1833
1834         /* Now do relocations. */
1835         for (i = 1; i < hdr->e_shnum; i++) {
1836                 const char *strtab = (char *)sechdrs[strindex].sh_addr;
1837                 unsigned int info = sechdrs[i].sh_info;
1838
1839                 /* Not a valid relocation section? */
1840                 if (info >= hdr->e_shnum)
1841                         continue;
1842
1843                 /* Don't bother with non-allocated sections */
1844                 if (!(sechdrs[info].sh_flags & SHF_ALLOC))
1845                         continue;
1846
1847                 if (sechdrs[i].sh_type == SHT_REL)
1848                         err = apply_relocate(sechdrs, strtab, symindex, i,mod);
1849                 else if (sechdrs[i].sh_type == SHT_RELA)
1850                         err = apply_relocate_add(sechdrs, strtab, symindex, i,
1851                                                  mod);
1852                 if (err < 0)
1853                         goto cleanup;
1854         }
1855
1856         /* Find duplicate symbols */
1857         err = verify_export_symbols(mod);
1858
1859         if (err < 0)
1860                 goto cleanup;
1861
1862         /* Set up and sort exception table */
1863         mod->num_exentries = sechdrs[exindex].sh_size / sizeof(*mod->extable);
1864         mod->extable = extable = (void *)sechdrs[exindex].sh_addr;
1865         sort_extable(extable, extable + mod->num_exentries);
1866
1867         /* Finally, copy percpu area over. */
1868         percpu_modcopy(mod->percpu, (void *)sechdrs[pcpuindex].sh_addr,
1869                        sechdrs[pcpuindex].sh_size);
1870
1871         add_kallsyms(mod, sechdrs, symindex, strindex, secstrings);
1872
1873         err = module_finalize(hdr, sechdrs, mod);
1874         if (err < 0)
1875                 goto cleanup;
1876
1877         /* flush the icache in correct context */
1878         old_fs = get_fs();
1879         set_fs(KERNEL_DS);
1880
1881         /*
1882          * Flush the instruction cache, since we've played with text.
1883          * Do it before processing of module parameters, so the module
1884          * can provide parameter accessor functions of its own.
1885          */
1886         if (mod->module_init)
1887                 flush_icache_range((unsigned long)mod->module_init,
1888                                    (unsigned long)mod->module_init
1889                                    + mod->init_size);
1890         flush_icache_range((unsigned long)mod->module_core,
1891                            (unsigned long)mod->module_core + mod->core_size);
1892
1893         set_fs(old_fs);
1894
1895         mod->args = args;
1896         if (obsparmindex)
1897                 printk(KERN_WARNING "%s: Ignoring obsolete parameters\n",
1898                        mod->name);
1899
1900         /* Size of section 0 is 0, so this works well if no params */
1901         err = parse_args(mod->name, mod->args,
1902                          (struct kernel_param *)
1903                          sechdrs[setupindex].sh_addr,
1904                          sechdrs[setupindex].sh_size
1905                          / sizeof(struct kernel_param),
1906                          NULL);
1907         if (err < 0)
1908                 goto arch_cleanup;
1909
1910         err = mod_sysfs_setup(mod, 
1911                               (struct kernel_param *)
1912                               sechdrs[setupindex].sh_addr,
1913                               sechdrs[setupindex].sh_size
1914                               / sizeof(struct kernel_param));
1915         if (err < 0)
1916                 goto arch_cleanup;
1917         add_sect_attrs(mod, hdr->e_shnum, secstrings, sechdrs);
1918
1919         /* Size of section 0 is 0, so this works well if no unwind info. */
1920         mod->unwind_info = unwind_add_table(mod,
1921                                             (void *)sechdrs[unwindex].sh_addr,
1922                                             sechdrs[unwindex].sh_size);
1923
1924         /* Get rid of temporary copy */
1925         vfree(hdr);
1926
1927         /* Done! */
1928         return mod;
1929
1930  arch_cleanup:
1931         module_arch_cleanup(mod);
1932  cleanup:
1933         module_unload_free(mod);
1934         module_free(mod, mod->module_init);
1935  free_core:
1936         module_free(mod, mod->module_core);
1937  free_percpu:
1938         if (percpu)
1939                 percpu_modfree(percpu);
1940  free_mod:
1941         kfree(args);
1942  free_hdr:
1943         vfree(hdr);
1944         return ERR_PTR(err);
1945
1946  truncated:
1947         printk(KERN_ERR "Module len %lu truncated\n", len);
1948         err = -ENOEXEC;
1949         goto free_hdr;
1950 }
1951
1952 /*
1953  * link the module with the whole machine is stopped with interrupts off
1954  * - this defends against kallsyms not taking locks
1955  */
1956 static int __link_module(void *_mod)
1957 {
1958         struct module *mod = _mod;
1959         list_add(&mod->list, &modules);
1960         return 0;
1961 }
1962
1963 /* This is where the real work happens */
1964 asmlinkage long
1965 sys_init_module(void __user *umod,
1966                 unsigned long len,
1967                 const char __user *uargs)
1968 {
1969         struct module *mod;
1970         int ret = 0;
1971
1972         /* Must have permission */
1973         if (!capable(CAP_SYS_MODULE))
1974                 return -EPERM;
1975
1976         /* Only one module load at a time, please */
1977         if (mutex_lock_interruptible(&module_mutex) != 0)
1978                 return -EINTR;
1979
1980         /* Do all the hard work */
1981         mod = load_module(umod, len, uargs);
1982         if (IS_ERR(mod)) {
1983                 mutex_unlock(&module_mutex);
1984                 return PTR_ERR(mod);
1985         }
1986
1987         /* Now sew it into the lists.  They won't access us, since
1988            strong_try_module_get() will fail. */
1989         stop_machine_run(__link_module, mod, NR_CPUS);
1990
1991         /* Drop lock so they can recurse */
1992         mutex_unlock(&module_mutex);
1993
1994         blocking_notifier_call_chain(&module_notify_list,
1995                         MODULE_STATE_COMING, mod);
1996
1997         /* Start the module */
1998         if (mod->init != NULL)
1999                 ret = mod->init();
2000         if (ret < 0) {
2001                 /* Init routine failed: abort.  Try to protect us from
2002                    buggy refcounters. */
2003                 mod->state = MODULE_STATE_GOING;
2004                 synchronize_sched();
2005                 if (mod->unsafe)
2006                         printk(KERN_ERR "%s: module is now stuck!\n",
2007                                mod->name);
2008                 else {
2009                         module_put(mod);
2010                         mutex_lock(&module_mutex);
2011                         free_module(mod);
2012                         mutex_unlock(&module_mutex);
2013                 }
2014                 return ret;
2015         }
2016
2017         /* Now it's a first class citizen! */
2018         mutex_lock(&module_mutex);
2019         mod->state = MODULE_STATE_LIVE;
2020         /* Drop initial reference. */
2021         module_put(mod);
2022         unwind_remove_table(mod->unwind_info, 1);
2023         module_free(mod, mod->module_init);
2024         mod->module_init = NULL;
2025         mod->init_size = 0;
2026         mod->init_text_size = 0;
2027         mutex_unlock(&module_mutex);
2028
2029         return 0;
2030 }
2031
2032 static inline int within(unsigned long addr, void *start, unsigned long size)
2033 {
2034         return ((void *)addr >= start && (void *)addr < start + size);
2035 }
2036
2037 #ifdef CONFIG_KALLSYMS
2038 /*
2039  * This ignores the intensely annoying "mapping symbols" found
2040  * in ARM ELF files: $a, $t and $d.
2041  */
2042 static inline int is_arm_mapping_symbol(const char *str)
2043 {
2044         return str[0] == '$' && strchr("atd", str[1]) 
2045                && (str[2] == '\0' || str[2] == '.');
2046 }
2047
2048 static const char *get_ksymbol(struct module *mod,
2049                                unsigned long addr,
2050                                unsigned long *size,
2051                                unsigned long *offset)
2052 {
2053         unsigned int i, best = 0;
2054         unsigned long nextval;
2055
2056         /* At worse, next value is at end of module */
2057         if (within(addr, mod->module_init, mod->init_size))
2058                 nextval = (unsigned long)mod->module_init+mod->init_text_size;
2059         else 
2060                 nextval = (unsigned long)mod->module_core+mod->core_text_size;
2061
2062         /* Scan for closest preceeding symbol, and next symbol. (ELF
2063            starts real symbols at 1). */
2064         for (i = 1; i < mod->num_symtab; i++) {
2065                 if (mod->symtab[i].st_shndx == SHN_UNDEF)
2066                         continue;
2067
2068                 /* We ignore unnamed symbols: they're uninformative
2069                  * and inserted at a whim. */
2070                 if (mod->symtab[i].st_value <= addr
2071                     && mod->symtab[i].st_value > mod->symtab[best].st_value
2072                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2073                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2074                         best = i;
2075                 if (mod->symtab[i].st_value > addr
2076                     && mod->symtab[i].st_value < nextval
2077                     && *(mod->strtab + mod->symtab[i].st_name) != '\0'
2078                     && !is_arm_mapping_symbol(mod->strtab + mod->symtab[i].st_name))
2079                         nextval = mod->symtab[i].st_value;
2080         }
2081
2082         if (!best)
2083                 return NULL;
2084
2085         *size = nextval - mod->symtab[best].st_value;
2086         *offset = addr - mod->symtab[best].st_value;
2087         return mod->strtab + mod->symtab[best].st_name;
2088 }
2089
2090 /* For kallsyms to ask for address resolution.  NULL means not found.
2091    We don't lock, as this is used for oops resolution and races are a
2092    lesser concern. */
2093 const char *module_address_lookup(unsigned long addr,
2094                                   unsigned long *size,
2095                                   unsigned long *offset,
2096                                   char **modname)
2097 {
2098         struct module *mod;
2099
2100         list_for_each_entry(mod, &modules, list) {
2101                 if (within(addr, mod->module_init, mod->init_size)
2102                     || within(addr, mod->module_core, mod->core_size)) {
2103                         if (modname)
2104                                 *modname = mod->name;
2105                         return get_ksymbol(mod, addr, size, offset);
2106                 }
2107         }
2108         return NULL;
2109 }
2110
2111 struct module *module_get_kallsym(unsigned int symnum, unsigned long *value,
2112                                 char *type, char *name, size_t namelen)
2113 {
2114         struct module *mod;
2115
2116         mutex_lock(&module_mutex);
2117         list_for_each_entry(mod, &modules, list) {
2118                 if (symnum < mod->num_symtab) {
2119                         *value = mod->symtab[symnum].st_value;
2120                         *type = mod->symtab[symnum].st_info;
2121                         strlcpy(name, mod->strtab + mod->symtab[symnum].st_name,
2122                                 namelen);
2123                         mutex_unlock(&module_mutex);
2124                         return mod;
2125                 }
2126                 symnum -= mod->num_symtab;
2127         }
2128         mutex_unlock(&module_mutex);
2129         return NULL;
2130 }
2131
2132 static unsigned long mod_find_symname(struct module *mod, const char *name)
2133 {
2134         unsigned int i;
2135
2136         for (i = 0; i < mod->num_symtab; i++)
2137                 if (strcmp(name, mod->strtab+mod->symtab[i].st_name) == 0 &&
2138                     mod->symtab[i].st_info != 'U')
2139                         return mod->symtab[i].st_value;
2140         return 0;
2141 }
2142
2143 /* Look for this name: can be of form module:name. */
2144 unsigned long module_kallsyms_lookup_name(const char *name)
2145 {
2146         struct module *mod;
2147         char *colon;
2148         unsigned long ret = 0;
2149
2150         /* Don't lock: we're in enough trouble already. */
2151         if ((colon = strchr(name, ':')) != NULL) {
2152                 *colon = '\0';
2153                 if ((mod = find_module(name)) != NULL)
2154                         ret = mod_find_symname(mod, colon+1);
2155                 *colon = ':';
2156         } else {
2157                 list_for_each_entry(mod, &modules, list)
2158                         if ((ret = mod_find_symname(mod, name)) != 0)
2159                                 break;
2160         }
2161         return ret;
2162 }
2163 #endif /* CONFIG_KALLSYMS */
2164
2165 /* Called by the /proc file system to return a list of modules. */
2166 static void *m_start(struct seq_file *m, loff_t *pos)
2167 {
2168         struct list_head *i;
2169         loff_t n = 0;
2170
2171         mutex_lock(&module_mutex);
2172         list_for_each(i, &modules) {
2173                 if (n++ == *pos)
2174                         break;
2175         }
2176         if (i == &modules)
2177                 return NULL;
2178         return i;
2179 }
2180
2181 static void *m_next(struct seq_file *m, void *p, loff_t *pos)
2182 {
2183         struct list_head *i = p;
2184         (*pos)++;
2185         if (i->next == &modules)
2186                 return NULL;
2187         return i->next;
2188 }
2189
2190 static void m_stop(struct seq_file *m, void *p)
2191 {
2192         mutex_unlock(&module_mutex);
2193 }
2194
2195 static char *taint_flags(unsigned int taints, char *buf)
2196 {
2197         int bx = 0;
2198
2199         if (taints) {
2200                 buf[bx++] = '(';
2201                 if (taints & TAINT_PROPRIETARY_MODULE)
2202                         buf[bx++] = 'P';
2203                 if (taints & TAINT_FORCED_MODULE)
2204                         buf[bx++] = 'F';
2205                 /*
2206                  * TAINT_FORCED_RMMOD: could be added.
2207                  * TAINT_UNSAFE_SMP, TAINT_MACHINE_CHECK, TAINT_BAD_PAGE don't
2208                  * apply to modules.
2209                  */
2210                 buf[bx++] = ')';
2211         }
2212         buf[bx] = '\0';
2213
2214         return buf;
2215 }
2216
2217 static int m_show(struct seq_file *m, void *p)
2218 {
2219         struct module *mod = list_entry(p, struct module, list);
2220         char buf[8];
2221
2222         seq_printf(m, "%s %lu",
2223                    mod->name, mod->init_size + mod->core_size);
2224         print_unload_info(m, mod);
2225
2226         /* Informative for users. */
2227         seq_printf(m, " %s",
2228                    mod->state == MODULE_STATE_GOING ? "Unloading":
2229                    mod->state == MODULE_STATE_COMING ? "Loading":
2230                    "Live");
2231         /* Used by oprofile and other similar tools. */
2232         seq_printf(m, " 0x%p", mod->module_core);
2233
2234         /* Taints info */
2235         if (mod->taints)
2236                 seq_printf(m, " %s", taint_flags(mod->taints, buf));
2237
2238         seq_printf(m, "\n");
2239         return 0;
2240 }
2241
2242 /* Format: modulename size refcount deps address
2243
2244    Where refcount is a number or -, and deps is a comma-separated list
2245    of depends or -.
2246 */
2247 const struct seq_operations modules_op = {
2248         .start  = m_start,
2249         .next   = m_next,
2250         .stop   = m_stop,
2251         .show   = m_show
2252 };
2253
2254 /* Given an address, look for it in the module exception tables. */
2255 const struct exception_table_entry *search_module_extables(unsigned long addr)
2256 {
2257         unsigned long flags;
2258         const struct exception_table_entry *e = NULL;
2259         struct module *mod;
2260
2261         spin_lock_irqsave(&modlist_lock, flags);
2262         list_for_each_entry(mod, &modules, list) {
2263                 if (mod->num_exentries == 0)
2264                         continue;
2265                                 
2266                 e = search_extable(mod->extable,
2267                                    mod->extable + mod->num_exentries - 1,
2268                                    addr);
2269                 if (e)
2270                         break;
2271         }
2272         spin_unlock_irqrestore(&modlist_lock, flags);
2273
2274         /* Now, if we found one, we are running inside it now, hence
2275            we cannot unload the module, hence no refcnt needed. */
2276         return e;
2277 }
2278
2279 /*
2280  * Is this a valid module address?
2281  */
2282 int is_module_address(unsigned long addr)
2283 {
2284         unsigned long flags;
2285         struct module *mod;
2286
2287         spin_lock_irqsave(&modlist_lock, flags);
2288
2289         list_for_each_entry(mod, &modules, list) {
2290                 if (within(addr, mod->module_core, mod->core_size)) {
2291                         spin_unlock_irqrestore(&modlist_lock, flags);
2292                         return 1;
2293                 }
2294         }
2295
2296         spin_unlock_irqrestore(&modlist_lock, flags);
2297
2298         return 0;
2299 }
2300
2301
2302 /* Is this a valid kernel address?  We don't grab the lock: we are oopsing. */
2303 struct module *__module_text_address(unsigned long addr)
2304 {
2305         struct module *mod;
2306
2307         list_for_each_entry(mod, &modules, list)
2308                 if (within(addr, mod->module_init, mod->init_text_size)
2309                     || within(addr, mod->module_core, mod->core_text_size))
2310                         return mod;
2311         return NULL;
2312 }
2313
2314 struct module *module_text_address(unsigned long addr)
2315 {
2316         struct module *mod;
2317         unsigned long flags;
2318
2319         spin_lock_irqsave(&modlist_lock, flags);
2320         mod = __module_text_address(addr);
2321         spin_unlock_irqrestore(&modlist_lock, flags);
2322
2323         return mod;
2324 }
2325
2326 /* Don't grab lock, we're oopsing. */
2327 void print_modules(void)
2328 {
2329         struct module *mod;
2330         char buf[8];
2331
2332         printk("Modules linked in:");
2333         list_for_each_entry(mod, &modules, list) {
2334                 printk(" %s%s", mod->name, taint_flags(mod->taints, buf));
2335 #if CONFIG_MODULE_SIG      
2336                 if (!mod->gpgsig_ok)
2337                         printk("(U)");
2338 #endif
2339         }
2340         printk("\n");
2341 }
2342
2343 static char *make_driver_name(struct device_driver *drv)
2344 {
2345         char *driver_name;
2346
2347         driver_name = kmalloc(strlen(drv->name) + strlen(drv->bus->name) + 2,
2348                               GFP_KERNEL);
2349         if (!driver_name)
2350                 return NULL;
2351
2352         sprintf(driver_name, "%s:%s", drv->bus->name, drv->name);
2353         return driver_name;
2354 }
2355
2356 void module_add_driver(struct module *mod, struct device_driver *drv)
2357 {
2358         char *driver_name;
2359         int no_warn;
2360
2361         if (!mod || !drv)
2362                 return;
2363
2364         /* Don't check return codes; these calls are idempotent */
2365         no_warn = sysfs_create_link(&drv->kobj, &mod->mkobj.kobj, "module");
2366         driver_name = make_driver_name(drv);
2367         if (driver_name) {
2368                 no_warn = sysfs_create_link(mod->drivers_dir, &drv->kobj,
2369                                             driver_name);
2370                 kfree(driver_name);
2371         }
2372 }
2373 EXPORT_SYMBOL(module_add_driver);
2374
2375 void module_remove_driver(struct device_driver *drv)
2376 {
2377         char *driver_name;
2378
2379         if (!drv)
2380                 return;
2381
2382         sysfs_remove_link(&drv->kobj, "module");
2383         if (drv->owner && drv->owner->drivers_dir) {
2384                 driver_name = make_driver_name(drv);
2385                 if (driver_name) {
2386                         sysfs_remove_link(drv->owner->drivers_dir,
2387                                           driver_name);
2388                         kfree(driver_name);
2389                 }
2390         }
2391 }
2392 EXPORT_SYMBOL(module_remove_driver);
2393
2394 #ifdef CONFIG_MODVERSIONS
2395 /* Generate the signature for struct module here, too, for modversions. */
2396 void struct_module(struct module *mod) { return; }
2397 EXPORT_SYMBOL(struct_module);
2398 #endif