vserver 1.9.5.x5
[linux-2.6.git] / arch / ppc64 / kernel / setup.c
1 /*
2  * 
3  * Common boot and setup code.
4  *
5  * Copyright (C) 2001 PPC64 Team, IBM Corp
6  *
7  *      This program is free software; you can redistribute it and/or
8  *      modify it under the terms of the GNU General Public License
9  *      as published by the Free Software Foundation; either version
10  *      2 of the License, or (at your option) any later version.
11  */
12
13 #undef DEBUG
14
15 #include <linux/config.h>
16 #include <linux/module.h>
17 #include <linux/string.h>
18 #include <linux/sched.h>
19 #include <linux/init.h>
20 #include <linux/kernel.h>
21 #include <linux/reboot.h>
22 #include <linux/delay.h>
23 #include <linux/initrd.h>
24 #include <linux/ide.h>
25 #include <linux/seq_file.h>
26 #include <linux/ioport.h>
27 #include <linux/console.h>
28 #include <linux/version.h>
29 #include <linux/tty.h>
30 #include <linux/root_dev.h>
31 #include <linux/notifier.h>
32 #include <linux/cpu.h>
33 #include <linux/unistd.h>
34 #include <linux/serial.h>
35 #include <linux/serial_8250.h>
36 #include <asm/io.h>
37 #include <asm/prom.h>
38 #include <asm/processor.h>
39 #include <asm/pgtable.h>
40 #include <asm/bootinfo.h>
41 #include <asm/smp.h>
42 #include <asm/elf.h>
43 #include <asm/machdep.h>
44 #include <asm/iSeries/LparData.h>
45 #include <asm/paca.h>
46 #include <asm/ppcdebug.h>
47 #include <asm/time.h>
48 #include <asm/cputable.h>
49 #include <asm/sections.h>
50 #include <asm/btext.h>
51 #include <asm/nvram.h>
52 #include <asm/setup.h>
53 #include <asm/system.h>
54 #include <asm/rtas.h>
55 #include <asm/iommu.h>
56 #include <asm/serial.h>
57 #include <asm/cache.h>
58 #include <asm/page.h>
59 #include <asm/mmu.h>
60
61 #ifdef DEBUG
62 #define DBG(fmt...) udbg_printf(fmt)
63 #else
64 #define DBG(fmt...)
65 #endif
66
67 /*
68  * Here are some early debugging facilities. You can enable one
69  * but your kernel will not boot on anything else if you do so
70  */
71
72 /* This one is for use on LPAR machines that support an HVC console
73  * on vterm 0
74  */
75 extern void udbg_init_debug_lpar(void);
76 /* This one is for use on Apple G5 machines
77  */
78 extern void udbg_init_pmac_realmode(void);
79 /* That's RTAS panel debug */
80 extern void call_rtas_display_status_delay(unsigned char c);
81 /* Here's maple real mode debug */
82 extern void udbg_init_maple_realmode(void);
83
84 #define EARLY_DEBUG_INIT() do {} while(0)
85
86 #if 0
87 #define EARLY_DEBUG_INIT() udbg_init_debug_lpar()
88 #define EARLY_DEBUG_INIT() udbg_init_maple_realmode()
89 #define EARLY_DEBUG_INIT() udbg_init_pmac_realmode()
90 #define EARLY_DEBUG_INIT()                                              \
91         do { ppc_md.udbg_putc = call_rtas_display_status_delay; } while(0)
92 #endif
93
94 /* extern void *stab; */
95 extern unsigned long klimit;
96
97 extern void mm_init_ppc64(void);
98 extern int  idle_setup(void);
99 extern void stab_initialize(unsigned long stab);
100 extern void htab_initialize(void);
101 extern void early_init_devtree(void *flat_dt);
102 extern void unflatten_device_tree(void);
103
104 extern void smp_release_cpus(void);
105
106 unsigned long decr_overclock = 1;
107 unsigned long decr_overclock_proc0 = 1;
108 unsigned long decr_overclock_set = 0;
109 unsigned long decr_overclock_proc0_set = 0;
110
111 int have_of = 1;
112 int boot_cpuid = 0;
113 int boot_cpuid_phys = 0;
114 dev_t boot_dev;
115 u64 ppc64_pft_size;
116 u64 ppc64_debug_switch;
117
118 struct ppc64_caches ppc64_caches;
119 EXPORT_SYMBOL_GPL(ppc64_caches);
120
121 /*
122  * These are used in binfmt_elf.c to put aux entries on the stack
123  * for each elf executable being started.
124  */
125 int dcache_bsize;
126 int icache_bsize;
127 int ucache_bsize;
128
129 /* The main machine-dep calls structure
130  */
131 struct machdep_calls ppc_md;
132
133 #ifdef CONFIG_MAGIC_SYSRQ
134 unsigned long SYSRQ_KEY;
135 #endif /* CONFIG_MAGIC_SYSRQ */
136
137
138 static int ppc64_panic_event(struct notifier_block *, unsigned long, void *);
139 static struct notifier_block ppc64_panic_block = {
140         .notifier_call = ppc64_panic_event,
141         .priority = INT_MIN /* may not return; must be done last */
142 };
143
144 /*
145  * Perhaps we can put the pmac screen_info[] here
146  * on pmac as well so we don't need the ifdef's.
147  * Until we get multiple-console support in here
148  * that is.  -- Cort
149  * Maybe tie it to serial consoles, since this is really what
150  * these processors use on existing boards.  -- Dan
151  */ 
152 struct screen_info screen_info = {
153         .orig_x = 0,
154         .orig_y = 25,
155         .orig_video_cols = 80,
156         .orig_video_lines = 25,
157         .orig_video_isVGA = 1,
158         .orig_video_points = 16
159 };
160
161 /*
162  * Initialize the PPCDBG state.  Called before relocation has been enabled.
163  */
164 void __init ppcdbg_initialize(void)
165 {
166         ppc64_debug_switch = PPC_DEBUG_DEFAULT; /* | PPCDBG_BUSWALK | */
167         /* PPCDBG_PHBINIT | PPCDBG_MM | PPCDBG_MMINIT | PPCDBG_TCEINIT | PPCDBG_TCE */;
168 }
169
170 /*
171  * Early boot console based on udbg
172  */
173 static struct console udbg_console = {
174         .name   = "udbg",
175         .write  = udbg_console_write,
176         .flags  = CON_PRINTBUFFER,
177         .index  = -1,
178 };
179 static int early_console_initialized;
180
181 void __init disable_early_printk(void)
182 {
183         if (!early_console_initialized)
184                 return;
185         unregister_console(&udbg_console);
186         early_console_initialized = 0;
187 }
188
189 #if defined(CONFIG_PPC_MULTIPLATFORM) && defined(CONFIG_SMP)
190
191 static int smt_enabled_cmdline;
192
193 /* Look for ibm,smt-enabled OF option */
194 static void check_smt_enabled(void)
195 {
196         struct device_node *dn;
197         char *smt_option;
198
199         /* Allow the command line to overrule the OF option */
200         if (smt_enabled_cmdline)
201                 return;
202
203         dn = of_find_node_by_path("/options");
204
205         if (dn) {
206                 smt_option = (char *)get_property(dn, "ibm,smt-enabled", NULL);
207
208                 if (smt_option) {
209                         if (!strcmp(smt_option, "on"))
210                                 smt_enabled_at_boot = 1;
211                         else if (!strcmp(smt_option, "off"))
212                                 smt_enabled_at_boot = 0;
213                 }
214         }
215 }
216
217 /* Look for smt-enabled= cmdline option */
218 static int __init early_smt_enabled(char *p)
219 {
220         smt_enabled_cmdline = 1;
221
222         if (!p)
223                 return 0;
224
225         if (!strcmp(p, "on") || !strcmp(p, "1"))
226                 smt_enabled_at_boot = 1;
227         else if (!strcmp(p, "off") || !strcmp(p, "0"))
228                 smt_enabled_at_boot = 0;
229
230         return 0;
231 }
232 early_param("smt-enabled", early_smt_enabled);
233
234 /**
235  * setup_cpu_maps - initialize the following cpu maps:
236  *                  cpu_possible_map
237  *                  cpu_present_map
238  *                  cpu_sibling_map
239  *
240  * Having the possible map set up early allows us to restrict allocations
241  * of things like irqstacks to num_possible_cpus() rather than NR_CPUS.
242  *
243  * We do not initialize the online map here; cpus set their own bits in
244  * cpu_online_map as they come up.
245  *
246  * This function is valid only for Open Firmware systems.  finish_device_tree
247  * must be called before using this.
248  *
249  * While we're here, we may as well set the "physical" cpu ids in the paca.
250  */
251 static void __init setup_cpu_maps(void)
252 {
253         struct device_node *dn = NULL;
254         int cpu = 0;
255         int swap_cpuid = 0;
256
257         check_smt_enabled();
258
259         while ((dn = of_find_node_by_type(dn, "cpu")) && cpu < NR_CPUS) {
260                 u32 *intserv;
261                 int j, len = sizeof(u32), nthreads;
262
263                 intserv = (u32 *)get_property(dn, "ibm,ppc-interrupt-server#s",
264                                               &len);
265                 if (!intserv)
266                         intserv = (u32 *)get_property(dn, "reg", NULL);
267
268                 nthreads = len / sizeof(u32);
269
270                 for (j = 0; j < nthreads && cpu < NR_CPUS; j++) {
271                         /*
272                          * Only spin up secondary threads if SMT is enabled.
273                          * We must leave space in the logical map for the
274                          * threads.
275                          */
276                         if (j == 0 || smt_enabled_at_boot) {
277                                 cpu_set(cpu, cpu_present_map);
278                                 set_hard_smp_processor_id(cpu, intserv[j]);
279                         }
280                         if (intserv[j] == boot_cpuid_phys)
281                                 swap_cpuid = cpu;
282                         cpu_set(cpu, cpu_possible_map);
283                         cpu++;
284                 }
285         }
286
287         /* Swap CPU id 0 with boot_cpuid_phys, so we can always assume that
288          * boot cpu is logical 0.
289          */
290         if (boot_cpuid_phys != get_hard_smp_processor_id(0)) {
291                 u32 tmp;
292                 tmp = get_hard_smp_processor_id(0);
293                 set_hard_smp_processor_id(0, boot_cpuid_phys);
294                 set_hard_smp_processor_id(swap_cpuid, tmp);
295         }
296
297         /*
298          * On pSeries LPAR, we need to know how many cpus
299          * could possibly be added to this partition.
300          */
301         if (systemcfg->platform == PLATFORM_PSERIES_LPAR &&
302                                 (dn = of_find_node_by_path("/rtas"))) {
303                 int num_addr_cell, num_size_cell, maxcpus;
304                 unsigned int *ireg;
305
306                 num_addr_cell = prom_n_addr_cells(dn);
307                 num_size_cell = prom_n_size_cells(dn);
308
309                 ireg = (unsigned int *)
310                         get_property(dn, "ibm,lrdr-capacity", NULL);
311
312                 if (!ireg)
313                         goto out;
314
315                 maxcpus = ireg[num_addr_cell + num_size_cell];
316
317                 /* Double maxcpus for processors which have SMT capability */
318                 if (cur_cpu_spec->cpu_features & CPU_FTR_SMT)
319                         maxcpus *= 2;
320
321                 if (maxcpus > NR_CPUS) {
322                         printk(KERN_WARNING
323                                "Partition configured for %d cpus, "
324                                "operating system maximum is %d.\n",
325                                maxcpus, NR_CPUS);
326                         maxcpus = NR_CPUS;
327                 } else
328                         printk(KERN_INFO "Partition configured for %d cpus.\n",
329                                maxcpus);
330
331                 for (cpu = 0; cpu < maxcpus; cpu++)
332                         cpu_set(cpu, cpu_possible_map);
333         out:
334                 of_node_put(dn);
335         }
336
337         /*
338          * Do the sibling map; assume only two threads per processor.
339          */
340         for_each_cpu(cpu) {
341                 cpu_set(cpu, cpu_sibling_map[cpu]);
342                 if (cur_cpu_spec->cpu_features & CPU_FTR_SMT)
343                         cpu_set(cpu ^ 0x1, cpu_sibling_map[cpu]);
344         }
345
346         systemcfg->processorCount = num_present_cpus();
347 }
348 #endif /* defined(CONFIG_PPC_MULTIPLATFORM) && defined(CONFIG_SMP) */
349
350
351 #ifdef CONFIG_PPC_MULTIPLATFORM
352
353 extern struct machdep_calls pSeries_md;
354 extern struct machdep_calls pmac_md;
355 extern struct machdep_calls maple_md;
356
357 /* Ultimately, stuff them in an elf section like initcalls... */
358 static struct machdep_calls __initdata *machines[] = {
359 #ifdef CONFIG_PPC_PSERIES
360         &pSeries_md,
361 #endif /* CONFIG_PPC_PSERIES */
362 #ifdef CONFIG_PPC_PMAC
363         &pmac_md,
364 #endif /* CONFIG_PPC_PMAC */
365 #ifdef CONFIG_PPC_MAPLE
366         &maple_md,
367 #endif /* CONFIG_PPC_MAPLE */
368         NULL
369 };
370
371 /*
372  * Early initialization entry point. This is called by head.S
373  * with MMU translation disabled. We rely on the "feature" of
374  * the CPU that ignores the top 2 bits of the address in real
375  * mode so we can access kernel globals normally provided we
376  * only toy with things in the RMO region. From here, we do
377  * some early parsing of the device-tree to setup out LMB
378  * data structures, and allocate & initialize the hash table
379  * and segment tables so we can start running with translation
380  * enabled.
381  *
382  * It is this function which will call the probe() callback of
383  * the various platform types and copy the matching one to the
384  * global ppc_md structure. Your platform can eventually do
385  * some very early initializations from the probe() routine, but
386  * this is not recommended, be very careful as, for example, the
387  * device-tree is not accessible via normal means at this point.
388  */
389
390 void __init early_setup(unsigned long dt_ptr)
391 {
392         struct paca_struct *lpaca = get_paca();
393         static struct machdep_calls **mach;
394
395         /*
396          * Enable early debugging if any specified (see top of
397          * this file)
398          */
399         EARLY_DEBUG_INIT();
400
401         DBG(" -> early_setup()\n");
402
403         /*
404          * Fill the default DBG level (do we want to keep
405          * that old mecanism around forever ?)
406          */
407         ppcdbg_initialize();
408
409         /*
410          * Do early initializations using the flattened device
411          * tree, like retreiving the physical memory map or
412          * calculating/retreiving the hash table size
413          */
414         early_init_devtree(__va(dt_ptr));
415
416         /*
417          * Iterate all ppc_md structures until we find the proper
418          * one for the current machine type
419          */
420         DBG("Probing machine type for platform %x...\n",
421             systemcfg->platform);
422
423         for (mach = machines; *mach; mach++) {
424                 if ((*mach)->probe(systemcfg->platform))
425                         break;
426         }
427         /* What can we do if we didn't find ? */
428         if (*mach == NULL) {
429                 DBG("No suitable machine found !\n");
430                 for (;;);
431         }
432         ppc_md = **mach;
433
434         /* our udbg callbacks got overriden by the above, let's put them
435          * back in. Ultimately, I want those things to be split from the
436          * main ppc_md
437          */
438         EARLY_DEBUG_INIT();
439
440         DBG("Found, Initializing memory management...\n");
441
442         /*
443          * Initialize stab / SLB management
444          */
445         stab_initialize(lpaca->stab_real);
446
447         /*
448          * Initialize the MMU Hash table and create the linear mapping
449          * of memory
450          */
451         htab_initialize();
452
453         DBG(" <- early_setup()\n");
454 }
455
456
457 /*
458  * Initialize some remaining members of the ppc64_caches and systemcfg structures
459  * (at least until we get rid of them completely). This is mostly some
460  * cache informations about the CPU that will be used by cache flush
461  * routines and/or provided to userland
462  */
463 static void __init initialize_cache_info(void)
464 {
465         struct device_node *np;
466         unsigned long num_cpus = 0;
467
468         DBG(" -> initialize_cache_info()\n");
469
470         for (np = NULL; (np = of_find_node_by_type(np, "cpu"));) {
471                 num_cpus += 1;
472
473                 /* We're assuming *all* of the CPUs have the same
474                  * d-cache and i-cache sizes... -Peter
475                  */
476
477                 if ( num_cpus == 1 ) {
478                         u32 *sizep, *lsizep;
479                         u32 size, lsize;
480                         const char *dc, *ic;
481
482                         /* Then read cache informations */
483                         if (systemcfg->platform == PLATFORM_POWERMAC) {
484                                 dc = "d-cache-block-size";
485                                 ic = "i-cache-block-size";
486                         } else {
487                                 dc = "d-cache-line-size";
488                                 ic = "i-cache-line-size";
489                         }
490
491                         size = 0;
492                         lsize = cur_cpu_spec->dcache_bsize;
493                         sizep = (u32 *)get_property(np, "d-cache-size", NULL);
494                         if (sizep != NULL)
495                                 size = *sizep;
496                         lsizep = (u32 *) get_property(np, dc, NULL);
497                         if (lsizep != NULL)
498                                 lsize = *lsizep;
499                         if (sizep == 0 || lsizep == 0)
500                                 DBG("Argh, can't find dcache properties ! "
501                                     "sizep: %p, lsizep: %p\n", sizep, lsizep);
502
503                         systemcfg->dcache_size = ppc64_caches.dsize = size;
504                         systemcfg->dcache_line_size =
505                                 ppc64_caches.dline_size = lsize;
506                         ppc64_caches.log_dline_size = __ilog2(lsize);
507                         ppc64_caches.dlines_per_page = PAGE_SIZE / lsize;
508
509                         size = 0;
510                         lsize = cur_cpu_spec->icache_bsize;
511                         sizep = (u32 *)get_property(np, "i-cache-size", NULL);
512                         if (sizep != NULL)
513                                 size = *sizep;
514                         lsizep = (u32 *)get_property(np, ic, NULL);
515                         if (lsizep != NULL)
516                                 lsize = *lsizep;
517                         if (sizep == 0 || lsizep == 0)
518                                 DBG("Argh, can't find icache properties ! "
519                                     "sizep: %p, lsizep: %p\n", sizep, lsizep);
520
521                         systemcfg->icache_size = ppc64_caches.isize = size;
522                         systemcfg->icache_line_size =
523                                 ppc64_caches.iline_size = lsize;
524                         ppc64_caches.log_iline_size = __ilog2(lsize);
525                         ppc64_caches.ilines_per_page = PAGE_SIZE / lsize;
526                 }
527         }
528
529         /* Add an eye catcher and the systemcfg layout version number */
530         strcpy(systemcfg->eye_catcher, "SYSTEMCFG:PPC64");
531         systemcfg->version.major = SYSTEMCFG_MAJOR;
532         systemcfg->version.minor = SYSTEMCFG_MINOR;
533         systemcfg->processor = mfspr(SPRN_PVR);
534
535         DBG(" <- initialize_cache_info()\n");
536 }
537
538 static void __init check_for_initrd(void)
539 {
540 #ifdef CONFIG_BLK_DEV_INITRD
541         u64 *prop;
542
543         DBG(" -> check_for_initrd()\n");
544
545         prop = (u64 *)get_property(of_chosen, "linux,initrd-start", NULL);
546         if (prop != NULL) {
547                 initrd_start = (unsigned long)__va(*prop);
548                 prop = (u64 *)get_property(of_chosen, "linux,initrd-end", NULL);
549                 if (prop != NULL) {
550                         initrd_end = (unsigned long)__va(*prop);
551                         initrd_below_start_ok = 1;
552                 } else
553                         initrd_start = 0;
554         }
555
556         /* If we were passed an initrd, set the ROOT_DEV properly if the values
557          * look sensible. If not, clear initrd reference.
558          */
559         if (initrd_start >= KERNELBASE && initrd_end >= KERNELBASE &&
560             initrd_end > initrd_start)
561                 ROOT_DEV = Root_RAM0;
562         else
563                 initrd_start = initrd_end = 0;
564
565         if (initrd_start)
566                 printk("Found initrd at 0x%lx:0x%lx\n", initrd_start, initrd_end);
567
568         DBG(" <- check_for_initrd()\n");
569 #endif /* CONFIG_BLK_DEV_INITRD */
570 }
571
572 #endif /* CONFIG_PPC_MULTIPLATFORM */
573
574 /*
575  * Do some initial setup of the system.  The parameters are those which 
576  * were passed in from the bootloader.
577  */
578 void __init setup_system(void)
579 {
580         DBG(" -> setup_system()\n");
581
582 #ifdef CONFIG_PPC_ISERIES
583         /* pSeries systems are identified in prom.c via OF. */
584         if (itLpNaca.xLparInstalled == 1)
585                 systemcfg->platform = PLATFORM_ISERIES_LPAR;
586
587         ppc_md.init_early();
588 #else /* CONFIG_PPC_ISERIES */
589
590         /*
591          * Unflatten the device-tree passed by prom_init or kexec
592          */
593         unflatten_device_tree();
594
595         /*
596          * Fill the ppc64_caches & systemcfg structures with informations
597          * retreived from the device-tree. Need to be called before
598          * finish_device_tree() since the later requires some of the
599          * informations filled up here to properly parse the interrupt
600          * tree.
601          * It also sets up the cache line sizes which allows to call
602          * routines like flush_icache_range (used by the hash init
603          * later on).
604          */
605         initialize_cache_info();
606
607 #ifdef CONFIG_PPC_PSERIES
608         /*
609          * Initialize RTAS if available
610          */
611         rtas_initialize();
612 #endif /* CONFIG_PPC_PSERIES */
613
614         /*
615          * Check if we have an initrd provided via the device-tree
616          */
617         check_for_initrd();
618
619         /*
620          * Do some platform specific early initializations, that includes
621          * setting up the hash table pointers. It also sets up some interrupt-mapping
622          * related options that will be used by finish_device_tree()
623          */
624         ppc_md.init_early();
625
626         /*
627          * "Finish" the device-tree, that is do the actual parsing of
628          * some of the properties like the interrupt map
629          */
630         finish_device_tree();
631
632         /*
633          * Initialize xmon
634          */
635 #ifdef CONFIG_XMON_DEFAULT
636         xmon_init();
637 #endif
638         /*
639          * Register early console
640          */
641         early_console_initialized = 1;
642         register_console(&udbg_console);
643
644 #endif /* !CONFIG_PPC_ISERIES */
645
646         /* Save unparsed command line copy for /proc/cmdline */
647         strlcpy(saved_command_line, cmd_line, COMMAND_LINE_SIZE);
648
649         parse_early_param();
650
651 #if defined(CONFIG_SMP) && !defined(CONFIG_PPC_ISERIES)
652         /*
653          * iSeries has already initialized the cpu maps at this point.
654          */
655         setup_cpu_maps();
656
657         /* Release secondary cpus out of their spinloops at 0x60 now that
658          * we can map physical -> logical CPU ids
659          */
660         smp_release_cpus();
661 #endif /* defined(CONFIG_SMP) && !defined(CONFIG_PPC_ISERIES) */
662
663         printk("Starting Linux PPC64 %s\n", UTS_RELEASE);
664
665         printk("-----------------------------------------------------\n");
666         printk("ppc64_pft_size                = 0x%lx\n", ppc64_pft_size);
667         printk("ppc64_debug_switch            = 0x%lx\n", ppc64_debug_switch);
668         printk("ppc64_interrupt_controller    = 0x%ld\n", ppc64_interrupt_controller);
669         printk("systemcfg                     = 0x%p\n", systemcfg);
670         printk("systemcfg->platform           = 0x%x\n", systemcfg->platform);
671         printk("systemcfg->processorCount     = 0x%lx\n", systemcfg->processorCount);
672         printk("systemcfg->physicalMemorySize = 0x%lx\n", systemcfg->physicalMemorySize);
673         printk("ppc64_caches.dcache_line_size = 0x%x\n",
674                         ppc64_caches.dline_size);
675         printk("ppc64_caches.icache_line_size = 0x%x\n",
676                         ppc64_caches.iline_size);
677         printk("htab_address                  = 0x%p\n", htab_address);
678         printk("htab_hash_mask                = 0x%lx\n", htab_hash_mask);
679         printk("-----------------------------------------------------\n");
680
681         mm_init_ppc64();
682
683         DBG(" <- setup_system()\n");
684 }
685
686
687 void machine_restart(char *cmd)
688 {
689         if (ppc_md.nvram_sync)
690                 ppc_md.nvram_sync();
691         ppc_md.restart(cmd);
692 }
693
694 EXPORT_SYMBOL(machine_restart);
695   
696 void machine_power_off(void)
697 {
698         if (ppc_md.nvram_sync)
699                 ppc_md.nvram_sync();
700         ppc_md.power_off();
701 }
702
703 EXPORT_SYMBOL(machine_power_off);
704   
705 void machine_halt(void)
706 {
707         if (ppc_md.nvram_sync)
708                 ppc_md.nvram_sync();
709         ppc_md.halt();
710 }
711
712 EXPORT_SYMBOL(machine_halt);
713
714 unsigned long ppc_proc_freq;
715 unsigned long ppc_tb_freq;
716
717 static int ppc64_panic_event(struct notifier_block *this,
718                              unsigned long event, void *ptr)
719 {
720         ppc_md.panic((char *)ptr);  /* May not return */
721         return NOTIFY_DONE;
722 }
723
724
725 #ifdef CONFIG_SMP
726 DEFINE_PER_CPU(unsigned int, pvr);
727 #endif
728
729 static int show_cpuinfo(struct seq_file *m, void *v)
730 {
731         unsigned long cpu_id = (unsigned long)v - 1;
732         unsigned int pvr;
733         unsigned short maj;
734         unsigned short min;
735
736         if (cpu_id == NR_CPUS) {
737                 seq_printf(m, "timebase\t: %lu\n", ppc_tb_freq);
738
739                 if (ppc_md.get_cpuinfo != NULL)
740                         ppc_md.get_cpuinfo(m);
741
742                 return 0;
743         }
744
745         /* We only show online cpus: disable preempt (overzealous, I
746          * knew) to prevent cpu going down. */
747         preempt_disable();
748         if (!cpu_online(cpu_id)) {
749                 preempt_enable();
750                 return 0;
751         }
752
753 #ifdef CONFIG_SMP
754         pvr = per_cpu(pvr, cpu_id);
755 #else
756         pvr = mfspr(SPRN_PVR);
757 #endif
758         maj = (pvr >> 8) & 0xFF;
759         min = pvr & 0xFF;
760
761         seq_printf(m, "processor\t: %lu\n", cpu_id);
762         seq_printf(m, "cpu\t\t: ");
763
764         if (cur_cpu_spec->pvr_mask)
765                 seq_printf(m, "%s", cur_cpu_spec->cpu_name);
766         else
767                 seq_printf(m, "unknown (%08x)", pvr);
768
769 #ifdef CONFIG_ALTIVEC
770         if (cur_cpu_spec->cpu_features & CPU_FTR_ALTIVEC)
771                 seq_printf(m, ", altivec supported");
772 #endif /* CONFIG_ALTIVEC */
773
774         seq_printf(m, "\n");
775
776         /*
777          * Assume here that all clock rates are the same in a
778          * smp system.  -- Cort
779          */
780         seq_printf(m, "clock\t\t: %lu.%06luMHz\n", ppc_proc_freq / 1000000,
781                    ppc_proc_freq % 1000000);
782
783         seq_printf(m, "revision\t: %hd.%hd\n\n", maj, min);
784
785         preempt_enable();
786         return 0;
787 }
788
789 static void *c_start(struct seq_file *m, loff_t *pos)
790 {
791         return *pos <= NR_CPUS ? (void *)((*pos)+1) : NULL;
792 }
793 static void *c_next(struct seq_file *m, void *v, loff_t *pos)
794 {
795         ++*pos;
796         return c_start(m, pos);
797 }
798 static void c_stop(struct seq_file *m, void *v)
799 {
800 }
801 struct seq_operations cpuinfo_op = {
802         .start =c_start,
803         .next = c_next,
804         .stop = c_stop,
805         .show = show_cpuinfo,
806 };
807
808 #if 0 /* XXX not currently used */
809 unsigned long memory_limit;
810
811 static int __init early_parsemem(char *p)
812 {
813         if (!p)
814                 return 0;
815
816         memory_limit = memparse(p, &p);
817
818         return 0;
819 }
820 early_param("mem", early_parsemem);
821 #endif
822
823 #ifdef CONFIG_PPC_MULTIPLATFORM
824 static int __init set_preferred_console(void)
825 {
826         struct device_node *prom_stdout = NULL;
827         char *name;
828         u32 *spd;
829         int offset = 0;
830
831         DBG(" -> set_preferred_console()\n");
832
833         /* The user has requested a console so this is already set up. */
834         if (strstr(saved_command_line, "console=")) {
835                 DBG(" console was specified !\n");
836                 return -EBUSY;
837         }
838
839         if (!of_chosen) {
840                 DBG(" of_chosen is NULL !\n");
841                 return -ENODEV;
842         }
843         /* We are getting a weird phandle from OF ... */
844         /* ... So use the full path instead */
845         name = (char *)get_property(of_chosen, "linux,stdout-path", NULL);
846         if (name == NULL) {
847                 DBG(" no linux,stdout-path !\n");
848                 return -ENODEV;
849         }
850         prom_stdout = of_find_node_by_path(name);
851         if (!prom_stdout) {
852                 DBG(" can't find stdout package %s !\n", name);
853                 return -ENODEV;
854         }       
855         DBG("stdout is %s\n", prom_stdout->full_name);
856
857         name = (char *)get_property(prom_stdout, "name", NULL);
858         if (!name) {
859                 DBG(" stdout package has no name !\n");
860                 goto not_found;
861         }
862         spd = (u32 *)get_property(prom_stdout, "current-speed", NULL);
863
864         if (0)
865                 ;
866 #ifdef CONFIG_SERIAL_8250_CONSOLE
867         else if (strcmp(name, "serial") == 0) {
868                 int i;
869                 u32 *reg = (u32 *)get_property(prom_stdout, "reg", &i);
870                 if (i > 8) {
871                         switch (reg[1]) {
872                                 case 0x3f8:
873                                         offset = 0;
874                                         break;
875                                 case 0x2f8:
876                                         offset = 1;
877                                         break;
878                                 case 0x898:
879                                         offset = 2;
880                                         break;
881                                 case 0x890:
882                                         offset = 3;
883                                         break;
884                                 default:
885                                         /* We dont recognise the serial port */
886                                         goto not_found;
887                         }
888                 }
889         }
890 #endif /* CONFIG_SERIAL_8250_CONSOLE */
891 #ifdef CONFIG_PPC_PSERIES
892         else if (strcmp(name, "vty") == 0) {
893                 u32 *reg = (u32 *)get_property(prom_stdout, "reg", NULL);
894                 char *compat = (char *)get_property(prom_stdout, "compatible", NULL);
895
896                 if (reg && compat && (strcmp(compat, "hvterm-protocol") == 0)) {
897                         /* Host Virtual Serial Interface */
898                         int offset;
899                         switch (reg[0]) {
900                                 case 0x30000000:
901                                         offset = 0;
902                                         break;
903                                 case 0x30000001:
904                                         offset = 1;
905                                         break;
906                                 default:
907                                         goto not_found;
908                         }
909                         of_node_put(prom_stdout);
910                         DBG("Found hvsi console at offset %d\n", offset);
911                         return add_preferred_console("hvsi", offset, NULL);
912                 } else {
913                         /* pSeries LPAR virtual console */
914                         of_node_put(prom_stdout);
915                         DBG("Found hvc console\n");
916                         return add_preferred_console("hvc", 0, NULL);
917                 }
918         }
919 #endif /* CONFIG_PPC_PSERIES */
920 #ifdef CONFIG_SERIAL_PMACZILOG_CONSOLE
921         else if (strcmp(name, "ch-a") == 0)
922                 offset = 0;
923         else if (strcmp(name, "ch-b") == 0)
924                 offset = 1;
925 #endif /* CONFIG_SERIAL_PMACZILOG_CONSOLE */
926         else
927                 goto not_found;
928         of_node_put(prom_stdout);
929
930         DBG("Found serial console at ttyS%d\n", offset);
931
932         if (spd) {
933                 static char __initdata opt[16];
934                 sprintf(opt, "%d", *spd);
935                 return add_preferred_console("ttyS", offset, opt);
936         } else
937                 return add_preferred_console("ttyS", offset, NULL);
938
939  not_found:
940         DBG("No preferred console found !\n");
941         of_node_put(prom_stdout);
942         return -ENODEV;
943 }
944 console_initcall(set_preferred_console);
945 #endif /* CONFIG_PPC_MULTIPLATFORM */
946
947 #ifdef CONFIG_IRQSTACKS
948 static void __init irqstack_early_init(void)
949 {
950         unsigned int i;
951
952         /*
953          * interrupt stacks must be under 256MB, we cannot afford to take
954          * SLB misses on them.
955          */
956         for_each_cpu(i) {
957                 softirq_ctx[i] = (struct thread_info *)__va(lmb_alloc_base(THREAD_SIZE,
958                                         THREAD_SIZE, 0x10000000));
959                 hardirq_ctx[i] = (struct thread_info *)__va(lmb_alloc_base(THREAD_SIZE,
960                                         THREAD_SIZE, 0x10000000));
961         }
962 }
963 #else
964 #define irqstack_early_init()
965 #endif
966
967 /*
968  * Stack space used when we detect a bad kernel stack pointer, and
969  * early in SMP boots before relocation is enabled.
970  */
971 static void __init emergency_stack_init(void)
972 {
973         unsigned long limit;
974         unsigned int i;
975
976         /*
977          * Emergency stacks must be under 256MB, we cannot afford to take
978          * SLB misses on them. The ABI also requires them to be 128-byte
979          * aligned.
980          *
981          * Since we use these as temporary stacks during secondary CPU
982          * bringup, we need to get at them in real mode. This means they
983          * must also be within the RMO region.
984          */
985         limit = min(0x10000000UL, lmb.rmo_size);
986
987         for_each_cpu(i)
988                 paca[i].emergency_sp = __va(lmb_alloc_base(PAGE_SIZE, 128,
989                                                 limit)) + PAGE_SIZE;
990 }
991
992 /*
993  * Called into from start_kernel, after lock_kernel has been called.
994  * Initializes bootmem, which is unsed to manage page allocation until
995  * mem_init is called.
996  */
997 void __init setup_arch(char **cmdline_p)
998 {
999         extern void do_init_bootmem(void);
1000
1001         ppc64_boot_msg(0x12, "Setup Arch");
1002
1003         *cmdline_p = cmd_line;
1004
1005         /*
1006          * Set cache line size based on type of cpu as a default.
1007          * Systems with OF can look in the properties on the cpu node(s)
1008          * for a possibly more accurate value.
1009          */
1010         dcache_bsize = ppc64_caches.dline_size;
1011         icache_bsize = ppc64_caches.iline_size;
1012
1013         /* reboot on panic */
1014         panic_timeout = 180;
1015
1016         if (ppc_md.panic)
1017                 notifier_chain_register(&panic_notifier_list, &ppc64_panic_block);
1018
1019         init_mm.start_code = PAGE_OFFSET;
1020         init_mm.end_code = (unsigned long) _etext;
1021         init_mm.end_data = (unsigned long) _edata;
1022         init_mm.brk = klimit;
1023         
1024         irqstack_early_init();
1025         emergency_stack_init();
1026
1027         /* set up the bootmem stuff with available memory */
1028         do_init_bootmem();
1029
1030         ppc_md.setup_arch();
1031
1032         /* Select the correct idle loop for the platform. */
1033         idle_setup();
1034
1035         paging_init();
1036         ppc64_boot_msg(0x15, "Setup Done");
1037 }
1038
1039
1040 /* ToDo: do something useful if ppc_md is not yet setup. */
1041 #define PPC64_LINUX_FUNCTION 0x0f000000
1042 #define PPC64_IPL_MESSAGE 0xc0000000
1043 #define PPC64_TERM_MESSAGE 0xb0000000
1044 #define PPC64_ATTN_MESSAGE 0xa0000000
1045 #define PPC64_DUMP_MESSAGE 0xd0000000
1046
1047 static void ppc64_do_msg(unsigned int src, const char *msg)
1048 {
1049         if (ppc_md.progress) {
1050                 char buf[32];
1051
1052                 sprintf(buf, "%08x        \n", src);
1053                 ppc_md.progress(buf, 0);
1054                 sprintf(buf, "%-16s", msg);
1055                 ppc_md.progress(buf, 0);
1056         }
1057 }
1058
1059 /* Print a boot progress message. */
1060 void ppc64_boot_msg(unsigned int src, const char *msg)
1061 {
1062         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_IPL_MESSAGE|src, msg);
1063         printk("[boot]%04x %s\n", src, msg);
1064 }
1065
1066 /* Print a termination message (print only -- does not stop the kernel) */
1067 void ppc64_terminate_msg(unsigned int src, const char *msg)
1068 {
1069         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_TERM_MESSAGE|src, msg);
1070         printk("[terminate]%04x %s\n", src, msg);
1071 }
1072
1073 /* Print something that needs attention (device error, etc) */
1074 void ppc64_attention_msg(unsigned int src, const char *msg)
1075 {
1076         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_ATTN_MESSAGE|src, msg);
1077         printk("[attention]%04x %s\n", src, msg);
1078 }
1079
1080 /* Print a dump progress message. */
1081 void ppc64_dump_msg(unsigned int src, const char *msg)
1082 {
1083         ppc64_do_msg(PPC64_LINUX_FUNCTION|PPC64_DUMP_MESSAGE|src, msg);
1084         printk("[dump]%04x %s\n", src, msg);
1085 }
1086
1087 int set_spread_lpevents( char * str )
1088 {
1089         /* The parameter is the number of processors to share in processing lp events */
1090         unsigned long i;
1091         unsigned long val = simple_strtoul( str, NULL, 0 );
1092         if ( ( val > 0 ) && ( val <= NR_CPUS ) ) {
1093                 for ( i=1; i<val; ++i )
1094                         paca[i].lpqueue_ptr = paca[0].lpqueue_ptr;
1095                 printk("lpevent processing spread over %ld processors\n", val);
1096         }
1097         else
1098                 printk("invalid spreaqd_lpevents %ld\n", val);
1099         return 1;
1100 }       
1101
1102 /* This should only be called on processor 0 during calibrate decr */
1103 void setup_default_decr(void)
1104 {
1105         struct paca_struct *lpaca = get_paca();
1106
1107         if ( decr_overclock_set && !decr_overclock_proc0_set )
1108                 decr_overclock_proc0 = decr_overclock;
1109
1110         lpaca->default_decr = tb_ticks_per_jiffy / decr_overclock_proc0;        
1111         lpaca->next_jiffy_update_tb = get_tb() + tb_ticks_per_jiffy;
1112 }
1113
1114 int set_decr_overclock_proc0( char * str )
1115 {
1116         unsigned long val = simple_strtoul( str, NULL, 0 );
1117         if ( ( val >= 1 ) && ( val <= 48 ) ) {
1118                 decr_overclock_proc0_set = 1;
1119                 decr_overclock_proc0 = val;
1120                 printk("proc 0 decrementer overclock factor of %ld\n", val);
1121         }
1122         else
1123                 printk("invalid proc 0 decrementer overclock factor of %ld\n", val);
1124         return 1;
1125 }
1126
1127 int set_decr_overclock( char * str )
1128 {
1129         unsigned long val = simple_strtoul( str, NULL, 0 );
1130         if ( ( val >= 1 ) && ( val <= 48 ) ) {
1131                 decr_overclock_set = 1;
1132                 decr_overclock = val;
1133                 printk("decrementer overclock factor of %ld\n", val);
1134         }
1135         else
1136                 printk("invalid decrementer overclock factor of %ld\n", val);
1137         return 1;
1138
1139 }
1140
1141 __setup("spread_lpevents=", set_spread_lpevents );
1142 __setup("decr_overclock_proc0=", set_decr_overclock_proc0 );
1143 __setup("decr_overclock=", set_decr_overclock );
1144
1145 #ifndef CONFIG_PPC_ISERIES
1146 /*
1147  * This function can be used by platforms to "find" legacy serial ports.
1148  * It works for "serial" nodes under an "isa" node, and will try to
1149  * respect the "ibm,aix-loc" property if any. It works with up to 8
1150  * ports.
1151  */
1152
1153 #define MAX_LEGACY_SERIAL_PORTS 8
1154 static struct plat_serial8250_port serial_ports[MAX_LEGACY_SERIAL_PORTS+1];
1155 static unsigned int old_serial_count;
1156
1157 void __init generic_find_legacy_serial_ports(u64 *physport,
1158                 unsigned int *default_speed)
1159 {
1160         struct device_node *np;
1161         u32 *sizeprop;
1162
1163         struct isa_reg_property {
1164                 u32 space;
1165                 u32 address;
1166                 u32 size;
1167         };
1168         struct pci_reg_property {
1169                 struct pci_address addr;
1170                 u32 size_hi;
1171                 u32 size_lo;
1172         };                                                                        
1173
1174         DBG(" -> generic_find_legacy_serial_port()\n");
1175
1176         *physport = 0;
1177         if (default_speed)
1178                 *default_speed = 0;
1179
1180         np = of_find_node_by_path("/");
1181         if (!np)
1182                 return;
1183
1184         /* First fill our array */
1185         for (np = NULL; (np = of_find_node_by_type(np, "serial"));) {
1186                 struct device_node *isa, *pci;
1187                 struct isa_reg_property *reg;
1188                 unsigned long phys_size, addr_size, io_base;
1189                 u32 *rangesp;
1190                 u32 *interrupts, *clk, *spd;
1191                 char *typep;
1192                 int index, rlen, rentsize;
1193
1194                 /* Ok, first check if it's under an "isa" parent */
1195                 isa = of_get_parent(np);
1196                 if (!isa || strcmp(isa->name, "isa")) {
1197                         DBG("%s: no isa parent found\n", np->full_name);
1198                         continue;
1199                 }
1200                 
1201                 /* Now look for an "ibm,aix-loc" property that gives us ordering
1202                  * if any...
1203                  */
1204                 typep = (char *)get_property(np, "ibm,aix-loc", NULL);
1205
1206                 /* Get the ISA port number */
1207                 reg = (struct isa_reg_property *)get_property(np, "reg", NULL); 
1208                 if (reg == NULL)
1209                         goto next_port;
1210                 /* We assume the interrupt number isn't translated ... */
1211                 interrupts = (u32 *)get_property(np, "interrupts", NULL);
1212                 /* get clock freq. if present */
1213                 clk = (u32 *)get_property(np, "clock-frequency", NULL);
1214                 /* get default speed if present */
1215                 spd = (u32 *)get_property(np, "current-speed", NULL);
1216                 /* Default to locate at end of array */
1217                 index = old_serial_count; /* end of the array by default */
1218
1219                 /* If we have a location index, then use it */
1220                 if (typep && *typep == 'S') {
1221                         index = simple_strtol(typep+1, NULL, 0) - 1;
1222                         /* if index is out of range, use end of array instead */
1223                         if (index >= MAX_LEGACY_SERIAL_PORTS)
1224                                 index = old_serial_count;
1225                         /* if our index is still out of range, that mean that
1226                          * array is full, we could scan for a free slot but that
1227                          * make little sense to bother, just skip the port
1228                          */
1229                         if (index >= MAX_LEGACY_SERIAL_PORTS)
1230                                 goto next_port;
1231                         if (index >= old_serial_count)
1232                                 old_serial_count = index + 1;
1233                         /* Check if there is a port who already claimed our slot */
1234                         if (serial_ports[index].iobase != 0) {
1235                                 /* if we still have some room, move it, else override */
1236                                 if (old_serial_count < MAX_LEGACY_SERIAL_PORTS) {
1237                                         DBG("Moved legacy port %d -> %d\n", index,
1238                                             old_serial_count);
1239                                         serial_ports[old_serial_count++] =
1240                                                 serial_ports[index];
1241                                 } else {
1242                                         DBG("Replacing legacy port %d\n", index);
1243                                 }
1244                         }
1245                 }
1246                 if (index >= MAX_LEGACY_SERIAL_PORTS)
1247                         goto next_port;
1248                 if (index >= old_serial_count)
1249                         old_serial_count = index + 1;
1250
1251                 /* Now fill the entry */
1252                 memset(&serial_ports[index], 0, sizeof(struct plat_serial8250_port));
1253                 serial_ports[index].uartclk = clk ? *clk : BASE_BAUD * 16;
1254                 serial_ports[index].iobase = reg->address;
1255                 serial_ports[index].irq = interrupts ? interrupts[0] : 0;
1256                 serial_ports[index].flags = ASYNC_BOOT_AUTOCONF;
1257
1258                 DBG("Added legacy port, index: %d, port: %x, irq: %d, clk: %d\n",
1259                     index,
1260                     serial_ports[index].iobase,
1261                     serial_ports[index].irq,
1262                     serial_ports[index].uartclk);
1263
1264                 /* Get phys address of IO reg for port 1 */
1265                 if (index != 0)
1266                         goto next_port;
1267
1268                 pci = of_get_parent(isa);
1269                 if (!pci) {
1270                         DBG("%s: no pci parent found\n", np->full_name);
1271                         goto next_port;
1272                 }
1273
1274                 rangesp = (u32 *)get_property(pci, "ranges", &rlen);
1275                 if (rangesp == NULL) {
1276                         of_node_put(pci);
1277                         goto next_port;
1278                 }
1279                 rlen /= 4;
1280
1281                 /* we need the #size-cells of the PCI bridge node itself */
1282                 phys_size = 1;
1283                 sizeprop = (u32 *)get_property(pci, "#size-cells", NULL);
1284                 if (sizeprop != NULL)
1285                         phys_size = *sizeprop;
1286                 /* we need the parent #addr-cells */
1287                 addr_size = prom_n_addr_cells(pci);
1288                 rentsize = 3 + addr_size + phys_size;
1289                 io_base = 0;
1290                 for (;rlen >= rentsize; rlen -= rentsize,rangesp += rentsize) {
1291                         if (((rangesp[0] >> 24) & 0x3) != 1)
1292                                 continue; /* not IO space */
1293                         io_base = rangesp[3];
1294                         if (addr_size == 2)
1295                                 io_base = (io_base << 32) | rangesp[4];
1296                 }
1297                 if (io_base != 0) {
1298                         *physport = io_base + reg->address;
1299                         if (default_speed && spd)
1300                                 *default_speed = *spd;
1301                 }
1302                 of_node_put(pci);
1303         next_port:
1304                 of_node_put(isa);
1305         }
1306
1307         DBG(" <- generic_find_legacy_serial_port()\n");
1308 }
1309
1310 static struct platform_device serial_device = {
1311         .name   = "serial8250",
1312         .id     = 0,
1313         .dev    = {
1314                 .platform_data = serial_ports,
1315         },
1316 };
1317
1318 static int __init serial_dev_init(void)
1319 {
1320         return platform_device_register(&serial_device);
1321 }
1322 arch_initcall(serial_dev_init);
1323
1324 #endif /* CONFIG_PPC_ISERIES */
1325
1326 int check_legacy_ioport(unsigned long base_port)
1327 {
1328         if (ppc_md.check_legacy_ioport == NULL)
1329                 return 0;
1330         return ppc_md.check_legacy_ioport(base_port);
1331 }
1332 EXPORT_SYMBOL(check_legacy_ioport);
1333
1334 #ifdef CONFIG_XMON
1335 static int __init early_xmon(char *p)
1336 {
1337         /* ensure xmon is enabled */
1338         xmon_init();
1339         debugger(NULL);
1340
1341         return 0;
1342 }
1343 early_param("xmon", early_xmon);
1344 #endif
1345
1346 void cpu_die(void)
1347 {
1348         idle_task_exit();
1349         if (ppc_md.cpu_die)
1350                 ppc_md.cpu_die();
1351         local_irq_disable();
1352         for (;;);
1353 }