This commit was manufactured by cvs2svn to create tag
[linux-2.6.git] / arch / x86_64 / kernel / setup.c
1 /*
2  *  linux/arch/x86-64/kernel/setup.c
3  *
4  *  Copyright (C) 1995  Linus Torvalds
5  *
6  *  Nov 2001 Dave Jones <davej@suse.de>
7  *  Forked from i386 setup code.
8  *
9  *  $Id$
10  */
11
12 /*
13  * This file handles the architecture-dependent parts of initialization
14  */
15
16 #include <linux/errno.h>
17 #include <linux/sched.h>
18 #include <linux/kernel.h>
19 #include <linux/mm.h>
20 #include <linux/stddef.h>
21 #include <linux/unistd.h>
22 #include <linux/ptrace.h>
23 #include <linux/slab.h>
24 #include <linux/user.h>
25 #include <linux/a.out.h>
26 #include <linux/tty.h>
27 #include <linux/ioport.h>
28 #include <linux/delay.h>
29 #include <linux/config.h>
30 #include <linux/init.h>
31 #include <linux/initrd.h>
32 #include <linux/highmem.h>
33 #include <linux/bootmem.h>
34 #include <linux/module.h>
35 #include <asm/processor.h>
36 #include <linux/console.h>
37 #include <linux/seq_file.h>
38 #include <linux/root_dev.h>
39 #include <linux/pci.h>
40 #include <linux/acpi.h>
41 #include <linux/kallsyms.h>
42 #include <linux/edd.h>
43 #include <asm/mtrr.h>
44 #include <asm/uaccess.h>
45 #include <asm/system.h>
46 #include <asm/io.h>
47 #include <asm/smp.h>
48 #include <asm/msr.h>
49 #include <asm/desc.h>
50 #include <video/edid.h>
51 #include <asm/e820.h>
52 #include <asm/dma.h>
53 #include <asm/mpspec.h>
54 #include <asm/mmu_context.h>
55 #include <asm/bootsetup.h>
56 #include <asm/smp.h>
57 #include <asm/proto.h>
58
59 /*
60  * Machine setup..
61  */
62
63 struct cpuinfo_x86 boot_cpu_data;
64
65 unsigned long mmu_cr4_features;
66 EXPORT_SYMBOL_GPL(mmu_cr4_features);
67
68 int acpi_disabled;
69 EXPORT_SYMBOL(acpi_disabled);
70 #ifdef  CONFIG_ACPI_BOOT
71 extern int __initdata acpi_ht;
72 extern acpi_interrupt_flags     acpi_sci_flags;
73 /* int __initdata acpi_force = 0; */
74 #endif
75
76 /* For PCI or other memory-mapped resources */
77 unsigned long pci_mem_start = 0x10000000;
78
79 unsigned long saved_video_mode;
80
81 int swiotlb;
82 EXPORT_SYMBOL(swiotlb);
83
84 /*
85  * Setup options
86  */
87 struct drive_info_struct { char dummy[32]; } drive_info;
88 struct screen_info screen_info;
89 struct sys_desc_table_struct {
90         unsigned short length;
91         unsigned char table[0];
92 };
93
94 struct edid_info edid_info;
95 struct e820map e820;
96
97 unsigned char aux_device_present;
98
99 extern int root_mountflags;
100 extern char _text, _etext, _edata, _end;
101
102 char command_line[COMMAND_LINE_SIZE];
103 char saved_command_line[COMMAND_LINE_SIZE];
104
105 struct resource standard_io_resources[] = {
106         { "dma1", 0x00, 0x1f, IORESOURCE_BUSY | IORESOURCE_IO },
107         { "pic1", 0x20, 0x21, IORESOURCE_BUSY | IORESOURCE_IO },
108         { "timer", 0x40, 0x5f, IORESOURCE_BUSY | IORESOURCE_IO },
109         { "keyboard", 0x60, 0x6f, IORESOURCE_BUSY | IORESOURCE_IO },
110         { "dma page reg", 0x80, 0x8f, IORESOURCE_BUSY | IORESOURCE_IO },
111         { "pic2", 0xa0, 0xa1, IORESOURCE_BUSY | IORESOURCE_IO },
112         { "dma2", 0xc0, 0xdf, IORESOURCE_BUSY | IORESOURCE_IO },
113         { "fpu", 0xf0, 0xff, IORESOURCE_BUSY | IORESOURCE_IO }
114 };
115
116 #define STANDARD_IO_RESOURCES \
117         (sizeof standard_io_resources / sizeof standard_io_resources[0])
118
119 #define IORESOURCE_RAM (IORESOURCE_BUSY | IORESOURCE_MEM)
120
121 struct resource data_resource = { "Kernel data", 0, 0, IORESOURCE_RAM };
122 struct resource code_resource = { "Kernel code", 0, 0, IORESOURCE_RAM };
123
124 #define IORESOURCE_ROM (IORESOURCE_BUSY | IORESOURCE_READONLY | IORESOURCE_MEM)
125
126 static struct resource system_rom_resource = { "System ROM", 0xf0000, 0xfffff, IORESOURCE_ROM };
127 static struct resource extension_rom_resource = { "Extension ROM", 0xe0000, 0xeffff, IORESOURCE_ROM };
128
129 static struct resource adapter_rom_resources[] = {
130         { "Adapter ROM", 0xc8000, 0, IORESOURCE_ROM },
131         { "Adapter ROM", 0, 0, IORESOURCE_ROM },
132         { "Adapter ROM", 0, 0, IORESOURCE_ROM },
133         { "Adapter ROM", 0, 0, IORESOURCE_ROM },
134         { "Adapter ROM", 0, 0, IORESOURCE_ROM },
135         { "Adapter ROM", 0, 0, IORESOURCE_ROM }
136 };
137
138 #define ADAPTER_ROM_RESOURCES \
139         (sizeof adapter_rom_resources / sizeof adapter_rom_resources[0])
140
141 static struct resource video_rom_resource = { "Video ROM", 0xc0000, 0xc7fff, IORESOURCE_ROM };
142 static struct resource video_ram_resource = { "Video RAM area", 0xa0000, 0xbffff, IORESOURCE_RAM };
143
144 #define romsignature(x) (*(unsigned short *)(x) == 0xaa55)
145
146 static int __init romchecksum(unsigned char *rom, unsigned long length)
147 {
148         unsigned char *p, sum = 0;
149
150         for (p = rom; p < rom + length; p++)
151                 sum += *p;
152         return sum == 0;
153 }
154
155 static void __init probe_roms(void)
156 {
157         unsigned long start, length, upper;
158         unsigned char *rom;
159         int           i;
160
161         /* video rom */
162         upper = adapter_rom_resources[0].start;
163         for (start = video_rom_resource.start; start < upper; start += 2048) {
164                 rom = isa_bus_to_virt(start);
165                 if (!romsignature(rom))
166                         continue;
167
168                 video_rom_resource.start = start;
169
170                 /* 0 < length <= 0x7f * 512, historically */
171                 length = rom[2] * 512;
172
173                 /* if checksum okay, trust length byte */
174                 if (length && romchecksum(rom, length))
175                         video_rom_resource.end = start + length - 1;
176
177                 request_resource(&iomem_resource, &video_rom_resource);
178                 break;
179                         }
180
181         start = (video_rom_resource.end + 1 + 2047) & ~2047UL;
182         if (start < upper)
183                 start = upper;
184
185         /* system rom */
186         request_resource(&iomem_resource, &system_rom_resource);
187         upper = system_rom_resource.start;
188
189         /* check for extension rom (ignore length byte!) */
190         rom = isa_bus_to_virt(extension_rom_resource.start);
191         if (romsignature(rom)) {
192                 length = extension_rom_resource.end - extension_rom_resource.start + 1;
193                 if (romchecksum(rom, length)) {
194                         request_resource(&iomem_resource, &extension_rom_resource);
195                         upper = extension_rom_resource.start;
196                 }
197         }
198
199         /* check for adapter roms on 2k boundaries */
200         for (i = 0; i < ADAPTER_ROM_RESOURCES && start < upper; start += 2048) {
201                 rom = isa_bus_to_virt(start);
202                 if (!romsignature(rom))
203                         continue;
204
205                 /* 0 < length <= 0x7f * 512, historically */
206                 length = rom[2] * 512;
207
208                 /* but accept any length that fits if checksum okay */
209                 if (!length || start + length > upper || !romchecksum(rom, length))
210                         continue;
211
212                 adapter_rom_resources[i].start = start;
213                 adapter_rom_resources[i].end = start + length - 1;
214                 request_resource(&iomem_resource, &adapter_rom_resources[i]);
215
216                 start = adapter_rom_resources[i++].end & ~2047UL;
217         }
218 }
219
220 static __init void parse_cmdline_early (char ** cmdline_p)
221 {
222         char c = ' ', *to = command_line, *from = COMMAND_LINE;
223         int len = 0;
224
225         /* Save unparsed command line copy for /proc/cmdline */
226         memcpy(saved_command_line, COMMAND_LINE, COMMAND_LINE_SIZE);
227         saved_command_line[COMMAND_LINE_SIZE-1] = '\0';
228
229         for (;;) {
230                 if (c != ' ') 
231                         goto next_char; 
232
233 #ifdef  CONFIG_SMP
234                 /*
235                  * If the BIOS enumerates physical processors before logical,
236                  * maxcpus=N at enumeration-time can be used to disable HT.
237                  */
238                 else if (!memcmp(from, "maxcpus=", 8)) {
239                         extern unsigned int maxcpus;
240
241                         maxcpus = simple_strtoul(from + 8, NULL, 0);
242                 }
243 #endif
244 #ifdef CONFIG_ACPI_BOOT
245                 /* "acpi=off" disables both ACPI table parsing and interpreter init */
246                 if (!memcmp(from, "acpi=off", 8))
247                         disable_acpi();
248
249                 if (!memcmp(from, "acpi=force", 10)) { 
250                         /* add later when we do DMI horrors: */
251                         /* acpi_force = 1; */   
252                         acpi_disabled = 0;
253                 }
254
255                 /* acpi=ht just means: do ACPI MADT parsing 
256                    at bootup, but don't enable the full ACPI interpreter */
257                 if (!memcmp(from, "acpi=ht", 7)) { 
258                         /* if (!acpi_force) */
259                                 disable_acpi();
260                         acpi_ht = 1; 
261                 }
262                 else if (!memcmp(from, "pci=noacpi", 10)) 
263                         acpi_disable_pci();
264                 else if (!memcmp(from, "acpi=noirq", 10))
265                         acpi_noirq_set();
266
267                 else if (!memcmp(from, "acpi_sci=edge", 13))
268                         acpi_sci_flags.trigger =  1;
269                 else if (!memcmp(from, "acpi_sci=level", 14))
270                         acpi_sci_flags.trigger = 3;
271                 else if (!memcmp(from, "acpi_sci=high", 13))
272                         acpi_sci_flags.polarity = 1;
273                 else if (!memcmp(from, "acpi_sci=low", 12))
274                         acpi_sci_flags.polarity = 3;
275
276                 /* acpi=strict disables out-of-spec workarounds */
277                 else if (!memcmp(from, "acpi=strict", 11)) {
278                         acpi_strict = 1;
279                 }
280 #endif
281
282                 if (!memcmp(from, "nolapic", 7) ||
283                     !memcmp(from, "disableapic", 11))
284                         disable_apic = 1;
285
286                 if (!memcmp(from, "noapic", 6)) 
287                         skip_ioapic_setup = 1;
288
289                 if (!memcmp(from, "apic", 4)) { 
290                         skip_ioapic_setup = 0;
291                         ioapic_force = 1;
292                 }
293                         
294                 if (!memcmp(from, "mem=", 4))
295                         parse_memopt(from+4, &from); 
296
297 #ifdef CONFIG_DISCONTIGMEM
298                 if (!memcmp(from, "numa=", 5))
299                         numa_setup(from+5); 
300 #endif
301
302 #ifdef CONFIG_GART_IOMMU 
303                 if (!memcmp(from,"iommu=",6)) { 
304                         iommu_setup(from+6); 
305                 }
306 #endif
307
308                 if (!memcmp(from,"oops=panic", 10))
309                         panic_on_oops = 1;
310
311         next_char:
312                 c = *(from++);
313                 if (!c)
314                         break;
315                 if (COMMAND_LINE_SIZE <= ++len)
316                         break;
317                 *(to++) = c;
318         }
319         *to = '\0';
320         *cmdline_p = command_line;
321 }
322
323 #ifndef CONFIG_DISCONTIGMEM
324 static void __init contig_initmem_init(void)
325 {
326         unsigned long bootmap_size, bootmap; 
327         bootmap_size = bootmem_bootmap_pages(end_pfn)<<PAGE_SHIFT;
328         bootmap = find_e820_area(0, end_pfn<<PAGE_SHIFT, bootmap_size);
329         if (bootmap == -1L) 
330                 panic("Cannot find bootmem map of size %ld\n",bootmap_size);
331         bootmap_size = init_bootmem(bootmap >> PAGE_SHIFT, end_pfn);
332         e820_bootmem_free(&contig_page_data, 0, end_pfn << PAGE_SHIFT); 
333         reserve_bootmem(bootmap, bootmap_size);
334
335 #endif
336
337 /* Use inline assembly to define this because the nops are defined 
338    as inline assembly strings in the include files and we cannot 
339    get them easily into strings. */
340 asm("\t.data\nk8nops: " 
341     K8_NOP1 K8_NOP2 K8_NOP3 K8_NOP4 K8_NOP5 K8_NOP6
342     K8_NOP7 K8_NOP8); 
343     
344 extern unsigned char k8nops[];
345 static unsigned char *k8_nops[ASM_NOP_MAX+1] = { 
346      NULL,
347      k8nops,
348      k8nops + 1,
349      k8nops + 1 + 2,
350      k8nops + 1 + 2 + 3,
351      k8nops + 1 + 2 + 3 + 4,
352      k8nops + 1 + 2 + 3 + 4 + 5,
353      k8nops + 1 + 2 + 3 + 4 + 5 + 6,
354      k8nops + 1 + 2 + 3 + 4 + 5 + 6 + 7,
355 }; 
356
357 /* Replace instructions with better alternatives for this CPU type.
358
359    This runs before SMP is initialized to avoid SMP problems with
360    self modifying code. This implies that assymetric systems where
361    APs have less capabilities than the boot processor are not handled. 
362    In this case boot with "noreplacement". */ 
363 void apply_alternatives(void *start, void *end) 
364
365         struct alt_instr *a; 
366         int diff, i, k;
367         for (a = start; (void *)a < end; a++) { 
368                 if (!boot_cpu_has(a->cpuid))
369                         continue;
370
371                 BUG_ON(a->replacementlen > a->instrlen); 
372                 __inline_memcpy(a->instr, a->replacement, a->replacementlen); 
373                 diff = a->instrlen - a->replacementlen; 
374
375                 /* Pad the rest with nops */
376                 for (i = a->replacementlen; diff > 0; diff -= k, i += k) {
377                         k = diff;
378                         if (k > ASM_NOP_MAX)
379                                 k = ASM_NOP_MAX;
380                         __inline_memcpy(a->instr + i, k8_nops[k], k); 
381                 } 
382         }
383
384
385 static int no_replacement __initdata = 0; 
386  
387 void __init alternative_instructions(void)
388 {
389         extern struct alt_instr __alt_instructions[], __alt_instructions_end[];
390         if (no_replacement) 
391                 return;
392         apply_alternatives(__alt_instructions, __alt_instructions_end);
393 }
394
395 static int __init noreplacement_setup(char *s)
396
397      no_replacement = 1; 
398      return 0; 
399
400
401 __setup("noreplacement", noreplacement_setup); 
402
403 #if defined(CONFIG_EDD) || defined(CONFIG_EDD_MODULE)
404 unsigned char eddnr;
405 struct edd_info edd[EDDMAXNR];
406 unsigned int edd_disk80_sig;
407 #ifdef CONFIG_EDD_MODULE
408 EXPORT_SYMBOL(eddnr);
409 EXPORT_SYMBOL(edd);
410 EXPORT_SYMBOL(edd_disk80_sig);
411 #endif
412 /**
413  * copy_edd() - Copy the BIOS EDD information
414  *              from empty_zero_page into a safe place.
415  *
416  */
417 static inline void copy_edd(void)
418 {
419      eddnr = EDD_NR;
420      memcpy(edd, EDD_BUF, sizeof(edd));
421      edd_disk80_sig = DISK80_SIGNATURE;
422 }
423 #else
424 #define copy_edd() do {} while (0)
425 #endif
426
427 void __init setup_arch(char **cmdline_p)
428 {
429         unsigned long low_mem_size;
430         unsigned long kernel_end;
431
432         ROOT_DEV = old_decode_dev(ORIG_ROOT_DEV);
433         drive_info = DRIVE_INFO;
434         screen_info = SCREEN_INFO;
435         edid_info = EDID_INFO;
436         aux_device_present = AUX_DEVICE_INFO;
437         saved_video_mode = SAVED_VIDEO_MODE;
438
439 #ifdef CONFIG_BLK_DEV_RAM
440         rd_image_start = RAMDISK_FLAGS & RAMDISK_IMAGE_START_MASK;
441         rd_prompt = ((RAMDISK_FLAGS & RAMDISK_PROMPT_FLAG) != 0);
442         rd_doload = ((RAMDISK_FLAGS & RAMDISK_LOAD_FLAG) != 0);
443 #endif
444         setup_memory_region();
445         copy_edd();
446
447         if (!MOUNT_ROOT_RDONLY)
448                 root_mountflags &= ~MS_RDONLY;
449         init_mm.start_code = (unsigned long) &_text;
450         init_mm.end_code = (unsigned long) &_etext;
451         init_mm.end_data = (unsigned long) &_edata;
452         init_mm.brk = (unsigned long) &_end;
453
454         code_resource.start = virt_to_phys(&_text);
455         code_resource.end = virt_to_phys(&_etext)-1;
456         data_resource.start = virt_to_phys(&_etext);
457         data_resource.end = virt_to_phys(&_edata)-1;
458
459         parse_cmdline_early(cmdline_p);
460
461         /*
462          * partially used pages are not usable - thus
463          * we are rounding upwards:
464          */
465         end_pfn = e820_end_of_ram();
466
467         check_efer();
468
469         init_memory_mapping(); 
470
471 #ifdef CONFIG_DISCONTIGMEM
472         numa_initmem_init(0, end_pfn); 
473 #else
474         contig_initmem_init(); 
475 #endif
476
477         /* Reserve direct mapping */
478         reserve_bootmem_generic(table_start << PAGE_SHIFT, 
479                                 (table_end - table_start) << PAGE_SHIFT);
480
481         /* reserve kernel */
482         kernel_end = round_up(__pa_symbol(&_end),PAGE_SIZE);
483         reserve_bootmem_generic(HIGH_MEMORY, kernel_end - HIGH_MEMORY);
484
485         /*
486          * reserve physical page 0 - it's a special BIOS page on many boxes,
487          * enabling clean reboots, SMP operation, laptop functions.
488          */
489         reserve_bootmem_generic(0, PAGE_SIZE);
490
491 #ifdef CONFIG_SMP
492         /*
493          * But first pinch a few for the stack/trampoline stuff
494          * FIXME: Don't need the extra page at 4K, but need to fix
495          * trampoline before removing it. (see the GDT stuff)
496          */
497         reserve_bootmem_generic(PAGE_SIZE, PAGE_SIZE);
498
499         /* Reserve SMP trampoline */
500         reserve_bootmem_generic(SMP_TRAMPOLINE_BASE, PAGE_SIZE);
501 #endif
502
503 #ifdef CONFIG_ACPI_SLEEP
504        /*
505         * Reserve low memory region for sleep support.
506         */
507        acpi_reserve_bootmem();
508 #endif
509 #ifdef CONFIG_X86_LOCAL_APIC
510         /*
511          * Find and reserve possible boot-time SMP configuration:
512          */
513         find_smp_config();
514 #endif
515 #ifdef CONFIG_BLK_DEV_INITRD
516         if (LOADER_TYPE && INITRD_START) {
517                 if (INITRD_START + INITRD_SIZE <= (end_pfn << PAGE_SHIFT)) {
518                         reserve_bootmem_generic(INITRD_START, INITRD_SIZE);
519                         initrd_start =
520                                 INITRD_START ? INITRD_START + PAGE_OFFSET : 0;
521                         initrd_end = initrd_start+INITRD_SIZE;
522                 }
523                 else {
524                         printk(KERN_ERR "initrd extends beyond end of memory "
525                             "(0x%08lx > 0x%08lx)\ndisabling initrd\n",
526                             (unsigned long)(INITRD_START + INITRD_SIZE),
527                             (unsigned long)(end_pfn << PAGE_SHIFT));
528                         initrd_start = 0;
529                 }
530         }
531 #endif
532         paging_init();
533
534                 check_ioapic();
535 #ifdef CONFIG_ACPI_BOOT
536        /*
537         * Initialize the ACPI boot-time table parser (gets the RSDP and SDT).
538         * Must do this after paging_init (due to reliance on fixmap, and thus
539         * the bootmem allocator) but before get_smp_config (to allow parsing
540         * of MADT).
541         */
542         acpi_boot_init();
543 #endif
544 #ifdef CONFIG_X86_LOCAL_APIC
545         /*
546          * get boot-time SMP configuration:
547          */
548         if (smp_found_config)
549                 get_smp_config();
550         init_apic_mappings();
551 #endif
552
553         /*
554          * Request address space for all standard RAM and ROM resources
555          * and also for regions reported as reserved by the e820.
556          */
557         probe_roms();
558         e820_reserve_resources(); 
559
560         request_resource(&iomem_resource, &video_ram_resource);
561
562         {
563         unsigned i;
564         /* request I/O space for devices used on all i[345]86 PCs */
565         for (i = 0; i < STANDARD_IO_RESOURCES; i++)
566                 request_resource(&ioport_resource, &standard_io_resources[i]);
567         }
568
569         /* Will likely break when you have unassigned resources with more
570            than 4GB memory and bridges that don't support more than 4GB. 
571            Doing it properly would require to use pci_alloc_consistent
572            in this case. */
573         low_mem_size = ((end_pfn << PAGE_SHIFT) + 0xfffff) & ~0xfffff;
574         if (low_mem_size > pci_mem_start)
575                 pci_mem_start = low_mem_size;
576
577 #ifdef CONFIG_GART_IOMMU
578        iommu_hole_init();
579 #endif
580
581 #ifdef CONFIG_VT
582 #if defined(CONFIG_VGA_CONSOLE)
583         conswitchp = &vga_con;
584 #elif defined(CONFIG_DUMMY_CONSOLE)
585         conswitchp = &dummy_con;
586 #endif
587 #endif
588 }
589
590 static int __init get_model_name(struct cpuinfo_x86 *c)
591 {
592         unsigned int *v;
593
594         if (cpuid_eax(0x80000000) < 0x80000004)
595                 return 0;
596
597         v = (unsigned int *) c->x86_model_id;
598         cpuid(0x80000002, &v[0], &v[1], &v[2], &v[3]);
599         cpuid(0x80000003, &v[4], &v[5], &v[6], &v[7]);
600         cpuid(0x80000004, &v[8], &v[9], &v[10], &v[11]);
601         c->x86_model_id[48] = 0;
602         return 1;
603 }
604
605
606 static void __init display_cacheinfo(struct cpuinfo_x86 *c)
607 {
608         unsigned int n, dummy, eax, ebx, ecx, edx;
609
610         n = cpuid_eax(0x80000000);
611
612         if (n >= 0x80000005) {
613                 cpuid(0x80000005, &dummy, &ebx, &ecx, &edx);
614                 printk(KERN_INFO "CPU: L1 I Cache: %dK (%d bytes/line), D cache %dK (%d bytes/line)\n",
615                         edx>>24, edx&0xFF, ecx>>24, ecx&0xFF);
616                 c->x86_cache_size=(ecx>>24)+(edx>>24);  
617                 /* DTLB and ITLB together, but only 4K */
618                 c->x86_tlbsize = ((ebx>>16)&0xff) + (ebx&0xff);
619         }
620
621         if (n >= 0x80000006) {
622                 cpuid(0x80000006, &dummy, &ebx, &ecx, &edx);
623         ecx = cpuid_ecx(0x80000006);
624         c->x86_cache_size = ecx >> 16;
625                 c->x86_tlbsize += ((ebx >> 16) & 0xfff) + (ebx & 0xfff);
626
627         printk(KERN_INFO "CPU: L2 Cache: %dK (%d bytes/line)\n",
628                 c->x86_cache_size, ecx & 0xFF);
629         }
630
631         if (n >= 0x80000007)
632                 cpuid(0x80000007, &dummy, &dummy, &dummy, &c->x86_power); 
633         if (n >= 0x80000008) {
634                 cpuid(0x80000008, &eax, &dummy, &dummy, &dummy); 
635                 c->x86_virt_bits = (eax >> 8) & 0xff;
636                 c->x86_phys_bits = eax & 0xff;
637         }
638 }
639
640
641 static int __init init_amd(struct cpuinfo_x86 *c)
642 {
643         int r;
644         int level;
645
646         /* Bit 31 in normal CPUID used for nonstandard 3DNow ID;
647            3DNow is IDd by bit 31 in extended CPUID (1*32+31) anyway */
648         clear_bit(0*32+31, &c->x86_capability);
649         
650         /* C-stepping K8? */
651         level = cpuid_eax(1);
652         if ((level >= 0x0f48 && level < 0x0f50) || level >= 0x0f58)
653                 set_bit(X86_FEATURE_K8_C, &c->x86_capability);
654
655         r = get_model_name(c);
656         if (!r) { 
657                 switch (c->x86) { 
658                 case 15:
659                         /* Should distinguish Models here, but this is only
660                            a fallback anyways. */
661                         strcpy(c->x86_model_id, "Hammer");
662                         break; 
663                 } 
664         } 
665         display_cacheinfo(c);
666         return r;
667 }
668
669 static void __init detect_ht(struct cpuinfo_x86 *c)
670 {
671 #ifdef CONFIG_SMP
672         u32     eax, ebx, ecx, edx;
673         int     index_lsb, index_msb, tmp;
674         int     initial_apic_id;
675         int     cpu = smp_processor_id();
676         
677         if (!cpu_has(c, X86_FEATURE_HT))
678                 return;
679
680         cpuid(1, &eax, &ebx, &ecx, &edx);
681         smp_num_siblings = (ebx & 0xff0000) >> 16;
682         
683         if (smp_num_siblings == 1) {
684                 printk(KERN_INFO  "CPU: Hyper-Threading is disabled\n");
685         } else if (smp_num_siblings > 1) {
686                 index_lsb = 0;
687                 index_msb = 31;
688                 /*
689                  * At this point we only support two siblings per
690                  * processor package.
691                  */
692                 if (smp_num_siblings > NR_CPUS) {
693                         printk(KERN_WARNING "CPU: Unsupported number of the siblings %d", smp_num_siblings);
694                         smp_num_siblings = 1;
695                         return;
696                 }
697                 tmp = smp_num_siblings;
698                 while ((tmp & 1) == 0) {
699                         tmp >>=1 ;
700                         index_lsb++;
701                 }
702                 tmp = smp_num_siblings;
703                 while ((tmp & 0x80000000 ) == 0) {
704                         tmp <<=1 ;
705                         index_msb--;
706                 }
707                 if (index_lsb != index_msb )
708                         index_msb++;
709                 initial_apic_id = ebx >> 24 & 0xff;
710                 phys_proc_id[cpu] = initial_apic_id >> index_msb;
711                 
712                 printk(KERN_INFO  "CPU: Physical Processor ID: %d\n",
713                        phys_proc_id[cpu]);
714         }
715 #endif
716 }
717         
718 #define LVL_1_INST      1
719 #define LVL_1_DATA      2
720 #define LVL_2           3
721 #define LVL_3           4
722 #define LVL_TRACE       5
723
724 struct _cache_table
725 {
726         unsigned char descriptor;
727         char cache_type;
728         short size;
729 };
730
731 /* all the cache descriptor types we care about (no TLB or trace cache entries) */
732 static struct _cache_table cache_table[] __initdata =
733 {
734         { 0x06, LVL_1_INST, 8 },
735         { 0x08, LVL_1_INST, 16 },
736         { 0x0a, LVL_1_DATA, 8 },
737         { 0x0c, LVL_1_DATA, 16 },
738         { 0x22, LVL_3,      512 },
739         { 0x23, LVL_3,      1024 },
740         { 0x25, LVL_3,      2048 },
741         { 0x29, LVL_3,      4096 },
742         { 0x2c, LVL_1_DATA, 32 },
743         { 0x30, LVL_1_INST, 32 },
744         { 0x39, LVL_2,      128 },
745         { 0x3b, LVL_2,      128 },
746         { 0x3c, LVL_2,      256 },
747         { 0x41, LVL_2,      128 },
748         { 0x42, LVL_2,      256 },
749         { 0x43, LVL_2,      512 },
750         { 0x44, LVL_2,      1024 },
751         { 0x45, LVL_2,      2048 },
752         { 0x66, LVL_1_DATA, 8 },
753         { 0x67, LVL_1_DATA, 16 },
754         { 0x68, LVL_1_DATA, 32 },
755         { 0x70, LVL_TRACE,  12 },
756         { 0x71, LVL_TRACE,  16 },
757         { 0x72, LVL_TRACE,  32 },
758         { 0x79, LVL_2,      128 },
759         { 0x7a, LVL_2,      256 },
760         { 0x7b, LVL_2,      512 },
761         { 0x7c, LVL_2,      1024 },
762         { 0x82, LVL_2,      256 },
763         { 0x83, LVL_2,      512 },
764         { 0x84, LVL_2,      1024 },
765         { 0x85, LVL_2,      2048 },
766         { 0x86, LVL_2,      512 },
767         { 0x87, LVL_2,      1024 },
768         { 0x00, 0, 0}
769 };
770
771 static void __init init_intel(struct cpuinfo_x86 *c)
772 {
773         /* Cache sizes */
774         unsigned int trace = 0, l1i = 0, l1d = 0, l2 = 0, l3 = 0; 
775         unsigned n;
776
777         if (c->cpuid_level > 1) {
778                 /* supports eax=2  call */
779                 int i, j, n;
780                 int regs[4];
781                 unsigned char *dp = (unsigned char *)regs;
782
783                 /* Number of times to iterate */
784                 n = cpuid_eax(2) & 0xFF;
785
786                 for ( i = 0 ; i < n ; i++ ) {
787                         cpuid(2, &regs[0], &regs[1], &regs[2], &regs[3]);
788                         
789                         /* If bit 31 is set, this is an unknown format */
790                         for ( j = 0 ; j < 3 ; j++ ) {
791                                 if ( regs[j] < 0 ) regs[j] = 0;
792                         }
793
794                         /* Byte 0 is level count, not a descriptor */
795                         for ( j = 1 ; j < 16 ; j++ ) {
796                                 unsigned char des = dp[j];
797                                 unsigned char k = 0;
798
799                                 /* look up this descriptor in the table */
800                                 while (cache_table[k].descriptor != 0)
801                                 {
802                                         if (cache_table[k].descriptor == des) {
803                                                 switch (cache_table[k].cache_type) {
804                                                 case LVL_1_INST:
805                                                         l1i += cache_table[k].size;
806                                                         break;
807                                                 case LVL_1_DATA:
808                                                         l1d += cache_table[k].size;
809                                                         break;
810                                                 case LVL_2:
811                                                         l2 += cache_table[k].size;
812                                                         break;
813                                                 case LVL_3:
814                                                         l3 += cache_table[k].size;
815                                                         break;
816                                                 case LVL_TRACE:
817                                                         trace += cache_table[k].size;
818                                                         break;
819                                                 }
820
821                                                 break;
822                                         }
823
824                                         k++;
825                                 }
826                         }
827                 }
828
829                 if (trace)
830                         printk (KERN_INFO "CPU: Trace cache: %dK uops", trace);
831                 else if (l1i)
832                         printk (KERN_INFO "CPU: L1 I cache: %dK", l1i);
833                 if (l1d)
834                         printk(", L1 D cache: %dK\n", l1d);
835                 else
836                         printk("\n"); 
837                 if (l2)
838                         printk(KERN_INFO "CPU: L2 cache: %dK\n", l2);
839                 if (l3)
840                         printk(KERN_INFO "CPU: L3 cache: %dK\n", l3);
841
842                 c->x86_cache_size = l2 ? l2 : (l1i+l1d);
843         }
844
845         n = cpuid_eax(0x80000000);
846         if (n >= 0x80000008) {
847                 unsigned eax = cpuid_eax(0x80000008);
848                 c->x86_virt_bits = (eax >> 8) & 0xff;
849                 c->x86_phys_bits = eax & 0xff;
850         }
851
852         if (c->x86 == 15)
853                 c->x86_cache_alignment = c->x86_clflush_size * 2;
854 }
855
856 void __init get_cpu_vendor(struct cpuinfo_x86 *c)
857 {
858         char *v = c->x86_vendor_id;
859
860         if (!strcmp(v, "AuthenticAMD"))
861                 c->x86_vendor = X86_VENDOR_AMD;
862         else if (!strcmp(v, "GenuineIntel"))
863                 c->x86_vendor = X86_VENDOR_INTEL;
864         else
865                 c->x86_vendor = X86_VENDOR_UNKNOWN;
866 }
867
868 struct cpu_model_info {
869         int vendor;
870         int family;
871         char *model_names[16];
872 };
873
874 /* Do some early cpuid on the boot CPU to get some parameter that are
875    needed before check_bugs. Everything advanced is in identify_cpu
876    below. */
877 void __init early_identify_cpu(struct cpuinfo_x86 *c)
878 {
879         u32 tfms;
880
881         c->loops_per_jiffy = loops_per_jiffy;
882         c->x86_cache_size = -1;
883         c->x86_vendor = X86_VENDOR_UNKNOWN;
884         c->x86_model = c->x86_mask = 0; /* So far unknown... */
885         c->x86_vendor_id[0] = '\0'; /* Unset */
886         c->x86_model_id[0] = '\0';  /* Unset */
887         c->x86_clflush_size = 64;
888         c->x86_cache_alignment = c->x86_clflush_size;
889         memset(&c->x86_capability, 0, sizeof c->x86_capability);
890
891         /* Get vendor name */
892         cpuid(0x00000000, &c->cpuid_level,
893               (int *)&c->x86_vendor_id[0],
894               (int *)&c->x86_vendor_id[8],
895               (int *)&c->x86_vendor_id[4]);
896                 
897         get_cpu_vendor(c);
898
899         /* Initialize the standard set of capabilities */
900         /* Note that the vendor-specific code below might override */
901
902         /* Intel-defined flags: level 0x00000001 */
903         if (c->cpuid_level >= 0x00000001) {
904                 __u32 misc;
905                 cpuid(0x00000001, &tfms, &misc, &c->x86_capability[4],
906                       &c->x86_capability[0]);
907                 c->x86 = (tfms >> 8) & 0xf;
908                 c->x86_model = (tfms >> 4) & 0xf;
909                 c->x86_mask = tfms & 0xf;
910                 if (c->x86 == 0xf) {
911                         c->x86 += (tfms >> 20) & 0xff;
912                         c->x86_model += ((tfms >> 16) & 0xF) << 4;
913                 } 
914                 if (c->x86_capability[0] & (1<<19)) 
915                         c->x86_clflush_size = ((misc >> 8) & 0xff) * 8;
916         } else {
917                 /* Have CPUID level 0 only - unheard of */
918                 c->x86 = 4;
919         }
920 }
921
922 /*
923  * This does the hard work of actually picking apart the CPU stuff...
924  */
925 void __init identify_cpu(struct cpuinfo_x86 *c)
926 {
927         int i;
928         u32 xlvl;
929
930         early_identify_cpu(c);
931
932         /* AMD-defined flags: level 0x80000001 */
933         xlvl = cpuid_eax(0x80000000);
934         if ( (xlvl & 0xffff0000) == 0x80000000 ) {
935                 if ( xlvl >= 0x80000001 )
936                         c->x86_capability[1] = cpuid_edx(0x80000001);
937                 if ( xlvl >= 0x80000004 )
938                         get_model_name(c); /* Default name */
939         }
940
941         /* Transmeta-defined flags: level 0x80860001 */
942         xlvl = cpuid_eax(0x80860000);
943         if ( (xlvl & 0xffff0000) == 0x80860000 ) {
944                 if (  xlvl >= 0x80860001 )
945                         c->x86_capability[2] = cpuid_edx(0x80860001);
946         }
947
948         /*
949          * Vendor-specific initialization.  In this section we
950          * canonicalize the feature flags, meaning if there are
951          * features a certain CPU supports which CPUID doesn't
952          * tell us, CPUID claiming incorrect flags, or other bugs,
953          * we handle them here.
954          *
955          * At the end of this section, c->x86_capability better
956          * indicate the features this CPU genuinely supports!
957          */
958         switch ( c->x86_vendor ) {
959
960                 case X86_VENDOR_AMD:
961                         init_amd(c);
962                         break;
963
964                 case X86_VENDOR_INTEL:
965                         init_intel(c); 
966                         break; 
967
968                 case X86_VENDOR_UNKNOWN:
969                 default:
970                         display_cacheinfo(c);
971                         break;
972         }
973
974         select_idle_routine(c);
975         detect_ht(c); 
976                 
977         /*
978          * On SMP, boot_cpu_data holds the common feature set between
979          * all CPUs; so make sure that we indicate which features are
980          * common between the CPUs.  The first time this routine gets
981          * executed, c == &boot_cpu_data.
982          */
983         if ( c != &boot_cpu_data ) {
984                 /* AND the already accumulated flags with these */
985                 for ( i = 0 ; i < NCAPINTS ; i++ )
986                         boot_cpu_data.x86_capability[i] &= c->x86_capability[i];
987         }
988
989         mcheck_init(c);
990 }
991  
992
993 void __init print_cpu_info(struct cpuinfo_x86 *c)
994 {
995         if (c->x86_model_id[0])
996                 printk("%s", c->x86_model_id);
997
998         if (c->x86_mask || c->cpuid_level >= 0) 
999                 printk(" stepping %02x\n", c->x86_mask);
1000         else
1001                 printk("\n");
1002 }
1003
1004 /*
1005  *      Get CPU information for use by the procfs.
1006  */
1007
1008 static int show_cpuinfo(struct seq_file *m, void *v)
1009 {
1010         struct cpuinfo_x86 *c = v;
1011
1012         /* 
1013          * These flag bits must match the definitions in <asm/cpufeature.h>.
1014          * NULL means this bit is undefined or reserved; either way it doesn't
1015          * have meaning as far as Linux is concerned.  Note that it's important
1016          * to realize there is a difference between this table and CPUID -- if
1017          * applications want to get the raw CPUID data, they should access
1018          * /dev/cpu/<cpu_nr>/cpuid instead.
1019          */
1020         static char *x86_cap_flags[] = {
1021                 /* Intel-defined */
1022                 "fpu", "vme", "de", "pse", "tsc", "msr", "pae", "mce",
1023                 "cx8", "apic", NULL, "sep", "mtrr", "pge", "mca", "cmov",
1024                 "pat", "pse36", "pn", "clflush", NULL, "dts", "acpi", "mmx",
1025                 "fxsr", "sse", "sse2", "ss", "ht", "tm", "ia64", NULL,
1026
1027                 /* AMD-defined */
1028                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1029                 NULL, NULL, NULL, "syscall", NULL, NULL, NULL, NULL,
1030                 NULL, NULL, NULL, NULL, "nx", NULL, "mmxext", NULL,
1031                 NULL, NULL, NULL, NULL, NULL, "lm", "3dnowext", "3dnow",
1032
1033                 /* Transmeta-defined */
1034                 "recovery", "longrun", NULL, "lrti", NULL, NULL, NULL, NULL,
1035                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1036                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1037                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1038
1039                 /* Other (Linux-defined) */
1040                 "cxmmx", "k6_mtrr", "cyrix_arr", "centaur_mcr", NULL, NULL, NULL, NULL,
1041                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1042                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1043                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1044
1045                 /* Intel-defined (#2) */
1046                 "pni", NULL, NULL, "monitor", "ds_cpl", NULL, NULL, "tm2",
1047                 "est", NULL, "cid", NULL, NULL, "cmpxchg16b", NULL, NULL,
1048                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1049                 NULL, NULL, NULL, NULL, NULL, NULL, NULL, NULL,
1050         };
1051         static char *x86_power_flags[] = { 
1052                 "ts",   /* temperature sensor */
1053                 "fid",  /* frequency id control */
1054                 "vid",  /* voltage id control */
1055                 "ttp",  /* thermal trip */
1056         };
1057
1058
1059 #ifdef CONFIG_SMP
1060         if (!cpu_online(c-cpu_data))
1061                 return 0;
1062 #endif
1063
1064         seq_printf(m,"processor\t: %u\n"
1065                      "vendor_id\t: %s\n"
1066                      "cpu family\t: %d\n"
1067                      "model\t\t: %d\n"
1068                      "model name\t: %s\n",
1069                      (unsigned)(c-cpu_data),
1070                      c->x86_vendor_id[0] ? c->x86_vendor_id : "unknown",
1071                      c->x86,
1072                      (int)c->x86_model,
1073                      c->x86_model_id[0] ? c->x86_model_id : "unknown");
1074         
1075         if (c->x86_mask || c->cpuid_level >= 0)
1076                 seq_printf(m, "stepping\t: %d\n", c->x86_mask);
1077         else
1078                 seq_printf(m, "stepping\t: unknown\n");
1079         
1080         if (cpu_has(c,X86_FEATURE_TSC)) {
1081                 seq_printf(m, "cpu MHz\t\t: %u.%03u\n",
1082                              cpu_khz / 1000, (cpu_khz % 1000));
1083         }
1084
1085         /* Cache size */
1086         if (c->x86_cache_size >= 0) 
1087                 seq_printf(m, "cache size\t: %d KB\n", c->x86_cache_size);
1088         
1089 #ifdef CONFIG_X86_HT
1090         if (cpu_has_ht) {
1091                 seq_printf(m, "physical id\t: %d\n", phys_proc_id[c - cpu_data]);
1092                 seq_printf(m, "siblings\t: %d\n", smp_num_siblings);
1093         }
1094 #endif  
1095
1096         seq_printf(m,
1097                 "fpu\t\t: yes\n"
1098                 "fpu_exception\t: yes\n"
1099                 "cpuid level\t: %d\n"
1100                 "wp\t\t: yes\n"
1101                 "flags\t\t:",
1102                    c->cpuid_level);
1103
1104         { 
1105                 int i; 
1106                 for ( i = 0 ; i < 32*NCAPINTS ; i++ )
1107                         if ( test_bit(i, &c->x86_capability) &&
1108                              x86_cap_flags[i] != NULL )
1109                                 seq_printf(m, " %s", x86_cap_flags[i]);
1110         }
1111                 
1112         seq_printf(m, "\nbogomips\t: %lu.%02lu\n",
1113                    c->loops_per_jiffy/(500000/HZ),
1114                    (c->loops_per_jiffy/(5000/HZ)) % 100);
1115
1116         if (c->x86_tlbsize > 0) 
1117                 seq_printf(m, "TLB size\t: %d 4K pages\n", c->x86_tlbsize);
1118         seq_printf(m, "clflush size\t: %d\n", c->x86_clflush_size);
1119         seq_printf(m, "cache_alignment\t: %d\n", c->x86_cache_alignment);
1120
1121         seq_printf(m, "address sizes\t: %u bits physical, %u bits virtual\n", 
1122                    c->x86_phys_bits, c->x86_virt_bits);
1123
1124         seq_printf(m, "power management:");
1125         {
1126                 unsigned i;
1127                 for (i = 0; i < 32; i++) 
1128                         if (c->x86_power & (1 << i)) {
1129                                 if (i < ARRAY_SIZE(x86_power_flags))
1130                                         seq_printf(m, " %s", x86_power_flags[i]);
1131                                 else
1132                                         seq_printf(m, " [%d]", i);
1133                         }
1134         }
1135
1136         seq_printf(m, "\n\n"); 
1137
1138         return 0;
1139 }
1140
1141 static void *c_start(struct seq_file *m, loff_t *pos)
1142 {
1143         return *pos < NR_CPUS ? cpu_data + *pos : NULL;
1144 }
1145
1146 static void *c_next(struct seq_file *m, void *v, loff_t *pos)
1147 {
1148         ++*pos;
1149         return c_start(m, pos);
1150 }
1151
1152 static void c_stop(struct seq_file *m, void *v)
1153 {
1154 }
1155
1156 struct seq_operations cpuinfo_op = {
1157         .start =c_start,
1158         .next = c_next,
1159         .stop = c_stop,
1160         .show = show_cpuinfo,
1161 };