fedora core 6 1.2949 + vserver 2.2.0
[linux-2.6.git] / arch / x86_64 / lib / clear_page.S
index 30a9da4..9a10a78 100644 (file)
@@ -1,16 +1,28 @@
+#include <linux/linkage.h>
+#include <asm/dwarf2.h>
+
 /*
  * Zero a page.        
  * rdi page
  */                    
-       .globl clear_page
-       .p2align 4
-clear_page:
+       ALIGN
+clear_page_c:
+       CFI_STARTPROC
+       movl $4096/8,%ecx
+       xorl %eax,%eax
+       rep stosq
+       ret
+       CFI_ENDPROC
+ENDPROC(clear_page)
+
+ENTRY(clear_page)
+       CFI_STARTPROC
        xorl   %eax,%eax
        movl   $4096/64,%ecx
        .p2align 4
 .Lloop:
        decl    %ecx
-#define PUT(x) movq %rax,x*8(%rdi) 
+#define PUT(x) movq %rax,x*8(%rdi)
        movq %rax,(%rdi)
        PUT(1)
        PUT(2)
@@ -23,28 +35,25 @@ clear_page:
        jnz     .Lloop
        nop
        ret
-clear_page_end:        
-       
-       /* C stepping K8 run faster using the string instructions.
+       CFI_ENDPROC
+.Lclear_page_end:
+ENDPROC(clear_page)
+
+       /* Some CPUs run faster using the string instructions.
           It is also a lot simpler. Use this when possible */
-       
+
 #include <asm/cpufeature.h>
-               
-       .section .altinstructions,"a"
-       .align 8
-       .quad  clear_page
-       .quad  clear_page_c
-       .byte  X86_FEATURE_K8_C
-       .byte  clear_page_end-clear_page        
-       .byte  clear_page_c_end-clear_page_c
-       .previous
 
        .section .altinstr_replacement,"ax"
-clear_page_c:
-       movl $4096/8,%ecx
-       xorl %eax,%eax
-       rep 
-       stosq
-       ret
-clear_page_c_end:
+1:     .byte 0xeb                                      /* jmp <disp8> */
+       .byte (clear_page_c - clear_page) - (2f - 1b)   /* offset */
+2:
+       .previous
+       .section .altinstructions,"a"
+       .align 8
+       .quad clear_page
+       .quad 1b
+       .byte X86_FEATURE_REP_GOOD
+       .byte .Lclear_page_end - clear_page
+       .byte 2b - 1b
        .previous