vserver 1.9.3
[linux-2.6.git] / arch / i386 / kernel / time.c
1 /*
2  *  linux/arch/i386/kernel/time.c
3  *
4  *  Copyright (C) 1991, 1992, 1995  Linus Torvalds
5  *
6  * This file contains the PC-specific time handling details:
7  * reading the RTC at bootup, etc..
8  * 1994-07-02    Alan Modra
9  *      fixed set_rtc_mmss, fixed time.year for >= 2000, new mktime
10  * 1995-03-26    Markus Kuhn
11  *      fixed 500 ms bug at call to set_rtc_mmss, fixed DS12887
12  *      precision CMOS clock update
13  * 1996-05-03    Ingo Molnar
14  *      fixed time warps in do_[slow|fast]_gettimeoffset()
15  * 1997-09-10   Updated NTP code according to technical memorandum Jan '96
16  *              "A Kernel Model for Precision Timekeeping" by Dave Mills
17  * 1998-09-05    (Various)
18  *      More robust do_fast_gettimeoffset() algorithm implemented
19  *      (works with APM, Cyrix 6x86MX and Centaur C6),
20  *      monotonic gettimeofday() with fast_get_timeoffset(),
21  *      drift-proof precision TSC calibration on boot
22  *      (C. Scott Ananian <cananian@alumni.princeton.edu>, Andrew D.
23  *      Balsa <andrebalsa@altern.org>, Philip Gladstone <philip@raptor.com>;
24  *      ported from 2.0.35 Jumbo-9 by Michael Krause <m.krause@tu-harburg.de>).
25  * 1998-12-16    Andrea Arcangeli
26  *      Fixed Jumbo-9 code in 2.1.131: do_gettimeofday was missing 1 jiffy
27  *      because was not accounting lost_ticks.
28  * 1998-12-24 Copyright (C) 1998  Andrea Arcangeli
29  *      Fixed a xtime SMP race (we need the xtime_lock rw spinlock to
30  *      serialize accesses to xtime/lost_ticks).
31  */
32
33 #include <linux/errno.h>
34 #include <linux/sched.h>
35 #include <linux/kernel.h>
36 #include <linux/param.h>
37 #include <linux/string.h>
38 #include <linux/mm.h>
39 #include <linux/interrupt.h>
40 #include <linux/time.h>
41 #include <linux/delay.h>
42 #include <linux/init.h>
43 #include <linux/smp.h>
44 #include <linux/module.h>
45 #include <linux/sysdev.h>
46 #include <linux/bcd.h>
47 #include <linux/efi.h>
48
49 #include <asm/io.h>
50 #include <asm/smp.h>
51 #include <asm/irq.h>
52 #include <asm/msr.h>
53 #include <asm/delay.h>
54 #include <asm/mpspec.h>
55 #include <asm/uaccess.h>
56 #include <asm/processor.h>
57 #include <asm/timer.h>
58
59 #include "mach_time.h"
60
61 #include <linux/timex.h>
62 #include <linux/config.h>
63
64 #include <asm/hpet.h>
65
66 #include <asm/arch_hooks.h>
67
68 #include "io_ports.h"
69
70 extern spinlock_t i8259A_lock;
71 int pit_latch_buggy;              /* extern */
72
73 #include "do_timer.h"
74
75 u64 jiffies_64 = INITIAL_JIFFIES;
76
77 EXPORT_SYMBOL(jiffies_64);
78
79 unsigned long cpu_khz;  /* Detected as we calibrate the TSC */
80
81 extern unsigned long wall_jiffies;
82
83 spinlock_t rtc_lock = SPIN_LOCK_UNLOCKED;
84
85 spinlock_t i8253_lock = SPIN_LOCK_UNLOCKED;
86 EXPORT_SYMBOL(i8253_lock);
87
88 struct timer_opts *cur_timer = &timer_none;
89
90 /*
91  * This version of gettimeofday has microsecond resolution
92  * and better than microsecond precision on fast x86 machines with TSC.
93  */
94 void do_gettimeofday(struct timeval *tv)
95 {
96         unsigned long seq;
97         unsigned long usec, sec;
98         unsigned long max_ntp_tick;
99
100         do {
101                 unsigned long lost;
102
103                 seq = read_seqbegin(&xtime_lock);
104
105                 usec = cur_timer->get_offset();
106                 lost = jiffies - wall_jiffies;
107
108                 /*
109                  * If time_adjust is negative then NTP is slowing the clock
110                  * so make sure not to go into next possible interval.
111                  * Better to lose some accuracy than have time go backwards..
112                  */
113                 if (unlikely(time_adjust < 0)) {
114                         max_ntp_tick = (USEC_PER_SEC / HZ) - tickadj;
115                         usec = min(usec, max_ntp_tick);
116
117                         if (lost)
118                                 usec += lost * max_ntp_tick;
119                 }
120                 else if (unlikely(lost))
121                         usec += lost * (USEC_PER_SEC / HZ);
122
123                 sec = xtime.tv_sec;
124                 usec += (xtime.tv_nsec / 1000);
125         } while (read_seqretry(&xtime_lock, seq));
126
127         while (usec >= 1000000) {
128                 usec -= 1000000;
129                 sec++;
130         }
131
132         tv->tv_sec = sec;
133         tv->tv_usec = usec;
134 }
135
136 EXPORT_SYMBOL(do_gettimeofday);
137
138 int do_settimeofday(struct timespec *tv)
139 {
140         time_t wtm_sec, sec = tv->tv_sec;
141         long wtm_nsec, nsec = tv->tv_nsec;
142
143         if ((unsigned long)tv->tv_nsec >= NSEC_PER_SEC)
144                 return -EINVAL;
145
146         write_seqlock_irq(&xtime_lock);
147         /*
148          * This is revolting. We need to set "xtime" correctly. However, the
149          * value in this location is the value at the most recent update of
150          * wall time.  Discover what correction gettimeofday() would have
151          * made, and then undo it!
152          */
153         nsec -= cur_timer->get_offset() * NSEC_PER_USEC;
154         nsec -= (jiffies - wall_jiffies) * TICK_NSEC;
155
156         wtm_sec  = wall_to_monotonic.tv_sec + (xtime.tv_sec - sec);
157         wtm_nsec = wall_to_monotonic.tv_nsec + (xtime.tv_nsec - nsec);
158
159         set_normalized_timespec(&xtime, sec, nsec);
160         set_normalized_timespec(&wall_to_monotonic, wtm_sec, wtm_nsec);
161
162         time_adjust = 0;                /* stop active adjtime() */
163         time_status |= STA_UNSYNC;
164         time_maxerror = NTP_PHASE_LIMIT;
165         time_esterror = NTP_PHASE_LIMIT;
166         write_sequnlock_irq(&xtime_lock);
167         clock_was_set();
168         return 0;
169 }
170
171 EXPORT_SYMBOL(do_settimeofday);
172
173 static int set_rtc_mmss(unsigned long nowtime)
174 {
175         int retval;
176
177         /* gets recalled with irq locally disabled */
178         spin_lock(&rtc_lock);
179         if (efi_enabled)
180                 retval = efi_set_rtc_mmss(nowtime);
181         else
182                 retval = mach_set_rtc_mmss(nowtime);
183         spin_unlock(&rtc_lock);
184
185         return retval;
186 }
187
188 /* last time the cmos clock got updated */
189 static long last_rtc_update;
190
191 int timer_ack;
192
193 /* monotonic_clock(): returns # of nanoseconds passed since time_init()
194  *              Note: This function is required to return accurate
195  *              time even in the absence of multiple timer ticks.
196  */
197 unsigned long long monotonic_clock(void)
198 {
199         return cur_timer->monotonic_clock();
200 }
201 EXPORT_SYMBOL(monotonic_clock);
202
203 #if defined(CONFIG_SMP) && defined(CONFIG_FRAME_POINTER)
204 unsigned long profile_pc(struct pt_regs *regs)
205 {
206         unsigned long pc = instruction_pointer(regs);
207
208         if (in_lock_functions(pc))
209                 return *(unsigned long *)(regs->ebp + 4);
210
211         return pc;
212 }
213 EXPORT_SYMBOL(profile_pc);
214 #endif
215
216 /*
217  * timer_interrupt() needs to keep up the real-time clock,
218  * as well as call the "do_timer()" routine every clocktick
219  */
220 static inline void do_timer_interrupt(int irq, void *dev_id,
221                                         struct pt_regs *regs)
222 {
223 #ifdef CONFIG_X86_IO_APIC
224         if (timer_ack) {
225                 /*
226                  * Subtle, when I/O APICs are used we have to ack timer IRQ
227                  * manually to reset the IRR bit for do_slow_gettimeoffset().
228                  * This will also deassert NMI lines for the watchdog if run
229                  * on an 82489DX-based system.
230                  */
231                 spin_lock(&i8259A_lock);
232                 outb(0x0c, PIC_MASTER_OCW3);
233                 /* Ack the IRQ; AEOI will end it automatically. */
234                 inb(PIC_MASTER_POLL);
235                 spin_unlock(&i8259A_lock);
236         }
237 #endif
238
239         do_timer_interrupt_hook(regs);
240
241         /*
242          * If we have an externally synchronized Linux clock, then update
243          * CMOS clock accordingly every ~11 minutes. Set_rtc_mmss() has to be
244          * called as close as possible to 500 ms before the new second starts.
245          */
246         if ((time_status & STA_UNSYNC) == 0 &&
247             xtime.tv_sec > last_rtc_update + 660 &&
248             (xtime.tv_nsec / 1000)
249                         >= USEC_AFTER - ((unsigned) TICK_SIZE) / 2 &&
250             (xtime.tv_nsec / 1000)
251                         <= USEC_BEFORE + ((unsigned) TICK_SIZE) / 2) {
252                 /* horrible...FIXME */
253                 if (efi_enabled) {
254                         if (efi_set_rtc_mmss(xtime.tv_sec) == 0)
255                                 last_rtc_update = xtime.tv_sec;
256                         else
257                                 last_rtc_update = xtime.tv_sec - 600;
258                 } else if (set_rtc_mmss(xtime.tv_sec) == 0)
259                         last_rtc_update = xtime.tv_sec;
260                 else
261                         last_rtc_update = xtime.tv_sec - 600; /* do it again in 60 s */
262         }
263
264 #ifdef CONFIG_MCA
265         if( MCA_bus ) {
266                 /* The PS/2 uses level-triggered interrupts.  You can't
267                 turn them off, nor would you want to (any attempt to
268                 enable edge-triggered interrupts usually gets intercepted by a
269                 special hardware circuit).  Hence we have to acknowledge
270                 the timer interrupt.  Through some incredibly stupid
271                 design idea, the reset for IRQ 0 is done by setting the
272                 high bit of the PPI port B (0x61).  Note that some PS/2s,
273                 notably the 55SX, work fine if this is removed.  */
274
275                 irq = inb_p( 0x61 );    /* read the current state */
276                 outb_p( irq|0x80, 0x61 );       /* reset the IRQ */
277         }
278 #endif
279 }
280
281 /*
282  * This is the same as the above, except we _also_ save the current
283  * Time Stamp Counter value at the time of the timer interrupt, so that
284  * we later on can estimate the time of day more exactly.
285  */
286 irqreturn_t timer_interrupt(int irq, void *dev_id, struct pt_regs *regs)
287 {
288         /*
289          * Here we are in the timer irq handler. We just have irqs locally
290          * disabled but we don't know if the timer_bh is running on the other
291          * CPU. We need to avoid to SMP race with it. NOTE: we don' t need
292          * the irq version of write_lock because as just said we have irq
293          * locally disabled. -arca
294          */
295         write_seqlock(&xtime_lock);
296
297         cur_timer->mark_offset();
298  
299         do_timer_interrupt(irq, NULL, regs);
300
301         write_sequnlock(&xtime_lock);
302         return IRQ_HANDLED;
303 }
304
305 /* not static: needed by APM */
306 unsigned long get_cmos_time(void)
307 {
308         unsigned long retval;
309
310         spin_lock(&rtc_lock);
311
312         if (efi_enabled)
313                 retval = efi_get_time();
314         else
315                 retval = mach_get_cmos_time();
316
317         spin_unlock(&rtc_lock);
318
319         return retval;
320 }
321
322 static long clock_cmos_diff;
323
324 static int time_suspend(struct sys_device *dev, u32 state)
325 {
326         /*
327          * Estimate time zone so that set_time can update the clock
328          */
329         clock_cmos_diff = -get_cmos_time();
330         clock_cmos_diff += get_seconds();
331         return 0;
332 }
333
334 static int time_resume(struct sys_device *dev)
335 {
336         unsigned long flags;
337         unsigned long sec = get_cmos_time() + clock_cmos_diff;
338         write_seqlock_irqsave(&xtime_lock, flags);
339         xtime.tv_sec = sec;
340         xtime.tv_nsec = 0;
341         write_sequnlock_irqrestore(&xtime_lock, flags);
342         return 0;
343 }
344
345 static struct sysdev_class pit_sysclass = {
346         .resume = time_resume,
347         .suspend = time_suspend,
348         set_kset_name("pit"),
349 };
350
351
352 /* XXX this driverfs stuff should probably go elsewhere later -john */
353 static struct sys_device device_i8253 = {
354         .id     = 0,
355         .cls    = &pit_sysclass,
356 };
357
358 static int time_init_device(void)
359 {
360         int error = sysdev_class_register(&pit_sysclass);
361         if (!error)
362                 error = sysdev_register(&device_i8253);
363         return error;
364 }
365
366 device_initcall(time_init_device);
367
368 #ifdef CONFIG_HPET_TIMER
369 extern void (*late_time_init)(void);
370 /* Duplicate of time_init() below, with hpet_enable part added */
371 void __init hpet_time_init(void)
372 {
373         xtime.tv_sec = get_cmos_time();
374         wall_to_monotonic.tv_sec = -xtime.tv_sec;
375         xtime.tv_nsec = (INITIAL_JIFFIES % HZ) * (NSEC_PER_SEC / HZ);
376         wall_to_monotonic.tv_nsec = -xtime.tv_nsec;
377
378         if (hpet_enable() >= 0) {
379                 printk("Using HPET for base-timer\n");
380         }
381
382         cur_timer = select_timer();
383         printk(KERN_INFO "Using %s for high-res timesource\n",cur_timer->name);
384
385         time_init_hook();
386 }
387 #endif
388
389 void __init time_init(void)
390 {
391 #ifdef CONFIG_HPET_TIMER
392         if (is_hpet_capable()) {
393                 /*
394                  * HPET initialization needs to do memory-mapped io. So, let
395                  * us do a late initialization after mem_init().
396                  */
397                 late_time_init = hpet_time_init;
398                 return;
399         }
400 #endif
401         xtime.tv_sec = get_cmos_time();
402         wall_to_monotonic.tv_sec = -xtime.tv_sec;
403         xtime.tv_nsec = (INITIAL_JIFFIES % HZ) * (NSEC_PER_SEC / HZ);
404         wall_to_monotonic.tv_nsec = -xtime.tv_nsec;
405
406         cur_timer = select_timer();
407         printk(KERN_INFO "Using %s for high-res timesource\n",cur_timer->name);
408
409         time_init_hook();
410 }