ftp://ftp.kernel.org/pub/linux/kernel/v2.6/linux-2.6.6.tar.bz2
[linux-2.6.git] / arch / i386 / kernel / time.c
1 /*
2  *  linux/arch/i386/kernel/time.c
3  *
4  *  Copyright (C) 1991, 1992, 1995  Linus Torvalds
5  *
6  * This file contains the PC-specific time handling details:
7  * reading the RTC at bootup, etc..
8  * 1994-07-02    Alan Modra
9  *      fixed set_rtc_mmss, fixed time.year for >= 2000, new mktime
10  * 1995-03-26    Markus Kuhn
11  *      fixed 500 ms bug at call to set_rtc_mmss, fixed DS12887
12  *      precision CMOS clock update
13  * 1996-05-03    Ingo Molnar
14  *      fixed time warps in do_[slow|fast]_gettimeoffset()
15  * 1997-09-10   Updated NTP code according to technical memorandum Jan '96
16  *              "A Kernel Model for Precision Timekeeping" by Dave Mills
17  * 1998-09-05    (Various)
18  *      More robust do_fast_gettimeoffset() algorithm implemented
19  *      (works with APM, Cyrix 6x86MX and Centaur C6),
20  *      monotonic gettimeofday() with fast_get_timeoffset(),
21  *      drift-proof precision TSC calibration on boot
22  *      (C. Scott Ananian <cananian@alumni.princeton.edu>, Andrew D.
23  *      Balsa <andrebalsa@altern.org>, Philip Gladstone <philip@raptor.com>;
24  *      ported from 2.0.35 Jumbo-9 by Michael Krause <m.krause@tu-harburg.de>).
25  * 1998-12-16    Andrea Arcangeli
26  *      Fixed Jumbo-9 code in 2.1.131: do_gettimeofday was missing 1 jiffy
27  *      because was not accounting lost_ticks.
28  * 1998-12-24 Copyright (C) 1998  Andrea Arcangeli
29  *      Fixed a xtime SMP race (we need the xtime_lock rw spinlock to
30  *      serialize accesses to xtime/lost_ticks).
31  */
32
33 #include <linux/errno.h>
34 #include <linux/sched.h>
35 #include <linux/kernel.h>
36 #include <linux/param.h>
37 #include <linux/string.h>
38 #include <linux/mm.h>
39 #include <linux/interrupt.h>
40 #include <linux/time.h>
41 #include <linux/delay.h>
42 #include <linux/init.h>
43 #include <linux/smp.h>
44 #include <linux/module.h>
45 #include <linux/sysdev.h>
46 #include <linux/bcd.h>
47 #include <linux/efi.h>
48
49 #include <asm/io.h>
50 #include <asm/smp.h>
51 #include <asm/irq.h>
52 #include <asm/msr.h>
53 #include <asm/delay.h>
54 #include <asm/mpspec.h>
55 #include <asm/uaccess.h>
56 #include <asm/processor.h>
57 #include <asm/timer.h>
58
59 #include "mach_time.h"
60
61 #include <linux/timex.h>
62 #include <linux/config.h>
63
64 #include <asm/hpet.h>
65
66 #include <asm/arch_hooks.h>
67
68 #include "io_ports.h"
69
70 extern spinlock_t i8259A_lock;
71 int pit_latch_buggy;              /* extern */
72
73 #include "do_timer.h"
74
75 u64 jiffies_64 = INITIAL_JIFFIES;
76
77 EXPORT_SYMBOL(jiffies_64);
78
79 unsigned long cpu_khz;  /* Detected as we calibrate the TSC */
80
81 extern unsigned long wall_jiffies;
82
83 spinlock_t rtc_lock = SPIN_LOCK_UNLOCKED;
84
85 spinlock_t i8253_lock = SPIN_LOCK_UNLOCKED;
86 EXPORT_SYMBOL(i8253_lock);
87
88 struct timer_opts *cur_timer = &timer_none;
89
90 /*
91  * This version of gettimeofday has microsecond resolution
92  * and better than microsecond precision on fast x86 machines with TSC.
93  */
94 void do_gettimeofday(struct timeval *tv)
95 {
96         unsigned long seq;
97         unsigned long usec, sec;
98         unsigned long max_ntp_tick;
99
100         do {
101                 unsigned long lost;
102
103                 seq = read_seqbegin(&xtime_lock);
104
105                 usec = cur_timer->get_offset();
106                 lost = jiffies - wall_jiffies;
107
108                 /*
109                  * If time_adjust is negative then NTP is slowing the clock
110                  * so make sure not to go into next possible interval.
111                  * Better to lose some accuracy than have time go backwards..
112                  */
113                 if (unlikely(time_adjust < 0)) {
114                         max_ntp_tick = (USEC_PER_SEC / HZ) - tickadj;
115                         usec = min(usec, max_ntp_tick);
116
117                         if (lost)
118                                 usec += lost * max_ntp_tick;
119                 }
120                 else if (unlikely(lost))
121                         usec += lost * (USEC_PER_SEC / HZ);
122
123                 sec = xtime.tv_sec;
124                 usec += (xtime.tv_nsec / 1000);
125         } while (read_seqretry(&xtime_lock, seq));
126
127         while (usec >= 1000000) {
128                 usec -= 1000000;
129                 sec++;
130         }
131
132         tv->tv_sec = sec;
133         tv->tv_usec = usec;
134 }
135
136 EXPORT_SYMBOL(do_gettimeofday);
137
138 int do_settimeofday(struct timespec *tv)
139 {
140         time_t wtm_sec, sec = tv->tv_sec;
141         long wtm_nsec, nsec = tv->tv_nsec;
142
143         if ((unsigned long)tv->tv_nsec >= NSEC_PER_SEC)
144                 return -EINVAL;
145
146         write_seqlock_irq(&xtime_lock);
147         /*
148          * This is revolting. We need to set "xtime" correctly. However, the
149          * value in this location is the value at the most recent update of
150          * wall time.  Discover what correction gettimeofday() would have
151          * made, and then undo it!
152          */
153         nsec -= cur_timer->get_offset() * NSEC_PER_USEC;
154         nsec -= (jiffies - wall_jiffies) * TICK_NSEC;
155
156         wtm_sec  = wall_to_monotonic.tv_sec + (xtime.tv_sec - sec);
157         wtm_nsec = wall_to_monotonic.tv_nsec + (xtime.tv_nsec - nsec);
158
159         set_normalized_timespec(&xtime, sec, nsec);
160         set_normalized_timespec(&wall_to_monotonic, wtm_sec, wtm_nsec);
161
162         time_adjust = 0;                /* stop active adjtime() */
163         time_status |= STA_UNSYNC;
164         time_maxerror = NTP_PHASE_LIMIT;
165         time_esterror = NTP_PHASE_LIMIT;
166         write_sequnlock_irq(&xtime_lock);
167         clock_was_set();
168         return 0;
169 }
170
171 EXPORT_SYMBOL(do_settimeofday);
172
173 static int set_rtc_mmss(unsigned long nowtime)
174 {
175         int retval;
176
177         /* gets recalled with irq locally disabled */
178         spin_lock(&rtc_lock);
179         if (efi_enabled)
180                 retval = efi_set_rtc_mmss(nowtime);
181         else
182                 retval = mach_set_rtc_mmss(nowtime);
183         spin_unlock(&rtc_lock);
184
185         return retval;
186 }
187
188 /* last time the cmos clock got updated */
189 static long last_rtc_update;
190
191 int timer_ack;
192
193 /* monotonic_clock(): returns # of nanoseconds passed since time_init()
194  *              Note: This function is required to return accurate
195  *              time even in the absence of multiple timer ticks.
196  */
197 unsigned long long monotonic_clock(void)
198 {
199         return cur_timer->monotonic_clock();
200 }
201 EXPORT_SYMBOL(monotonic_clock);
202
203
204 /*
205  * timer_interrupt() needs to keep up the real-time clock,
206  * as well as call the "do_timer()" routine every clocktick
207  */
208 static inline void do_timer_interrupt(int irq, void *dev_id,
209                                         struct pt_regs *regs)
210 {
211 #ifdef CONFIG_X86_IO_APIC
212         if (timer_ack) {
213                 /*
214                  * Subtle, when I/O APICs are used we have to ack timer IRQ
215                  * manually to reset the IRR bit for do_slow_gettimeoffset().
216                  * This will also deassert NMI lines for the watchdog if run
217                  * on an 82489DX-based system.
218                  */
219                 spin_lock(&i8259A_lock);
220                 outb(0x0c, PIC_MASTER_OCW3);
221                 /* Ack the IRQ; AEOI will end it automatically. */
222                 inb(PIC_MASTER_POLL);
223                 spin_unlock(&i8259A_lock);
224         }
225 #endif
226
227         do_timer_interrupt_hook(regs);
228
229         /*
230          * If we have an externally synchronized Linux clock, then update
231          * CMOS clock accordingly every ~11 minutes. Set_rtc_mmss() has to be
232          * called as close as possible to 500 ms before the new second starts.
233          */
234         if ((time_status & STA_UNSYNC) == 0 &&
235             xtime.tv_sec > last_rtc_update + 660 &&
236             (xtime.tv_nsec / 1000)
237                         >= USEC_AFTER - ((unsigned) TICK_SIZE) / 2 &&
238             (xtime.tv_nsec / 1000)
239                         <= USEC_BEFORE + ((unsigned) TICK_SIZE) / 2) {
240                 /* horrible...FIXME */
241                 if (efi_enabled) {
242                         if (efi_set_rtc_mmss(xtime.tv_sec) == 0)
243                                 last_rtc_update = xtime.tv_sec;
244                         else
245                                 last_rtc_update = xtime.tv_sec - 600;
246                 } else if (set_rtc_mmss(xtime.tv_sec) == 0)
247                         last_rtc_update = xtime.tv_sec;
248                 else
249                         last_rtc_update = xtime.tv_sec - 600; /* do it again in 60 s */
250         }
251
252 #ifdef CONFIG_MCA
253         if( MCA_bus ) {
254                 /* The PS/2 uses level-triggered interrupts.  You can't
255                 turn them off, nor would you want to (any attempt to
256                 enable edge-triggered interrupts usually gets intercepted by a
257                 special hardware circuit).  Hence we have to acknowledge
258                 the timer interrupt.  Through some incredibly stupid
259                 design idea, the reset for IRQ 0 is done by setting the
260                 high bit of the PPI port B (0x61).  Note that some PS/2s,
261                 notably the 55SX, work fine if this is removed.  */
262
263                 irq = inb_p( 0x61 );    /* read the current state */
264                 outb_p( irq|0x80, 0x61 );       /* reset the IRQ */
265         }
266 #endif
267 }
268
269 /*
270  * This is the same as the above, except we _also_ save the current
271  * Time Stamp Counter value at the time of the timer interrupt, so that
272  * we later on can estimate the time of day more exactly.
273  */
274 irqreturn_t timer_interrupt(int irq, void *dev_id, struct pt_regs *regs)
275 {
276         /*
277          * Here we are in the timer irq handler. We just have irqs locally
278          * disabled but we don't know if the timer_bh is running on the other
279          * CPU. We need to avoid to SMP race with it. NOTE: we don' t need
280          * the irq version of write_lock because as just said we have irq
281          * locally disabled. -arca
282          */
283         write_seqlock(&xtime_lock);
284
285         cur_timer->mark_offset();
286  
287         do_timer_interrupt(irq, NULL, regs);
288
289         write_sequnlock(&xtime_lock);
290         return IRQ_HANDLED;
291 }
292
293 /* not static: needed by APM */
294 unsigned long get_cmos_time(void)
295 {
296         unsigned long retval;
297
298         spin_lock(&rtc_lock);
299
300         if (efi_enabled)
301                 retval = efi_get_time();
302         else
303                 retval = mach_get_cmos_time();
304
305         spin_unlock(&rtc_lock);
306
307         return retval;
308 }
309
310 static long clock_cmos_diff;
311
312 static int time_suspend(struct sys_device *dev, u32 state)
313 {
314         /*
315          * Estimate time zone so that set_time can update the clock
316          */
317         clock_cmos_diff = -get_cmos_time();
318         clock_cmos_diff += get_seconds();
319         return 0;
320 }
321
322 static int time_resume(struct sys_device *dev)
323 {
324         unsigned long sec = get_cmos_time() + clock_cmos_diff;
325         write_seqlock_irq(&xtime_lock);
326         xtime.tv_sec = sec;
327         xtime.tv_nsec = 0;
328         write_sequnlock_irq(&xtime_lock);
329         return 0;
330 }
331
332 static struct sysdev_class pit_sysclass = {
333         .resume = time_resume,
334         .suspend = time_suspend,
335         set_kset_name("pit"),
336 };
337
338
339 /* XXX this driverfs stuff should probably go elsewhere later -john */
340 static struct sys_device device_i8253 = {
341         .id     = 0,
342         .cls    = &pit_sysclass,
343 };
344
345 static int time_init_device(void)
346 {
347         int error = sysdev_class_register(&pit_sysclass);
348         if (!error)
349                 error = sysdev_register(&device_i8253);
350         return error;
351 }
352
353 device_initcall(time_init_device);
354
355 #ifdef CONFIG_HPET_TIMER
356 extern void (*late_time_init)(void);
357 /* Duplicate of time_init() below, with hpet_enable part added */
358 void __init hpet_time_init(void)
359 {
360         xtime.tv_sec = get_cmos_time();
361         wall_to_monotonic.tv_sec = -xtime.tv_sec;
362         xtime.tv_nsec = (INITIAL_JIFFIES % HZ) * (NSEC_PER_SEC / HZ);
363         wall_to_monotonic.tv_nsec = -xtime.tv_nsec;
364
365         if (hpet_enable() >= 0) {
366                 printk("Using HPET for base-timer\n");
367         }
368
369         cur_timer = select_timer();
370         printk(KERN_INFO "Using %s for high-res timesource\n",cur_timer->name);
371
372         time_init_hook();
373 }
374 #endif
375
376 void __init time_init(void)
377 {
378 #ifdef CONFIG_HPET_TIMER
379         if (is_hpet_capable()) {
380                 /*
381                  * HPET initialization needs to do memory-mapped io. So, let
382                  * us do a late initialization after mem_init().
383                  */
384                 late_time_init = hpet_time_init;
385                 return;
386         }
387 #endif
388         xtime.tv_sec = get_cmos_time();
389         wall_to_monotonic.tv_sec = -xtime.tv_sec;
390         xtime.tv_nsec = (INITIAL_JIFFIES % HZ) * (NSEC_PER_SEC / HZ);
391         wall_to_monotonic.tv_nsec = -xtime.tv_nsec;
392
393         cur_timer = select_timer();
394         printk(KERN_INFO "Using %s for high-res timesource\n",cur_timer->name);
395
396         time_init_hook();
397 }