vserver 1.9.3
[linux-2.6.git] / arch / ppc64 / kernel / pSeries_lpar.c
1 /*
2  * pSeries_lpar.c
3  * Copyright (C) 2001 Todd Inglett, IBM Corporation
4  *
5  * pSeries LPAR support.
6  * 
7  * This program is free software; you can redistribute it and/or modify
8  * it under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 2 of the License, or
10  * (at your option) any later version.
11  * 
12  * This program is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  * 
17  * You should have received a copy of the GNU General Public License
18  * along with this program; if not, write to the Free Software
19  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
20  */
21
22 #define DEBUG
23
24 #include <linux/config.h>
25 #include <linux/kernel.h>
26 #include <linux/dma-mapping.h>
27 #include <asm/processor.h>
28 #include <asm/mmu.h>
29 #include <asm/page.h>
30 #include <asm/pgtable.h>
31 #include <asm/machdep.h>
32 #include <asm/abs_addr.h>
33 #include <asm/mmu_context.h>
34 #include <asm/ppcdebug.h>
35 #include <asm/iommu.h>
36 #include <asm/naca.h>
37 #include <asm/tlbflush.h>
38 #include <asm/tlb.h>
39 #include <asm/prom.h>
40 #include <asm/abs_addr.h>
41 #include <asm/cputable.h>
42 #include <asm/plpar_wrappers.h>
43
44 #ifdef DEBUG
45 #define DBG(fmt...) udbg_printf(fmt)
46 #else
47 #define DBG(fmt...)
48 #endif
49
50 /* in pSeries_hvCall.S */
51 EXPORT_SYMBOL(plpar_hcall);
52 EXPORT_SYMBOL(plpar_hcall_4out);
53 EXPORT_SYMBOL(plpar_hcall_norets);
54 EXPORT_SYMBOL(plpar_hcall_8arg_2ret);
55
56 extern void fw_feature_init(void);
57 extern void pSeries_find_serial_port(void);
58
59
60 int vtermno;    /* virtual terminal# for udbg  */
61
62 static void udbg_putcLP(unsigned char c)
63 {
64         char buf[16];
65         unsigned long rc;
66
67         if (c == '\n')
68                 udbg_putcLP('\r');
69
70         buf[0] = c;
71         do {
72                 rc = plpar_put_term_char(vtermno, 1, buf);
73         } while(rc == H_Busy);
74 }
75
76 /* Buffered chars getc */
77 static long inbuflen;
78 static long inbuf[2];   /* must be 2 longs */
79
80 static int udbg_getc_pollLP(void)
81 {
82         /* The interface is tricky because it may return up to 16 chars.
83          * We save them statically for future calls to udbg_getc().
84          */
85         char ch, *buf = (char *)inbuf;
86         int i;
87         long rc;
88         if (inbuflen == 0) {
89                 /* get some more chars. */
90                 inbuflen = 0;
91                 rc = plpar_get_term_char(vtermno, &inbuflen, buf);
92                 if (rc != H_Success)
93                         inbuflen = 0;   /* otherwise inbuflen is garbage */
94         }
95         if (inbuflen <= 0 || inbuflen > 16) {
96                 /* Catch error case as well as other oddities (corruption) */
97                 inbuflen = 0;
98                 return -1;
99         }
100         ch = buf[0];
101         for (i = 1; i < inbuflen; i++)  /* shuffle them down. */
102                 buf[i-1] = buf[i];
103         inbuflen--;
104         return ch;
105 }
106
107 static unsigned char udbg_getcLP(void)
108 {
109         int ch;
110         for (;;) {
111                 ch = udbg_getc_pollLP();
112                 if (ch == -1) {
113                         /* This shouldn't be needed...but... */
114                         volatile unsigned long delay;
115                         for (delay=0; delay < 2000000; delay++)
116                                 ;
117                 } else {
118                         return ch;
119                 }
120         }
121 }
122
123 /* call this from early_init() for a working debug console on
124  * vterm capable LPAR machines
125  */
126 void udbg_init_debug_lpar(void)
127 {
128         vtermno = 0;
129         ppc_md.udbg_putc = udbg_putcLP;
130         ppc_md.udbg_getc = udbg_getcLP;
131         ppc_md.udbg_getc_poll = udbg_getc_pollLP;
132 }
133
134 /* returns 0 if couldn't find or use /chosen/stdout as console */
135 int find_udbg_vterm(void)
136 {
137         struct device_node *stdout_node;
138         u32 *termno;
139         char *name;
140         int found = 0;
141
142         /* find the boot console from /chosen/stdout */
143         if (!of_chosen)
144                 return 0;
145         name = (char *)get_property(of_chosen, "linux,stdout-path", NULL);
146         if (name == NULL)
147                 return 0;
148         stdout_node = of_find_node_by_path(name);
149         if (!stdout_node)
150                 return 0;
151
152         /* now we have the stdout node; figure out what type of device it is. */
153         name = (char *)get_property(stdout_node, "name", NULL);
154         if (!name) {
155                 printk(KERN_WARNING "stdout node missing 'name' property!\n");
156                 goto out;
157         }
158
159         if (strncmp(name, "vty", 3) == 0) {
160                 if (device_is_compatible(stdout_node, "hvterm1")) {
161                         termno = (u32 *)get_property(stdout_node, "reg", NULL);
162                         if (termno) {
163                                 vtermno = termno[0];
164                                 ppc_md.udbg_putc = udbg_putcLP;
165                                 ppc_md.udbg_getc = udbg_getcLP;
166                                 ppc_md.udbg_getc_poll = udbg_getc_pollLP;
167                                 found = 1;
168                         }
169                 } else {
170                         /* XXX implement udbg_putcLP_vtty for hvterm-protocol1 case */
171                         printk(KERN_WARNING "%s doesn't speak hvterm1; "
172                                         "can't print udbg messages\n",
173                                stdout_node->full_name);
174                 }
175         } else if (strncmp(name, "serial", 6)) {
176                 /* XXX fix ISA serial console */
177                 printk(KERN_WARNING "serial stdout on LPAR ('%s')! "
178                                 "can't print udbg messages\n",
179                        stdout_node->full_name);
180         } else {
181                 printk(KERN_WARNING "don't know how to print to stdout '%s'\n",
182                        stdout_node->full_name);
183         }
184
185 out:
186         of_node_put(stdout_node);
187         return found;
188 }
189
190
191 long pSeries_lpar_hpte_insert(unsigned long hpte_group,
192                               unsigned long va, unsigned long prpn,
193                               int secondary, unsigned long hpteflags,
194                               int bolted, int large)
195 {
196         unsigned long arpn = physRpn_to_absRpn(prpn);
197         unsigned long lpar_rc;
198         unsigned long flags;
199         unsigned long slot;
200         HPTE lhpte;
201         unsigned long dummy0, dummy1;
202
203         /* Fill in the local HPTE with absolute rpn, avpn and flags */
204         lhpte.dw1.dword1      = 0;
205         lhpte.dw1.dw1.rpn     = arpn;
206         lhpte.dw1.flags.flags = hpteflags;
207
208         lhpte.dw0.dword0      = 0;
209         lhpte.dw0.dw0.avpn    = va >> 23;
210         lhpte.dw0.dw0.h       = secondary;
211         lhpte.dw0.dw0.bolted  = bolted;
212         lhpte.dw0.dw0.v       = 1;
213
214         if (large) {
215                 lhpte.dw0.dw0.l = 1;
216                 lhpte.dw0.dw0.avpn &= ~0x1UL;
217         }
218
219         /* Now fill in the actual HPTE */
220         /* Set CEC cookie to 0         */
221         /* Zero page = 0               */
222         /* I-cache Invalidate = 0      */
223         /* I-cache synchronize = 0     */
224         /* Exact = 0                   */
225         flags = 0;
226
227         /* XXX why is this here? - Anton */
228         if (hpteflags & (_PAGE_GUARDED|_PAGE_NO_CACHE))
229                 lhpte.dw1.flags.flags &= ~_PAGE_COHERENT;
230
231         lpar_rc = plpar_hcall(H_ENTER, flags, hpte_group, lhpte.dw0.dword0,
232                               lhpte.dw1.dword1, &slot, &dummy0, &dummy1);
233
234         if (unlikely(lpar_rc == H_PTEG_Full))
235                 return -1;
236
237         /*
238          * Since we try and ioremap PHBs we don't own, the pte insert
239          * will fail. However we must catch the failure in hash_page
240          * or we will loop forever, so return -2 in this case.
241          */
242         if (unlikely(lpar_rc != H_Success))
243                 return -2;
244
245         /* Because of iSeries, we have to pass down the secondary
246          * bucket bit here as well
247          */
248         return (slot & 7) | (secondary << 3);
249 }
250
251 static spinlock_t pSeries_lpar_tlbie_lock = SPIN_LOCK_UNLOCKED;
252
253 static long pSeries_lpar_hpte_remove(unsigned long hpte_group)
254 {
255         unsigned long slot_offset;
256         unsigned long lpar_rc;
257         int i;
258         unsigned long dummy1, dummy2;
259
260         /* pick a random slot to start at */
261         slot_offset = mftb() & 0x7;
262
263         for (i = 0; i < HPTES_PER_GROUP; i++) {
264
265                 /* don't remove a bolted entry */
266                 lpar_rc = plpar_pte_remove(H_ANDCOND, hpte_group + slot_offset,
267                                            (0x1UL << 4), &dummy1, &dummy2);
268
269                 if (lpar_rc == H_Success)
270                         return i;
271
272                 BUG_ON(lpar_rc != H_Not_Found);
273
274                 slot_offset++;
275                 slot_offset &= 0x7;
276         }
277
278         return -1;
279 }
280
281 static void pSeries_lpar_hptab_clear(void)
282 {
283         unsigned long size_bytes = 1UL << naca->pftSize;
284         unsigned long hpte_count = size_bytes >> 4;
285         unsigned long dummy1, dummy2;
286         int i;
287
288         /* TODO: Use bulk call */
289         for (i = 0; i < hpte_count; i++)
290                 plpar_pte_remove(0, i, 0, &dummy1, &dummy2);
291 }
292
293 /*
294  * NOTE: for updatepp ops we are fortunate that the linux "newpp" bits and
295  * the low 3 bits of flags happen to line up.  So no transform is needed.
296  * We can probably optimize here and assume the high bits of newpp are
297  * already zero.  For now I am paranoid.
298  */
299 static long pSeries_lpar_hpte_updatepp(unsigned long slot, unsigned long newpp,
300                                        unsigned long va, int large, int local)
301 {
302         unsigned long lpar_rc;
303         unsigned long flags = (newpp & 7) | H_AVPN;
304         unsigned long avpn = va >> 23;
305
306         if (large)
307                 avpn &= ~0x1UL;
308
309         lpar_rc = plpar_pte_protect(flags, slot, (avpn << 7));
310
311         if (lpar_rc == H_Not_Found)
312                 return -1;
313
314         BUG_ON(lpar_rc != H_Success);
315
316         return 0;
317 }
318
319 static unsigned long pSeries_lpar_hpte_getword0(unsigned long slot)
320 {
321         unsigned long dword0;
322         unsigned long lpar_rc;
323         unsigned long dummy_word1;
324         unsigned long flags;
325
326         /* Read 1 pte at a time                        */
327         /* Do not need RPN to logical page translation */
328         /* No cross CEC PFT access                     */
329         flags = 0;
330
331         lpar_rc = plpar_pte_read(flags, slot, &dword0, &dummy_word1);
332
333         BUG_ON(lpar_rc != H_Success);
334
335         return dword0;
336 }
337
338 static long pSeries_lpar_hpte_find(unsigned long vpn)
339 {
340         unsigned long hash;
341         unsigned long i, j;
342         long slot;
343         union {
344                 unsigned long dword0;
345                 Hpte_dword0 dw0;
346         } hpte_dw0;
347         Hpte_dword0 dw0;
348
349         hash = hpt_hash(vpn, 0);
350
351         for (j = 0; j < 2; j++) {
352                 slot = (hash & htab_data.htab_hash_mask) * HPTES_PER_GROUP;
353                 for (i = 0; i < HPTES_PER_GROUP; i++) {
354                         hpte_dw0.dword0 = pSeries_lpar_hpte_getword0(slot);
355                         dw0 = hpte_dw0.dw0;
356
357                         if ((dw0.avpn == (vpn >> 11)) && dw0.v &&
358                             (dw0.h == j)) {
359                                 /* HPTE matches */
360                                 if (j)
361                                         slot = -slot;
362                                 return slot;
363                         }
364                         ++slot;
365                 }
366                 hash = ~hash;
367         }
368
369         return -1;
370
371
372 static void pSeries_lpar_hpte_updateboltedpp(unsigned long newpp,
373                                              unsigned long ea)
374 {
375         unsigned long lpar_rc;
376         unsigned long vsid, va, vpn, flags;
377         long slot;
378
379         vsid = get_kernel_vsid(ea);
380         va = (vsid << 28) | (ea & 0x0fffffff);
381         vpn = va >> PAGE_SHIFT;
382
383         slot = pSeries_lpar_hpte_find(vpn);
384         BUG_ON(slot == -1);
385
386         flags = newpp & 3;
387         lpar_rc = plpar_pte_protect(flags, slot, 0);
388
389         BUG_ON(lpar_rc != H_Success);
390 }
391
392 static void pSeries_lpar_hpte_invalidate(unsigned long slot, unsigned long va,
393                                          int large, int local)
394 {
395         unsigned long avpn = va >> 23;
396         unsigned long lpar_rc;
397         unsigned long dummy1, dummy2;
398
399         if (large)
400                 avpn &= ~0x1UL;
401
402         lpar_rc = plpar_pte_remove(H_AVPN, slot, (avpn << 7), &dummy1,
403                                    &dummy2);
404
405         if (lpar_rc == H_Not_Found)
406                 return;
407
408         BUG_ON(lpar_rc != H_Success);
409 }
410
411 /*
412  * Take a spinlock around flushes to avoid bouncing the hypervisor tlbie
413  * lock.
414  */
415 void pSeries_lpar_flush_hash_range(unsigned long context, unsigned long number,
416                                    int local)
417 {
418         int i;
419         unsigned long flags;
420         struct ppc64_tlb_batch *batch = &__get_cpu_var(ppc64_tlb_batch);
421         int lock_tlbie = !(cur_cpu_spec->cpu_features & CPU_FTR_LOCKLESS_TLBIE);
422
423         if (lock_tlbie)
424                 spin_lock_irqsave(&pSeries_lpar_tlbie_lock, flags);
425
426         for (i = 0; i < number; i++)
427                 flush_hash_page(context, batch->addr[i], batch->pte[i], local);
428
429         if (lock_tlbie)
430                 spin_unlock_irqrestore(&pSeries_lpar_tlbie_lock, flags);
431 }
432
433 void hpte_init_lpar(void)
434 {
435         ppc_md.hpte_invalidate  = pSeries_lpar_hpte_invalidate;
436         ppc_md.hpte_updatepp    = pSeries_lpar_hpte_updatepp;
437         ppc_md.hpte_updateboltedpp = pSeries_lpar_hpte_updateboltedpp;
438         ppc_md.hpte_insert      = pSeries_lpar_hpte_insert;
439         ppc_md.hpte_remove      = pSeries_lpar_hpte_remove;
440         ppc_md.flush_hash_range = pSeries_lpar_flush_hash_range;
441         ppc_md.hpte_clear_all   = pSeries_lpar_hptab_clear;
442
443         htab_finish_init();
444 }