vserver 1.9.5.x5
[linux-2.6.git] / arch / parisc / kernel / pci-dma.c
1 /*
2 ** PARISC 1.1 Dynamic DMA mapping support.
3 ** This implementation is for PA-RISC platforms that do not support
4 ** I/O TLBs (aka DMA address translation hardware).
5 ** See Documentation/DMA-mapping.txt for interface definitions.
6 **
7 **      (c) Copyright 1999,2000 Hewlett-Packard Company
8 **      (c) Copyright 2000 Grant Grundler
9 **      (c) Copyright 2000 Philipp Rumpf <prumpf@tux.org>
10 **      (c) Copyright 2000 John Marvin
11 **
12 ** "leveraged" from 2.3.47: arch/ia64/kernel/pci-dma.c.
13 ** (I assume it's from David Mosberger-Tang but there was no Copyright)
14 **
15 ** AFAIK, all PA7100LC and PA7300LC platforms can use this code.
16 **
17 ** - ggg
18 */
19
20 #include <linux/init.h>
21 #include <linux/mm.h>
22 #include <linux/pci.h>
23 #include <linux/proc_fs.h>
24 #include <linux/slab.h>
25 #include <linux/string.h>
26 #include <linux/types.h>
27
28 #include <asm/cacheflush.h>
29 #include <asm/dma.h>    /* for DMA_CHUNK_SIZE */
30 #include <asm/io.h>
31 #include <asm/page.h>   /* get_order */
32 #include <asm/pgalloc.h>
33 #include <asm/uaccess.h>
34
35 #ifdef DEBUG_PCI
36 #undef ASSERT
37 #define ASSERT(expr) \
38         if(!(expr)) { \
39                 printk("\n%s:%d: Assertion " #expr " failed!\n", \
40                                 __FILE__, __LINE__); \
41                 panic(#expr); \
42         }
43 #else
44 #define ASSERT(expr)
45 #endif
46
47
48 static struct proc_dir_entry * proc_gsc_root = NULL;
49 static int pcxl_proc_info(char *buffer, char **start, off_t offset, int length);
50 static unsigned long pcxl_used_bytes = 0;
51 static unsigned long pcxl_used_pages = 0;
52
53 extern unsigned long pcxl_dma_start; /* Start of pcxl dma mapping area */
54 static spinlock_t   pcxl_res_lock;
55 static char    *pcxl_res_map;
56 static int     pcxl_res_hint;
57 static int     pcxl_res_size;
58
59 #ifdef DEBUG_PCXL_RESOURCE
60 #define DBG_RES(x...)   printk(x)
61 #else
62 #define DBG_RES(x...)
63 #endif
64
65
66 /*
67 ** Dump a hex representation of the resource map.
68 */
69
70 #ifdef DUMP_RESMAP
71 static
72 void dump_resmap(void)
73 {
74         u_long *res_ptr = (unsigned long *)pcxl_res_map;
75         u_long i = 0;
76
77         printk("res_map: ");
78         for(; i < (pcxl_res_size / sizeof(unsigned long)); ++i, ++res_ptr)
79                 printk("%08lx ", *res_ptr);
80
81         printk("\n");
82 }
83 #else
84 static inline void dump_resmap(void) {;}
85 #endif
86
87 static int pa11_dma_supported( struct device *dev, u64 mask)
88 {
89         return 1;
90 }
91
92 static inline int map_pte_uncached(pte_t * pte,
93                 unsigned long vaddr,
94                 unsigned long size, unsigned long *paddr_ptr)
95 {
96         unsigned long end;
97         unsigned long orig_vaddr = vaddr;
98
99         vaddr &= ~PMD_MASK;
100         end = vaddr + size;
101         if (end > PMD_SIZE)
102                 end = PMD_SIZE;
103         do {
104                 if (!pte_none(*pte))
105                         printk(KERN_ERR "map_pte_uncached: page already exists\n");
106                 set_pte(pte, __mk_pte(*paddr_ptr, PAGE_KERNEL_UNC));
107                 purge_tlb_start();
108                 pdtlb_kernel(orig_vaddr);
109                 purge_tlb_end();
110                 vaddr += PAGE_SIZE;
111                 orig_vaddr += PAGE_SIZE;
112                 (*paddr_ptr) += PAGE_SIZE;
113                 pte++;
114         } while (vaddr < end);
115         return 0;
116 }
117
118 static inline int map_pmd_uncached(pmd_t * pmd, unsigned long vaddr,
119                 unsigned long size, unsigned long *paddr_ptr)
120 {
121         unsigned long end;
122         unsigned long orig_vaddr = vaddr;
123
124         vaddr &= ~PGDIR_MASK;
125         end = vaddr + size;
126         if (end > PGDIR_SIZE)
127                 end = PGDIR_SIZE;
128         do {
129                 pte_t * pte = pte_alloc_kernel(&init_mm, pmd, vaddr);
130                 if (!pte)
131                         return -ENOMEM;
132                 if (map_pte_uncached(pte, orig_vaddr, end - vaddr, paddr_ptr))
133                         return -ENOMEM;
134                 vaddr = (vaddr + PMD_SIZE) & PMD_MASK;
135                 orig_vaddr += PMD_SIZE;
136                 pmd++;
137         } while (vaddr < end);
138         return 0;
139 }
140
141 static inline int map_uncached_pages(unsigned long vaddr, unsigned long size,
142                 unsigned long paddr)
143 {
144         pgd_t * dir;
145         unsigned long end = vaddr + size;
146
147         dir = pgd_offset_k(vaddr);
148         do {
149                 pmd_t *pmd;
150                 
151                 pmd = pmd_alloc(NULL, dir, vaddr);
152                 if (!pmd)
153                         return -ENOMEM;
154                 if (map_pmd_uncached(pmd, vaddr, end - vaddr, &paddr))
155                         return -ENOMEM;
156                 vaddr = vaddr + PGDIR_SIZE;
157                 dir++;
158         } while (vaddr && (vaddr < end));
159         return 0;
160 }
161
162 static inline void unmap_uncached_pte(pmd_t * pmd, unsigned long vaddr,
163                 unsigned long size)
164 {
165         pte_t * pte;
166         unsigned long end;
167         unsigned long orig_vaddr = vaddr;
168
169         if (pmd_none(*pmd))
170                 return;
171         if (pmd_bad(*pmd)) {
172                 pmd_ERROR(*pmd);
173                 pmd_clear(pmd);
174                 return;
175         }
176         pte = pte_offset_map(pmd, vaddr);
177         vaddr &= ~PMD_MASK;
178         end = vaddr + size;
179         if (end > PMD_SIZE)
180                 end = PMD_SIZE;
181         do {
182                 pte_t page = *pte;
183                 pte_clear(pte);
184                 purge_tlb_start();
185                 pdtlb_kernel(orig_vaddr);
186                 purge_tlb_end();
187                 vaddr += PAGE_SIZE;
188                 orig_vaddr += PAGE_SIZE;
189                 pte++;
190                 if (pte_none(page) || pte_present(page))
191                         continue;
192                 printk(KERN_CRIT "Whee.. Swapped out page in kernel page table\n");
193         } while (vaddr < end);
194 }
195
196 static inline void unmap_uncached_pmd(pgd_t * dir, unsigned long vaddr,
197                 unsigned long size)
198 {
199         pmd_t * pmd;
200         unsigned long end;
201         unsigned long orig_vaddr = vaddr;
202
203         if (pgd_none(*dir))
204                 return;
205         if (pgd_bad(*dir)) {
206                 pgd_ERROR(*dir);
207                 pgd_clear(dir);
208                 return;
209         }
210         pmd = pmd_offset(dir, vaddr);
211         vaddr &= ~PGDIR_MASK;
212         end = vaddr + size;
213         if (end > PGDIR_SIZE)
214                 end = PGDIR_SIZE;
215         do {
216                 unmap_uncached_pte(pmd, orig_vaddr, end - vaddr);
217                 vaddr = (vaddr + PMD_SIZE) & PMD_MASK;
218                 orig_vaddr += PMD_SIZE;
219                 pmd++;
220         } while (vaddr < end);
221 }
222
223 static void unmap_uncached_pages(unsigned long vaddr, unsigned long size)
224 {
225         pgd_t * dir;
226         unsigned long end = vaddr + size;
227
228         dir = pgd_offset_k(vaddr);
229         do {
230                 unmap_uncached_pmd(dir, vaddr, end - vaddr);
231                 vaddr = vaddr + PGDIR_SIZE;
232                 dir++;
233         } while (vaddr && (vaddr < end));
234 }
235
236 #define PCXL_SEARCH_LOOP(idx, mask, size)  \
237        for(; res_ptr < res_end; ++res_ptr) \
238        { \
239                if(0 == ((*res_ptr) & mask)) { \
240                        *res_ptr |= mask; \
241                        idx = (int)((u_long)res_ptr - (u_long)pcxl_res_map); \
242                        pcxl_res_hint = idx + (size >> 3); \
243                        goto resource_found; \
244                } \
245        }
246
247 #define PCXL_FIND_FREE_MAPPING(idx, mask, size)  { \
248        u##size *res_ptr = (u##size *)&(pcxl_res_map[pcxl_res_hint & ~((size >> 3) - 1)]); \
249        u##size *res_end = (u##size *)&pcxl_res_map[pcxl_res_size]; \
250        PCXL_SEARCH_LOOP(idx, mask, size); \
251        res_ptr = (u##size *)&pcxl_res_map[0]; \
252        PCXL_SEARCH_LOOP(idx, mask, size); \
253 }
254
255 unsigned long
256 pcxl_alloc_range(size_t size)
257 {
258         int res_idx;
259         u_long mask, flags;
260         unsigned int pages_needed = size >> PAGE_SHIFT;
261
262         ASSERT(pages_needed);
263         ASSERT((pages_needed * PAGE_SIZE) < DMA_CHUNK_SIZE);
264         ASSERT(pages_needed < (BITS_PER_LONG - PAGE_SHIFT));
265
266         mask = (u_long) -1L;
267         mask >>= BITS_PER_LONG - pages_needed;
268
269         DBG_RES("pcxl_alloc_range() size: %d pages_needed %d pages_mask 0x%08lx\n", 
270                 size, pages_needed, mask);
271
272         spin_lock_irqsave(&pcxl_res_lock, flags);
273
274         if(pages_needed <= 8) {
275                 PCXL_FIND_FREE_MAPPING(res_idx, mask, 8);
276         } else if(pages_needed <= 16) {
277                 PCXL_FIND_FREE_MAPPING(res_idx, mask, 16);
278         } else if(pages_needed <= 32) {
279                 PCXL_FIND_FREE_MAPPING(res_idx, mask, 32);
280         } else {
281                 panic("%s: pcxl_alloc_range() Too many pages to map.\n",
282                       __FILE__);
283         }
284
285         dump_resmap();
286         panic("%s: pcxl_alloc_range() out of dma mapping resources\n",
287               __FILE__);
288         
289 resource_found:
290         
291         DBG_RES("pcxl_alloc_range() res_idx %d mask 0x%08lx res_hint: %d\n",
292                 res_idx, mask, pcxl_res_hint);
293
294         pcxl_used_pages += pages_needed;
295         pcxl_used_bytes += ((pages_needed >> 3) ? (pages_needed >> 3) : 1);
296
297         spin_unlock_irqrestore(&pcxl_res_lock, flags);
298
299         dump_resmap();
300
301         /* 
302         ** return the corresponding vaddr in the pcxl dma map
303         */
304         return (pcxl_dma_start + (res_idx << (PAGE_SHIFT + 3)));
305 }
306
307 #define PCXL_FREE_MAPPINGS(idx, m, size) \
308                 u##size *res_ptr = (u##size *)&(pcxl_res_map[(idx) + (((size >> 3) - 1) & (~((size >> 3) - 1)))]); \
309                 ASSERT((*res_ptr & m) == m); \
310                 *res_ptr &= ~m;
311
312 /*
313 ** clear bits in the pcxl resource map
314 */
315 static void
316 pcxl_free_range(unsigned long vaddr, size_t size)
317 {
318         u_long mask, flags;
319         unsigned int res_idx = (vaddr - pcxl_dma_start) >> (PAGE_SHIFT + 3);
320         unsigned int pages_mapped = size >> PAGE_SHIFT;
321
322         ASSERT(pages_mapped);
323         ASSERT((pages_mapped * PAGE_SIZE) < DMA_CHUNK_SIZE);
324         ASSERT(pages_mapped < (BITS_PER_LONG - PAGE_SHIFT));
325
326         mask = (u_long) -1L;
327         mask >>= BITS_PER_LONG - pages_mapped;
328
329         DBG_RES("pcxl_free_range() res_idx: %d size: %d pages_mapped %d mask 0x%08lx\n", 
330                 res_idx, size, pages_mapped, mask);
331
332         spin_lock_irqsave(&pcxl_res_lock, flags);
333
334         if(pages_mapped <= 8) {
335                 PCXL_FREE_MAPPINGS(res_idx, mask, 8);
336         } else if(pages_mapped <= 16) {
337                 PCXL_FREE_MAPPINGS(res_idx, mask, 16);
338         } else if(pages_mapped <= 32) {
339                 PCXL_FREE_MAPPINGS(res_idx, mask, 32);
340         } else {
341                 panic("%s: pcxl_free_range() Too many pages to unmap.\n",
342                       __FILE__);
343         }
344         
345         pcxl_used_pages -= (pages_mapped ? pages_mapped : 1);
346         pcxl_used_bytes -= ((pages_mapped >> 3) ? (pages_mapped >> 3) : 1);
347
348         spin_unlock_irqrestore(&pcxl_res_lock, flags);
349
350         dump_resmap();
351 }
352
353 static int __init
354 pcxl_dma_init(void)
355 {
356     if (pcxl_dma_start == 0)
357         return 0;
358
359     spin_lock_init(&pcxl_res_lock);
360     pcxl_res_size = PCXL_DMA_MAP_SIZE >> (PAGE_SHIFT + 3);
361     pcxl_res_hint = 0;
362     pcxl_res_map = (char *)__get_free_pages(GFP_KERNEL,
363                                             get_order(pcxl_res_size));
364     memset(pcxl_res_map, 0, pcxl_res_size);
365     proc_gsc_root = proc_mkdir("gsc", 0);
366     create_proc_info_entry("dino", 0, proc_gsc_root, pcxl_proc_info);
367     return 0;
368 }
369
370 __initcall(pcxl_dma_init);
371
372 static void * pa11_dma_alloc_consistent (struct device *dev, size_t size, dma_addr_t *dma_handle, int flag)
373 {
374         unsigned long vaddr;
375         unsigned long paddr;
376         int order;
377
378         order = get_order(size);
379         size = 1 << (order + PAGE_SHIFT);
380         vaddr = pcxl_alloc_range(size);
381         paddr = __get_free_pages(flag, order);
382         flush_kernel_dcache_range(paddr, size);
383         paddr = __pa(paddr);
384         map_uncached_pages(vaddr, size, paddr);
385         *dma_handle = (dma_addr_t) paddr;
386
387 #if 0
388 /* This probably isn't needed to support EISA cards.
389 ** ISA cards will certainly only support 24-bit DMA addressing.
390 ** Not clear if we can, want, or need to support ISA.
391 */
392         if (!dev || *dev->coherent_dma_mask < 0xffffffff)
393                 gfp |= GFP_DMA;
394 #endif
395         return (void *)vaddr;
396 }
397
398 static void pa11_dma_free_consistent (struct device *dev, size_t size, void *vaddr, dma_addr_t dma_handle)
399 {
400         int order;
401
402         order = get_order(size);
403         size = 1 << (order + PAGE_SHIFT);
404         unmap_uncached_pages((unsigned long)vaddr, size);
405         pcxl_free_range((unsigned long)vaddr, size);
406         free_pages((unsigned long)__va(dma_handle), order);
407 }
408
409 static dma_addr_t pa11_dma_map_single(struct device *dev, void *addr, size_t size, enum dma_data_direction direction)
410 {
411         if (direction == DMA_NONE) {
412                 printk(KERN_ERR "pa11_dma_map_single(PCI_DMA_NONE) called by %p\n", __builtin_return_address(0));
413                 BUG();
414         }
415
416         flush_kernel_dcache_range((unsigned long) addr, size);
417         return virt_to_phys(addr);
418 }
419
420 static void pa11_dma_unmap_single(struct device *dev, dma_addr_t dma_handle, size_t size, enum dma_data_direction direction)
421 {
422         if (direction == DMA_NONE) {
423                 printk(KERN_ERR "pa11_dma_unmap_single(PCI_DMA_NONE) called by %p\n", __builtin_return_address(0));
424                 BUG();
425         }
426
427         if (direction == DMA_TO_DEVICE)
428             return;
429
430         /*
431          * For PCI_DMA_FROMDEVICE this flush is not necessary for the
432          * simple map/unmap case. However, it IS necessary if if
433          * pci_dma_sync_single_* has been called and the buffer reused.
434          */
435
436         flush_kernel_dcache_range((unsigned long) phys_to_virt(dma_handle), size);
437         return;
438 }
439
440 static int pa11_dma_map_sg(struct device *dev, struct scatterlist *sglist, int nents, enum dma_data_direction direction)
441 {
442         int i;
443
444         if (direction == DMA_NONE)
445             BUG();
446
447         for (i = 0; i < nents; i++, sglist++ ) {
448                 unsigned long vaddr = sg_virt_addr(sglist);
449                 sg_dma_address(sglist) = (dma_addr_t) virt_to_phys(vaddr);
450                 sg_dma_len(sglist) = sglist->length;
451                 flush_kernel_dcache_range(vaddr, sglist->length);
452         }
453         return nents;
454 }
455
456 static void pa11_dma_unmap_sg(struct device *dev, struct scatterlist *sglist, int nents, enum dma_data_direction direction)
457 {
458         int i;
459
460         if (direction == DMA_NONE)
461             BUG();
462
463         if (direction == DMA_TO_DEVICE)
464             return;
465
466         /* once we do combining we'll need to use phys_to_virt(sg_dma_address(sglist)) */
467
468         for (i = 0; i < nents; i++, sglist++ )
469                 flush_kernel_dcache_range(sg_virt_addr(sglist), sglist->length);
470         return;
471 }
472
473 static void pa11_dma_sync_single_for_cpu(struct device *dev, dma_addr_t dma_handle, unsigned long offset, size_t size, enum dma_data_direction direction)
474 {
475         if (direction == DMA_NONE)
476             BUG();
477
478         flush_kernel_dcache_range((unsigned long) phys_to_virt(dma_handle) + offset, size);
479 }
480
481 static void pa11_dma_sync_single_for_device(struct device *dev, dma_addr_t dma_handle, unsigned long offset, size_t size, enum dma_data_direction direction)
482 {
483         if (direction == DMA_NONE)
484             BUG();
485
486         flush_kernel_dcache_range((unsigned long) phys_to_virt(dma_handle) + offset, size);
487 }
488
489 static void pa11_dma_sync_sg_for_cpu(struct device *dev, struct scatterlist *sglist, int nents, enum dma_data_direction direction)
490 {
491         int i;
492
493         /* once we do combining we'll need to use phys_to_virt(sg_dma_address(sglist)) */
494
495         for (i = 0; i < nents; i++, sglist++ )
496                 flush_kernel_dcache_range(sg_virt_addr(sglist), sglist->length);
497 }
498
499 static void pa11_dma_sync_sg_for_device(struct device *dev, struct scatterlist *sglist, int nents, enum dma_data_direction direction)
500 {
501         int i;
502
503         /* once we do combining we'll need to use phys_to_virt(sg_dma_address(sglist)) */
504
505         for (i = 0; i < nents; i++, sglist++ )
506                 flush_kernel_dcache_range(sg_virt_addr(sglist), sglist->length);
507 }
508
509 struct hppa_dma_ops pcxl_dma_ops = {
510         .dma_supported =        pa11_dma_supported,
511         .alloc_consistent =     pa11_dma_alloc_consistent,
512         .alloc_noncoherent =    pa11_dma_alloc_consistent,
513         .free_consistent =      pa11_dma_free_consistent,
514         .map_single =           pa11_dma_map_single,
515         .unmap_single =         pa11_dma_unmap_single,
516         .map_sg =               pa11_dma_map_sg,
517         .unmap_sg =             pa11_dma_unmap_sg,
518         .dma_sync_single_for_cpu = pa11_dma_sync_single_for_cpu,
519         .dma_sync_single_for_device = pa11_dma_sync_single_for_device,
520         .dma_sync_sg_for_cpu = pa11_dma_sync_sg_for_cpu,
521         .dma_sync_sg_for_device = pa11_dma_sync_sg_for_device,
522 };
523
524 static void *fail_alloc_consistent(struct device *dev, size_t size,
525                                    dma_addr_t *dma_handle, int flag)
526 {
527         return NULL;
528 }
529
530 static void *pa11_dma_alloc_noncoherent(struct device *dev, size_t size,
531                                           dma_addr_t *dma_handle, int flag)
532 {
533         void *addr = NULL;
534
535         /* rely on kmalloc to be cacheline aligned */
536         addr = kmalloc(size, flag);
537         if(addr)
538                 *dma_handle = (dma_addr_t)virt_to_phys(addr);
539
540         return addr;
541 }
542
543 static void pa11_dma_free_noncoherent(struct device *dev, size_t size,
544                                         void *vaddr, dma_addr_t iova)
545 {
546         kfree(vaddr);
547         return;
548 }
549
550 struct hppa_dma_ops pcx_dma_ops = {
551         .dma_supported =        pa11_dma_supported,
552         .alloc_consistent =     fail_alloc_consistent,
553         .alloc_noncoherent =    pa11_dma_alloc_noncoherent,
554         .free_consistent =      pa11_dma_free_noncoherent,
555         .map_single =           pa11_dma_map_single,
556         .unmap_single =         pa11_dma_unmap_single,
557         .map_sg =               pa11_dma_map_sg,
558         .unmap_sg =             pa11_dma_unmap_sg,
559         .dma_sync_single_for_cpu =      pa11_dma_sync_single_for_cpu,
560         .dma_sync_single_for_device =   pa11_dma_sync_single_for_device,
561         .dma_sync_sg_for_cpu =          pa11_dma_sync_sg_for_cpu,
562         .dma_sync_sg_for_device =       pa11_dma_sync_sg_for_device,
563 };
564
565
566 static int pcxl_proc_info(char *buf, char **start, off_t offset, int len)
567 {
568         u_long i = 0;
569         unsigned long *res_ptr = (u_long *)pcxl_res_map;
570         unsigned long total_pages = pcxl_res_size << 3;        /* 8 bits per byte */
571
572         sprintf(buf, "\nDMA Mapping Area size    : %d bytes (%d pages)\n",
573                 PCXL_DMA_MAP_SIZE,
574                 (pcxl_res_size << 3) ); /* 1 bit per page */
575         
576         sprintf(buf, "%sResource bitmap : %d bytes (%d pages)\n", 
577                 buf, pcxl_res_size, pcxl_res_size << 3);   /* 8 bits per byte */
578
579         strcat(buf,  "            total:    free:    used:   % used:\n");
580         sprintf(buf, "%sblocks  %8d %8ld %8ld %8ld%%\n", buf, pcxl_res_size,
581                 pcxl_res_size - pcxl_used_bytes, pcxl_used_bytes,
582                 (pcxl_used_bytes * 100) / pcxl_res_size);
583
584         sprintf(buf, "%spages   %8ld %8ld %8ld %8ld%%\n", buf, total_pages,
585                 total_pages - pcxl_used_pages, pcxl_used_pages,
586                 (pcxl_used_pages * 100 / total_pages));
587         
588         strcat(buf, "\nResource bitmap:");
589
590         for(; i < (pcxl_res_size / sizeof(u_long)); ++i, ++res_ptr) {
591                 if ((i & 7) == 0)
592                     strcat(buf,"\n   ");
593                 sprintf(buf, "%s %08lx", buf, *res_ptr);
594         }
595         strcat(buf, "\n");
596         return strlen(buf);
597 }
598