ftp://ftp.kernel.org/pub/linux/kernel/v2.6/linux-2.6.6.tar.bz2
[linux-2.6.git] / arch / ia64 / kernel / sys_ia64.c
1 /*
2  * This file contains various system calls that have different calling
3  * conventions on different platforms.
4  *
5  * Copyright (C) 1999-2000, 2002-2003 Hewlett-Packard Co
6  *      David Mosberger-Tang <davidm@hpl.hp.com>
7  */
8 #include <linux/config.h>
9 #include <linux/errno.h>
10 #include <linux/fs.h>
11 #include <linux/mm.h>
12 #include <linux/mman.h>
13 #include <linux/sched.h>
14 #include <linux/shm.h>
15 #include <linux/file.h>         /* doh, must come after sched.h... */
16 #include <linux/smp.h>
17 #include <linux/smp_lock.h>
18 #include <linux/syscalls.h>
19 #include <linux/highuid.h>
20 #include <linux/hugetlb.h>
21
22 #include <asm/shmparam.h>
23 #include <asm/uaccess.h>
24
25 unsigned long
26 arch_get_unmapped_area (struct file *filp, unsigned long addr, unsigned long len,
27                         unsigned long pgoff, unsigned long flags)
28 {
29         long map_shared = (flags & MAP_SHARED);
30         unsigned long start_addr, align_mask = PAGE_SIZE - 1;
31         struct mm_struct *mm = current->mm;
32         struct vm_area_struct *vma;
33
34         if (len > RGN_MAP_LIMIT)
35                 return -ENOMEM;
36
37 #ifdef CONFIG_HUGETLB_PAGE
38         if (REGION_NUMBER(addr) == REGION_HPAGE)
39                 addr = 0;
40 #endif
41         if (!addr)
42                 addr = mm->free_area_cache;
43
44         if (map_shared && (TASK_SIZE > 0xfffffffful))
45                 /*
46                  * For 64-bit tasks, align shared segments to 1MB to avoid potential
47                  * performance penalty due to virtual aliasing (see ASDM).  For 32-bit
48                  * tasks, we prefer to avoid exhausting the address space too quickly by
49                  * limiting alignment to a single page.
50                  */
51                 align_mask = SHMLBA - 1;
52
53   full_search:
54         start_addr = addr = (addr + align_mask) & ~align_mask;
55
56         for (vma = find_vma(mm, addr); ; vma = vma->vm_next) {
57                 /* At this point:  (!vma || addr < vma->vm_end). */
58                 if (TASK_SIZE - len < addr || RGN_MAP_LIMIT - len < REGION_OFFSET(addr)) {
59                         if (start_addr != TASK_UNMAPPED_BASE) {
60                                 /* Start a new search --- just in case we missed some holes.  */
61                                 addr = TASK_UNMAPPED_BASE;
62                                 goto full_search;
63                         }
64                         return -ENOMEM;
65                 }
66                 if (!vma || addr + len <= vma->vm_start) {
67                         /* Remember the address where we stopped this search:  */
68                         mm->free_area_cache = addr + len;
69                         return addr;
70                 }
71                 addr = (vma->vm_end + align_mask) & ~align_mask;
72         }
73 }
74
75 asmlinkage long
76 ia64_getpriority (int which, int who)
77 {
78         long prio;
79
80         prio = sys_getpriority(which, who);
81         if (prio >= 0) {
82                 force_successful_syscall_return();
83                 prio = 20 - prio;
84         }
85         return prio;
86 }
87
88 /* XXX obsolete, but leave it here until the old libc is gone... */
89 asmlinkage unsigned long
90 sys_getpagesize (void)
91 {
92         return PAGE_SIZE;
93 }
94
95 asmlinkage unsigned long
96 ia64_shmat (int shmid, void *shmaddr, int shmflg)
97 {
98         unsigned long raddr;
99         int retval;
100
101         retval = do_shmat(shmid, shmaddr, shmflg, &raddr);
102         if (retval < 0)
103                 return retval;
104
105         force_successful_syscall_return();
106         return raddr;
107 }
108
109 asmlinkage unsigned long
110 ia64_brk (unsigned long brk)
111 {
112         unsigned long rlim, retval, newbrk, oldbrk;
113         struct mm_struct *mm = current->mm;
114
115         /*
116          * Most of this replicates the code in sys_brk() except for an additional safety
117          * check and the clearing of r8.  However, we can't call sys_brk() because we need
118          * to acquire the mmap_sem before we can do the test...
119          */
120         down_write(&mm->mmap_sem);
121
122         if (brk < mm->end_code)
123                 goto out;
124         newbrk = PAGE_ALIGN(brk);
125         oldbrk = PAGE_ALIGN(mm->brk);
126         if (oldbrk == newbrk)
127                 goto set_brk;
128
129         /* Always allow shrinking brk. */
130         if (brk <= mm->brk) {
131                 if (!do_munmap(mm, newbrk, oldbrk-newbrk))
132                         goto set_brk;
133                 goto out;
134         }
135
136         /* Check against unimplemented/unmapped addresses: */
137         if ((newbrk - oldbrk) > RGN_MAP_LIMIT || REGION_OFFSET(newbrk) > RGN_MAP_LIMIT)
138                 goto out;
139
140         /* Check against rlimit.. */
141         rlim = current->rlim[RLIMIT_DATA].rlim_cur;
142         if (rlim < RLIM_INFINITY && brk - mm->start_data > rlim)
143                 goto out;
144
145         /* Check against existing mmap mappings. */
146         if (find_vma_intersection(mm, oldbrk, newbrk+PAGE_SIZE))
147                 goto out;
148
149         /* Ok, looks good - let it rip. */
150         if (do_brk(oldbrk, newbrk-oldbrk) != oldbrk)
151                 goto out;
152 set_brk:
153         mm->brk = brk;
154 out:
155         retval = mm->brk;
156         up_write(&mm->mmap_sem);
157         force_successful_syscall_return();
158         return retval;
159 }
160
161 /*
162  * On IA-64, we return the two file descriptors in ret0 and ret1 (r8
163  * and r9) as this is faster than doing a copy_to_user().
164  */
165 asmlinkage long
166 sys_pipe (long arg0, long arg1, long arg2, long arg3,
167           long arg4, long arg5, long arg6, long arg7, long stack)
168 {
169         struct pt_regs *regs = (struct pt_regs *) &stack;
170         int fd[2];
171         int retval;
172
173         retval = do_pipe(fd);
174         if (retval)
175                 goto out;
176         retval = fd[0];
177         regs->r9 = fd[1];
178   out:
179         return retval;
180 }
181
182 static inline unsigned long
183 do_mmap2 (unsigned long addr, unsigned long len, int prot, int flags, int fd, unsigned long pgoff)
184 {
185         unsigned long roff;
186         struct file *file = 0;
187
188         flags &= ~(MAP_EXECUTABLE | MAP_DENYWRITE);
189         if (!(flags & MAP_ANONYMOUS)) {
190                 file = fget(fd);
191                 if (!file)
192                         return -EBADF;
193
194                 if (!file->f_op || !file->f_op->mmap) {
195                         addr = -ENODEV;
196                         goto out;
197                 }
198         }
199
200         /*
201          * A zero mmap always succeeds in Linux, independent of whether or not the
202          * remaining arguments are valid.
203          */
204         if (len == 0)
205                 goto out;
206
207         /* Careful about overflows.. */
208         len = PAGE_ALIGN(len);
209         if (!len || len > TASK_SIZE) {
210                 addr = -EINVAL;
211                 goto out;
212         }
213
214         /*
215          * Don't permit mappings into unmapped space, the virtual page table of a region,
216          * or across a region boundary.  Note: RGN_MAP_LIMIT is equal to 2^n-PAGE_SIZE
217          * (for some integer n <= 61) and len > 0.
218          */
219         roff = REGION_OFFSET(addr);
220         if ((len > RGN_MAP_LIMIT) || (roff > (RGN_MAP_LIMIT - len))) {
221                 addr = -EINVAL;
222                 goto out;
223         }
224
225         down_write(&current->mm->mmap_sem);
226         addr = do_mmap_pgoff(file, addr, len, prot, flags, pgoff);
227         up_write(&current->mm->mmap_sem);
228
229 out:    if (file)
230                 fput(file);
231         return addr;
232 }
233
234 /*
235  * mmap2() is like mmap() except that the offset is expressed in units
236  * of PAGE_SIZE (instead of bytes).  This allows to mmap2() (pieces
237  * of) files that are larger than the address space of the CPU.
238  */
239 asmlinkage unsigned long
240 sys_mmap2 (unsigned long addr, unsigned long len, int prot, int flags, int fd, long pgoff)
241 {
242         addr = do_mmap2(addr, len, prot, flags, fd, pgoff);
243         if (!IS_ERR((void *) addr))
244                 force_successful_syscall_return();
245         return addr;
246 }
247
248 asmlinkage unsigned long
249 sys_mmap (unsigned long addr, unsigned long len, int prot, int flags, int fd, long off)
250 {
251         if (offset_in_page(off) != 0)
252                 return -EINVAL;
253
254         addr = do_mmap2(addr, len, prot, flags, fd, off >> PAGE_SHIFT);
255         if (!IS_ERR((void *) addr))
256                 force_successful_syscall_return();
257         return addr;
258 }
259
260 asmlinkage unsigned long
261 ia64_mremap (unsigned long addr, unsigned long old_len, unsigned long new_len, unsigned long flags,
262              unsigned long new_addr)
263 {
264         extern unsigned long do_mremap (unsigned long addr,
265                                         unsigned long old_len,
266                                         unsigned long new_len,
267                                         unsigned long flags,
268                                         unsigned long new_addr);
269
270         down_write(&current->mm->mmap_sem);
271         {
272                 addr = do_mremap(addr, old_len, new_len, flags, new_addr);
273         }
274         up_write(&current->mm->mmap_sem);
275
276         if (IS_ERR((void *) addr))
277                 return addr;
278
279         force_successful_syscall_return();
280         return addr;
281 }
282
283 #ifndef CONFIG_PCI
284
285 asmlinkage long
286 sys_pciconfig_read (unsigned long bus, unsigned long dfn, unsigned long off, unsigned long len,
287                     void *buf)
288 {
289         return -ENOSYS;
290 }
291
292 asmlinkage long
293 sys_pciconfig_write (unsigned long bus, unsigned long dfn, unsigned long off, unsigned long len,
294                      void *buf)
295 {
296         return -ENOSYS;
297 }
298
299 #endif /* CONFIG_PCI */