vserver 1.9.5.x5
[linux-2.6.git] / fs / xfs / linux-2.6 / xfs_linux.h
1 /*
2  * Copyright (c) 2000-2004 Silicon Graphics, Inc.  All Rights Reserved.
3  *
4  * This program is free software; you can redistribute it and/or modify it
5  * under the terms of version 2 of the GNU General Public License as
6  * published by the Free Software Foundation.
7  *
8  * This program is distributed in the hope that it would be useful, but
9  * WITHOUT ANY WARRANTY; without even the implied warranty of
10  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
11  *
12  * Further, this software is distributed without any warranty that it is
13  * free of the rightful claim of any third person regarding infringement
14  * or the like.  Any license provided herein, whether implied or
15  * otherwise, applies only to this software file.  Patent licenses, if
16  * any, provided herein do not apply to combinations of this program with
17  * other software, or any other product whatsoever.
18  *
19  * You should have received a copy of the GNU General Public License along
20  * with this program; if not, write the Free Software Foundation, Inc., 59
21  * Temple Place - Suite 330, Boston MA 02111-1307, USA.
22  *
23  * Contact information: Silicon Graphics, Inc., 1600 Amphitheatre Pkwy,
24  * Mountain View, CA  94043, or:
25  *
26  * http://www.sgi.com
27  *
28  * For further information regarding this notice, see:
29  *
30  * http://oss.sgi.com/projects/GenInfo/SGIGPLNoticeExplan/
31  */
32 #ifndef __XFS_LINUX__
33 #define __XFS_LINUX__
34
35 #include <linux/types.h>
36 #include <linux/config.h>
37
38 /*
39  * Some types are conditional depending on the target system.
40  * XFS_BIG_BLKNOS needs block layer disk addresses to be 64 bits.
41  * XFS_BIG_INUMS needs the VFS inode number to be 64 bits, as well
42  * as requiring XFS_BIG_BLKNOS to be set.
43  */
44 #if defined(CONFIG_LBD) || (BITS_PER_LONG == 64)
45 # define XFS_BIG_BLKNOS 1
46 # if BITS_PER_LONG == 64
47 #  define XFS_BIG_INUMS 1
48 # else
49 #  define XFS_BIG_INUMS 0
50 # endif
51 #else
52 # define XFS_BIG_BLKNOS 0
53 # define XFS_BIG_INUMS  0
54 #endif
55
56 #include <xfs_types.h>
57 #include <xfs_arch.h>
58
59 #include <kmem.h>
60 #include <mrlock.h>
61 #include <spin.h>
62 #include <sv.h>
63 #include <mutex.h>
64 #include <sema.h>
65 #include <time.h>
66
67 #include <support/qsort.h>
68 #include <support/ktrace.h>
69 #include <support/debug.h>
70 #include <support/move.h>
71 #include <support/uuid.h>
72
73 #include <linux/mm.h>
74 #include <linux/kernel.h>
75 #include <linux/blkdev.h>
76 #include <linux/slab.h>
77 #include <linux/module.h>
78 #include <linux/file.h>
79 #include <linux/swap.h>
80 #include <linux/errno.h>
81 #include <linux/sched.h>
82 #include <linux/bitops.h>
83 #include <linux/major.h>
84 #include <linux/pagemap.h>
85 #include <linux/vfs.h>
86 #include <linux/seq_file.h>
87 #include <linux/init.h>
88 #include <linux/list.h>
89 #include <linux/proc_fs.h>
90 #include <linux/version.h>
91
92 #include <asm/page.h>
93 #include <asm/div64.h>
94 #include <asm/param.h>
95 #include <asm/uaccess.h>
96 #include <asm/byteorder.h>
97 #include <asm/unaligned.h>
98
99 #include <xfs_behavior.h>
100 #include <xfs_vfs.h>
101 #include <xfs_cred.h>
102 #include <xfs_vnode.h>
103 #include <xfs_stats.h>
104 #include <xfs_sysctl.h>
105 #include <xfs_iops.h>
106 #include <xfs_super.h>
107 #include <xfs_globals.h>
108 #include <xfs_fs_subr.h>
109 #include <xfs_lrw.h>
110 #include <xfs_buf.h>
111
112 /*
113  * Feature macros (disable/enable)
114  */
115 #undef  HAVE_REFCACHE   /* reference cache not needed for NFS in 2.6 */
116 #define HAVE_SENDFILE   /* sendfile(2) exists in 2.6, but not in 2.4 */
117
118 /*
119  * State flag for unwritten extent buffers.
120  *
121  * We need to be able to distinguish between these and delayed
122  * allocate buffers within XFS.  The generic IO path code does
123  * not need to distinguish - we use the BH_Delay flag for both
124  * delalloc and these ondisk-uninitialised buffers.
125  */
126 BUFFER_FNS(PrivateStart, unwritten);
127 static inline void set_buffer_unwritten_io(struct buffer_head *bh)
128 {
129         bh->b_end_io = linvfs_unwritten_done;
130 }
131
132 #define restricted_chown        xfs_params.restrict_chown.val
133 #define irix_sgid_inherit       xfs_params.sgid_inherit.val
134 #define irix_symlink_mode       xfs_params.symlink_mode.val
135 #define xfs_panic_mask          xfs_params.panic_mask.val
136 #define xfs_error_level         xfs_params.error_level.val
137 #define xfs_syncd_centisecs     xfs_params.syncd_timer.val
138 #define xfs_stats_clear         xfs_params.stats_clear.val
139 #define xfs_inherit_sync        xfs_params.inherit_sync.val
140 #define xfs_inherit_nodump      xfs_params.inherit_nodump.val
141 #define xfs_inherit_noatime     xfs_params.inherit_noatim.val
142 #define xfs_buf_timer_centisecs xfs_params.xfs_buf_timer.val
143 #define xfs_buf_age_centisecs   xfs_params.xfs_buf_age.val
144 #define xfs_inherit_nosymlinks  xfs_params.inherit_nosym.val
145 #define xfs_rotorstep           xfs_params.rotorstep.val
146
147 #ifndef __smp_processor_id
148 #define __smp_processor_id()    smp_processor_id()
149 #endif
150 #define current_cpu()           __smp_processor_id()
151 #define current_pid()           (current->pid)
152 #define current_fsuid(cred)     (current->fsuid)
153 #define current_fsgid(cred)     (current->fsgid)
154
155 #define NBPP            PAGE_SIZE
156 #define DPPSHFT         (PAGE_SHIFT - 9)
157 #define NDPP            (1 << (PAGE_SHIFT - 9))
158 #define dtop(DD)        (((DD) + NDPP - 1) >> DPPSHFT)
159 #define dtopt(DD)       ((DD) >> DPPSHFT)
160 #define dpoff(DD)       ((DD) & (NDPP-1))
161
162 #define NBBY            8               /* number of bits per byte */
163 #define NBPC            PAGE_SIZE       /* Number of bytes per click */
164 #define BPCSHIFT        PAGE_SHIFT      /* LOG2(NBPC) if exact */
165
166 /*
167  * Size of block device i/o is parameterized here.
168  * Currently the system supports page-sized i/o.
169  */
170 #define BLKDEV_IOSHIFT          BPCSHIFT
171 #define BLKDEV_IOSIZE           (1<<BLKDEV_IOSHIFT)
172 /* number of BB's per block device block */
173 #define BLKDEV_BB               BTOBB(BLKDEV_IOSIZE)
174
175 /* bytes to clicks */
176 #define btoc(x)         (((__psunsigned_t)(x)+(NBPC-1))>>BPCSHIFT)
177 #define btoct(x)        ((__psunsigned_t)(x)>>BPCSHIFT)
178 #define btoc64(x)       (((__uint64_t)(x)+(NBPC-1))>>BPCSHIFT)
179 #define btoct64(x)      ((__uint64_t)(x)>>BPCSHIFT)
180 #define io_btoc(x)      (((__psunsigned_t)(x)+(IO_NBPC-1))>>IO_BPCSHIFT)
181 #define io_btoct(x)     ((__psunsigned_t)(x)>>IO_BPCSHIFT)
182
183 /* off_t bytes to clicks */
184 #define offtoc(x)       (((__uint64_t)(x)+(NBPC-1))>>BPCSHIFT)
185 #define offtoct(x)      ((xfs_off_t)(x)>>BPCSHIFT)
186
187 /* clicks to off_t bytes */
188 #define ctooff(x)       ((xfs_off_t)(x)<<BPCSHIFT)
189
190 /* clicks to bytes */
191 #define ctob(x)         ((__psunsigned_t)(x)<<BPCSHIFT)
192 #define btoct(x)        ((__psunsigned_t)(x)>>BPCSHIFT)
193 #define ctob64(x)       ((__uint64_t)(x)<<BPCSHIFT)
194 #define io_ctob(x)      ((__psunsigned_t)(x)<<IO_BPCSHIFT)
195
196 /* bytes to clicks */
197 #define btoc(x)         (((__psunsigned_t)(x)+(NBPC-1))>>BPCSHIFT)
198
199 #ifndef CELL_CAPABLE
200 #define FSC_NOTIFY_NAME_CHANGED(vp)
201 #endif
202
203 #ifndef ENOATTR
204 #define ENOATTR         ENODATA         /* Attribute not found */
205 #endif
206
207 /* Note: EWRONGFS never visible outside the kernel */
208 #define EWRONGFS        EINVAL          /* Mount with wrong filesystem type */
209
210 /*
211  * XXX EFSCORRUPTED needs a real value in errno.h. asm-i386/errno.h won't
212  *     return codes out of its known range in errno.
213  * XXX Also note: needs to be < 1000 and fairly unique on Linux (mustn't
214  *     conflict with any code we use already or any code a driver may use)
215  * XXX Some options (currently we do #2):
216  *      1/ New error code ["Filesystem is corrupted", _after_ glibc updated]
217  *      2/ 990 ["Unknown error 990"]
218  *      3/ EUCLEAN ["Structure needs cleaning"]
219  *      4/ Convert EFSCORRUPTED to EIO [just prior to return into userspace]
220  */
221 #define EFSCORRUPTED    990             /* Filesystem is corrupted */
222
223 #define SYNCHRONIZE()   barrier()
224 #define __return_address __builtin_return_address(0)
225
226 /*
227  * IRIX (BSD) quotactl makes use of separate commands for user/group,
228  * whereas on Linux the syscall encodes this information into the cmd
229  * field (see the QCMD macro in quota.h).  These macros help keep the
230  * code portable - they are not visible from the syscall interface.
231  */
232 #define Q_XSETGQLIM     XQM_CMD(0x8)    /* set groups disk limits */
233 #define Q_XGETGQUOTA    XQM_CMD(0x9)    /* get groups disk limits */
234
235 /* IRIX uses a dynamic sizing algorithm (ndquot = 200 + numprocs*2) */
236 /* we may well need to fine-tune this if it ever becomes an issue.  */
237 #define DQUOT_MAX_HEURISTIC     1024    /* NR_DQUOTS */
238 #define ndquot                  DQUOT_MAX_HEURISTIC
239
240 /* IRIX uses the current size of the name cache to guess a good value */
241 /* - this isn't the same but is a good enough starting point for now. */
242 #define DQUOT_HASH_HEURISTIC    files_stat.nr_files
243
244 /* IRIX inodes maintain the project ID also, zero this field on Linux */
245 #define DEFAULT_PROJID  0
246 #define dfltprid        DEFAULT_PROJID
247
248 #define MAXPATHLEN      1024
249
250 #define MIN(a,b)        (min(a,b))
251 #define MAX(a,b)        (max(a,b))
252 #define howmany(x, y)   (((x)+((y)-1))/(y))
253 #define roundup(x, y)   ((((x)+((y)-1))/(y))*(y))
254
255 #define xfs_stack_trace()       dump_stack()
256
257 #define xfs_itruncate_data(ip, off)     \
258         (-vmtruncate(LINVFS_GET_IP(XFS_ITOV(ip)), (off)))
259
260
261 /* Move the kernel do_div definition off to one side */
262
263 #if defined __i386__
264 /* For ia32 we need to pull some tricks to get past various versions
265  * of the compiler which do not like us using do_div in the middle
266  * of large functions.
267  */
268 static inline __u32 xfs_do_div(void *a, __u32 b, int n)
269 {
270         __u32   mod;
271
272         switch (n) {
273                 case 4:
274                         mod = *(__u32 *)a % b;
275                         *(__u32 *)a = *(__u32 *)a / b;
276                         return mod;
277                 case 8:
278                         {
279                         unsigned long __upper, __low, __high, __mod;
280                         __u64   c = *(__u64 *)a;
281                         __upper = __high = c >> 32;
282                         __low = c;
283                         if (__high) {
284                                 __upper = __high % (b);
285                                 __high = __high / (b);
286                         }
287                         asm("divl %2":"=a" (__low), "=d" (__mod):"rm" (b), "0" (__low), "1" (__upper));
288                         asm("":"=A" (c):"a" (__low),"d" (__high));
289                         *(__u64 *)a = c;
290                         return __mod;
291                         }
292         }
293
294         /* NOTREACHED */
295         return 0;
296 }
297
298 /* Side effect free 64 bit mod operation */
299 static inline __u32 xfs_do_mod(void *a, __u32 b, int n)
300 {
301         switch (n) {
302                 case 4:
303                         return *(__u32 *)a % b;
304                 case 8:
305                         {
306                         unsigned long __upper, __low, __high, __mod;
307                         __u64   c = *(__u64 *)a;
308                         __upper = __high = c >> 32;
309                         __low = c;
310                         if (__high) {
311                                 __upper = __high % (b);
312                                 __high = __high / (b);
313                         }
314                         asm("divl %2":"=a" (__low), "=d" (__mod):"rm" (b), "0" (__low), "1" (__upper));
315                         asm("":"=A" (c):"a" (__low),"d" (__high));
316                         return __mod;
317                         }
318         }
319
320         /* NOTREACHED */
321         return 0;
322 }
323 #else
324 static inline __u32 xfs_do_div(void *a, __u32 b, int n)
325 {
326         __u32   mod;
327
328         switch (n) {
329                 case 4:
330                         mod = *(__u32 *)a % b;
331                         *(__u32 *)a = *(__u32 *)a / b;
332                         return mod;
333                 case 8:
334                         mod = do_div(*(__u64 *)a, b);
335                         return mod;
336         }
337
338         /* NOTREACHED */
339         return 0;
340 }
341
342 /* Side effect free 64 bit mod operation */
343 static inline __u32 xfs_do_mod(void *a, __u32 b, int n)
344 {
345         switch (n) {
346                 case 4:
347                         return *(__u32 *)a % b;
348                 case 8:
349                         {
350                         __u64   c = *(__u64 *)a;
351                         return do_div(c, b);
352                         }
353         }
354
355         /* NOTREACHED */
356         return 0;
357 }
358 #endif
359
360 #undef do_div
361 #define do_div(a, b)    xfs_do_div(&(a), (b), sizeof(a))
362 #define do_mod(a, b)    xfs_do_mod(&(a), (b), sizeof(a))
363
364 static inline __uint64_t roundup_64(__uint64_t x, __uint32_t y)
365 {
366         x += y - 1;
367         do_div(x, y);
368         return(x * y);
369 }
370
371 #endif /* __XFS_LINUX__ */