patch-2_6_7-vs1_9_1_12
[linux-2.6.git] / fs / jfs / xattr.c
1 /*
2  *   Copyright (C) International Business Machines  Corp., 2000-2003
3  *   Copyright (C) Christoph Hellwig, 2002
4  *
5  *   This program is free software;  you can redistribute it and/or modify
6  *   it under the terms of the GNU General Public License as published by
7  *   the Free Software Foundation; either version 2 of the License, or 
8  *   (at your option) any later version.
9  * 
10  *   This program is distributed in the hope that it will be useful,
11  *   but WITHOUT ANY WARRANTY;  without even the implied warranty of
12  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See
13  *   the GNU General Public License for more details.
14  *
15  *   You should have received a copy of the GNU General Public License
16  *   along with this program;  if not, write to the Free Software 
17  *   Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
18  */
19
20 #include <linux/fs.h>
21 #include <linux/xattr.h>
22 #include "jfs_incore.h"
23 #include "jfs_superblock.h"
24 #include "jfs_dmap.h"
25 #include "jfs_debug.h"
26 #include "jfs_dinode.h"
27 #include "jfs_extent.h"
28 #include "jfs_metapage.h"
29 #include "jfs_xattr.h"
30 #include "jfs_acl.h"
31
32 /*
33  *      jfs_xattr.c: extended attribute service
34  *
35  * Overall design --
36  *
37  * Format:
38  *
39  *   Extended attribute lists (jfs_ea_list) consist of an overall size (32 bit
40  *   value) and a variable (0 or more) number of extended attribute
41  *   entries.  Each extended attribute entry (jfs_ea) is a <name,value> double
42  *   where <name> is constructed from a null-terminated ascii string
43  *   (1 ... 255 bytes in the name) and <value> is arbitrary 8 bit data
44  *   (1 ... 65535 bytes).  The in-memory format is
45  *
46  *   0       1        2        4                4 + namelen + 1
47  *   +-------+--------+--------+----------------+-------------------+
48  *   | Flags | Name   | Value  | Name String \0 | Data . . . .      |
49  *   |       | Length | Length |                |                   |
50  *   +-------+--------+--------+----------------+-------------------+
51  *
52  *   A jfs_ea_list then is structured as
53  *
54  *   0            4                   4 + EA_SIZE(ea1)
55  *   +------------+-------------------+--------------------+-----
56  *   | Overall EA | First FEA Element | Second FEA Element | ..... 
57  *   | List Size  |                   |                    |
58  *   +------------+-------------------+--------------------+-----
59  *
60  *   On-disk:
61  *
62  *     FEALISTs are stored on disk using blocks allocated by dbAlloc() and
63  *     written directly. An EA list may be in-lined in the inode if there is
64  *     sufficient room available.
65  */
66
67 struct ea_buffer {
68         int flag;               /* Indicates what storage xattr points to */
69         int max_size;           /* largest xattr that fits in current buffer */
70         dxd_t new_ea;           /* dxd to replace ea when modifying xattr */
71         struct metapage *mp;    /* metapage containing ea list */
72         struct jfs_ea_list *xattr;      /* buffer containing ea list */
73 };
74
75 /*
76  * ea_buffer.flag values
77  */
78 #define EA_INLINE       0x0001
79 #define EA_EXTENT       0x0002
80 #define EA_NEW          0x0004
81 #define EA_MALLOC       0x0008
82
83 /* Namespaces */
84 #define XATTR_SYSTEM_PREFIX "system."
85 #define XATTR_SYSTEM_PREFIX_LEN (sizeof (XATTR_SYSTEM_PREFIX) - 1)
86
87 #define XATTR_USER_PREFIX "user."
88 #define XATTR_USER_PREFIX_LEN (sizeof (XATTR_USER_PREFIX) - 1)
89
90 #define XATTR_OS2_PREFIX "os2."
91 #define XATTR_OS2_PREFIX_LEN (sizeof (XATTR_OS2_PREFIX) - 1)
92
93 /*
94  * These three routines are used to recognize on-disk extended attributes
95  * that are in a recognized namespace.  If the attribute is not recognized,
96  * "os2." is prepended to the name
97  */
98 static inline int is_os2_xattr(struct jfs_ea *ea)
99 {
100         /*
101          * Check for "system."
102          */
103         if ((ea->namelen >= XATTR_SYSTEM_PREFIX_LEN) &&
104             !strncmp(ea->name, XATTR_SYSTEM_PREFIX, XATTR_SYSTEM_PREFIX_LEN))
105                 return FALSE;
106         /*
107          * Check for "user."
108          */
109         if ((ea->namelen >= XATTR_USER_PREFIX_LEN) &&
110             !strncmp(ea->name, XATTR_USER_PREFIX, XATTR_USER_PREFIX_LEN))
111                 return FALSE;
112         /*
113          * Add any other valid namespace prefixes here
114          */
115
116         /*
117          * We assume it's OS/2's flat namespace
118          */
119         return TRUE;
120 }
121
122 static inline int name_size(struct jfs_ea *ea)
123 {
124         if (is_os2_xattr(ea))
125                 return ea->namelen + XATTR_OS2_PREFIX_LEN;
126         else
127                 return ea->namelen;
128 }
129
130 static inline int copy_name(char *buffer, struct jfs_ea *ea)
131 {
132         int len = ea->namelen;
133
134         if (is_os2_xattr(ea)) {
135                 memcpy(buffer, XATTR_OS2_PREFIX, XATTR_OS2_PREFIX_LEN);
136                 buffer += XATTR_OS2_PREFIX_LEN;
137                 len += XATTR_OS2_PREFIX_LEN;
138         }
139         memcpy(buffer, ea->name, ea->namelen);
140         buffer[ea->namelen] = 0;
141
142         return len;
143 }
144
145 /* Forward references */
146 static void ea_release(struct inode *inode, struct ea_buffer *ea_buf);
147
148 /*
149  * NAME: ea_write_inline
150  *                                                                    
151  * FUNCTION: Attempt to write an EA inline if area is available
152  *                                                                    
153  * PRE CONDITIONS:
154  *      Already verified that the specified EA is small enough to fit inline
155  *
156  * PARAMETERS:
157  *      ip      - Inode pointer
158  *      ealist  - EA list pointer
159  *      size    - size of ealist in bytes
160  *      ea      - dxd_t structure to be filled in with necessary EA information
161  *                if we successfully copy the EA inline
162  *
163  * NOTES:
164  *      Checks if the inode's inline area is available.  If so, copies EA inline
165  *      and sets <ea> fields appropriately.  Otherwise, returns failure, EA will
166  *      have to be put into an extent.
167  *
168  * RETURNS: 0 for successful copy to inline area; -1 if area not available
169  */
170 static int ea_write_inline(struct inode *ip, struct jfs_ea_list *ealist,
171                            int size, dxd_t * ea)
172 {
173         struct jfs_inode_info *ji = JFS_IP(ip);
174
175         /*
176          * Make sure we have an EA -- the NULL EA list is valid, but you
177          * can't copy it!
178          */
179         if (ealist && size > sizeof (struct jfs_ea_list)) {
180                 assert(size <= sizeof (ji->i_inline_ea));
181
182                 /*
183                  * See if the space is available or if it is already being
184                  * used for an inline EA.
185                  */
186                 if (!(ji->mode2 & INLINEEA) && !(ji->ea.flag & DXD_INLINE))
187                         return -EPERM;
188
189                 DXDsize(ea, size);
190                 DXDlength(ea, 0);
191                 DXDaddress(ea, 0);
192                 memcpy(ji->i_inline_ea, ealist, size);
193                 ea->flag = DXD_INLINE;
194                 ji->mode2 &= ~INLINEEA;
195         } else {
196                 ea->flag = 0;
197                 DXDsize(ea, 0);
198                 DXDlength(ea, 0);
199                 DXDaddress(ea, 0);
200
201                 /* Free up INLINE area */
202                 if (ji->ea.flag & DXD_INLINE)
203                         ji->mode2 |= INLINEEA;
204         }
205
206         return 0;
207 }
208
209 /*
210  * NAME: ea_write
211  *                                                                    
212  * FUNCTION: Write an EA for an inode
213  *                                                                    
214  * PRE CONDITIONS: EA has been verified 
215  *
216  * PARAMETERS:
217  *      ip      - Inode pointer
218  *      ealist  - EA list pointer
219  *      size    - size of ealist in bytes
220  *      ea      - dxd_t structure to be filled in appropriately with where the
221  *                EA was copied
222  *
223  * NOTES: Will write EA inline if able to, otherwise allocates blocks for an
224  *      extent and synchronously writes it to those blocks.
225  *
226  * RETURNS: 0 for success; Anything else indicates failure
227  */
228 static int ea_write(struct inode *ip, struct jfs_ea_list *ealist, int size,
229                        dxd_t * ea)
230 {
231         struct super_block *sb = ip->i_sb;
232         struct jfs_inode_info *ji = JFS_IP(ip);
233         struct jfs_sb_info *sbi = JFS_SBI(sb);
234         int nblocks;
235         s64 blkno;
236         int rc = 0, i;
237         char *cp;
238         s32 nbytes, nb;
239         s32 bytes_to_write;
240         struct metapage *mp;
241
242         /*
243          * Quick check to see if this is an in-linable EA.  Short EAs
244          * and empty EAs are all in-linable, provided the space exists.
245          */
246         if (!ealist || size <= sizeof (ji->i_inline_ea)) {
247                 if (!ea_write_inline(ip, ealist, size, ea))
248                         return 0;
249         }
250
251         /* figure out how many blocks we need */
252         nblocks = (size + (sb->s_blocksize - 1)) >> sb->s_blocksize_bits;
253
254         rc = dbAlloc(ip, INOHINT(ip), nblocks, &blkno);
255         if (rc)
256                 return rc;
257
258         /*
259          * Now have nblocks worth of storage to stuff into the FEALIST.
260          * loop over the FEALIST copying data into the buffer one page at
261          * a time.
262          */
263         cp = (char *) ealist;
264         nbytes = size;
265         for (i = 0; i < nblocks; i += sbi->nbperpage) {
266                 /*
267                  * Determine how many bytes for this request, and round up to
268                  * the nearest aggregate block size
269                  */
270                 nb = min(PSIZE, nbytes);
271                 bytes_to_write =
272                     ((((nb + sb->s_blocksize - 1)) >> sb->s_blocksize_bits))
273                     << sb->s_blocksize_bits;
274
275                 if (!(mp = get_metapage(ip, blkno + i, bytes_to_write, 1))) {
276                         rc = -EIO;
277                         goto failed;
278                 }
279
280                 memcpy(mp->data, cp, nb);
281
282                 /*
283                  * We really need a way to propagate errors for
284                  * forced writes like this one.  --hch
285                  *
286                  * (__write_metapage => release_metapage => flush_metapage)
287                  */
288 #ifdef _JFS_FIXME
289                 if ((rc = flush_metapage(mp))) {
290                         /*
291                          * the write failed -- this means that the buffer
292                          * is still assigned and the blocks are not being
293                          * used.  this seems like the best error recovery
294                          * we can get ...
295                          */
296                         goto failed;
297                 }
298 #else
299                 flush_metapage(mp);
300 #endif
301
302                 cp += PSIZE;
303                 nbytes -= nb;
304         }
305
306         ea->flag = DXD_EXTENT;
307         DXDsize(ea, le32_to_cpu(ealist->size));
308         DXDlength(ea, nblocks);
309         DXDaddress(ea, blkno);
310
311         /* Free up INLINE area */
312         if (ji->ea.flag & DXD_INLINE)
313                 ji->mode2 |= INLINEEA;
314
315         return 0;
316
317       failed:
318         dbFree(ip, blkno, nblocks);
319         return rc;
320 }
321
322 /*
323  * NAME: ea_read_inline
324  *                                                                    
325  * FUNCTION: Read an inlined EA into user's buffer
326  *                                                                    
327  * PARAMETERS:
328  *      ip      - Inode pointer
329  *      ealist  - Pointer to buffer to fill in with EA
330  *
331  * RETURNS: 0
332  */
333 static int ea_read_inline(struct inode *ip, struct jfs_ea_list *ealist)
334 {
335         struct jfs_inode_info *ji = JFS_IP(ip);
336         int ea_size = sizeDXD(&ji->ea);
337
338         if (ea_size == 0) {
339                 ealist->size = 0;
340                 return 0;
341         }
342
343         /* Sanity Check */
344         if ((sizeDXD(&ji->ea) > sizeof (ji->i_inline_ea)))
345                 return -EIO;
346         if (le32_to_cpu(((struct jfs_ea_list *) &ji->i_inline_ea)->size)
347             != ea_size)
348                 return -EIO;
349
350         memcpy(ealist, ji->i_inline_ea, ea_size);
351         return 0;
352 }
353
354 /*
355  * NAME: ea_read
356  *                                                                    
357  * FUNCTION: copy EA data into user's buffer
358  *                                                                    
359  * PARAMETERS:
360  *      ip      - Inode pointer
361  *      ealist  - Pointer to buffer to fill in with EA
362  *
363  * NOTES:  If EA is inline calls ea_read_inline() to copy EA.
364  *
365  * RETURNS: 0 for success; other indicates failure
366  */
367 static int ea_read(struct inode *ip, struct jfs_ea_list *ealist)
368 {
369         struct super_block *sb = ip->i_sb;
370         struct jfs_inode_info *ji = JFS_IP(ip);
371         struct jfs_sb_info *sbi = JFS_SBI(sb);
372         int nblocks;
373         s64 blkno;
374         char *cp = (char *) ealist;
375         int i;
376         int nbytes, nb;
377         s32 bytes_to_read;
378         struct metapage *mp;
379
380         /* quick check for in-line EA */
381         if (ji->ea.flag & DXD_INLINE)
382                 return ea_read_inline(ip, ealist);
383
384         nbytes = sizeDXD(&ji->ea);
385         if (!nbytes) {
386                 jfs_error(sb, "ea_read: nbytes is 0");
387                 return -EIO;
388         }
389
390         /* 
391          * Figure out how many blocks were allocated when this EA list was
392          * originally written to disk.
393          */
394         nblocks = lengthDXD(&ji->ea) << sbi->l2nbperpage;
395         blkno = addressDXD(&ji->ea) << sbi->l2nbperpage;
396
397         /*
398          * I have found the disk blocks which were originally used to store
399          * the FEALIST.  now i loop over each contiguous block copying the
400          * data into the buffer.
401          */
402         for (i = 0; i < nblocks; i += sbi->nbperpage) {
403                 /*
404                  * Determine how many bytes for this request, and round up to
405                  * the nearest aggregate block size
406                  */
407                 nb = min(PSIZE, nbytes);
408                 bytes_to_read =
409                     ((((nb + sb->s_blocksize - 1)) >> sb->s_blocksize_bits))
410                     << sb->s_blocksize_bits;
411
412                 if (!(mp = read_metapage(ip, blkno + i, bytes_to_read, 1)))
413                         return -EIO;
414
415                 memcpy(cp, mp->data, nb);
416                 release_metapage(mp);
417
418                 cp += PSIZE;
419                 nbytes -= nb;
420         }
421
422         return 0;
423 }
424
425 /*
426  * NAME: ea_get
427  *                                                                    
428  * FUNCTION: Returns buffer containing existing extended attributes.
429  *           The size of the buffer will be the larger of the existing
430  *           attributes size, or min_size.
431  *
432  *           The buffer, which may be inlined in the inode or in the
433  *           page cache must be release by calling ea_release or ea_put
434  *                                                                    
435  * PARAMETERS:
436  *      inode   - Inode pointer
437  *      ea_buf  - Structure to be populated with ealist and its metadata
438  *      min_size- minimum size of buffer to be returned
439  *
440  * RETURNS: 0 for success; Other indicates failure
441  */
442 static int ea_get(struct inode *inode, struct ea_buffer *ea_buf, int min_size)
443 {
444         struct jfs_inode_info *ji = JFS_IP(inode);
445         struct super_block *sb = inode->i_sb;
446         int size;
447         int ea_size = sizeDXD(&ji->ea);
448         int blocks_needed, current_blocks;
449         s64 blkno;
450         int rc;
451
452         /* When fsck.jfs clears a bad ea, it doesn't clear the size */
453         if (ji->ea.flag == 0)
454                 ea_size = 0;
455
456         if (ea_size == 0) {
457                 if (min_size == 0) {
458                         ea_buf->flag = 0;
459                         ea_buf->max_size = 0;
460                         ea_buf->xattr = NULL;
461                         return 0;
462                 }
463                 if ((min_size <= sizeof (ji->i_inline_ea)) &&
464                     (ji->mode2 & INLINEEA)) {
465                         ea_buf->flag = EA_INLINE | EA_NEW;
466                         ea_buf->max_size = sizeof (ji->i_inline_ea);
467                         ea_buf->xattr = (struct jfs_ea_list *) ji->i_inline_ea;
468                         DXDlength(&ea_buf->new_ea, 0);
469                         DXDaddress(&ea_buf->new_ea, 0);
470                         ea_buf->new_ea.flag = DXD_INLINE;
471                         DXDsize(&ea_buf->new_ea, min_size);
472                         return 0;
473                 }
474                 current_blocks = 0;
475         } else if (ji->ea.flag & DXD_INLINE) {
476                 if (min_size <= sizeof (ji->i_inline_ea)) {
477                         ea_buf->flag = EA_INLINE;
478                         ea_buf->max_size = sizeof (ji->i_inline_ea);
479                         ea_buf->xattr = (struct jfs_ea_list *) ji->i_inline_ea;
480                         goto size_check;
481                 }
482                 current_blocks = 0;
483         } else {
484                 if (!(ji->ea.flag & DXD_EXTENT)) {
485                         jfs_error(sb, "ea_get: invalid ea.flag)");
486                         return -EIO;
487                 }
488                 current_blocks = (ea_size + sb->s_blocksize - 1) >>
489                     sb->s_blocksize_bits;
490         }
491         size = max(min_size, ea_size);
492
493         if (size > PSIZE) {
494                 /*
495                  * To keep the rest of the code simple.  Allocate a
496                  * contiguous buffer to work with
497                  */
498                 ea_buf->xattr = kmalloc(size, GFP_KERNEL);
499                 if (ea_buf->xattr == NULL)
500                         return -ENOMEM;
501
502                 ea_buf->flag = EA_MALLOC;
503                 ea_buf->max_size = (size + sb->s_blocksize - 1) &
504                     ~(sb->s_blocksize - 1);
505
506                 if (ea_size == 0)
507                         return 0;
508
509                 if ((rc = ea_read(inode, ea_buf->xattr))) {
510                         kfree(ea_buf->xattr);
511                         ea_buf->xattr = NULL;
512                         return rc;
513                 }
514                 goto size_check;
515         }
516         blocks_needed = (min_size + sb->s_blocksize - 1) >>
517             sb->s_blocksize_bits;
518
519         if (blocks_needed > current_blocks) {
520                 rc = dbAlloc(inode, INOHINT(inode), (s64) blocks_needed,
521                              &blkno);
522                 if (rc)
523                         return rc;
524
525                 DXDlength(&ea_buf->new_ea, blocks_needed);
526                 DXDaddress(&ea_buf->new_ea, blkno);
527                 ea_buf->new_ea.flag = DXD_EXTENT;
528                 DXDsize(&ea_buf->new_ea, min_size);
529
530                 ea_buf->flag = EA_EXTENT | EA_NEW;
531
532                 ea_buf->mp = get_metapage(inode, blkno,
533                                           blocks_needed << sb->s_blocksize_bits,
534                                           1);
535                 if (ea_buf->mp == NULL) {
536                         dbFree(inode, blkno, (s64) blocks_needed);
537                         return -EIO;
538                 }
539                 ea_buf->xattr = ea_buf->mp->data;
540                 ea_buf->max_size = (min_size + sb->s_blocksize - 1) &
541                     ~(sb->s_blocksize - 1);
542                 if (ea_size == 0)
543                         return 0;
544                 if ((rc = ea_read(inode, ea_buf->xattr))) {
545                         discard_metapage(ea_buf->mp);
546                         dbFree(inode, blkno, (s64) blocks_needed);
547                         return rc;
548                 }
549                 goto size_check;
550         }
551         ea_buf->flag = EA_EXTENT;
552         ea_buf->mp = read_metapage(inode, addressDXD(&ji->ea),
553                                    lengthDXD(&ji->ea) << sb->s_blocksize_bits,
554                                    1);
555         if (ea_buf->mp == NULL)
556                 return -EIO;
557         ea_buf->xattr = ea_buf->mp->data;
558         ea_buf->max_size = (ea_size + sb->s_blocksize - 1) &
559             ~(sb->s_blocksize - 1);
560
561       size_check:
562         if (EALIST_SIZE(ea_buf->xattr) != ea_size) {
563                 printk(KERN_ERR "ea_get: invalid extended attribute\n");
564                 dump_mem("xattr", ea_buf->xattr, ea_size);
565                 ea_release(inode, ea_buf);
566                 return -EIO;
567         }
568
569         return ea_size;
570 }
571
572 static void ea_release(struct inode *inode, struct ea_buffer *ea_buf)
573 {
574         if (ea_buf->flag & EA_MALLOC)
575                 kfree(ea_buf->xattr);
576         else if (ea_buf->flag & EA_EXTENT) {
577                 assert(ea_buf->mp);
578                 release_metapage(ea_buf->mp);
579
580                 if (ea_buf->flag & EA_NEW)
581                         dbFree(inode, addressDXD(&ea_buf->new_ea),
582                                lengthDXD(&ea_buf->new_ea));
583         }
584 }
585
586 static int ea_put(struct inode *inode, struct ea_buffer *ea_buf, int new_size)
587 {
588         struct jfs_inode_info *ji = JFS_IP(inode);
589         unsigned long old_blocks, new_blocks;
590         int rc = 0;
591         tid_t tid;
592
593         if (new_size == 0) {
594                 ea_release(inode, ea_buf);
595                 ea_buf = 0;
596         } else if (ea_buf->flag & EA_INLINE) {
597                 assert(new_size <= sizeof (ji->i_inline_ea));
598                 ji->mode2 &= ~INLINEEA;
599                 ea_buf->new_ea.flag = DXD_INLINE;
600                 DXDsize(&ea_buf->new_ea, new_size);
601                 DXDaddress(&ea_buf->new_ea, 0);
602                 DXDlength(&ea_buf->new_ea, 0);
603         } else if (ea_buf->flag & EA_MALLOC) {
604                 rc = ea_write(inode, ea_buf->xattr, new_size, &ea_buf->new_ea);
605                 kfree(ea_buf->xattr);
606         } else if (ea_buf->flag & EA_NEW) {
607                 /* We have already allocated a new dxd */
608                 flush_metapage(ea_buf->mp);
609         } else {
610                 /* ->xattr must point to original ea's metapage */
611                 rc = ea_write(inode, ea_buf->xattr, new_size, &ea_buf->new_ea);
612                 discard_metapage(ea_buf->mp);
613         }
614         if (rc)
615                 return rc;
616
617         tid = txBegin(inode->i_sb, 0);
618         down(&ji->commit_sem);
619
620         old_blocks = new_blocks = 0;
621
622         if (ji->ea.flag & DXD_EXTENT) {
623                 invalidate_dxd_metapages(inode, ji->ea);
624                 old_blocks = lengthDXD(&ji->ea);
625         }
626
627         if (ea_buf) {
628                 txEA(tid, inode, &ji->ea, &ea_buf->new_ea);
629                 if (ea_buf->new_ea.flag & DXD_EXTENT) {
630                         new_blocks = lengthDXD(&ea_buf->new_ea);
631                         if (ji->ea.flag & DXD_INLINE)
632                                 ji->mode2 |= INLINEEA;
633                 }
634                 ji->ea = ea_buf->new_ea;
635         } else {
636                 txEA(tid, inode, &ji->ea, 0);
637                 if (ji->ea.flag & DXD_INLINE)
638                         ji->mode2 |= INLINEEA;
639                 ji->ea.flag = 0;
640                 ji->ea.size = 0;
641         }
642
643         inode->i_blocks += LBLK2PBLK(inode->i_sb, new_blocks - old_blocks);
644         inode->i_ctime = CURRENT_TIME;
645         rc = txCommit(tid, 1, &inode, 0);
646         txEnd(tid);
647         up(&ji->commit_sem);
648
649         return rc;
650 }
651
652 /*
653  * can_set_system_xattr
654  *
655  * This code is specific to the system.* namespace.  It contains policy
656  * which doesn't belong in the main xattr codepath.
657  */
658 static int can_set_system_xattr(struct inode *inode, const char *name,
659                                 const void *value, size_t value_len)
660 {
661 #ifdef CONFIG_JFS_POSIX_ACL
662         struct posix_acl *acl;
663         int rc;
664
665         if ((current->fsuid != inode->i_uid) && !capable(CAP_FOWNER))
666                 return -EPERM;
667
668         /*
669          * XATTR_NAME_ACL_ACCESS is tied to i_mode
670          */
671         if (strcmp(name, XATTR_NAME_ACL_ACCESS) == 0) {
672                 acl = posix_acl_from_xattr(value, value_len);
673                 if (IS_ERR(acl)) {
674                         rc = PTR_ERR(acl);
675                         printk(KERN_ERR "posix_acl_from_xattr returned %d\n",
676                                rc);
677                         return rc;
678                 }
679                 if (acl) {
680                         mode_t mode = inode->i_mode;
681                         rc = posix_acl_equiv_mode(acl, &mode);
682                         posix_acl_release(acl);
683                         if (rc < 0) {
684                                 printk(KERN_ERR
685                                        "posix_acl_equiv_mode returned %d\n",
686                                        rc);
687                                 return rc;
688                         }
689                         inode->i_mode = mode;
690                         mark_inode_dirty(inode);
691                 }
692                 /*
693                  * We're changing the ACL.  Get rid of the cached one
694                  */
695                 acl =JFS_IP(inode)->i_acl;
696                 if (acl != JFS_ACL_NOT_CACHED)
697                         posix_acl_release(acl);
698                 JFS_IP(inode)->i_acl = JFS_ACL_NOT_CACHED;
699
700                 return 0;
701         } else if (strcmp(name, XATTR_NAME_ACL_DEFAULT) == 0) {
702                 acl = posix_acl_from_xattr(value, value_len);
703                 if (IS_ERR(acl)) {
704                         rc = PTR_ERR(acl);
705                         printk(KERN_ERR "posix_acl_from_xattr returned %d\n",
706                                rc);
707                         return rc;
708                 }
709                 posix_acl_release(acl);
710
711                 /*
712                  * We're changing the default ACL.  Get rid of the cached one
713                  */
714                 acl =JFS_IP(inode)->i_default_acl;
715                 if (acl && (acl != JFS_ACL_NOT_CACHED))
716                         posix_acl_release(acl);
717                 JFS_IP(inode)->i_default_acl = JFS_ACL_NOT_CACHED;
718
719                 return 0;
720         }
721 #endif                  /* CONFIG_JFS_POSIX_ACL */
722         return -EOPNOTSUPP;
723 }
724
725 static int can_set_xattr(struct inode *inode, const char *name,
726                          const void *value, size_t value_len)
727 {
728         if (IS_RDONLY(inode))
729                 return -EROFS;
730
731         if (IS_IMMUTABLE(inode) || IS_APPEND(inode) || S_ISLNK(inode->i_mode))
732                 return -EPERM;
733
734         if(strncmp(name, XATTR_SYSTEM_PREFIX, XATTR_SYSTEM_PREFIX_LEN) == 0)
735                 /*
736                  * "system.*"
737                  */
738                 return can_set_system_xattr(inode, name, value, value_len);
739
740         if((strncmp(name, XATTR_USER_PREFIX, XATTR_USER_PREFIX_LEN) != 0) &&
741            (strncmp(name, XATTR_OS2_PREFIX, XATTR_OS2_PREFIX_LEN) != 0))
742                 return -EOPNOTSUPP;
743
744         if (!S_ISREG(inode->i_mode) &&
745             (!S_ISDIR(inode->i_mode) || inode->i_mode &S_ISVTX))
746                 return -EPERM;
747
748         return permission(inode, MAY_WRITE, NULL);
749 }
750
751 int __jfs_setxattr(struct inode *inode, const char *name, const void *value,
752                    size_t value_len, int flags)
753 {
754         struct jfs_ea_list *ealist;
755         struct jfs_ea *ea, *old_ea = NULL, *next_ea = NULL;
756         struct ea_buffer ea_buf;
757         int old_ea_size = 0;
758         int xattr_size;
759         int new_size;
760         int namelen = strlen(name);
761         char *os2name = NULL;
762         int found = 0;
763         int rc;
764         int length;
765
766         if ((rc = can_set_xattr(inode, name, value, value_len)))
767                 return rc;
768
769         if (strncmp(name, XATTR_OS2_PREFIX, XATTR_OS2_PREFIX_LEN) == 0) {
770                 os2name = kmalloc(namelen - XATTR_OS2_PREFIX_LEN + 1,
771                                   GFP_KERNEL);
772                 if (!os2name)
773                         return -ENOMEM;
774                 strcpy(os2name, name + XATTR_OS2_PREFIX_LEN);
775                 name = os2name;
776                 namelen -= XATTR_OS2_PREFIX_LEN;
777         }
778
779         down_write(&JFS_IP(inode)->xattr_sem);
780
781         xattr_size = ea_get(inode, &ea_buf, 0);
782         if (xattr_size < 0) {
783                 rc = xattr_size;
784                 goto out;
785         }
786
787       again:
788         ealist = (struct jfs_ea_list *) ea_buf.xattr;
789         new_size = sizeof (struct jfs_ea_list);
790
791         if (xattr_size) {
792                 for (ea = FIRST_EA(ealist); ea < END_EALIST(ealist);
793                      ea = NEXT_EA(ea)) {
794                         if ((namelen == ea->namelen) &&
795                             (memcmp(name, ea->name, namelen) == 0)) {
796                                 found = 1;
797                                 if (flags & XATTR_CREATE) {
798                                         rc = -EEXIST;
799                                         goto release;
800                                 }
801                                 old_ea = ea;
802                                 old_ea_size = EA_SIZE(ea);
803                                 next_ea = NEXT_EA(ea);
804                         } else
805                                 new_size += EA_SIZE(ea);
806                 }
807         }
808
809         if (!found) {
810                 if (flags & XATTR_REPLACE) {
811                         rc = -ENODATA;
812                         goto release;
813                 }
814                 if (value == NULL) {
815                         rc = 0;
816                         goto release;
817                 }
818         }
819         if (value)
820                 new_size += sizeof (struct jfs_ea) + namelen + 1 + value_len;
821
822         if (new_size > ea_buf.max_size) {
823                 /*
824                  * We need to allocate more space for merged ea list.
825                  * We should only have loop to again: once.
826                  */
827                 ea_release(inode, &ea_buf);
828                 xattr_size = ea_get(inode, &ea_buf, new_size);
829                 if (xattr_size < 0) {
830                         rc = xattr_size;
831                         goto out;
832                 }
833                 goto again;
834         }
835
836         /* Remove old ea of the same name */
837         if (found) {
838                 /* number of bytes following target EA */
839                 length = (char *) END_EALIST(ealist) - (char *) next_ea;
840                 if (length > 0)
841                         memmove(old_ea, next_ea, length);
842                 xattr_size -= old_ea_size;
843         }
844
845         /* Add new entry to the end */
846         if (value) {
847                 if (xattr_size == 0)
848                         /* Completely new ea list */
849                         xattr_size = sizeof (struct jfs_ea_list);
850
851                 ea = (struct jfs_ea *) ((char *) ealist + xattr_size);
852                 ea->flag = 0;
853                 ea->namelen = namelen;
854                 ea->valuelen = (cpu_to_le16(value_len));
855                 memcpy(ea->name, name, namelen);
856                 ea->name[namelen] = 0;
857                 if (value_len)
858                         memcpy(&ea->name[namelen + 1], value, value_len);
859                 xattr_size += EA_SIZE(ea);
860         }
861
862         /* DEBUG - If we did this right, these number match */
863         if (xattr_size != new_size) {
864                 printk(KERN_ERR
865                        "jfs_xsetattr: xattr_size = %d, new_size = %d\n",
866                        xattr_size, new_size);
867
868                 rc = -EINVAL;
869                 goto release;
870         }
871
872         /*
873          * If we're left with an empty list, there's no ea
874          */
875         if (new_size == sizeof (struct jfs_ea_list))
876                 new_size = 0;
877
878         ealist->size = cpu_to_le32(new_size);
879
880         rc = ea_put(inode, &ea_buf, new_size);
881
882         goto out;
883       release:
884         ea_release(inode, &ea_buf);
885       out:
886         up_write(&JFS_IP(inode)->xattr_sem);
887
888         if (os2name)
889                 kfree(os2name);
890
891         return rc;
892 }
893
894 int jfs_setxattr(struct dentry *dentry, const char *name, const void *value,
895                  size_t value_len, int flags)
896 {
897         if (value == NULL) {    /* empty EA, do not remove */
898                 value = "";
899                 value_len = 0;
900         }
901
902         return __jfs_setxattr(dentry->d_inode, name, value, value_len, flags);
903 }
904
905 static int can_get_xattr(struct inode *inode, const char *name)
906 {
907         if(strncmp(name, XATTR_SYSTEM_PREFIX, XATTR_SYSTEM_PREFIX_LEN) == 0)
908                 return 0;
909         return permission(inode, MAY_READ, NULL);
910 }
911
912 ssize_t __jfs_getxattr(struct inode *inode, const char *name, void *data,
913                        size_t buf_size)
914 {
915         struct jfs_ea_list *ealist;
916         struct jfs_ea *ea;
917         struct ea_buffer ea_buf;
918         int xattr_size;
919         ssize_t size;
920         int namelen = strlen(name);
921         char *os2name = NULL;
922         int rc;
923         char *value;
924
925         if ((rc = can_get_xattr(inode, name)))
926                 return rc;
927
928         if (strncmp(name, XATTR_OS2_PREFIX, XATTR_OS2_PREFIX_LEN) == 0) {
929                 os2name = kmalloc(namelen - XATTR_OS2_PREFIX_LEN + 1,
930                                   GFP_KERNEL);
931                 if (!os2name)
932                         return -ENOMEM;
933                 strcpy(os2name, name + XATTR_OS2_PREFIX_LEN);
934                 name = os2name;
935                 namelen -= XATTR_OS2_PREFIX_LEN;
936         }
937
938         down_read(&JFS_IP(inode)->xattr_sem);
939
940         xattr_size = ea_get(inode, &ea_buf, 0);
941
942         if (xattr_size < 0) {
943                 size = xattr_size;
944                 goto out;
945         }
946
947         if (xattr_size == 0)
948                 goto not_found;
949
950         ealist = (struct jfs_ea_list *) ea_buf.xattr;
951
952         /* Find the named attribute */
953         for (ea = FIRST_EA(ealist); ea < END_EALIST(ealist); ea = NEXT_EA(ea))
954                 if ((namelen == ea->namelen) &&
955                     memcmp(name, ea->name, namelen) == 0) {
956                         /* Found it */
957                         size = le16_to_cpu(ea->valuelen);
958                         if (!data)
959                                 goto release;
960                         else if (size > buf_size) {
961                                 size = -ERANGE;
962                                 goto release;
963                         }
964                         value = ((char *) &ea->name) + ea->namelen + 1;
965                         memcpy(data, value, size);
966                         goto release;
967                 }
968       not_found:
969         size = -ENODATA;
970       release:
971         ea_release(inode, &ea_buf);
972       out:
973         up_read(&JFS_IP(inode)->xattr_sem);
974
975         if (os2name)
976                 kfree(os2name);
977
978         return size;
979 }
980
981 ssize_t jfs_getxattr(struct dentry *dentry, const char *name, void *data,
982                      size_t buf_size)
983 {
984         int err;
985
986         err = __jfs_getxattr(dentry->d_inode, name, data, buf_size);
987
988         return err;
989 }
990
991 ssize_t jfs_listxattr(struct dentry * dentry, char *data, size_t buf_size)
992 {
993         struct inode *inode = dentry->d_inode;
994         char *buffer;
995         ssize_t size = 0;
996         int xattr_size;
997         struct jfs_ea_list *ealist;
998         struct jfs_ea *ea;
999         struct ea_buffer ea_buf;
1000
1001         down_read(&JFS_IP(inode)->xattr_sem);
1002
1003         xattr_size = ea_get(inode, &ea_buf, 0);
1004         if (xattr_size < 0) {
1005                 size = xattr_size;
1006                 goto out;
1007         }
1008
1009         if (xattr_size == 0)
1010                 goto release;
1011
1012         ealist = (struct jfs_ea_list *) ea_buf.xattr;
1013
1014         /* compute required size of list */
1015         for (ea = FIRST_EA(ealist); ea < END_EALIST(ealist); ea = NEXT_EA(ea))
1016                 size += name_size(ea) + 1;
1017
1018         if (!data)
1019                 goto release;
1020
1021         if (size > buf_size) {
1022                 size = -ERANGE;
1023                 goto release;
1024         }
1025
1026         /* Copy attribute names to buffer */
1027         buffer = data;
1028         for (ea = FIRST_EA(ealist); ea < END_EALIST(ealist); ea = NEXT_EA(ea)) {
1029                 int namelen = copy_name(buffer, ea);
1030                 buffer += namelen + 1;
1031         }
1032
1033       release:
1034         ea_release(inode, &ea_buf);
1035       out:
1036         up_read(&JFS_IP(inode)->xattr_sem);
1037         return size;
1038 }
1039
1040 int jfs_removexattr(struct dentry *dentry, const char *name)
1041 {
1042         return __jfs_setxattr(dentry->d_inode, name, 0, 0, XATTR_REPLACE);
1043 }