vserver 1.9.3
[linux-2.6.git] / fs / xfs / quota / xfs_qm_syscalls.c
1 /*
2  * Copyright (c) 2000-2003 Silicon Graphics, Inc.  All Rights Reserved.
3  *
4  * This program is free software; you can redistribute it and/or modify it
5  * under the terms of version 2 of the GNU General Public License as
6  * published by the Free Software Foundation.
7  *
8  * This program is distributed in the hope that it would be useful, but
9  * WITHOUT ANY WARRANTY; without even the implied warranty of
10  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
11  *
12  * Further, this software is distributed without any warranty that it is
13  * free of the rightful claim of any third person regarding infringement
14  * or the like.  Any license provided herein, whether implied or
15  * otherwise, applies only to this software file.  Patent licenses, if
16  * any, provided herein do not apply to combinations of this program with
17  * other software, or any other product whatsoever.
18  *
19  * You should have received a copy of the GNU General Public License along
20  * with this program; if not, write the Free Software Foundation, Inc., 59
21  * Temple Place - Suite 330, Boston MA 02111-1307, USA.
22  *
23  * Contact information: Silicon Graphics, Inc., 1600 Amphitheatre Pkwy,
24  * Mountain View, CA  94043, or:
25  *
26  * http://www.sgi.com
27  *
28  * For further information regarding this notice, see:
29  *
30  * http://oss.sgi.com/projects/GenInfo/SGIGPLNoticeExplan/
31  */
32
33 #include "xfs.h"
34 #include "xfs_fs.h"
35 #include "xfs_inum.h"
36 #include "xfs_log.h"
37 #include "xfs_trans.h"
38 #include "xfs_sb.h"
39 #include "xfs_dir.h"
40 #include "xfs_dir2.h"
41 #include "xfs_alloc.h"
42 #include "xfs_dmapi.h"
43 #include "xfs_quota.h"
44 #include "xfs_mount.h"
45 #include "xfs_alloc_btree.h"
46 #include "xfs_bmap_btree.h"
47 #include "xfs_ialloc_btree.h"
48 #include "xfs_btree.h"
49 #include "xfs_ialloc.h"
50 #include "xfs_attr_sf.h"
51 #include "xfs_dir_sf.h"
52 #include "xfs_dir2_sf.h"
53 #include "xfs_dinode.h"
54 #include "xfs_inode.h"
55 #include "xfs_bmap.h"
56 #include "xfs_bit.h"
57 #include "xfs_rtalloc.h"
58 #include "xfs_error.h"
59 #include "xfs_itable.h"
60 #include "xfs_rw.h"
61 #include "xfs_acl.h"
62 #include "xfs_cap.h"
63 #include "xfs_mac.h"
64 #include "xfs_attr.h"
65 #include "xfs_buf_item.h"
66 #include "xfs_utils.h"
67
68 #include "xfs_qm.h"
69
70 #ifdef DEBUG
71 # define qdprintk(s, args...)   cmn_err(CE_DEBUG, s, ## args)
72 #else
73 # define qdprintk(s, args...)   do { } while (0)
74 #endif
75
76 STATIC int      xfs_qm_scall_trunc_qfiles(xfs_mount_t *, uint);
77 STATIC int      xfs_qm_scall_getquota(xfs_mount_t *, xfs_dqid_t, uint,
78                                         fs_disk_quota_t *);
79 STATIC int      xfs_qm_scall_getqstat(xfs_mount_t *, fs_quota_stat_t *);
80 STATIC int      xfs_qm_scall_setqlim(xfs_mount_t *, xfs_dqid_t, uint,
81                                         fs_disk_quota_t *);
82 STATIC int      xfs_qm_scall_quotaon(xfs_mount_t *, uint);
83 STATIC int      xfs_qm_scall_quotaoff(xfs_mount_t *, uint, boolean_t);
84 STATIC int      xfs_qm_log_quotaoff(xfs_mount_t *, xfs_qoff_logitem_t **, uint);
85 STATIC int      xfs_qm_log_quotaoff_end(xfs_mount_t *, xfs_qoff_logitem_t *,
86                                         uint);
87 STATIC uint     xfs_qm_import_flags(uint);
88 STATIC uint     xfs_qm_export_flags(uint);
89 STATIC uint     xfs_qm_import_qtype_flags(uint);
90 STATIC uint     xfs_qm_export_qtype_flags(uint);
91 STATIC void     xfs_qm_export_dquot(xfs_mount_t *, xfs_disk_dquot_t *,
92                                         fs_disk_quota_t *);
93
94
95 /*
96  * The main distribution switch of all XFS quotactl system calls.
97  */
98 int
99 xfs_qm_quotactl(
100         struct bhv_desc *bdp,
101         int             cmd,
102         int             id,
103         xfs_caddr_t     addr)
104 {
105         xfs_mount_t     *mp;
106         int             error;
107         struct vfs      *vfsp;
108
109         vfsp = bhvtovfs(bdp);
110         mp = XFS_VFSTOM(vfsp);
111
112         if (addr == NULL && cmd != Q_SYNC)
113                 return XFS_ERROR(EINVAL);
114         if (id < 0 && cmd != Q_SYNC)
115                 return XFS_ERROR(EINVAL);
116
117         /*
118          * The following commands are valid even when quotaoff.
119          */
120         switch (cmd) {
121                 /*
122                  * truncate quota files. quota must be off.
123                  */
124               case Q_XQUOTARM:
125                 if (XFS_IS_QUOTA_ON(mp) || addr == NULL)
126                         return XFS_ERROR(EINVAL);
127                 if (vfsp->vfs_flag & VFS_RDONLY)
128                         return XFS_ERROR(EROFS);
129                 return (xfs_qm_scall_trunc_qfiles(mp,
130                                xfs_qm_import_qtype_flags(*(uint *)addr)));
131                 /*
132                  * Get quota status information.
133                  */
134               case Q_XGETQSTAT:
135                 return (xfs_qm_scall_getqstat(mp, (fs_quota_stat_t *)addr));
136
137                 /*
138                  * QUOTAON for root f/s and quota enforcement on others..
139                  * Quota accounting for non-root f/s's must be turned on
140                  * at mount time.
141                  */
142               case Q_XQUOTAON:
143                 if (addr == NULL)
144                         return XFS_ERROR(EINVAL);
145                 if (vfsp->vfs_flag & VFS_RDONLY)
146                         return XFS_ERROR(EROFS);
147                 return (xfs_qm_scall_quotaon(mp,
148                                           xfs_qm_import_flags(*(uint *)addr)));
149               case Q_XQUOTAOFF:
150                 if (vfsp->vfs_flag & VFS_RDONLY)
151                         return XFS_ERROR(EROFS);
152                 break;
153
154               default:
155                 break;
156         }
157
158         if (! XFS_IS_QUOTA_ON(mp))
159                 return XFS_ERROR(ESRCH);
160
161         switch (cmd) {
162               case Q_XQUOTAOFF:
163                 if (vfsp->vfs_flag & VFS_RDONLY)
164                         return XFS_ERROR(EROFS);
165                 error = xfs_qm_scall_quotaoff(mp,
166                                             xfs_qm_import_flags(*(uint *)addr),
167                                             B_FALSE);
168                 break;
169
170                 /*
171                  * Defaults to XFS_GETUQUOTA.
172                  */
173               case Q_XGETQUOTA:
174                 error = xfs_qm_scall_getquota(mp, (xfs_dqid_t)id, XFS_DQ_USER,
175                                         (fs_disk_quota_t *)addr);
176                 break;
177                 /*
178                  * Set limits, both hard and soft. Defaults to Q_SETUQLIM.
179                  */
180               case Q_XSETQLIM:
181                 if (vfsp->vfs_flag & VFS_RDONLY)
182                         return XFS_ERROR(EROFS);
183                 error = xfs_qm_scall_setqlim(mp, (xfs_dqid_t)id, XFS_DQ_USER,
184                                              (fs_disk_quota_t *)addr);
185                 break;
186
187                case Q_XSETGQLIM:
188                 if (vfsp->vfs_flag & VFS_RDONLY)
189                         return XFS_ERROR(EROFS);
190                 error = xfs_qm_scall_setqlim(mp, (xfs_dqid_t)id, XFS_DQ_GROUP,
191                                              (fs_disk_quota_t *)addr);
192                 break;
193
194
195               case Q_XGETGQUOTA:
196                 error = xfs_qm_scall_getquota(mp, (xfs_dqid_t)id, XFS_DQ_GROUP,
197                                         (fs_disk_quota_t *)addr);
198                 break;
199
200                 /*
201                  * Quotas are entirely undefined after quotaoff in XFS quotas.
202                  * For instance, there's no way to set limits when quotaoff.
203                  */
204
205               default:
206                 error = XFS_ERROR(EINVAL);
207                 break;
208         }
209
210         return (error);
211 }
212
213 /*
214  * Turn off quota accounting and/or enforcement for all udquots and/or
215  * gdquots. Called only at unmount time.
216  *
217  * This assumes that there are no dquots of this file system cached
218  * incore, and modifies the ondisk dquot directly. Therefore, for example,
219  * it is an error to call this twice, without purging the cache.
220  */
221 STATIC int
222 xfs_qm_scall_quotaoff(
223         xfs_mount_t             *mp,
224         uint                    flags,
225         boolean_t               force)
226 {
227         uint                    dqtype;
228         unsigned long   s;
229         int                     error;
230         uint                    inactivate_flags;
231         xfs_qoff_logitem_t      *qoffstart;
232         int                     nculprits;
233
234         if (!force && !capable(CAP_SYS_ADMIN))
235                 return XFS_ERROR(EPERM);
236         /*
237          * No file system can have quotas enabled on disk but not in core.
238          * Note that quota utilities (like quotaoff) _expect_
239          * errno == EEXIST here.
240          */
241         if ((mp->m_qflags & flags) == 0)
242                 return XFS_ERROR(EEXIST);
243         error = 0;
244
245         flags &= (XFS_ALL_QUOTA_ACCT | XFS_ALL_QUOTA_ENFD);
246
247         /*
248          * We don't want to deal with two quotaoffs messing up each other,
249          * so we're going to serialize it. quotaoff isn't exactly a performance
250          * critical thing.
251          * If quotaoff, then we must be dealing with the root filesystem.
252          */
253         ASSERT(mp->m_quotainfo);
254         if (mp->m_quotainfo)
255                 mutex_lock(&(XFS_QI_QOFFLOCK(mp)), PINOD);
256
257         ASSERT(mp->m_quotainfo);
258
259         /*
260          * If we're just turning off quota enforcement, change mp and go.
261          */
262         if ((flags & XFS_ALL_QUOTA_ACCT) == 0) {
263                 mp->m_qflags &= ~(flags);
264
265                 s = XFS_SB_LOCK(mp);
266                 mp->m_sb.sb_qflags = mp->m_qflags;
267                 XFS_SB_UNLOCK(mp, s);
268                 mutex_unlock(&(XFS_QI_QOFFLOCK(mp)));
269
270                 /* XXX what to do if error ? Revert back to old vals incore ? */
271                 error = xfs_qm_write_sb_changes(mp, XFS_SB_QFLAGS);
272                 return (error);
273         }
274
275         dqtype = 0;
276         inactivate_flags = 0;
277         /*
278          * If accounting is off, we must turn enforcement off, clear the
279          * quota 'CHKD' certificate to make it known that we have to
280          * do a quotacheck the next time this quota is turned on.
281          */
282         if (flags & XFS_UQUOTA_ACCT) {
283                 dqtype |= XFS_QMOPT_UQUOTA;
284                 flags |= (XFS_UQUOTA_CHKD | XFS_UQUOTA_ENFD);
285                 inactivate_flags |= XFS_UQUOTA_ACTIVE;
286         }
287         if (flags & XFS_GQUOTA_ACCT) {
288                 dqtype |= XFS_QMOPT_GQUOTA;
289                 flags |= (XFS_GQUOTA_CHKD | XFS_GQUOTA_ENFD);
290                 inactivate_flags |= XFS_GQUOTA_ACTIVE;
291         }
292
293         /*
294          * Nothing to do?  Don't complain. This happens when we're just
295          * turning off quota enforcement.
296          */
297         if ((mp->m_qflags & flags) == 0) {
298                 mutex_unlock(&(XFS_QI_QOFFLOCK(mp)));
299                 return (0);
300         }
301
302         /*
303          * Write the LI_QUOTAOFF log record, and do SB changes atomically,
304          * and synchronously.
305          */
306         xfs_qm_log_quotaoff(mp, &qoffstart, flags);
307
308         /*
309          * Next we clear the XFS_MOUNT_*DQ_ACTIVE bit(s) in the mount struct
310          * to take care of the race between dqget and quotaoff. We don't take
311          * any special locks to reset these bits. All processes need to check
312          * these bits *after* taking inode lock(s) to see if the particular
313          * quota type is in the process of being turned off. If *ACTIVE, it is
314          * guaranteed that all dquot structures and all quotainode ptrs will all
315          * stay valid as long as that inode is kept locked.
316          *
317          * There is no turning back after this.
318          */
319         mp->m_qflags &= ~inactivate_flags;
320
321         /*
322          * Give back all the dquot reference(s) held by inodes.
323          * Here we go thru every single incore inode in this file system, and
324          * do a dqrele on the i_udquot/i_gdquot that it may have.
325          * Essentially, as long as somebody has an inode locked, this guarantees
326          * that quotas will not be turned off. This is handy because in a
327          * transaction once we lock the inode(s) and check for quotaon, we can
328          * depend on the quota inodes (and other things) being valid as long as
329          * we keep the lock(s).
330          */
331         xfs_qm_dqrele_all_inodes(mp, flags);
332
333         /*
334          * Next we make the changes in the quota flag in the mount struct.
335          * This isn't protected by a particular lock directly, because we
336          * don't want to take a mrlock everytime we depend on quotas being on.
337          */
338         mp->m_qflags &= ~(flags);
339
340         /*
341          * Go through all the dquots of this file system and purge them,
342          * according to what was turned off. We may not be able to get rid
343          * of all dquots, because dquots can have temporary references that
344          * are not attached to inodes. eg. xfs_setattr, xfs_create.
345          * So, if we couldn't purge all the dquots from the filesystem,
346          * we can't get rid of the incore data structures.
347          */
348         while ((nculprits = xfs_qm_dqpurge_all(mp, dqtype|XFS_QMOPT_QUOTAOFF)))
349                 delay(10 * nculprits);
350
351         /*
352          * Transactions that had started before ACTIVE state bit was cleared
353          * could have logged many dquots, so they'd have higher LSNs than
354          * the first QUOTAOFF log record does. If we happen to crash when
355          * the tail of the log has gone past the QUOTAOFF record, but
356          * before the last dquot modification, those dquots __will__
357          * recover, and that's not good.
358          *
359          * So, we have QUOTAOFF start and end logitems; the start
360          * logitem won't get overwritten until the end logitem appears...
361          */
362         xfs_qm_log_quotaoff_end(mp, qoffstart, flags);
363
364         /*
365          * If quotas is completely disabled, close shop.
366          */
367         if ((flags & XFS_MOUNT_QUOTA_ALL) == XFS_MOUNT_QUOTA_ALL) {
368                 mutex_unlock(&(XFS_QI_QOFFLOCK(mp)));
369                 xfs_qm_destroy_quotainfo(mp);
370                 return (0);
371         }
372
373         /*
374          * Release our quotainode references, and vn_purge them,
375          * if we don't need them anymore.
376          */
377         if ((dqtype & XFS_QMOPT_UQUOTA) && XFS_QI_UQIP(mp)) {
378                 XFS_PURGE_INODE(XFS_QI_UQIP(mp));
379                 XFS_QI_UQIP(mp) = NULL;
380         }
381         if ((dqtype & XFS_QMOPT_GQUOTA) && XFS_QI_GQIP(mp)) {
382                 XFS_PURGE_INODE(XFS_QI_GQIP(mp));
383                 XFS_QI_GQIP(mp) = NULL;
384         }
385         mutex_unlock(&(XFS_QI_QOFFLOCK(mp)));
386
387         return (error);
388 }
389
390 STATIC int
391 xfs_qm_scall_trunc_qfiles(
392         xfs_mount_t     *mp,
393         uint            flags)
394 {
395         int             error;
396         xfs_inode_t     *qip;
397
398         if (!capable(CAP_SYS_ADMIN))
399                 return XFS_ERROR(EPERM);
400         error = 0;
401         if (!XFS_SB_VERSION_HASQUOTA(&mp->m_sb) || flags == 0) {
402                 qdprintk("qtrunc flags=%x m_qflags=%x\n", flags, mp->m_qflags);
403                 return XFS_ERROR(EINVAL);
404         }
405
406         if ((flags & XFS_DQ_USER) && mp->m_sb.sb_uquotino != NULLFSINO) {
407                 error = xfs_iget(mp, NULL, mp->m_sb.sb_uquotino, 0, &qip, 0);
408                 if (! error) {
409                         (void) xfs_truncate_file(mp, qip);
410                         VN_RELE(XFS_ITOV(qip));
411                 }
412         }
413
414         if ((flags & XFS_DQ_GROUP) && mp->m_sb.sb_gquotino != NULLFSINO) {
415                 error = xfs_iget(mp, NULL, mp->m_sb.sb_gquotino, 0, &qip, 0);
416                 if (! error) {
417                         (void) xfs_truncate_file(mp, qip);
418                         VN_RELE(XFS_ITOV(qip));
419                 }
420         }
421
422         return (error);
423 }
424
425
426 /*
427  * Switch on (a given) quota enforcement for a filesystem.  This takes
428  * effect immediately.
429  * (Switching on quota accounting must be done at mount time.)
430  */
431 STATIC int
432 xfs_qm_scall_quotaon(
433         xfs_mount_t     *mp,
434         uint            flags)
435 {
436         int             error;
437         unsigned long s;
438         uint            qf;
439         uint            accflags;
440         __int64_t       sbflags;
441
442         if (!capable(CAP_SYS_ADMIN))
443                 return XFS_ERROR(EPERM);
444
445         flags &= (XFS_ALL_QUOTA_ACCT | XFS_ALL_QUOTA_ENFD);
446         /*
447          * Switching on quota accounting must be done at mount time.
448          */
449         accflags = flags & XFS_ALL_QUOTA_ACCT;
450         flags &= ~(XFS_ALL_QUOTA_ACCT);
451
452         sbflags = 0;
453
454         if (flags == 0) {
455                 qdprintk("quotaon: zero flags, m_qflags=%x\n", mp->m_qflags);
456                 return XFS_ERROR(EINVAL);
457         }
458
459         /* No fs can turn on quotas with a delayed effect */
460         ASSERT((flags & XFS_ALL_QUOTA_ACCT) == 0);
461
462         /*
463          * Can't enforce without accounting. We check the superblock
464          * qflags here instead of m_qflags because rootfs can have
465          * quota acct on ondisk without m_qflags' knowing.
466          */
467         if (((flags & XFS_UQUOTA_ACCT) == 0 &&
468             (mp->m_sb.sb_qflags & XFS_UQUOTA_ACCT) == 0 &&
469             (flags & XFS_UQUOTA_ENFD))
470             ||
471             ((flags & XFS_GQUOTA_ACCT) == 0 &&
472             (mp->m_sb.sb_qflags & XFS_GQUOTA_ACCT) == 0 &&
473             (flags & XFS_GQUOTA_ENFD))) {
474                 qdprintk("Can't enforce without acct, flags=%x sbflags=%x\n",
475                         flags, mp->m_sb.sb_qflags);
476                 return XFS_ERROR(EINVAL);
477         }
478         /*
479          * If everything's upto-date incore, then don't waste time.
480          */
481         if ((mp->m_qflags & flags) == flags)
482                 return XFS_ERROR(EEXIST);
483
484         /*
485          * Change sb_qflags on disk but not incore mp->qflags
486          * if this is the root filesystem.
487          */
488         s = XFS_SB_LOCK(mp);
489         qf = mp->m_sb.sb_qflags;
490         mp->m_sb.sb_qflags = qf | flags;
491         XFS_SB_UNLOCK(mp, s);
492
493         /*
494          * There's nothing to change if it's the same.
495          */
496         if ((qf & flags) == flags && sbflags == 0)
497                 return XFS_ERROR(EEXIST);
498         sbflags |= XFS_SB_QFLAGS;
499
500         if ((error = xfs_qm_write_sb_changes(mp, sbflags)))
501                 return (error);
502         /*
503          * If we aren't trying to switch on quota enforcement, we are done.
504          */
505         if  (((mp->m_sb.sb_qflags & XFS_UQUOTA_ACCT) !=
506              (mp->m_qflags & XFS_UQUOTA_ACCT)) ||
507             (flags & XFS_ALL_QUOTA_ENFD) == 0)
508                 return (0);
509
510         if (! XFS_IS_QUOTA_RUNNING(mp))
511                 return XFS_ERROR(ESRCH);
512
513         /*
514          * Switch on quota enforcement in core.
515          */
516         mutex_lock(&(XFS_QI_QOFFLOCK(mp)), PINOD);
517         mp->m_qflags |= (flags & XFS_ALL_QUOTA_ENFD);
518         mutex_unlock(&(XFS_QI_QOFFLOCK(mp)));
519
520         return (0);
521 }
522
523
524
525 /*
526  * Return quota status information, such as uquota-off, enforcements, etc.
527  */
528 STATIC int
529 xfs_qm_scall_getqstat(
530         xfs_mount_t     *mp,
531         fs_quota_stat_t *out)
532 {
533         xfs_inode_t     *uip, *gip;
534         boolean_t       tempuqip, tempgqip;
535
536         uip = gip = NULL;
537         tempuqip = tempgqip = B_FALSE;
538         memset(out, 0, sizeof(fs_quota_stat_t));
539
540         out->qs_version = FS_QSTAT_VERSION;
541         if (! XFS_SB_VERSION_HASQUOTA(&mp->m_sb)) {
542                 out->qs_uquota.qfs_ino = NULLFSINO;
543                 out->qs_gquota.qfs_ino = NULLFSINO;
544                 return (0);
545         }
546         out->qs_flags = (__uint16_t) xfs_qm_export_flags(mp->m_qflags &
547                                                         (XFS_ALL_QUOTA_ACCT|
548                                                          XFS_ALL_QUOTA_ENFD));
549         out->qs_pad = 0;
550         out->qs_uquota.qfs_ino = mp->m_sb.sb_uquotino;
551         out->qs_gquota.qfs_ino = mp->m_sb.sb_gquotino;
552
553         if (mp->m_quotainfo) {
554                 uip = mp->m_quotainfo->qi_uquotaip;
555                 gip = mp->m_quotainfo->qi_gquotaip;
556         }
557         if (!uip && mp->m_sb.sb_uquotino != NULLFSINO) {
558                 if (xfs_iget(mp, NULL, mp->m_sb.sb_uquotino, 0, &uip, 0) == 0)
559                         tempuqip = B_TRUE;
560         }
561         if (!gip && mp->m_sb.sb_gquotino != NULLFSINO) {
562                 if (xfs_iget(mp, NULL, mp->m_sb.sb_gquotino, 0, &gip, 0) == 0)
563                         tempgqip = B_TRUE;
564         }
565         if (uip) {
566                 out->qs_uquota.qfs_nblks = uip->i_d.di_nblocks;
567                 out->qs_uquota.qfs_nextents = uip->i_d.di_nextents;
568                 if (tempuqip)
569                         VN_RELE(XFS_ITOV(uip));
570         }
571         if (gip) {
572                 out->qs_gquota.qfs_nblks = gip->i_d.di_nblocks;
573                 out->qs_gquota.qfs_nextents = gip->i_d.di_nextents;
574                 if (tempgqip)
575                         VN_RELE(XFS_ITOV(gip));
576         }
577         if (mp->m_quotainfo) {
578                 out->qs_incoredqs = XFS_QI_MPLNDQUOTS(mp);
579                 out->qs_btimelimit = XFS_QI_BTIMELIMIT(mp);
580                 out->qs_itimelimit = XFS_QI_ITIMELIMIT(mp);
581                 out->qs_rtbtimelimit = XFS_QI_RTBTIMELIMIT(mp);
582                 out->qs_bwarnlimit = XFS_QI_BWARNLIMIT(mp);
583                 out->qs_iwarnlimit = XFS_QI_IWARNLIMIT(mp);
584         }
585         return (0);
586 }
587
588 /*
589  * Adjust quota limits, and start/stop timers accordingly.
590  */
591 STATIC int
592 xfs_qm_scall_setqlim(
593         xfs_mount_t             *mp,
594         xfs_dqid_t              id,
595         uint                    type,
596         fs_disk_quota_t         *newlim)
597 {
598         xfs_disk_dquot_t        *ddq;
599         xfs_dquot_t             *dqp;
600         xfs_trans_t             *tp;
601         int                     error;
602         xfs_qcnt_t              hard, soft;
603
604         if (!capable(CAP_SYS_ADMIN))
605                 return XFS_ERROR(EPERM);
606
607         if ((newlim->d_fieldmask & (FS_DQ_LIMIT_MASK|FS_DQ_TIMER_MASK)) == 0)
608                 return (0);
609
610         tp = xfs_trans_alloc(mp, XFS_TRANS_QM_SETQLIM);
611         if ((error = xfs_trans_reserve(tp, 0, sizeof(xfs_disk_dquot_t) + 128,
612                                       0, 0, XFS_DEFAULT_LOG_COUNT))) {
613                 xfs_trans_cancel(tp, 0);
614                 return (error);
615         }
616
617         /*
618          * We don't want to race with a quotaoff so take the quotaoff lock.
619          * (We don't hold an inode lock, so there's nothing else to stop
620          * a quotaoff from happening). (XXXThis doesn't currently happen
621          * because we take the vfslock before calling xfs_qm_sysent).
622          */
623         mutex_lock(&(XFS_QI_QOFFLOCK(mp)), PINOD);
624
625         /*
626          * Get the dquot (locked), and join it to the transaction.
627          * Allocate the dquot if this doesn't exist.
628          */
629         if ((error = xfs_qm_dqget(mp, NULL, id, type, XFS_QMOPT_DQALLOC, &dqp))) {
630                 xfs_trans_cancel(tp, XFS_TRANS_ABORT);
631                 mutex_unlock(&(XFS_QI_QOFFLOCK(mp)));
632                 ASSERT(error != ENOENT);
633                 return (error);
634         }
635         xfs_dqtrace_entry(dqp, "Q_SETQLIM: AFT DQGET");
636         xfs_trans_dqjoin(tp, dqp);
637         ddq = &dqp->q_core;
638
639         /*
640          * Make sure that hardlimits are >= soft limits before changing.
641          */
642         hard = (newlim->d_fieldmask & FS_DQ_BHARD) ?
643                 (xfs_qcnt_t) XFS_BB_TO_FSB(mp, newlim->d_blk_hardlimit) :
644                         INT_GET(ddq->d_blk_hardlimit, ARCH_CONVERT);
645         soft = (newlim->d_fieldmask & FS_DQ_BSOFT) ?
646                 (xfs_qcnt_t) XFS_BB_TO_FSB(mp, newlim->d_blk_softlimit) :
647                         INT_GET(ddq->d_blk_softlimit, ARCH_CONVERT);
648         if (hard == 0 || hard >= soft) {
649                 INT_SET(ddq->d_blk_hardlimit, ARCH_CONVERT, hard);
650                 INT_SET(ddq->d_blk_softlimit, ARCH_CONVERT, soft);
651                 if (id == 0) {
652                         mp->m_quotainfo->qi_bhardlimit = hard;
653                         mp->m_quotainfo->qi_bsoftlimit = soft;
654                 }
655         } else {
656                 qdprintk("blkhard %Ld < blksoft %Ld\n", hard, soft);
657         }
658         hard = (newlim->d_fieldmask & FS_DQ_RTBHARD) ?
659                 (xfs_qcnt_t) XFS_BB_TO_FSB(mp, newlim->d_rtb_hardlimit) :
660                         INT_GET(ddq->d_rtb_hardlimit, ARCH_CONVERT);
661         soft = (newlim->d_fieldmask & FS_DQ_RTBSOFT) ?
662                 (xfs_qcnt_t) XFS_BB_TO_FSB(mp, newlim->d_rtb_softlimit) :
663                         INT_GET(ddq->d_rtb_softlimit, ARCH_CONVERT);
664         if (hard == 0 || hard >= soft) {
665                 INT_SET(ddq->d_rtb_hardlimit, ARCH_CONVERT, hard);
666                 INT_SET(ddq->d_rtb_softlimit, ARCH_CONVERT, soft);
667                 if (id == 0) {
668                         mp->m_quotainfo->qi_rtbhardlimit = hard;
669                         mp->m_quotainfo->qi_rtbsoftlimit = soft;
670                 }
671         } else {
672                 qdprintk("rtbhard %Ld < rtbsoft %Ld\n", hard, soft);
673         }
674
675         hard = (newlim->d_fieldmask & FS_DQ_IHARD) ?
676                 (xfs_qcnt_t) newlim->d_ino_hardlimit :
677                         INT_GET(ddq->d_ino_hardlimit, ARCH_CONVERT);
678         soft = (newlim->d_fieldmask & FS_DQ_ISOFT) ?
679                 (xfs_qcnt_t) newlim->d_ino_softlimit :
680                         INT_GET(ddq->d_ino_softlimit, ARCH_CONVERT);
681         if (hard == 0 || hard >= soft) {
682                 INT_SET(ddq->d_ino_hardlimit, ARCH_CONVERT, hard);
683                 INT_SET(ddq->d_ino_softlimit, ARCH_CONVERT, soft);
684                 if (id == 0) {
685                         mp->m_quotainfo->qi_ihardlimit = hard;
686                         mp->m_quotainfo->qi_isoftlimit = soft;
687                 }
688         } else {
689                 qdprintk("ihard %Ld < isoft %Ld\n", hard, soft);
690         }
691
692         if (id == 0) {
693                 /*
694                  * Timelimits for the super user set the relative time
695                  * the other users can be over quota for this file system.
696                  * If it is zero a default is used.  Ditto for the default
697                  * soft and hard limit values (already done, above).
698                  */
699                 if (newlim->d_fieldmask & FS_DQ_BTIMER) {
700                         mp->m_quotainfo->qi_btimelimit = newlim->d_btimer;
701                         INT_SET(ddq->d_btimer, ARCH_CONVERT, newlim->d_btimer);
702                 }
703                 if (newlim->d_fieldmask & FS_DQ_ITIMER) {
704                         mp->m_quotainfo->qi_itimelimit = newlim->d_itimer;
705                         INT_SET(ddq->d_itimer, ARCH_CONVERT, newlim->d_itimer);
706                 }
707                 if (newlim->d_fieldmask & FS_DQ_RTBTIMER) {
708                         mp->m_quotainfo->qi_rtbtimelimit = newlim->d_rtbtimer;
709                         INT_SET(ddq->d_rtbtimer, ARCH_CONVERT, newlim->d_rtbtimer);
710                 }
711         } else /* if (XFS_IS_QUOTA_ENFORCED(mp)) */ {
712                 /*
713                  * If the user is now over quota, start the timelimit.
714                  * The user will not be 'warned'.
715                  * Note that we keep the timers ticking, whether enforcement
716                  * is on or off. We don't really want to bother with iterating
717                  * over all ondisk dquots and turning the timers on/off.
718                  */
719                 xfs_qm_adjust_dqtimers(mp, ddq);
720         }
721         dqp->dq_flags |= XFS_DQ_DIRTY;
722         xfs_trans_log_dquot(tp, dqp);
723
724         xfs_dqtrace_entry(dqp, "Q_SETQLIM: COMMIT");
725         xfs_trans_commit(tp, 0, NULL);
726         xfs_qm_dqprint(dqp);
727         xfs_qm_dqrele(dqp);
728         mutex_unlock(&(XFS_QI_QOFFLOCK(mp)));
729
730         return (0);
731 }
732
733 STATIC int
734 xfs_qm_scall_getquota(
735         xfs_mount_t     *mp,
736         xfs_dqid_t      id,
737         uint            type,
738         fs_disk_quota_t *out)
739 {
740         xfs_dquot_t     *dqp;
741         int             error;
742
743         /*
744          * Try to get the dquot. We don't want it allocated on disk, so
745          * we aren't passing the XFS_QMOPT_DOALLOC flag. If it doesn't
746          * exist, we'll get ENOENT back.
747          */
748         if ((error = xfs_qm_dqget(mp, NULL, id, type, 0, &dqp))) {
749                 return (error);
750         }
751
752         xfs_dqtrace_entry(dqp, "Q_GETQUOTA SUCCESS");
753         /*
754          * If everything's NULL, this dquot doesn't quite exist as far as
755          * our utility programs are concerned.
756          */
757         if (XFS_IS_DQUOT_UNINITIALIZED(dqp)) {
758                 xfs_qm_dqput(dqp);
759                 return XFS_ERROR(ENOENT);
760         }
761         /* xfs_qm_dqprint(dqp); */
762         /*
763          * Convert the disk dquot to the exportable format
764          */
765         xfs_qm_export_dquot(mp, &dqp->q_core, out);
766         xfs_qm_dqput(dqp);
767         return (error ? XFS_ERROR(EFAULT) : 0);
768 }
769
770
771 STATIC int
772 xfs_qm_log_quotaoff_end(
773         xfs_mount_t             *mp,
774         xfs_qoff_logitem_t      *startqoff,
775         uint                    flags)
776 {
777         xfs_trans_t            *tp;
778         int                     error;
779         xfs_qoff_logitem_t     *qoffi;
780
781         tp = xfs_trans_alloc(mp, XFS_TRANS_QM_QUOTAOFF_END);
782
783         if ((error = xfs_trans_reserve(tp, 0, sizeof(xfs_qoff_logitem_t) * 2,
784                                       0, 0, XFS_DEFAULT_LOG_COUNT))) {
785                 xfs_trans_cancel(tp, 0);
786                 return (error);
787         }
788
789         qoffi = xfs_trans_get_qoff_item(tp, startqoff,
790                                         flags & XFS_ALL_QUOTA_ACCT);
791         xfs_trans_log_quotaoff_item(tp, qoffi);
792
793         /*
794          * We have to make sure that the transaction is secure on disk before we
795          * return and actually stop quota accounting. So, make it synchronous.
796          * We don't care about quotoff's performance.
797          */
798         xfs_trans_set_sync(tp);
799         error = xfs_trans_commit(tp, 0, NULL);
800         return (error);
801 }
802
803
804 STATIC int
805 xfs_qm_log_quotaoff(
806         xfs_mount_t            *mp,
807         xfs_qoff_logitem_t     **qoffstartp,
808         uint                   flags)
809 {
810         xfs_trans_t            *tp;
811         int                     error;
812         unsigned long   s;
813         xfs_qoff_logitem_t     *qoffi=NULL;
814         uint                    oldsbqflag=0;
815
816         tp = xfs_trans_alloc(mp, XFS_TRANS_QM_QUOTAOFF);
817         if ((error = xfs_trans_reserve(tp, 0,
818                                       sizeof(xfs_qoff_logitem_t) * 2 +
819                                       mp->m_sb.sb_sectsize + 128,
820                                       0,
821                                       0,
822                                       XFS_DEFAULT_LOG_COUNT))) {
823                 goto error0;
824         }
825
826         qoffi = xfs_trans_get_qoff_item(tp, NULL, flags & XFS_ALL_QUOTA_ACCT);
827         xfs_trans_log_quotaoff_item(tp, qoffi);
828
829         s = XFS_SB_LOCK(mp);
830         oldsbqflag = mp->m_sb.sb_qflags;
831         mp->m_sb.sb_qflags = (mp->m_qflags & ~(flags)) & XFS_MOUNT_QUOTA_ALL;
832         XFS_SB_UNLOCK(mp, s);
833
834         xfs_mod_sb(tp, XFS_SB_QFLAGS);
835
836         /*
837          * We have to make sure that the transaction is secure on disk before we
838          * return and actually stop quota accounting. So, make it synchronous.
839          * We don't care about quotoff's performance.
840          */
841         xfs_trans_set_sync(tp);
842         error = xfs_trans_commit(tp, 0, NULL);
843
844 error0:
845         if (error) {
846                 xfs_trans_cancel(tp, 0);
847                 /*
848                  * No one else is modifying sb_qflags, so this is OK.
849                  * We still hold the quotaofflock.
850                  */
851                 s = XFS_SB_LOCK(mp);
852                 mp->m_sb.sb_qflags = oldsbqflag;
853                 XFS_SB_UNLOCK(mp, s);
854         }
855         *qoffstartp = qoffi;
856         return (error);
857 }
858
859
860 /*
861  * Translate an internal style on-disk-dquot to the exportable format.
862  * The main differences are that the counters/limits are all in Basic
863  * Blocks (BBs) instead of the internal FSBs, and all on-disk data has
864  * to be converted to the native endianness.
865  */
866 STATIC void
867 xfs_qm_export_dquot(
868         xfs_mount_t             *mp,
869         xfs_disk_dquot_t        *src,
870         struct fs_disk_quota    *dst)
871 {
872         memset(dst, 0, sizeof(*dst));
873         dst->d_version = FS_DQUOT_VERSION;  /* different from src->d_version */
874         dst->d_flags =
875                 xfs_qm_export_qtype_flags(INT_GET(src->d_flags, ARCH_CONVERT));
876         dst->d_id = INT_GET(src->d_id, ARCH_CONVERT);
877         dst->d_blk_hardlimit = (__uint64_t)
878                 XFS_FSB_TO_BB(mp, INT_GET(src->d_blk_hardlimit, ARCH_CONVERT));
879         dst->d_blk_softlimit = (__uint64_t)
880                 XFS_FSB_TO_BB(mp, INT_GET(src->d_blk_softlimit, ARCH_CONVERT));
881         dst->d_ino_hardlimit = (__uint64_t)
882                 INT_GET(src->d_ino_hardlimit, ARCH_CONVERT);
883         dst->d_ino_softlimit = (__uint64_t)
884                 INT_GET(src->d_ino_softlimit, ARCH_CONVERT);
885         dst->d_bcount = (__uint64_t)
886                 XFS_FSB_TO_BB(mp, INT_GET(src->d_bcount, ARCH_CONVERT));
887         dst->d_icount = (__uint64_t) INT_GET(src->d_icount, ARCH_CONVERT);
888         dst->d_btimer = (__uint32_t) INT_GET(src->d_btimer, ARCH_CONVERT);
889         dst->d_itimer = (__uint32_t) INT_GET(src->d_itimer, ARCH_CONVERT);
890         dst->d_iwarns = INT_GET(src->d_iwarns, ARCH_CONVERT);
891         dst->d_bwarns = INT_GET(src->d_bwarns, ARCH_CONVERT);
892
893         dst->d_rtb_hardlimit = (__uint64_t)
894                 XFS_FSB_TO_BB(mp, INT_GET(src->d_rtb_hardlimit, ARCH_CONVERT));
895         dst->d_rtb_softlimit = (__uint64_t)
896                 XFS_FSB_TO_BB(mp, INT_GET(src->d_rtb_softlimit, ARCH_CONVERT));
897         dst->d_rtbcount = (__uint64_t)
898                 XFS_FSB_TO_BB(mp, INT_GET(src->d_rtbcount, ARCH_CONVERT));
899         dst->d_rtbtimer = (__uint32_t) INT_GET(src->d_rtbtimer, ARCH_CONVERT);
900         dst->d_rtbwarns = INT_GET(src->d_rtbwarns, ARCH_CONVERT);
901
902         /*
903          * Internally, we don't reset all the timers when quota enforcement
904          * gets turned off. No need to confuse the userlevel code,
905          * so return zeroes in that case.
906          */
907         if (! XFS_IS_QUOTA_ENFORCED(mp)) {
908                 dst->d_btimer = 0;
909                 dst->d_itimer = 0;
910                 dst->d_rtbtimer = 0;
911         }
912
913 #ifdef DEBUG
914         if (XFS_IS_QUOTA_ENFORCED(mp) && dst->d_id != 0) {
915                 if (((int) dst->d_bcount >= (int) dst->d_blk_softlimit) &&
916                     (dst->d_blk_softlimit > 0)) {
917                         ASSERT(dst->d_btimer != 0);
918                 }
919                 if (((int) dst->d_icount >= (int) dst->d_ino_softlimit) &&
920                     (dst->d_ino_softlimit > 0)) {
921                         ASSERT(dst->d_itimer != 0);
922                 }
923         }
924 #endif
925 }
926
927 STATIC uint
928 xfs_qm_import_qtype_flags(
929         uint uflags)
930 {
931         /*
932          * Can't be both at the same time.
933          */
934         if (((uflags & (XFS_GROUP_QUOTA | XFS_USER_QUOTA)) ==
935              (XFS_GROUP_QUOTA | XFS_USER_QUOTA)) ||
936             ((uflags & (XFS_GROUP_QUOTA | XFS_USER_QUOTA)) == 0))
937                 return (0);
938
939         return (uflags & XFS_USER_QUOTA) ?
940                 XFS_DQ_USER : XFS_DQ_GROUP;
941 }
942
943 STATIC uint
944 xfs_qm_export_qtype_flags(
945         uint flags)
946 {
947         /*
948          * Can't be both at the same time.
949          */
950         ASSERT((flags & (XFS_GROUP_QUOTA | XFS_USER_QUOTA)) !=
951                 (XFS_GROUP_QUOTA | XFS_USER_QUOTA));
952         ASSERT((flags & (XFS_GROUP_QUOTA | XFS_USER_QUOTA)) != 0);
953
954         return (flags & XFS_DQ_USER) ?
955                 XFS_USER_QUOTA : XFS_GROUP_QUOTA;
956 }
957
958 STATIC uint
959 xfs_qm_import_flags(
960         uint uflags)
961 {
962         uint flags = 0;
963
964         if (uflags & XFS_QUOTA_UDQ_ACCT)
965                 flags |= XFS_UQUOTA_ACCT;
966         if (uflags & XFS_QUOTA_GDQ_ACCT)
967                 flags |= XFS_GQUOTA_ACCT;
968         if (uflags & XFS_QUOTA_UDQ_ENFD)
969                 flags |= XFS_UQUOTA_ENFD;
970         if (uflags & XFS_QUOTA_GDQ_ENFD)
971                 flags |= XFS_GQUOTA_ENFD;
972         return (flags);
973 }
974
975
976 STATIC uint
977 xfs_qm_export_flags(
978         uint flags)
979 {
980         uint uflags;
981
982         uflags = 0;
983         if (flags & XFS_UQUOTA_ACCT)
984                 uflags |= XFS_QUOTA_UDQ_ACCT;
985         if (flags & XFS_GQUOTA_ACCT)
986                 uflags |= XFS_QUOTA_GDQ_ACCT;
987         if (flags & XFS_UQUOTA_ENFD)
988                 uflags |= XFS_QUOTA_UDQ_ENFD;
989         if (flags & XFS_GQUOTA_ENFD)
990                 uflags |= XFS_QUOTA_GDQ_ENFD;
991         return (uflags);
992 }
993
994
995 /*
996  * Go thru all the inodes in the file system, releasing their dquots.
997  * Note that the mount structure gets modified to indicate that quotas are off
998  * AFTER this, in the case of quotaoff. This also gets called from
999  * xfs_rootumount.
1000  */
1001 void
1002 xfs_qm_dqrele_all_inodes(
1003         struct xfs_mount *mp,
1004         uint             flags)
1005 {
1006         vmap_t          vmap;
1007         xfs_inode_t     *ip, *topino;
1008         uint            ireclaims;
1009         vnode_t         *vp;
1010         boolean_t       vnode_refd;
1011
1012         ASSERT(mp->m_quotainfo);
1013
1014 again:
1015         XFS_MOUNT_ILOCK(mp);
1016         ip = mp->m_inodes;
1017         if (ip == NULL) {
1018                 XFS_MOUNT_IUNLOCK(mp);
1019                 return;
1020         }
1021         do {
1022                 /* Skip markers inserted by xfs_sync */
1023                 if (ip->i_mount == NULL) {
1024                         ip = ip->i_mnext;
1025                         continue;
1026                 }
1027                 /* Root inode, rbmip and rsumip have associated blocks */
1028                 if (ip == XFS_QI_UQIP(mp) || ip == XFS_QI_GQIP(mp)) {
1029                         ASSERT(ip->i_udquot == NULL);
1030                         ASSERT(ip->i_gdquot == NULL);
1031                         ip = ip->i_mnext;
1032                         continue;
1033                 }
1034                 vp = XFS_ITOV_NULL(ip);
1035                 if (!vp) {
1036                         ASSERT(ip->i_udquot == NULL);
1037                         ASSERT(ip->i_gdquot == NULL);
1038                         ip = ip->i_mnext;
1039                         continue;
1040                 }
1041                 vnode_refd = B_FALSE;
1042                 if (xfs_ilock_nowait(ip, XFS_ILOCK_EXCL) == 0) {
1043                         /*
1044                          * Sample vp mapping while holding the mplock, lest
1045                          * we come across a non-existent vnode.
1046                          */
1047                         VMAP(vp, vmap);
1048                         ireclaims = mp->m_ireclaims;
1049                         topino = mp->m_inodes;
1050                         XFS_MOUNT_IUNLOCK(mp);
1051
1052                         /* XXX restart limit ? */
1053                         if ( ! (vp = vn_get(vp, &vmap)))
1054                                 goto again;
1055                         xfs_ilock(ip, XFS_ILOCK_EXCL);
1056                         vnode_refd = B_TRUE;
1057                 } else {
1058                         ireclaims = mp->m_ireclaims;
1059                         topino = mp->m_inodes;
1060                         XFS_MOUNT_IUNLOCK(mp);
1061                 }
1062
1063                 /*
1064                  * We don't keep the mountlock across the dqrele() call,
1065                  * since it can take a while..
1066                  */
1067                 if ((flags & XFS_UQUOTA_ACCT) && ip->i_udquot) {
1068                         xfs_qm_dqrele(ip->i_udquot);
1069                         ip->i_udquot = NULL;
1070                 }
1071                 if ((flags & XFS_GQUOTA_ACCT) && ip->i_gdquot) {
1072                         xfs_qm_dqrele(ip->i_gdquot);
1073                         ip->i_gdquot = NULL;
1074                 }
1075                 xfs_iunlock(ip, XFS_ILOCK_EXCL);
1076                 /*
1077                  * Wait until we've dropped the ilock and mountlock to
1078                  * do the vn_rele. Or be condemned to an eternity in the
1079                  * inactive code in hell.
1080                  */
1081                 if (vnode_refd)
1082                         VN_RELE(vp);
1083                 XFS_MOUNT_ILOCK(mp);
1084                 /*
1085                  * If an inode was inserted or removed, we gotta
1086                  * start over again.
1087                  */
1088                 if (topino != mp->m_inodes || mp->m_ireclaims != ireclaims) {
1089                         /* XXX use a sentinel */
1090                         XFS_MOUNT_IUNLOCK(mp);
1091                         goto again;
1092                 }
1093                 ip = ip->i_mnext;
1094         } while (ip != mp->m_inodes);
1095
1096         XFS_MOUNT_IUNLOCK(mp);
1097 }
1098
1099 /*------------------------------------------------------------------------*/
1100 #ifdef DEBUG
1101 /*
1102  * This contains all the test functions for XFS disk quotas.
1103  * Currently it does a quota accounting check. ie. it walks through
1104  * all inodes in the file system, calculating the dquot accounting fields,
1105  * and prints out any inconsistencies.
1106  */
1107 xfs_dqhash_t *qmtest_udqtab;
1108 xfs_dqhash_t *qmtest_gdqtab;
1109 int           qmtest_hashmask;
1110 int           qmtest_nfails;
1111 mutex_t       qcheck_lock;
1112
1113 #define DQTEST_HASHVAL(mp, id) (((__psunsigned_t)(mp) + \
1114                                  (__psunsigned_t)(id)) & \
1115                                 (qmtest_hashmask - 1))
1116
1117 #define DQTEST_HASH(mp, id, type)   ((type & XFS_DQ_USER) ? \
1118                                      (qmtest_udqtab + \
1119                                       DQTEST_HASHVAL(mp, id)) : \
1120                                      (qmtest_gdqtab + \
1121                                       DQTEST_HASHVAL(mp, id)))
1122
1123 #define DQTEST_LIST_PRINT(l, NXT, title) \
1124 { \
1125           xfs_dqtest_t  *dqp; int i = 0;\
1126           cmn_err(CE_DEBUG, "%s (#%d)", title, (int) (l)->qh_nelems); \
1127           for (dqp = (xfs_dqtest_t *)(l)->qh_next; dqp != NULL; \
1128                dqp = (xfs_dqtest_t *)dqp->NXT) { \
1129                 cmn_err(CE_DEBUG, "  %d. \"%d (%s)\"  bcnt = %d, icnt = %d", \
1130                          ++i, dqp->d_id, DQFLAGTO_TYPESTR(dqp),      \
1131                          dqp->d_bcount, dqp->d_icount); } \
1132 }
1133
1134 typedef struct dqtest {
1135         xfs_dqmarker_t  q_lists;
1136         xfs_dqhash_t    *q_hash;        /* the hashchain header */
1137         xfs_mount_t     *q_mount;       /* filesystem this relates to */
1138         xfs_dqid_t      d_id;           /* user id or group id */
1139         xfs_qcnt_t      d_bcount;       /* # disk blocks owned by the user */
1140         xfs_qcnt_t      d_icount;       /* # inodes owned by the user */
1141 } xfs_dqtest_t;
1142
1143 STATIC void
1144 xfs_qm_hashinsert(xfs_dqhash_t *h, xfs_dqtest_t *dqp)
1145 {
1146         xfs_dquot_t *d;
1147         if (((d) = (h)->qh_next))
1148                 (d)->HL_PREVP = &((dqp)->HL_NEXT);
1149         (dqp)->HL_NEXT = d;
1150         (dqp)->HL_PREVP = &((h)->qh_next);
1151         (h)->qh_next = (xfs_dquot_t *)dqp;
1152         (h)->qh_version++;
1153         (h)->qh_nelems++;
1154 }
1155 STATIC void
1156 xfs_qm_dqtest_print(
1157         xfs_dqtest_t    *d)
1158 {
1159         cmn_err(CE_DEBUG, "-----------DQTEST DQUOT----------------");
1160         cmn_err(CE_DEBUG, "---- dquot ID = %d", d->d_id);
1161         cmn_err(CE_DEBUG, "---- type     = %s", XFS_QM_ISUDQ(d)? "USR" : "GRP");
1162         cmn_err(CE_DEBUG, "---- fs       = 0x%p", d->q_mount);
1163         cmn_err(CE_DEBUG, "---- bcount   = %Lu (0x%x)",
1164                 d->d_bcount, (int)d->d_bcount);
1165         cmn_err(CE_DEBUG, "---- icount   = %Lu (0x%x)",
1166                 d->d_icount, (int)d->d_icount);
1167         cmn_err(CE_DEBUG, "---------------------------");
1168 }
1169
1170 STATIC void
1171 xfs_qm_dqtest_failed(
1172         xfs_dqtest_t    *d,
1173         xfs_dquot_t     *dqp,
1174         char            *reason,
1175         xfs_qcnt_t      a,
1176         xfs_qcnt_t      b,
1177         int             error)
1178 {
1179         qmtest_nfails++;
1180         if (error)
1181                 cmn_err(CE_DEBUG, "quotacheck failed id=%d, err=%d\nreason: %s",
1182                        INT_GET(d->d_id, ARCH_CONVERT), error, reason);
1183         else
1184                 cmn_err(CE_DEBUG, "quotacheck failed id=%d (%s) [%d != %d]",
1185                        INT_GET(d->d_id, ARCH_CONVERT), reason, (int)a, (int)b);
1186         xfs_qm_dqtest_print(d);
1187         if (dqp)
1188                 xfs_qm_dqprint(dqp);
1189 }
1190
1191 STATIC int
1192 xfs_dqtest_cmp2(
1193         xfs_dqtest_t    *d,
1194         xfs_dquot_t     *dqp)
1195 {
1196         int err = 0;
1197         if (INT_GET(dqp->q_core.d_icount, ARCH_CONVERT) != d->d_icount) {
1198                 xfs_qm_dqtest_failed(d, dqp, "icount mismatch",
1199                         INT_GET(dqp->q_core.d_icount, ARCH_CONVERT),
1200                         d->d_icount, 0);
1201                 err++;
1202         }
1203         if (INT_GET(dqp->q_core.d_bcount, ARCH_CONVERT) != d->d_bcount) {
1204                 xfs_qm_dqtest_failed(d, dqp, "bcount mismatch",
1205                         INT_GET(dqp->q_core.d_bcount, ARCH_CONVERT),
1206                         d->d_bcount, 0);
1207                 err++;
1208         }
1209         if (INT_GET(dqp->q_core.d_blk_softlimit, ARCH_CONVERT) &&
1210             INT_GET(dqp->q_core.d_bcount, ARCH_CONVERT) >=
1211             INT_GET(dqp->q_core.d_blk_softlimit, ARCH_CONVERT)) {
1212                 if (INT_ISZERO(dqp->q_core.d_btimer, ARCH_CONVERT) &&
1213                     !INT_ISZERO(dqp->q_core.d_id, ARCH_CONVERT)) {
1214                         cmn_err(CE_DEBUG,
1215                                 "%d [%s] [0x%p] BLK TIMER NOT STARTED",
1216                                 d->d_id, DQFLAGTO_TYPESTR(d), d->q_mount);
1217                         err++;
1218                 }
1219         }
1220         if (INT_GET(dqp->q_core.d_ino_softlimit, ARCH_CONVERT) &&
1221             INT_GET(dqp->q_core.d_icount, ARCH_CONVERT) >=
1222             INT_GET(dqp->q_core.d_ino_softlimit, ARCH_CONVERT)) {
1223                 if (INT_ISZERO(dqp->q_core.d_itimer, ARCH_CONVERT) &&
1224                     !INT_ISZERO(dqp->q_core.d_id, ARCH_CONVERT)) {
1225                         cmn_err(CE_DEBUG,
1226                                 "%d [%s] [0x%p] INO TIMER NOT STARTED",
1227                                 d->d_id, DQFLAGTO_TYPESTR(d), d->q_mount);
1228                         err++;
1229                 }
1230         }
1231 #ifdef QUOTADEBUG
1232         if (!err) {
1233                 cmn_err(CE_DEBUG, "%d [%s] [0x%p] qchecked",
1234                         d->d_id, XFS_QM_ISUDQ(d) ? "USR" : "GRP", d->q_mount);
1235         }
1236 #endif
1237         return (err);
1238 }
1239
1240 STATIC void
1241 xfs_dqtest_cmp(
1242         xfs_dqtest_t    *d)
1243 {
1244         xfs_dquot_t     *dqp;
1245         int             error;
1246
1247         /* xfs_qm_dqtest_print(d); */
1248         if ((error = xfs_qm_dqget(d->q_mount, NULL, d->d_id, d->dq_flags, 0,
1249                                  &dqp))) {
1250                 xfs_qm_dqtest_failed(d, NULL, "dqget failed", 0, 0, error);
1251                 return;
1252         }
1253         xfs_dqtest_cmp2(d, dqp);
1254         xfs_qm_dqput(dqp);
1255 }
1256
1257 STATIC int
1258 xfs_qm_internalqcheck_dqget(
1259         xfs_mount_t     *mp,
1260         xfs_dqid_t      id,
1261         uint            type,
1262         xfs_dqtest_t    **O_dq)
1263 {
1264         xfs_dqtest_t    *d;
1265         xfs_dqhash_t    *h;
1266
1267         h = DQTEST_HASH(mp, id, type);
1268         for (d = (xfs_dqtest_t *) h->qh_next; d != NULL;
1269              d = (xfs_dqtest_t *) d->HL_NEXT) {
1270                 /* DQTEST_LIST_PRINT(h, HL_NEXT, "@@@@@ dqtestlist @@@@@"); */
1271                 if (d->d_id == id && mp == d->q_mount) {
1272                         *O_dq = d;
1273                         return (0);
1274                 }
1275         }
1276         d = kmem_zalloc(sizeof(xfs_dqtest_t), KM_SLEEP);
1277         d->dq_flags = type;
1278         d->d_id = id;
1279         d->q_mount = mp;
1280         d->q_hash = h;
1281         xfs_qm_hashinsert(h, d);
1282         *O_dq = d;
1283         return (0);
1284 }
1285
1286 STATIC void
1287 xfs_qm_internalqcheck_get_dquots(
1288         xfs_mount_t     *mp,
1289         xfs_dqid_t      uid,
1290         xfs_dqid_t      gid,
1291         xfs_dqtest_t    **ud,
1292         xfs_dqtest_t    **gd)
1293 {
1294         if (XFS_IS_UQUOTA_ON(mp))
1295                 xfs_qm_internalqcheck_dqget(mp, uid, XFS_DQ_USER, ud);
1296         if (XFS_IS_GQUOTA_ON(mp))
1297                 xfs_qm_internalqcheck_dqget(mp, gid, XFS_DQ_GROUP, gd);
1298 }
1299
1300
1301 STATIC void
1302 xfs_qm_internalqcheck_dqadjust(
1303         xfs_inode_t             *ip,
1304         xfs_dqtest_t            *d)
1305 {
1306         d->d_icount++;
1307         d->d_bcount += (xfs_qcnt_t)ip->i_d.di_nblocks;
1308 }
1309
1310 STATIC int
1311 xfs_qm_internalqcheck_adjust(
1312         xfs_mount_t     *mp,            /* mount point for filesystem */
1313         xfs_ino_t       ino,            /* inode number to get data for */
1314         void            __user *buffer, /* not used */
1315         int             ubsize,         /* not used */
1316         void            *private_data,  /* not used */
1317         xfs_daddr_t     bno,            /* starting block of inode cluster */
1318         int             *ubused,        /* not used */
1319         void            *dip,           /* not used */
1320         int             *res)           /* bulkstat result code */
1321 {
1322         xfs_inode_t             *ip;
1323         xfs_dqtest_t            *ud, *gd;
1324         uint                    lock_flags;
1325         boolean_t               ipreleased;
1326         int                     error;
1327
1328         ASSERT(XFS_IS_QUOTA_RUNNING(mp));
1329
1330         if (ino == mp->m_sb.sb_uquotino || ino == mp->m_sb.sb_gquotino) {
1331                 *res = BULKSTAT_RV_NOTHING;
1332                 qdprintk("internalqcheck: ino=%llu, uqino=%llu, gqino=%llu\n",
1333                         (unsigned long long) ino,
1334                         (unsigned long long) mp->m_sb.sb_uquotino,
1335                         (unsigned long long) mp->m_sb.sb_gquotino);
1336                 return XFS_ERROR(EINVAL);
1337         }
1338         ipreleased = B_FALSE;
1339  again:
1340         lock_flags = XFS_ILOCK_SHARED;
1341         if ((error = xfs_iget(mp, NULL, ino, lock_flags, &ip, bno))) {
1342                 *res = BULKSTAT_RV_NOTHING;
1343                 return (error);
1344         }
1345
1346         if (ip->i_d.di_mode == 0) {
1347                 xfs_iput_new(ip, lock_flags);
1348                 *res = BULKSTAT_RV_NOTHING;
1349                 return XFS_ERROR(ENOENT);
1350         }
1351
1352         /*
1353          * This inode can have blocks after eof which can get released
1354          * when we send it to inactive. Since we don't check the dquot
1355          * until the after all our calculations are done, we must get rid
1356          * of those now.
1357          */
1358         if (! ipreleased) {
1359                 xfs_iput(ip, lock_flags);
1360                 ipreleased = B_TRUE;
1361                 goto again;
1362         }
1363         xfs_qm_internalqcheck_get_dquots(mp,
1364                                         (xfs_dqid_t) ip->i_d.di_uid,
1365                                         (xfs_dqid_t) ip->i_d.di_gid,
1366                                         &ud, &gd);
1367         if (XFS_IS_UQUOTA_ON(mp)) {
1368                 ASSERT(ud);
1369                 xfs_qm_internalqcheck_dqadjust(ip, ud);
1370         }
1371         if (XFS_IS_GQUOTA_ON(mp)) {
1372                 ASSERT(gd);
1373                 xfs_qm_internalqcheck_dqadjust(ip, gd);
1374         }
1375         xfs_iput(ip, lock_flags);
1376         *res = BULKSTAT_RV_DIDONE;
1377         return (0);
1378 }
1379
1380
1381 /* PRIVATE, debugging */
1382 int
1383 xfs_qm_internalqcheck(
1384         xfs_mount_t     *mp)
1385 {
1386         xfs_ino_t       lastino;
1387         int             done, count;
1388         int             i;
1389         xfs_dqtest_t    *d, *e;
1390         xfs_dqhash_t    *h1;
1391         int             error;
1392
1393         lastino = 0;
1394         qmtest_hashmask = 32;
1395         count = 5;
1396         done = 0;
1397         qmtest_nfails = 0;
1398
1399         if (! XFS_IS_QUOTA_ON(mp))
1400                 return XFS_ERROR(ESRCH);
1401
1402         xfs_log_force(mp, (xfs_lsn_t)0, XFS_LOG_FORCE | XFS_LOG_SYNC);
1403         XFS_bflush(mp->m_ddev_targp);
1404         xfs_log_force(mp, (xfs_lsn_t)0, XFS_LOG_FORCE | XFS_LOG_SYNC);
1405         XFS_bflush(mp->m_ddev_targp);
1406
1407         mutex_lock(&qcheck_lock, PINOD);
1408         /* There should be absolutely no quota activity while this
1409            is going on. */
1410         qmtest_udqtab = kmem_zalloc(qmtest_hashmask *
1411                                     sizeof(xfs_dqhash_t), KM_SLEEP);
1412         qmtest_gdqtab = kmem_zalloc(qmtest_hashmask *
1413                                     sizeof(xfs_dqhash_t), KM_SLEEP);
1414         do {
1415                 /*
1416                  * Iterate thru all the inodes in the file system,
1417                  * adjusting the corresponding dquot counters
1418                  */
1419                 if ((error = xfs_bulkstat(mp, &lastino, &count,
1420                                  xfs_qm_internalqcheck_adjust, NULL,
1421                                  0, NULL, BULKSTAT_FG_IGET, &done))) {
1422                         break;
1423                 }
1424         } while (! done);
1425         if (error) {
1426                 cmn_err(CE_DEBUG, "Bulkstat returned error 0x%x", error);
1427         }
1428         cmn_err(CE_DEBUG, "Checking results against system dquots");
1429         for (i = 0; i < qmtest_hashmask; i++) {
1430                 h1 = &qmtest_udqtab[i];
1431                 for (d = (xfs_dqtest_t *) h1->qh_next; d != NULL; ) {
1432                         xfs_dqtest_cmp(d);
1433                         e = (xfs_dqtest_t *) d->HL_NEXT;
1434                         kmem_free(d, sizeof(xfs_dqtest_t));
1435                         d = e;
1436                 }
1437                 h1 = &qmtest_gdqtab[i];
1438                 for (d = (xfs_dqtest_t *) h1->qh_next; d != NULL; ) {
1439                         xfs_dqtest_cmp(d);
1440                         e = (xfs_dqtest_t *) d->HL_NEXT;
1441                         kmem_free(d, sizeof(xfs_dqtest_t));
1442                         d = e;
1443                 }
1444         }
1445
1446         if (qmtest_nfails) {
1447                 cmn_err(CE_DEBUG, "******** quotacheck failed  ********");
1448                 cmn_err(CE_DEBUG, "failures = %d", qmtest_nfails);
1449         } else {
1450                 cmn_err(CE_DEBUG, "******** quotacheck successful! ********");
1451         }
1452         kmem_free(qmtest_udqtab, qmtest_hashmask * sizeof(xfs_dqhash_t));
1453         kmem_free(qmtest_gdqtab, qmtest_hashmask * sizeof(xfs_dqhash_t));
1454         mutex_unlock(&qcheck_lock);
1455         return (qmtest_nfails);
1456 }
1457
1458 #endif /* DEBUG */