4.4BSD snapshot (revision 8.1); add 1993 to copyright
[unix-history] / usr / src / sys / ufs / ffs / ffs_vfsops.c
index 6e2ef17..55530ef 100644 (file)
 /*
 /*
- * Copyright (c) 1989 The Regents of the University of California.
- * All rights reserved.
+ * Copyright (c) 1989, 1991, 1993
+ *     The Regents of the University of California.  All rights reserved.
  *
  *
- * Redistribution and use in source and binary forms are permitted
- * provided that the above copyright notice and this paragraph are
- * duplicated in all such forms and that any documentation,
- * advertising materials, and other materials related to such
- * distribution and use acknowledge that the software was developed
- * by the University of California, Berkeley.  The name of the
- * University may not be used to endorse or promote products derived
- * from this software without specific prior written permission.
- * THIS SOFTWARE IS PROVIDED ``AS IS'' AND WITHOUT ANY EXPRESS OR
- * IMPLIED WARRANTIES, INCLUDING, WITHOUT LIMITATION, THE IMPLIED
- * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE.
+ * %sccs.include.redist.c%
  *
  *
- *     @(#)ffs_vfsops.c        7.13 (Berkeley) %G%
+ *     @(#)ffs_vfsops.c        8.1 (Berkeley) %G%
  */
 
  */
 
-
-#include "param.h"
-#include "systm.h"
-#include "time.h"
-#include "kernel.h"
-#include "namei.h"
-#include "vnode.h"
-#include "mount.h"
-#include "buf.h"
-#include "file.h"
-#include "disklabel.h"
-#include "ioctl.h"
-#include "errno.h"
-#include "malloc.h"
-#include "../ufs/fs.h"
-#include "../ufs/ufsmount.h"
-#include "../ufs/inode.h"
+#include <sys/param.h>
+#include <sys/systm.h>
+#include <sys/namei.h>
+#include <sys/proc.h>
+#include <sys/kernel.h>
+#include <sys/vnode.h>
+#include <sys/socket.h>
+#include <sys/mount.h>
+#include <sys/buf.h>
+#include <sys/mbuf.h>
+#include <sys/file.h>
+#include <sys/disklabel.h>
+#include <sys/ioctl.h>
+#include <sys/errno.h>
+#include <sys/malloc.h>
+
+#include <miscfs/specfs/specdev.h>
 #include "ioctl.h"
 #include "disklabel.h"
 #include "stat.h"
 
 #include "ioctl.h"
 #include "disklabel.h"
 #include "stat.h"
 
-/*
- * ufs vfs operations.
- */
-int ufs_mount();
-int ufs_unmount();
-int ufs_root();
-int ufs_statfs();
-int ufs_sync();
-int ufs_fhtovp();
-int ufs_vptofh();
+#include <ufs/ufs/quota.h>
+#include <ufs/ufs/ufsmount.h>
+#include <ufs/ufs/inode.h>
+#include <ufs/ufs/ufs_extern.h>
+
+#include <ufs/ffs/fs.h>
+#include <ufs/ffs/ffs_extern.h>
+
+int ffs_sbupdate __P((struct ufsmount *, int));
 
 struct vfsops ufs_vfsops = {
 
 struct vfsops ufs_vfsops = {
-       ufs_mount,
-       ufs_unmount,
-       ufs_root,
-       ufs_statfs,
-       ufs_sync,
-       ufs_fhtovp,
-       ufs_vptofh
+       ffs_mount,
+       ufs_start,
+       ffs_unmount,
+       ffs_root,
+       ufs_quotactl,
+       ffs_statfs,
+       ffs_sync,
+       ffs_vget,
+       ffs_fhtovp,
+       ffs_vptofh,
+       ffs_init,
 };
 
 };
 
-/*
- * ufs mount table.
- */
-struct ufsmount mounttab[NMOUNT];
+extern u_long nextgennumber;
 
 /*
 
 /*
- * Called by vfs_mountroot when ufs is going to be mounted as root
+ * Called by main() when ufs is going to be mounted as root.
  *
  *
- * XXX - Need to have a way of figuring the name of the root device
+ * Name is updated by mount(8) after booting.
  */
  */
-#define ROOTNAME       "root device"
+#define ROOTNAME       "root_device"
 
 
-ufs_mountroot()
+ffs_mountroot()
 {
 {
-       register struct mount *mp;
        extern struct vnode *rootvp;
        extern struct vnode *rootvp;
-       struct ufsmount *ump;
        register struct fs *fs;
        register struct fs *fs;
+       register struct mount *mp;
+       struct proc *p = curproc;       /* XXX */
+       struct ufsmount *ump;
        u_int size;
        int error;
        u_int size;
        int error;
-
-       mp = (struct mount *)malloc((u_long)sizeof(struct mount),
-               M_MOUNT, M_WAITOK);
-       mp->m_op = &ufs_vfsops;
-       mp->m_flag = 0;
-       mp->m_exroot = 0;
-       error = mountfs(rootvp, mp);
-       if (error) {
-               free((caddr_t)mp, M_MOUNT);
+       
+       /*
+        * Get vnodes for swapdev and rootdev.
+        */
+       if (bdevvp(swapdev, &swapdev_vp) || bdevvp(rootdev, &rootvp))
+               panic("ffs_mountroot: can't setup bdevvp's");
+
+       mp = malloc((u_long)sizeof(struct mount), M_MOUNT, M_WAITOK);
+       bzero((char *)mp, (u_long)sizeof(struct mount));
+       mp->mnt_op = &ufs_vfsops;
+       mp->mnt_flag = MNT_RDONLY;
+       if (error = ffs_mountfs(rootvp, mp, p)) {
+               free(mp, M_MOUNT);
                return (error);
        }
                return (error);
        }
-       error = vfs_add((struct vnode *)0, mp, 0);
-       if (error) {
-               (void)ufs_unmount(mp, 0);
-               free((caddr_t)mp, M_MOUNT);
+       if (error = vfs_lock(mp)) {
+               (void)ffs_unmount(mp, 0, p);
+               free(mp, M_MOUNT);
                return (error);
        }
                return (error);
        }
+       rootfs = mp;
+       mp->mnt_next = mp;
+       mp->mnt_prev = mp;
+       mp->mnt_vnodecovered = NULLVP;
        ump = VFSTOUFS(mp);
        fs = ump->um_fs;
        ump = VFSTOUFS(mp);
        fs = ump->um_fs;
+       bzero(fs->fs_fsmnt, sizeof(fs->fs_fsmnt));
        fs->fs_fsmnt[0] = '/';
        fs->fs_fsmnt[0] = '/';
-       bzero(fs->fs_fsmnt + 1, sizeof(fs->fs_fsmnt) - 1);
-       (void) copystr(ROOTNAME, ump->um_mntname, MNAMELEN - 1, &size);
-       bzero(ump->um_mntname + size, MNAMELEN - size);
+       bcopy((caddr_t)fs->fs_fsmnt, (caddr_t)mp->mnt_stat.f_mntonname,
+           MNAMELEN);
+       (void) copystr(ROOTNAME, mp->mnt_stat.f_mntfromname, MNAMELEN - 1,
+           &size);
+       bzero(mp->mnt_stat.f_mntfromname + size, MNAMELEN - size);
+       (void)ffs_statfs(mp, &mp->mnt_stat, p);
        vfs_unlock(mp);
        inittodr(fs->fs_time);
        return (0);
        vfs_unlock(mp);
        inittodr(fs->fs_time);
        return (0);
@@ -112,24 +114,88 @@ ufs_mountroot()
  *
  * mount system call
  */
  *
  * mount system call
  */
-ufs_mount(mp, path, data, ndp)
-       struct mount *mp;
+int
+ffs_mount(mp, path, data, ndp, p)
+       register struct mount *mp;
        char *path;
        caddr_t data;
        struct nameidata *ndp;
        char *path;
        caddr_t data;
        struct nameidata *ndp;
+       struct proc *p;
 {
        struct vnode *devvp;
        struct ufs_args args;
        struct ufsmount *ump;
        register struct fs *fs;
        u_int size;
 {
        struct vnode *devvp;
        struct ufs_args args;
        struct ufsmount *ump;
        register struct fs *fs;
        u_int size;
-       int error;
+       int error, flags;
 
        if (error = copyin(data, (caddr_t)&args, sizeof (struct ufs_args)))
                return (error);
 
        if (error = copyin(data, (caddr_t)&args, sizeof (struct ufs_args)))
                return (error);
-       if ((error = getmdev(&devvp, args.fspec, ndp)) != 0)
+       /*
+        * If updating, check whether changing from read-only to
+        * read/write; if there is no device name, that's all we do.
+        */
+       if (mp->mnt_flag & MNT_UPDATE) {
+               ump = VFSTOUFS(mp);
+               fs = ump->um_fs;
+               error = 0;
+               if (fs->fs_ronly == 0 && (mp->mnt_flag & MNT_RDONLY)) {
+                       flags = WRITECLOSE;
+                       if (mp->mnt_flag & MNT_FORCE)
+                               flags |= FORCECLOSE;
+                       if (vfs_busy(mp))
+                               return (EBUSY);
+                       error = ffs_flushfiles(mp, flags, p);
+                       vfs_unbusy(mp);
+               }
+               if (!error && (mp->mnt_flag & MNT_RELOAD))
+                       error = ffs_reload(mp, ndp->ni_cnd.cn_cred, p);
+               if (error)
+                       return (error);
+               if (fs->fs_ronly && (mp->mnt_flag & MNT_WANTRDWR))
+                       fs->fs_ronly = 0;
+               if (args.fspec == 0) {
+                       /*
+                        * Process export requests.
+                        */
+                       if (args.exflags & MNT_EXPORTED) {
+                               if (error = ufs_hang_addrlist(mp, &args))
+                                       return (error);
+                               mp->mnt_flag |= MNT_EXPORTED;
+                       }
+                       if (args.exflags & MNT_DELEXPORT) {
+                               ufs_free_addrlist(ump);
+                               mp->mnt_flag &=
+                                   ~(MNT_EXPORTED | MNT_DEFEXPORTED);
+                       }
+                       return (0);
+               }
+       }
+       /*
+        * Not an update, or updating the name: look up the name
+        * and verify that it refers to a sensible block device.
+        */
+       NDINIT(ndp, LOOKUP, FOLLOW, UIO_USERSPACE, args.fspec, p);
+       if (error = namei(ndp))
                return (error);
                return (error);
-       error = mountfs(devvp, mp);
+       devvp = ndp->ni_vp;
+
+       if (devvp->v_type != VBLK) {
+               vrele(devvp);
+               return (ENOTBLK);
+       }
+       if (major(devvp->v_rdev) >= nblkdev) {
+               vrele(devvp);
+               return (ENXIO);
+       }
+       if ((mp->mnt_flag & MNT_UPDATE) == 0)
+               error = ffs_mountfs(devvp, mp, p);
+       else {
+               if (devvp != ump->um_devvp)
+                       error = EINVAL; /* needs translation */
+               else
+                       vrele(devvp);
+       }
        if (error) {
                vrele(devvp);
                return (error);
        if (error) {
                vrele(devvp);
                return (error);
@@ -138,21 +204,132 @@ ufs_mount(mp, path, data, ndp)
        fs = ump->um_fs;
        (void) copyinstr(path, fs->fs_fsmnt, sizeof(fs->fs_fsmnt) - 1, &size);
        bzero(fs->fs_fsmnt + size, sizeof(fs->fs_fsmnt) - size);
        fs = ump->um_fs;
        (void) copyinstr(path, fs->fs_fsmnt, sizeof(fs->fs_fsmnt) - 1, &size);
        bzero(fs->fs_fsmnt + size, sizeof(fs->fs_fsmnt) - size);
-       (void) copyinstr(args.fspec, ump->um_mntname, MNAMELEN - 1, &size);
-       bzero(ump->um_mntname + size, MNAMELEN - size);
+       bcopy((caddr_t)fs->fs_fsmnt, (caddr_t)mp->mnt_stat.f_mntonname,
+           MNAMELEN);
+       (void) copyinstr(args.fspec, mp->mnt_stat.f_mntfromname, MNAMELEN - 1, 
+           &size);
+       bzero(mp->mnt_stat.f_mntfromname + size, MNAMELEN - size);
+       (void)ffs_statfs(mp, &mp->mnt_stat, p);
+       return (0);
+}
+
+/*
+ * Reload all incore data for a filesystem (used after running fsck on
+ * the root filesystem and finding things to fix). The filesystem must
+ * be mounted read-only.
+ *
+ * Things to do to update the mount:
+ *     1) invalidate all cached meta-data.
+ *     2) re-read superblock from disk.
+ *     3) re-read summary information from disk.
+ *     4) invalidate all inactive vnodes.
+ *     5) invalidate all cached file data.
+ *     6) re-read inode data for all active vnodes.
+ */
+ffs_reload(mountp, cred, p)
+       register struct mount *mountp;
+       struct ucred *cred;
+       struct proc *p;
+{
+       register struct vnode *vp, *nvp, *devvp;
+       struct inode *ip;
+       struct dinode *dp;
+       struct csum *space;
+       struct buf *bp;
+       struct fs *fs;
+       int i, blks, size, error;
+
+       if ((mountp->mnt_flag & MNT_RDONLY) == 0)
+               return (EINVAL);
+       /*
+        * Step 1: invalidate all cached meta-data.
+        */
+       devvp = VFSTOUFS(mountp)->um_devvp;
+       if (vinvalbuf(devvp, 0, cred, p, 0, 0))
+               panic("ffs_reload: dirty1");
+       /*
+        * Step 2: re-read superblock from disk.
+        */
+       if (error = bread(devvp, SBLOCK, SBSIZE, NOCRED, &bp))
+               return (error);
+       fs = bp->b_un.b_fs;
+       if (fs->fs_magic != FS_MAGIC || fs->fs_bsize > MAXBSIZE ||
+           fs->fs_bsize < sizeof(struct fs)) {
+               brelse(bp);
+               return (EIO);           /* XXX needs translation */
+       }
+       fs = VFSTOUFS(mountp)->um_fs;
+       bcopy((caddr_t)&fs->fs_csp[0], (caddr_t)&bp->b_un.b_fs->fs_csp[0],
+           sizeof(fs->fs_csp));
+       bcopy((caddr_t)bp->b_un.b_addr, (caddr_t)fs, (u_int)fs->fs_sbsize);
+       if (fs->fs_sbsize < SBSIZE)
+               bp->b_flags |= B_INVAL;
+       brelse(bp);
+       ffs_oldfscompat(fs);
+       /*
+        * Step 3: re-read summary information from disk.
+        */
+       blks = howmany(fs->fs_cssize, fs->fs_fsize);
+       space = fs->fs_csp[0];
+       for (i = 0; i < blks; i += fs->fs_frag) {
+               size = fs->fs_bsize;
+               if (i + fs->fs_frag > blks)
+                       size = (blks - i) * fs->fs_fsize;
+               if (error = bread(devvp, fsbtodb(fs, fs->fs_csaddr + i), size,
+                   NOCRED, &bp))
+                       return (error);
+               bcopy((caddr_t)bp->b_un.b_addr, fs->fs_csp[fragstoblks(fs, i)],
+                   (u_int)size);
+               brelse(bp);
+       }
+loop:
+       for (vp = mountp->mnt_mounth; vp; vp = nvp) {
+               nvp = vp->v_mountf;
+               /*
+                * Step 4: invalidate all inactive vnodes.
+                */
+               if (vp->v_usecount == 0) {
+                       vgone(vp);
+                       continue;
+               }
+               /*
+                * Step 5: invalidate all cached file data.
+                */
+               if (vget(vp))
+                       goto loop;
+               if (vinvalbuf(vp, 0, cred, p, 0, 0))
+                       panic("ffs_reload: dirty2");
+               /*
+                * Step 6: re-read inode data for all active vnodes.
+                */
+               ip = VTOI(vp);
+               if (error = bread(devvp, fsbtodb(fs, itod(fs, ip->i_number)),
+                   (int)fs->fs_bsize, NOCRED, &bp)) {
+                       vput(vp);
+                       return (error);
+               }
+               dp = bp->b_un.b_dino;
+               dp += itoo(fs, ip->i_number);
+               ip->i_din = *dp;
+               brelse(bp);
+               vput(vp);
+               if (vp->v_mount != mountp)
+                       goto loop;
+       }
        return (0);
 }
 
 /*
  * Common code for mount and mountroot
  */
        return (0);
 }
 
 /*
  * Common code for mount and mountroot
  */
-mountfs(devvp, mp)
-       struct vnode *devvp;
+int
+ffs_mountfs(devvp, mp, p)
+       register struct vnode *devvp;
        struct mount *mp;
        struct mount *mp;
+       struct proc *p;
 {
        register struct ufsmount *ump;
 {
        register struct ufsmount *ump;
-       struct ufsmount *fmp = NULL;
-       struct buf *bp = NULL;
+       struct buf *bp;
        register struct fs *fs;
        dev_t dev = devvp->v_rdev;
        struct partinfo dpart;
        register struct fs *fs;
        dev_t dev = devvp->v_rdev;
        struct partinfo dpart;
@@ -160,44 +337,34 @@ mountfs(devvp, mp)
        caddr_t base, space;
        int havepart = 0, blks;
        int error, i, size;
        caddr_t base, space;
        int havepart = 0, blks;
        int error, i, size;
-       int needclose = 0;
-       int ronly = (mp->m_flag & M_RDONLY) != 0;
-
-       for (ump = &mounttab[0]; ump < &mounttab[NMOUNT]; ump++) {
-               if (ump->um_fs == NULL) {
-                       if (fmp == NULL)
-                               fmp = ump;
-               } else if (dev == ump->um_dev) {
-                       return (EBUSY);         /* needs translation */
-               }
-       }
-           (*bdevsw[major(dev)].d_open)(dev, ronly ? FREAD : FREAD|FWRITE,
-               S_IFBLK);
-       if (error) {
-               ump->um_fs = NULL;
+       int ronly;
+       extern struct vnode *rootvp;
+
+       if (error = VOP_OPEN(devvp, ronly ? FREAD : FREAD|FWRITE, FSCRED, p))
                return (error);
                return (error);
-       }
-       needclose = 1;
-       if (VOP_IOCTL(devvp, DIOCGPART, (caddr_t)&dpart, FREAD,
-           (struct ucred *)0) != 0)
+       if (VOP_IOCTL(devvp, DIOCGPART, (caddr_t)&dpart, FREAD, NOCRED, p) != 0)
                size = DEV_BSIZE;
        else {
                havepart = 1;
                size = dpart.disklab->d_secsize;
        }
                size = DEV_BSIZE;
        else {
                havepart = 1;
                size = dpart.disklab->d_secsize;
        }
-       if (error = bread(devvp, SBLOCK, SBSIZE, &bp)) {
-               ump->um_fs = NULL;
+
+       bp = NULL;
+       ump = NULL;
+       if (error = bread(devvp, SBLOCK, SBSIZE, NOCRED, &bp))
                goto out;
                goto out;
-       }
        fs = bp->b_un.b_fs;
        fs = bp->b_un.b_fs;
-               ump->um_fs = NULL;
-               error = EINVAL;         /* XXX also needs translation */
+               error = EINVAL;         /* XXX needs translation */
                goto out;
        }
                goto out;
        }
-       ump->um_fs = (struct fs *)malloc((u_long)fs->fs_sbsize, M_SUPERBLK,
+       ump = malloc(sizeof *ump, M_UFSMNT, M_WAITOK);
+       bzero((caddr_t)ump, sizeof *ump);
+       ump->um_fs = malloc((u_long)fs->fs_sbsize, M_UFSMNT,
            M_WAITOK);
        bcopy((caddr_t)bp->b_un.b_addr, (caddr_t)ump->um_fs,
           (u_int)fs->fs_sbsize);
            M_WAITOK);
        bcopy((caddr_t)bp->b_un.b_addr, (caddr_t)ump->um_fs,
           (u_int)fs->fs_sbsize);
+       if (fs->fs_sbsize < SBSIZE)
+               bp->b_flags |= B_INVAL;
        brelse(bp);
        bp = NULL;
        fs = ump->um_fs;
        brelse(bp);
        bp = NULL;
        fs = ump->um_fs;
@@ -236,7 +403,7 @@ mountfs(devvp, mp)
                fs->fs_dbsize = size;
        }
        blks = howmany(fs->fs_cssize, fs->fs_fsize);
                fs->fs_dbsize = size;
        }
        blks = howmany(fs->fs_cssize, fs->fs_fsize);
-       base = space = (caddr_t)malloc((u_long)fs->fs_cssize, M_SUPERBLK,
+       base = space = malloc((u_long)fs->fs_cssize, M_UFSMNT,
            M_WAITOK);
        for (i = 0; i < blks; i += fs->fs_frag) {
                size = fs->fs_bsize;
            M_WAITOK);
        for (i = 0; i < blks; i += fs->fs_frag) {
                size = fs->fs_bsize;
@@ -246,9 +413,10 @@ mountfs(devvp, mp)
                tp = bread(dev, fsbtodb(fs, fs->fs_csaddr + i), size,
                    fs->fs_dbsize);
 #else SECSIZE
                tp = bread(dev, fsbtodb(fs, fs->fs_csaddr + i), size,
                    fs->fs_dbsize);
 #else SECSIZE
-               error = bread(devvp, fsbtodb(fs, fs->fs_csaddr + i), size, &bp);
+               error = bread(devvp, fsbtodb(fs, fs->fs_csaddr + i), size,
+                       NOCRED, &bp);
                if (error) {
                if (error) {
-                       free((caddr_t)base, M_SUPERBLK);
+                       free(base, M_UFSMNT);
                        goto out;
                }
                bcopy((caddr_t)bp->b_un.b_addr, space, (u_int)size);
                        goto out;
                }
                bcopy((caddr_t)bp->b_un.b_addr, space, (u_int)size);
@@ -257,100 +425,137 @@ mountfs(devvp, mp)
                brelse(bp);
                bp = NULL;
        }
                brelse(bp);
                bp = NULL;
        }
-       mp->m_data = (qaddr_t)ump;
-       mp->m_bsize = fs->fs_bsize;
-       mp->m_fsize = fs->fs_fsize;
-       mp->m_fsid.val[0] = (long)dev;
-       mp->m_fsid.val[1] = MOUNT_UFS;
+       mp->mnt_data = (qaddr_t)ump;
+       mp->mnt_stat.f_fsid.val[0] = (long)dev;
+       mp->mnt_stat.f_fsid.val[1] = MOUNT_UFS;
+       mp->mnt_maxsymlinklen = fs->fs_maxsymlinklen;
+       mp->mnt_flag |= MNT_LOCAL;
        ump->um_mountp = mp;
        ump->um_dev = dev;
        ump->um_devvp = devvp;
        ump->um_mountp = mp;
        ump->um_dev = dev;
        ump->um_devvp = devvp;
-       ump->um_qinod = NULL;
-
-       /* Sanity checks for old file systems.                     XXX */
-       fs->fs_npsect = MAX(fs->fs_npsect, fs->fs_nsect);       /* XXX */
-       fs->fs_interleave = MAX(fs->fs_interleave, 1);          /* XXX */
-       if (fs->fs_postblformat == FS_42POSTBLFMT)              /* XXX */
-               fs->fs_nrpos = 8;                               /* XXX */
-
+       ump->um_nindir = fs->fs_nindir;
+       ump->um_bptrtodb = fs->fs_fsbtodb;
+       ump->um_seqinc = fs->fs_frag;
+       for (i = 0; i < MAXQUOTAS; i++)
+               ump->um_quotas[i] = NULLVP;
+       devvp->v_specflags |= SI_MOUNTEDON;
+       ffs_oldfscompat(fs);
        return (0);
 out:
        return (0);
 out:
-       if (needclose)
-               (void) VOP_CLOSE(devvp, ronly ? FREAD : FREAD|FWRITE,
-                       (struct ucred *)0);
-       if (ump->um_fs) {
-               free((caddr_t)ump->um_fs, M_SUPERBLK);
-               ump->um_fs = NULL;
-       }
        if (bp)
                brelse(bp);
        if (bp)
                brelse(bp);
+       (void)VOP_CLOSE(devvp, ronly ? FREAD : FREAD|FWRITE, NOCRED, p);
+       if (ump) {
+               free(ump->um_fs, M_UFSMNT);
+               free(ump, M_UFSMNT);
+               mp->mnt_data = (qaddr_t)0;
+       }
        return (error);
 }
 
        return (error);
 }
 
+/*
+ * Sanity checks for old file systems.
+ *
+ * XXX - goes away some day.
+ */
+ffs_oldfscompat(fs)
+       struct fs *fs;
+{
+       int i;
+
+       fs->fs_npsect = max(fs->fs_npsect, fs->fs_nsect);       /* XXX */
+       fs->fs_interleave = max(fs->fs_interleave, 1);          /* XXX */
+       if (fs->fs_postblformat == FS_42POSTBLFMT)              /* XXX */
+               fs->fs_nrpos = 8;                               /* XXX */
+       if (fs->fs_inodefmt < FS_44INODEFMT) {                  /* XXX */
+               quad_t sizepb = fs->fs_bsize;                   /* XXX */
+                                                               /* XXX */
+               fs->fs_maxfilesize = fs->fs_bsize * NDADDR - 1; /* XXX */
+               for (i = 0; i < NIADDR; i++) {                  /* XXX */
+                       sizepb *= NINDIR(fs);                   /* XXX */
+                       fs->fs_maxfilesize += sizepb;           /* XXX */
+               }                                               /* XXX */
+               fs->fs_qbmask = ~fs->fs_bmask;                  /* XXX */
+               fs->fs_qfmask = ~fs->fs_fmask;                  /* XXX */
+       }                                                       /* XXX */
+
+       return (0);
+}
 
 /*
  * unmount system call
  */
 
 /*
  * unmount system call
  */
-ufs_unmount(mp, flags)
+int
+ffs_unmount(mp, mntflags, p)
        struct mount *mp;
        struct mount *mp;
-       int flags;
+       int mntflags;
+       struct proc *p;
 {
        register struct ufsmount *ump;
        register struct fs *fs;
 {
        register struct ufsmount *ump;
        register struct fs *fs;
-       dev_t dev;
-       int error, ronly;
+       int error, flags, ronly;
 
 
-       if (flags & MNT_FORCE)
-               return (EINVAL);
-       ump = VFSTOUFS(mp);
-       dev = ump->um_dev;
-#ifdef QUOTA
-       if ((error = iflush(dev, mp->m_qinod)) && !forcibly)
-#else
-       if ((error = iflush(dev)) && !forcibly)
-#endif
+       flags = 0;
+       if (mntflags & MNT_FORCE) {
+               if (mp == rootfs)
+                       return (EINVAL);
+               flags |= FORCECLOSE;
+       }
+       if (error = ffs_flushfiles(mp, flags, p))
                return (error);
                return (error);
-#ifdef QUOTA
-       (void)closedq(ump);
-       /*
-        * Here we have to iflush again to get rid of the quota inode.
-        * A drag, but it would be ugly to cheat, & this doesn't happen often.
-        */
-       (void)iflush(dev, (struct inode *)NULL);
-#endif
+       ump = VFSTOUFS(mp);
        fs = ump->um_fs;
        ronly = !fs->fs_ronly;
        fs = ump->um_fs;
        ronly = !fs->fs_ronly;
-       free((caddr_t)fs->fs_csp[0], M_SUPERBLK);
-       error = closei(dev, IFBLK, fs->fs_ronly? FREAD : FREAD|FWRITE);
-       irele(ip);
+       ump->um_devvp->v_specflags &= ~SI_MOUNTEDON;
+       error = VOP_CLOSE(ump->um_devvp, ronly ? FREAD : FREAD|FWRITE,
+               NOCRED, p);
+       vrele(ump->um_devvp);
+       free(fs->fs_csp[0], M_UFSMNT);
+       free(fs, M_UFSMNT);
+       free(ump, M_UFSMNT);
+       mp->mnt_data = (qaddr_t)0;
+       mp->mnt_flag &= ~MNT_LOCAL;
        return (error);
 }
 
 /*
        return (error);
 }
 
 /*
- * Return root of a filesystem
+ * Flush out all the files in a filesystem.
  */
  */
-ufs_root(mp, vpp)
-       struct mount *mp;
-       struct vnode **vpp;
+ffs_flushfiles(mp, flags, p)
+       register struct mount *mp;
+       int flags;
+       struct proc *p;
 {
 {
-       struct inode tip, *ip;
-       int error;
+       extern int doforce;
+       register struct ufsmount *ump;
+       int i, error;
 
 
-       tip.i_dev = VFSTOUFS(mp)->um_dev;
-       tip.i_vnode.v_mount = mp;
-       error = iget(&tip, (ino_t)ROOTINO, &ip);
-       if (error)
+       if (!doforce)
+               flags &= ~FORCECLOSE;
+       ump = VFSTOUFS(mp);
                return (error);
                return (error);
-       *vpp = ITOV(ip);
-       return (0);
-}
-
-/*
+#ifdef QUOTA
+       if (mp->mnt_flag & MNT_QUOTA) {
+               if (error = vflush(mp, NULLVP, SKIPSYSTEM|flags))
+                       return (error);
+               for (i = 0; i < MAXQUOTAS; i++) {
+                       if (ump->um_quotas[i] == NULLVP)
+                               continue;
+                       quotaoff(p, mp, i);
+               }
+               /*
+                * Here we fall through to vflush again to ensure
+                * that we have gotten rid of all the system vnodes.
+                */
+       }
+#endif
  * Get file system statistics.
  */
  * Get file system statistics.
  */
-ufs_statfs(mp, sbp)
+int
+ffs_statfs(mp, sbp, p)
        struct mount *mp;
        register struct statfs *sbp;
        struct mount *mp;
        register struct statfs *sbp;
+       struct proc *p;
 {
        register struct ufsmount *ump;
        register struct fs *fs;
 {
        register struct ufsmount *ump;
        register struct fs *fs;
@@ -358,52 +563,47 @@ ufs_statfs(mp, sbp)
        ump = VFSTOUFS(mp);
        fs = ump->um_fs;
        if (fs->fs_magic != FS_MAGIC)
        ump = VFSTOUFS(mp);
        fs = ump->um_fs;
        if (fs->fs_magic != FS_MAGIC)
-               panic("ufs_statfs");
+               panic("ffs_statfs");
        sbp->f_type = MOUNT_UFS;
        sbp->f_type = MOUNT_UFS;
-       sbp->f_flags = mp->m_flag &~ (M_MLOCK|M_MWAIT);
-       sbp->f_fsize = fs->fs_fsize;
-       sbp->f_bsize = fs->fs_bsize;
+       sbp->f_bsize = fs->fs_fsize;
+       sbp->f_iosize = fs->fs_bsize;
        sbp->f_blocks = fs->fs_dsize;
        sbp->f_bfree = fs->fs_cstotal.cs_nbfree * fs->fs_frag +
                fs->fs_cstotal.cs_nffree;
        sbp->f_bavail = (fs->fs_dsize * (100 - fs->fs_minfree) / 100) -
                (fs->fs_dsize - sbp->f_bfree);
        sbp->f_blocks = fs->fs_dsize;
        sbp->f_bfree = fs->fs_cstotal.cs_nbfree * fs->fs_frag +
                fs->fs_cstotal.cs_nffree;
        sbp->f_bavail = (fs->fs_dsize * (100 - fs->fs_minfree) / 100) -
                (fs->fs_dsize - sbp->f_bfree);
-       if (sbp->f_bavail < 0)
-               sbp->f_bavail = 0;
-       sbp->f_files =  fs->fs_ncg * fs->fs_ipg;
+       sbp->f_files =  fs->fs_ncg * fs->fs_ipg - ROOTINO;
        sbp->f_ffree = fs->fs_cstotal.cs_nifree;
        sbp->f_ffree = fs->fs_cstotal.cs_nifree;
-       sbp->f_fsid = mp->m_fsid;
-       bcopy((caddr_t)fs->fs_fsmnt, (caddr_t)&sbp->f_mntonname[0], MNAMELEN);
-       bcopy((caddr_t)ump->um_mntname, (caddr_t)&sbp->f_mntfromname[0],
-               MNAMELEN);
+       if (sbp != &mp->mnt_stat) {
+               bcopy((caddr_t)mp->mnt_stat.f_mntonname,
+                       (caddr_t)&sbp->f_mntonname[0], MNAMELEN);
+               bcopy((caddr_t)mp->mnt_stat.f_mntfromname,
+                       (caddr_t)&sbp->f_mntfromname[0], MNAMELEN);
+       }
        return (0);
 }
 
        return (0);
 }
 
-int    syncprt = 0;
-
 /*
  * Go through the disk queues to initiate sandbagged IO;
  * go through the inodes to write those that have been modified;
  * initiate the writing of the super block if it has been modified.
 /*
  * Go through the disk queues to initiate sandbagged IO;
  * go through the inodes to write those that have been modified;
  * initiate the writing of the super block if it has been modified.
+ *
+ * Note: we are always called with the filesystem marked `MPBUSY'.
  */
  */
-ufs_sync(mp, waitfor)
+int
+ffs_sync(mp, waitfor, cred, p)
        struct mount *mp;
        int waitfor;
        struct mount *mp;
        int waitfor;
+       struct ucred *cred;
+       struct proc *p;
 {
 {
+       register struct vnode *vp;
        register struct inode *ip;
        register struct ufsmount *ump = VFSTOUFS(mp);
        register struct fs *fs;
        register struct inode *ip;
        register struct ufsmount *ump = VFSTOUFS(mp);
        register struct fs *fs;
-       int error = 0;
-       static int updlock = 0;
+       int error, allerror = 0;
 
 
-       if (syncprt)
-               bufstats();
-       if (updlock)
-               return (EBUSY);
        fs = ump->um_fs;
        fs = ump->um_fs;
-       if (fs == (struct fs *)1)
-               return (0);
-       updlock++;
        /*
         * Write back modified superblock.
         * Consistency check that the superblock
        /*
         * Write back modified superblock.
         * Consistency check that the superblock
@@ -416,33 +616,206 @@ ufs_sync(mp, waitfor)
                }
                fs->fs_fmod = 0;
                fs->fs_time = time.tv_sec;
                }
                fs->fs_fmod = 0;
                fs->fs_time = time.tv_sec;
-               error = sbupdate(ump, waitfor);
+               allerror = ffs_sbupdate(ump, waitfor);
        }
        /*
         * Write back each (modified) inode.
         */
        }
        /*
         * Write back each (modified) inode.
         */
-       for (ip = inode; ip < inodeNINODE; ip++) {
-               if (ip->i_devvp != ump->um_devvp ||
-                   (ip->i_flag & ILOCKED) != 0 || ITOV(ip)->v_count == 0 ||
-                   (ip->i_flag & (IMOD|IACC|IUPD|ICHG)) == 0)
+loop:
+       for (vp = mp->mnt_mounth; vp; vp = vp->v_mountf) {
+               /*
+                * If the vnode that we are about to sync is no longer
+                * associated with this mount point, start over.
+                */
+               if (vp->v_mount != mp)
+                       goto loop;
+               if (VOP_ISLOCKED(vp))
+                       continue;
+               ip = VTOI(vp);
+               if ((ip->i_flag & (IMOD|IACC|IUPD|ICHG)) == 0 &&
+                   vp->v_dirtyblkhd.le_next == NULL)
                        continue;
                        continue;
-               ip->i_flag |= ILOCKED;
-               ITOV(ip)->v_count++;
-               error = iupdat(ip, &time, &time, waitfor == MNT_WAIT);
-               iput(ip);
+               if (vget(vp))
+                       goto loop;
+               if (error = VOP_FSYNC(vp, cred, waitfor, p))
+                       allerror = error;
+               vput(vp);
        }
        }
-       updlock = 0;
        /*
        /*
-        * Force stale buffer cache information to be flushed.
+        * Force stale file system control information to be flushed.
         */
         */
-       bflush(ump->um_devvp->v_rdev);
-       return (error);
+       if (error = VOP_FSYNC(ump->um_devvp, cred, waitfor, p))
+               allerror = error;
+#ifdef QUOTA
+       qsync(mp);
+#endif
+       return (allerror);
+}
+
+/*
+ * Look up a FFS dinode number to find its incore vnode.
+ * If it is not in core, read it in from the specified device.
+ * If it is in core, wait for the lock bit to clear, then
+ * return the inode locked. Detection and handling of mount
+ * points must be done by the calling routine.
+ */
+int
+ffs_vget(mp, ino, vpp)
+       struct mount *mp;
+       ino_t ino;
+       struct vnode **vpp;
+{
+       register struct fs *fs;
+       register struct inode *ip;
+       struct ufsmount *ump;
+       struct buf *bp;
+       struct dinode *dp;
+       struct vnode *vp;
+       union ihead *ih;
+       dev_t dev;
+       int i, type, error;
+
+       ump = VFSTOUFS(mp);
+       dev = ump->um_dev;
+       if ((*vpp = ufs_ihashget(dev, ino)) != NULL)
+               return (0);
+
+       /* Allocate a new vnode/inode. */
+       if (error = getnewvnode(VT_UFS, mp, ffs_vnodeop_p, &vp)) {
+               *vpp = NULL;
+               return (error);
+       }
+       type = ump->um_devvp->v_tag == VT_MFS ? M_MFSNODE : M_FFSNODE; /* XXX */
+       MALLOC(ip, struct inode *, sizeof(struct inode), type, M_WAITOK);
+       bzero((caddr_t)ip, sizeof(struct inode));
+       vp->v_data = ip;
+       ip->i_vnode = vp;
+       ip->i_fs = fs = ump->um_fs;
+       ip->i_dev = dev;
+       ip->i_number = ino;
+#ifdef QUOTA
+       for (i = 0; i < MAXQUOTAS; i++)
+               ip->i_dquot[i] = NODQUOT;
+#endif
+       /*
+        * Put it onto its hash chain and lock it so that other requests for
+        * this inode will block if they arrive while we are sleeping waiting
+        * for old data structures to be purged or for the contents of the
+        * disk portion of this inode to be read.
+        */
+       ufs_ihashins(ip);
+
+       /* Read in the disk contents for the inode, copy into the inode. */
+       if (error = bread(ump->um_devvp, fsbtodb(fs, itod(fs, ino)),
+           (int)fs->fs_bsize, NOCRED, &bp)) {
+               /*
+                * The inode does not contain anything useful, so it would
+                * be misleading to leave it on its hash chain. With mode
+                * still zero, it will be unlinked and returned to the free
+                * list by vput().
+                */
+               vput(vp);
+               brelse(bp);
+               *vpp = NULL;
+               return (error);
+       }
+       dp = bp->b_un.b_dino;
+       dp += itoo(fs, ino);
+       ip->i_din = *dp;
+       brelse(bp);
+
+       /*
+        * Initialize the vnode from the inode, check for aliases.
+        * Note that the underlying vnode may have changed.
+        */
+       if (error = ufs_vinit(mp, ffs_specop_p, FFS_FIFOOPS, &vp)) {
+               vput(vp);
+               *vpp = NULL;
+               return (error);
+       }
+       /*
+        * Finish inode initialization now that aliasing has been resolved.
+        */
+       ip->i_devvp = ump->um_devvp;
+       VREF(ip->i_devvp);
+       /*
+        * Set up a generation number for this inode if it does not
+        * already have one. This should only happen on old filesystems.
+        */
+       if (ip->i_gen == 0) {
+               if (++nextgennumber < (u_long)time.tv_sec)
+                       nextgennumber = time.tv_sec;
+               ip->i_gen = nextgennumber;
+               if ((vp->v_mount->mnt_flag & MNT_RDONLY) == 0)
+                       ip->i_flag |= IMOD;
+       }
+       /*
+        * Ensure that uid and gid are correct. This is a temporary
+        * fix until fsck has been changed to do the update.
+        */
+       if (fs->fs_inodefmt < FS_44INODEFMT) {          /* XXX */
+               ip->i_uid = ip->i_din.di_ouid;          /* XXX */
+               ip->i_gid = ip->i_din.di_ogid;          /* XXX */
+       }                                               /* XXX */
+
+       *vpp = vp;
+       return (0);
+}
+
+/*
+ * File handle to vnode
+ *
+ * Have to be really careful about stale file handles:
+ * - check that the inode number is valid
+ * - call ffs_vget() to get the locked inode
+ * - check for an unallocated inode (i_mode == 0)
+ * - check that the given client host has export rights and return
+ *   those rights via. exflagsp and credanonp
+ */
+int
+ffs_fhtovp(mp, fhp, nam, vpp, exflagsp, credanonp)
+       register struct mount *mp;
+       struct fid *fhp;
+       struct mbuf *nam;
+       struct vnode **vpp;
+       int *exflagsp;
+       struct ucred **credanonp;
+{
+       register struct ufid *ufhp;
+       struct fs *fs;
+
+       ufhp = (struct ufid *)fhp;
+       fs = VFSTOUFS(mp)->um_fs;
+       if (ufhp->ufid_ino < ROOTINO ||
+           ufhp->ufid_ino >= fs->fs_ncg * fs->fs_ipg)
+               return (ESTALE);
+       return (ufs_check_export(mp, ufhp, nam, vpp, exflagsp, credanonp));
+}
+
+/*
+ * Vnode pointer to File handle
+ */
+/* ARGSUSED */
+ffs_vptofh(vp, fhp)
+       struct vnode *vp;
+       struct fid *fhp;
+{
+       register struct inode *ip;
+       register struct ufid *ufhp;
+
+       ip = VTOI(vp);
+       ufhp = (struct ufid *)fhp;
+       ufhp->ufid_len = sizeof(struct ufid);
+       ufhp->ufid_ino = ip->i_number;
+       ufhp->ufid_gen = ip->i_gen;
+       return (0);
 }
 
 /*
  * Write a superblock and associated information back to disk.
  */
 }
 
 /*
  * Write a superblock and associated information back to disk.
  */
-sbupdate(mp, waitfor)
+int
+ffs_sbupdate(mp, waitfor)
        struct ufsmount *mp;
        int waitfor;
 {
        struct ufsmount *mp;
        int waitfor;
 {
@@ -456,7 +829,7 @@ sbupdate(mp, waitfor)
        bp = getblk(mp->m_dev, (daddr_t)fsbtodb(fs, SBOFF / fs->fs_fsize),
            (int)fs->fs_sbsize, fs->fs_dbsize);
 #else SECSIZE
        bp = getblk(mp->m_dev, (daddr_t)fsbtodb(fs, SBOFF / fs->fs_fsize),
            (int)fs->fs_sbsize, fs->fs_dbsize);
 #else SECSIZE
-       bp = getblk(mp->um_devvp, SBLOCK, (int)fs->fs_sbsize);
+       bp = getblk(mp->um_devvp, SBLOCK, (int)fs->fs_sbsize, 0, 0);
 #endif SECSIZE
        bcopy((caddr_t)fs, bp->b_un.b_addr, (u_int)fs->fs_sbsize);
        /* Restore compatibility to old file systems.              XXX */
 #endif SECSIZE
        bcopy((caddr_t)fs, bp->b_un.b_addr, (u_int)fs->fs_sbsize);
        /* Restore compatibility to old file systems.              XXX */
@@ -483,7 +856,8 @@ sbupdate(mp, waitfor)
                bp = getblk(mp->m_dev, fsbtodb(fs, fs->fs_csaddr + i), size,
                    fs->fs_dbsize);
 #else SECSIZE
                bp = getblk(mp->m_dev, fsbtodb(fs, fs->fs_csaddr + i), size,
                    fs->fs_dbsize);
 #else SECSIZE
-               bp = getblk(mp->um_devvp, fsbtodb(fs, fs->fs_csaddr + i), size);
+               bp = getblk(mp->um_devvp, fsbtodb(fs, fs->fs_csaddr + i),
+                   size, 0, 0);
 #endif SECSIZE
                bcopy(space, bp->b_un.b_addr, (u_int)size);
                space += size;
 #endif SECSIZE
                bcopy(space, bp->b_un.b_addr, (u_int)size);
                space += size;
@@ -494,107 +868,3 @@ sbupdate(mp, waitfor)
        }
        return (error);
 }
        }
        return (error);
 }
-
-/*
- * Print out statistics on the current allocation of the buffer pool.
- * Can be enabled to print out on every ``sync'' by setting "syncprt"
- * above.
- */
-bufstats()
-{
-       int s, i, j, count;
-       register struct buf *bp, *dp;
-       int counts[MAXBSIZE/CLBYTES+1];
-       static char *bname[BQUEUES] = { "LOCKED", "LRU", "AGE", "EMPTY" };
-
-       for (bp = bfreelist, i = 0; bp < &bfreelist[BQUEUES]; bp++, i++) {
-               count = 0;
-               for (j = 0; j <= MAXBSIZE/CLBYTES; j++)
-                       counts[j] = 0;
-               s = splbio();
-               for (dp = bp->av_forw; dp != bp; dp = dp->av_forw) {
-                       counts[dp->b_bufsize/CLBYTES]++;
-                       count++;
-               }
-               splx(s);
-               printf("%s: total-%d", bname[i], count);
-               for (j = 0; j <= MAXBSIZE/CLBYTES; j++)
-                       if (counts[j] != 0)
-                               printf(", %d-%d", j * CLBYTES, counts[j]);
-               printf("\n");
-       }
-}
-
-/*
- * File handle to vnode
- */
-ufs_fhtovp(mp, fhp, vpp)
-       struct mount *mp;
-       struct fid *fhp;
-       struct vnode **vpp;
-{
-       register struct ufid *ufhp;
-       struct inode tip, *ip;
-       int error;
-
-       ufhp = (struct ufid *)fhp;
-       tip.i_dev = VFSTOUFS(mp)->um_dev;
-       tip.i_vnode.v_mount = mp;
-       if (error = iget(&tip, ufhp->ufid_ino, &ip)) {
-               *vpp = NULL;
-               return (error);
-       }
-       if (ip->i_gen != ufhp->ufid_gen) {
-               iput(ip);
-               *vpp = NULL;
-               return (EINVAL);
-       }
-       *vpp = ITOV(ip);
-       return (0);
-}
-
-/*
- * Vnode pointer to File handle, should never happen.
- */
-/* ARGSUSED */
-ufs_vptofh(mp, fhp, vpp)
-       struct mount *mp;
-       struct fid *fhp;
-       struct vnode **vpp;
-{
-
-       return (EINVAL);
-}
-
-/*
- * Common code for mount and quota.
- * Check that the user's argument is a reasonable
- * thing on which to mount, and return the device number if so.
- */
-getmdev(devvpp, fname, ndp)
-       struct vnode **devvpp;
-       caddr_t fname;
-       register struct nameidata *ndp;
-{
-       register struct vnode *vp;
-       int error;
-
-       ndp->ni_nameiop = LOOKUP | LOCKLEAF | FOLLOW;
-       ndp->ni_segflg = UIO_USERSPACE;
-       ndp->ni_dirp = fname;
-       if (error = namei(ndp)) {
-               if (error == ENOENT)
-                       return (ENODEV);        /* needs translation */
-               return (error);
-       }
-       vp = ndp->ni_vp;
-       if (vp->v_type != VBLK) {
-               vput(vp);
-               return (ENOTBLK);
-       }
-       if (major(vp->v_rdev) >= nblkdev)
-               return (ENXIO);
-       iunlock(VTOI(vp));
-       *devvpp = vp;
-       return (0);
-}