BSD 4_4 release
[unix-history] / usr / src / sys / kern / init_main.c
index 0a150fb..1b41cc7 100644 (file)
-/*     init_main.c     6.5     84/08/01        */
-
-#include "../machine/pte.h"
-
-#include "../h/param.h"
-#include "../h/systm.h"
-#include "../h/dir.h"
-#include "../h/user.h"
-#include "../h/kernel.h"
-#include "../h/fs.h"
-#include "../h/mount.h"
-#include "../h/map.h"
-#include "../h/proc.h"
-#include "../h/inode.h"
-#include "../h/seg.h"
-#include "../h/conf.h"
-#include "../h/buf.h"
-#include "../h/vm.h"
-#include "../h/cmap.h"
-#include "../h/text.h"
-#include "../h/clist.h"
-#ifdef INET
-#include "../h/protosw.h"
+/*
+ * Copyright (c) 1982, 1986, 1989, 1991, 1992, 1993
+ *     The Regents of the University of California.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without
+ * modification, are permitted provided that the following conditions
+ * are met:
+ * 1. Redistributions of source code must retain the above copyright
+ *    notice, this list of conditions and the following disclaimer.
+ * 2. Redistributions in binary form must reproduce the above copyright
+ *    notice, this list of conditions and the following disclaimer in the
+ *    documentation and/or other materials provided with the distribution.
+ * 3. All advertising materials mentioning features or use of this software
+ *    must display the following acknowledgement:
+ *     This product includes software developed by the University of
+ *     California, Berkeley and its contributors.
+ * 4. Neither the name of the University nor the names of its contributors
+ *    may be used to endorse or promote products derived from this software
+ *    without specific prior written permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
+ * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
+ * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
+ * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
+ * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
+ * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
+ * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
+ * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
+ * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
+ * SUCH DAMAGE.
+ *
+ *     @(#)init_main.c 8.1 (Berkeley) 6/10/93
+ */
+
+#include <sys/param.h>
+#include <sys/filedesc.h>
+#include <sys/kernel.h>
+#include <sys/mount.h>
+#include <sys/map.h>
+#include <sys/proc.h>
+#include <sys/resourcevar.h>
+#include <sys/signalvar.h>
+#include <sys/systm.h>
+#include <sys/vnode.h>
+#include <sys/conf.h>
+#include <sys/buf.h>
+#include <sys/clist.h>
+#include <sys/device.h>
+#include <sys/protosw.h>
+#include <sys/reboot.h>
+#include <sys/user.h>
+
+#include <ufs/ufs/quota.h>
+
+#include <machine/cpu.h>
+
+#include <vm/vm.h>
+
+#ifdef HPFPLIB
+char   copyright[] =
+"Copyright (c) 1982, 1986, 1989, 1991, 1993\n\tThe Regents of the University of California.\nCopyright (c) 1992 Hewlett-Packard Company\nCopyright (c) 1992 Motorola Inc.\nAll rights reserved.\n\n";
+#else
+char   copyright[] =
+"Copyright (c) 1982, 1986, 1989, 1991, 1993\n\tThe Regents of the University of California.  All rights reserved.\n\n";
 #endif
 #endif
-#include "../h/quota.h"
-#include "../machine/reg.h"
-#include "../machine/cpu.h"
+
+/*
+ * Components of process 0;
+ * never freed.
+ */
+struct session session0;
+struct pgrp pgrp0;
+struct proc proc0;
+struct pcred cred0;
+struct filedesc0 filedesc0;
+struct plimit limit0;
+struct vmspace vmspace0;
+struct proc *curproc = &proc0;
+struct proc *initproc, *pageproc;
 
 int    cmask = CMASK;
 
 int    cmask = CMASK;
+extern struct user *proc0paddr;
+extern int (*mountroot)();
+
+struct vnode *rootvp, *swapdev_vp;
+int    boothowto;
+struct timeval boottime;
+struct timeval runtime;
+
 /*
 /*
- * Initialization code.
- * Called from cold start routine as
- * soon as a stack and segmentation
- * have been established.
- * Functions:
- *     clear and free user core
- *     turn on clock
- *     hand craft 0th process
- *     call all initialization routines
- *     fork - process 0 to schedule
- *          - process 2 to page out
- *          - process 1 execute bootstrap
- *
- * loop at loc 13 (0xd) in user mode -- /etc/init
- *     cannot be executed.
+ * System startup; initialize the world, create process 0,
+ * mount root filesystem, and fork to create init and pagedaemon.
+ * Most of the hard work is done in the lower-level initialization
+ * routines including startup(), which does memory initialization
+ * and autoconfiguration.
  */
  */
-main(firstaddr)
-       int firstaddr;
+main()
 {
        register int i;
        register struct proc *p;
 {
        register int i;
        register struct proc *p;
-       struct fs *fs;
-       int s;
+       register struct filedesc0 *fdp;
+       register struct pdevinit *pdev;
+       int s, rval[2];
+       extern struct pdevinit pdevinit[];
+       extern void roundrobin __P((void *));
+       extern void schedcpu __P((void *));
 
 
-       rqinit();
-#include "loop.h"
-       startup(firstaddr);
+       /*
+        * Initialize curproc before any possible traps/probes
+        * to simplify trap processing.
+        */
+       p = &proc0;
+       curproc = p;
+       /*
+        * Attempt to find console and initialize
+        * in case of early panic or other messages.
+        */
+       consinit();
+       printf(copyright);
+
+       vm_mem_init();
+       kmeminit();
+       cpu_startup();
 
        /*
         * set up system process 0 (swapper)
         */
 
        /*
         * set up system process 0 (swapper)
         */
-       p = &proc[0];
-       p->p_p0br = u.u_pcb.pcb_p0br;
-       p->p_szpt = 1;
-       p->p_addr = uaddr(p);
+       p = &proc0;
+       curproc = p;
+
+       allproc = (volatile struct proc *)p;
+       p->p_prev = (struct proc **)&allproc;
+       p->p_pgrp = &pgrp0;
+       pgrphash[0] = &pgrp0;
+       pgrp0.pg_mem = p;
+       pgrp0.pg_session = &session0;
+       session0.s_count = 1;
+       session0.s_leader = p;
+
+       p->p_flag = SLOAD|SSYS;
        p->p_stat = SRUN;
        p->p_stat = SRUN;
-       p->p_flag |= SLOAD|SSYS;
        p->p_nice = NZERO;
        p->p_nice = NZERO;
-       setredzone(p->p_addr, (caddr_t)&u);
-       u.u_procp = p;
-#ifdef vax
+       bcopy("swapper", p->p_comm, sizeof ("swapper"));
+
        /*
        /*
-        * This assumes that the u. area is always mapped 
-        * to the same physical address. Otherwise must be
-        * handled when copying the u. area in newproc().
+        * Setup credentials
         */
         */
-       u.u_nd.ni_iov = &u.u_nd.ni_iovec;
-#endif
-       u.u_nd.ni_iovcnt = 1;
-       u.u_cmask = cmask;
-       for (i = 1; i < NGROUPS; i++)
-               u.u_groups[i] = NOGROUP;
-       for (i = 0; i < sizeof(u.u_rlimit)/sizeof(u.u_rlimit[0]); i++)
-               u.u_rlimit[i].rlim_cur = u.u_rlimit[i].rlim_max = 
-                   RLIM_INFINITY;
-       u.u_rlimit[RLIMIT_STACK].rlim_cur = 512*1024;
-       u.u_rlimit[RLIMIT_STACK].rlim_max = ctob(MAXSSIZ);
-       u.u_rlimit[RLIMIT_DATA].rlim_max =
-           u.u_rlimit[RLIMIT_DATA].rlim_cur = ctob(MAXDSIZ);
-       p->p_maxrss = RLIM_INFINITY/NBPG;
-#if defined(QUOTA)
-       qtinit();
-       p->p_quota = u.u_quota = getquota(0, 0, Q_NDQ);
-#endif
-       startrtclock();
-#include "kg.h"
-#if NKG > 0
-       startkgclock();
-#endif
+       cred0.p_refcnt = 1;
+       p->p_cred = &cred0;
+       p->p_ucred = crget();
+       p->p_ucred->cr_ngroups = 1;     /* group 0 */
+
+       /*
+        * Create the file descriptor table for process 0.
+        */
+       fdp = &filedesc0;
+       p->p_fd = &fdp->fd_fd;
+       fdp->fd_fd.fd_refcnt = 1;
+       fdp->fd_fd.fd_cmask = cmask;
+       fdp->fd_fd.fd_ofiles = fdp->fd_dfiles;
+       fdp->fd_fd.fd_ofileflags = fdp->fd_dfileflags;
+       fdp->fd_fd.fd_nfiles = NDFILE;
+
+       /*
+        * Set initial limits
+        */
+       p->p_limit = &limit0;
+       for (i = 0; i < sizeof(p->p_rlimit)/sizeof(p->p_rlimit[0]); i++)
+               limit0.pl_rlimit[i].rlim_cur =
+                   limit0.pl_rlimit[i].rlim_max = RLIM_INFINITY;
+       limit0.pl_rlimit[RLIMIT_NOFILE].rlim_cur = NOFILE;
+       limit0.pl_rlimit[RLIMIT_NPROC].rlim_cur = MAXUPRC;
+       i = ptoa(cnt.v_free_count);
+       limit0.pl_rlimit[RLIMIT_RSS].rlim_max = i;
+       limit0.pl_rlimit[RLIMIT_MEMLOCK].rlim_max = i;
+       limit0.pl_rlimit[RLIMIT_MEMLOCK].rlim_cur = i / 3;
+       limit0.p_refcnt = 1;
+
+       /*
+        * Allocate a prototype map so we have something to fork
+        */
+       p->p_vmspace = &vmspace0;
+       vmspace0.vm_refcnt = 1;
+       pmap_pinit(&vmspace0.vm_pmap);
+       vm_map_init(&p->p_vmspace->vm_map, round_page(VM_MIN_ADDRESS),
+           trunc_page(VM_MAX_ADDRESS), TRUE);
+       vmspace0.vm_map.pmap = &vmspace0.vm_pmap;
+       p->p_addr = proc0paddr;                         /* XXX */
+
+       /*
+        * We continue to place resource usage info
+        * and signal actions in the user struct so they're pageable.
+        */
+       p->p_stats = &p->p_addr->u_stats;
+       p->p_sigacts = &p->p_addr->u_sigacts;
 
        /*
 
        /*
-        * Initialize tables, protocols, and set up well-known inodes.
+        * Initialize per uid information structure and charge
+        * root for one process.
         */
         */
+       usrinfoinit();
+       (void)chgproccnt(0, 1);
+
+       rqinit();
+
+       /* Configure virtual memory system, set vm rlimits. */
+       vm_init_limits(p);
+
+       /* Initialize the file systems. */
+       vfsinit();
+
+       /* Start real time and statistics clocks. */
+       initclocks();
+
+       /* Initialize tables. */
        mbinit();
        mbinit();
-       cinit();                        /* needed by dmc-11 driver */
-#ifdef INET
-#if NLOOP > 0
-       loattach();                     /* XXX */
+       cinit();
+#ifdef SYSVSHM
+       shminit();
 #endif
 #endif
+
+       /* Attach pseudo-devices. */
+       for (pdev = pdevinit; pdev->pdev_attach != NULL; pdev++)
+               (*pdev->pdev_attach)(pdev->pdev_count);
+
        /*
        /*
-        * Block reception of incoming packets
-        * until protocols have been initialized.
+        * Initialize protocols.  Block reception of incoming packets
+        * until everything is ready.
         */
        s = splimp();
        ifinit();
         */
        s = splimp();
        ifinit();
-#endif
        domaininit();
        domaininit();
-#ifdef INET
        splx(s);
        splx(s);
-#endif
-       pqinit();
-       ihinit();
-       bhinit();
-       binit();
-       bswinit();
-       nchinit();
+
 #ifdef GPROF
        kmstartup();
 #endif
 
 #ifdef GPROF
        kmstartup();
 #endif
 
-       fs = mountfs(rootdev, 0, (struct inode *)0);
-       if (fs == 0)
-               panic("iinit");
-       bcopy("/", fs->fs_fsmnt, 2);
-
-       inittodr(fs->fs_time);
-       boottime = time;
-
-/* kick off timeout driven events by calling first time */
-       roundrobin();
-       schedcpu();
-       schedpaging();
-
-/* set up the root file system */
-       rootdir = iget(rootdev, fs, (ino_t)ROOTINO);
-       iunlock(rootdir);
-       u.u_cdir = iget(rootdev, fs, (ino_t)ROOTINO);
-       iunlock(u.u_cdir);
-       u.u_rdir = NULL;
+       /* kick off timeout driven events by calling first time */
+       roundrobin(NULL);
+       schedcpu(NULL);
 
 
-       u.u_dmap = zdmap;
-       u.u_smap = zdmap;
+       /*
+        * Set up the root file system and vnode.
+        */
+       if ((*mountroot)())
+               panic("cannot mount root");
+       /*
+        * Get vnode for '/'.
+        * Setup rootdir and fdp->fd_fd.fd_cdir to point to it.
+        */
+       if (VFS_ROOT(rootfs, &rootdir))
+               panic("cannot find root vnode");
+       fdp->fd_fd.fd_cdir = rootdir;
+       VREF(fdp->fd_fd.fd_cdir);
+       VOP_UNLOCK(rootdir);
+       fdp->fd_fd.fd_rdir = NULL;
+       swapinit();
 
        /*
 
        /*
-        * Set the scan rate and other parameters of the paging subsystem.
+        * Now can look at time, having had a chance to verify the time
+        * from the file system.  Reset p->p_rtime as it may have been
+        * munched in swtch() after the time got set.
         */
         */
-       setupclock();
+       p->p_stats->p_start = runtime = mono_time = boottime = time;
+       p->p_rtime.tv_sec = p->p_rtime.tv_usec = 0;
 
        /*
         * make init process
         */
 
        /*
         * make init process
         */
+       siginit(p);
+       if (fork(p, NULL, rval))
+               panic("fork init");
+       if (rval[1]) {
+               extern int icode[];             /* user init code */
+               extern int szicode;             /* size of icode */
+               static char initflags[] = "-sf";
+               vm_offset_t addr;
+               char *ip;
 
 
-       proc[0].p_szpt = CLSIZE;
-       if (newproc(0)) {
-               expand(clrnd((int)btoc(szicode)), 0);
-               (void) swpexpand(u.u_dsize, 0, &u.u_dmap, &u.u_smap);
-               (void) copyout((caddr_t)icode, (caddr_t)0, (unsigned)szicode);
                /*
                /*
-                * Return goes to loc. 0 of user init
-                * code just copied out.
+                * Now in process 1.  Set init flags into icode, get a minimal
+                * address space, copy out "icode", and return to it to do an
+                * exec of init.
                 */
                 */
-               return;
+               ip = initflags + 1;
+               if (boothowto&RB_SINGLE)
+                       *ip++ = 's';
+#ifdef notyet
+               if (boothowto&RB_FASTBOOT)
+                       *ip++ = 'f';
+#endif
+               if (ip == initflags + 1)
+                       *ip++ = '-';
+               *ip++ = '\0';
+
+               addr = VM_MIN_ADDRESS;
+               initproc = p = curproc;
+               if (vm_allocate(&p->p_vmspace->vm_map, &addr,
+                   round_page(szicode + sizeof(initflags)), FALSE) != 0 ||
+                   addr != VM_MIN_ADDRESS)
+                       panic("init: couldn't allocate at zero");
+
+               /* need just enough stack to exec from */
+               addr = trunc_page(USRSTACK - PAGE_SIZE);
+               if (vm_allocate(&p->p_vmspace->vm_map, &addr,
+                   PAGE_SIZE, FALSE) != KERN_SUCCESS)
+                       panic("vm_allocate init stack");
+               p->p_vmspace->vm_maxsaddr = (caddr_t)addr;
+               (void)copyout((caddr_t)icode, (caddr_t)VM_MIN_ADDRESS,
+                   (u_int)szicode);
+               (void)copyout(initflags, (caddr_t)(VM_MIN_ADDRESS + szicode),
+                   sizeof(initflags));
+               return;                 /* returns to icode */
        }
        }
+
        /*
        /*
-        * make page-out daemon (process 2)
-        * the daemon has ctopt(nswbuf*CLSIZE*KLMAX) pages of page
-        * table so that it can map dirty pages into
-        * its address space during asychronous pushes.
+        * Start up pageout daemon (process 2).
         */
         */
-       proc[0].p_szpt = clrnd(ctopt(nswbuf*CLSIZE*KLMAX + UPAGES));
-       if (newproc(0)) {
-               proc[2].p_flag |= SLOAD|SSYS;
-               proc[2].p_dsize = u.u_dsize = nswbuf*CLSIZE*KLMAX; 
-               pageout();
+       if (fork(p, NULL, rval))
+               panic("fork pager");
+       if (rval[1]) {
+               /*
+                * Now in process 2.
+                */
+               p = curproc;
+               pageproc = p;
+               p->p_flag |= SLOAD|SSYS;                /* XXX */
+               bcopy("pagedaemon", curproc->p_comm, sizeof ("pagedaemon"));
+               vm_pageout();
                /*NOTREACHED*/
        }
 
        /*
         * enter scheduling loop
         */
                /*NOTREACHED*/
        }
 
        /*
         * enter scheduling loop
         */
-       proc[0].p_szpt = 1;
        sched();
 }
        sched();
 }
-
-/*
- * Initialize hash links for buffers.
- */
-bhinit()
-{
-       register int i;
-       register struct bufhd *bp;
-
-       for (bp = bufhash, i = 0; i < BUFHSZ; i++, bp++)
-               bp->b_forw = bp->b_back = (struct buf *)bp;
-}
-
-/*
- * Initialize the buffer I/O system by freeing
- * all buffers and setting all device buffer lists to empty.
- */
-binit()
-{
-       register struct buf *bp, *dp;
-       register int i;
-       struct swdevt *swp;
-       int base, residual;
-
-       for (dp = bfreelist; dp < &bfreelist[BQUEUES]; dp++) {
-               dp->b_forw = dp->b_back = dp->av_forw = dp->av_back = dp;
-               dp->b_flags = B_HEAD;
-       }
-       base = bufpages / nbuf;
-       residual = bufpages % nbuf;
-       for (i = 0; i < nbuf; i++) {
-               bp = &buf[i];
-               bp->b_dev = NODEV;
-               bp->b_bcount = 0;
-               bp->b_un.b_addr = buffers + i * MAXBSIZE;
-               if (i < residual)
-                       bp->b_bufsize = (base + 1) * CLBYTES;
-               else
-                       bp->b_bufsize = base * CLBYTES;
-               binshash(bp, &bfreelist[BQ_AGE]);
-               bp->b_flags = B_BUSY|B_INVAL;
-               brelse(bp);
-       }
-       /*
-        * Count swap devices, and adjust total swap space available.
-        * Some of this space will not be available until a vswapon()
-        * system is issued, usually when the system goes multi-user.
-        */
-       nswdev = 0;
-       nswap = 0;
-       for (swp = swdevt; swp->sw_dev; swp++) {
-               nswdev++;
-               if (swp->sw_nblks > nswap)
-                       nswap = swp->sw_nblks;
-       }
-       if (nswdev == 0)
-               panic("binit");
-       if (nswdev > 1)
-               nswap = ((nswap + dmmax - 1) / dmmax) * dmmax;
-       nswap *= nswdev;
-       maxpgio *= nswdev;
-       swfree(0);
-}
-
-/*
- * Initialize linked list of free swap
- * headers. These do not actually point
- * to buffers, but rather to pages that
- * are being swapped in and out.
- */
-bswinit()
-{
-       register int i;
-       register struct buf *sp = swbuf;
-
-       bswlist.av_forw = sp;
-       for (i=0; i<nswbuf-1; i++, sp++)
-               sp->av_forw = sp+1;
-       sp->av_forw = NULL;
-}
-
-/*
- * Initialize clist by freeing all character blocks, then count
- * number of character devices. (Once-only routine)
- */
-cinit()
-{
-       register int ccp;
-       register struct cblock *cp;
-
-       ccp = (int)cfree;
-       ccp = (ccp+CROUND) & ~CROUND;
-       for(cp=(struct cblock *)ccp; cp < &cfree[nclist-1]; cp++) {
-               cp->c_next = cfreelist;
-               cfreelist = cp;
-               cfreecount += CBSIZE;
-       }
-}