u. is gone, pcb is at p_addr; aston => signotify
[unix-history] / usr / src / sys / kern / uipc_syscalls.c
index 745e37e..a704ef7 100644 (file)
-/*     uipc_syscalls.c 4.14    82/02/25        */
-
-#include "../h/param.h"
-#include "../h/systm.h"
-#include "../h/dir.h"
-#include "../h/user.h"
-#include "../h/proc.h"
-#include "../h/file.h"
-#include "../h/inode.h"
-#include "../h/buf.h"
-#include "../h/mbuf.h"
-#include "../h/protosw.h"
-#include "../h/socket.h"
-#include "../h/socketvar.h"
-#include "../net/in.h"
-#include "../net/in_systm.h"
-
 /*
 /*
- * Socket system call interface.
  *
  *
- * These routines interface the socket routines to UNIX,
- * isolating the system interface from the socket-protocol interface.
+ * %sccs.include.redist.c%
  *
  *
- * TODO:
- *     SO_INTNOTIFY
+ *     @(#)uipc_syscalls.c     7.23 (Berkeley) %G%
  */
 
  */
 
-static struct sockproto localproto = { PF_UNIX, 0 };
+#include "param.h"
+#include "filedesc.h"
+#include "proc.h"
+#include "file.h"
+#include "buf.h"
+#include "malloc.h"
+#include "mbuf.h"
+#include "protosw.h"
+#include "socket.h"
+#include "socketvar.h"
+#ifdef KTRACE
+#include "ktrace.h"
+#endif
+
 /*
 /*
- * Pipe system call interface.
+ * System call interface to the socket abstraction.
  */
  */
-spipe()
+
+extern struct fileops socketops;
+
+socket(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     domain;
+               int     type;
+               int     protocol;
+       } *uap;
+       int *retval;
 {
 {
-       register struct file *rf, *wf;
-       struct socket *rso, *wso;
-       int r;
-COUNT(SPIPE);
-       
-       u.u_error = socreate(&rso, SOCK_STREAM,
-           &localproto, (struct sockaddr *)0, 0);
-       if (u.u_error)
-               return;
-       u.u_error = socreate(&wso, SOCK_STREAM,
-           &localproto, (struct sockaddr *)0, 0);
-       if (u.u_error)
-               goto free;
-       rf = falloc();
-       if (rf == NULL)
-               goto free2;
-       r = u.u_r.r_val1;
-       rf->f_flag = FREAD|FSOCKET;
-       rf->f_socket = rso;
-       wf = falloc();
-       if (wf == NULL)
-               goto free3;
-       wf->f_flag = FWRITE|FSOCKET;
-       wf->f_socket = wso;
-       u.u_r.r_val2 = u.u_r.r_val1;
-       u.u_r.r_val1 = r;
-       if (piconnect(wso, rso) == 0)
-               goto free4;
-       return;
-free4:
-       wf->f_count = 0;
-       u.u_ofile[u.u_r.r_val1] = 0;
-free3:
-       rf->f_count = 0;
-       u.u_ofile[r] = 0;
-free2:
-       wso->so_state |= SS_USERGONE;
-       sofree(wso);
-free:
-       rso->so_state |= SS_USERGONE;
-       sofree(rso);
+       struct filedesc *fdp = p->p_fd;
+       struct socket *so;
+       struct file *fp;
+       int fd, error;
+
+       if (error = falloc(p, &fp, &fd))
+               return (error);
+       fp->f_flag = FREAD|FWRITE;
+       fp->f_type = DTYPE_SOCKET;
+       fp->f_ops = &socketops;
+       if (error = socreate(uap->domain, &so, uap->type, uap->protocol)) {
+               fdp->fd_ofiles[fd] = 0;
+               crfree(fp->f_cred);
+               fp->f_count = 0;
+       } else {
+               fp->f_data = (caddr_t)so;
+               *retval = fd;
+       }
+       return (error);
 }
 
 }
 
-/*
- * Splice system call interface.
- */
-ssplice()
+/* ARGSUSED */
+bind(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               caddr_t name;
+               int     namelen;
+       } *uap;
+       int *retval;
 {
 {
-       register struct a {
-               int     fd1;
-               int     fd2;
-       } *ap = (struct a *)u.u_ap;
-       struct file *f1, *f2;
-COUNT(SSPLICE);
-
-       f1 = getf(ap->fd1);
-       if (f1 == NULL)
-               return;
-       f2 = getf(ap->fd2);
-       if (f2 == NULL)
-               return;
-       if (f1 == f2) {
-               u.u_error = EINVAL;
-               return;
-       }
-       if ((f1->f_flag & FSOCKET) == 0 || (f2->f_flag & FSOCKET) == 0) {
-               u.u_error = ENOTSOCK;
-               return;
-       }
-       if (f1->f_count > 1 || f2->f_count > 1) {
-               u.u_error = ETOOMANYREFS;
-               return;
-       }
-       u.u_error = sosplice(f1->f_socket, f2->f_socket);
-       if (u.u_error)
-               return;
-       u.u_ofile[ap->fd1] = 0;
-       u.u_ofile[ap->fd2] = 0;
-       f1->f_count = 0;
-       f2->f_count = 0;
+       struct file *fp;
+       struct mbuf *nam;
+       int error;
+
+       if (error = getsock(p->p_fd, uap->s, &fp))
+               return (error);
+       if (error = sockargs(&nam, uap->name, uap->namelen, MT_SONAME))
+               return (error);
+       error = sobind((struct socket *)fp->f_data, nam);
+       m_freem(nam);
+       return (error);
 }
 
 }
 
-/*
- * Socket system call interface.  Copy sa arguments
- * set up file descriptor and call internal socket
- * creation routine.
- */
-ssocket()
+/* ARGSUSED */
+listen(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               int     backlog;
+       } *uap;
+       int *retval;
 {
 {
-       register struct a {
-               int     type;
-               struct  sockproto *asp;
-               struct  sockaddr *asa;
-               int     options;
-       } *uap = (struct a *)u.u_ap;
-       struct sockproto sp;
-       struct sockaddr sa;
-       struct socket *so;
-       register struct file *fp;
-COUNT(SSOCKET);
-
-       if ((fp = falloc()) == NULL)
-               return;
-       fp->f_flag = FSOCKET|FREAD|FWRITE;
-       if (uap->asp && copyin((caddr_t)uap->asp, (caddr_t)&sp, sizeof (sp)) ||
-           uap->asa && copyin((caddr_t)uap->asa, (caddr_t)&sa, sizeof (sa))) {
-               u.u_error = EFAULT;
-               return;
-       }
-       u.u_error = socreate(&so, uap->type,
-           uap->asp ? &sp : 0, uap->asa ? &sa : 0, uap->options);
-       if (u.u_error)
-               goto bad;
-       fp->f_socket = so;
-       return;
-bad:
-       u.u_ofile[u.u_r.r_val1] = 0;
-       fp->f_count = 0;
+       struct file *fp;
+       int error;
+
+       if (error = getsock(p->p_fd, uap->s, &fp))
+               return (error);
+       return (solisten((struct socket *)fp->f_data, uap->backlog));
 }
 
 }
 
-/*
- * Accept system call interface.
- */
-saccept()
+#ifdef COMPAT_43
+accept(p, uap, retval)
+       struct proc *p;
+       struct args {
+               int     s;
+               caddr_t name;
+               int     *anamelen;
+               int     compat_43;
+       } *uap;
+       int *retval;
 {
 {
-       register struct a {
-               int     fdes;
-               struct  sockaddr *asa;
-       } *uap = (struct a *)u.u_ap;
-       struct sockaddr sa;
-       register struct file *fp;
-       struct socket *so;
-       int s;
-COUNT(SACCEPT);
 
 
-       if (uap->asa && useracc((caddr_t)uap->asa, sizeof (sa), B_WRITE)==0) {
-               u.u_error = EFAULT;
-               return;
-       }
-       fp = getf(uap->fdes);
-       if (fp == 0)
-               return;
-       if ((fp->f_flag & FSOCKET) == 0) {
-               u.u_error = ENOTSOCK;
-               return;
-       }
+       uap->compat_43 = 0;
+       return (accept1(p, uap, retval));
+}
+
+oaccept(p, uap, retval)
+       struct proc *p;
+       struct args {
+               int     s;
+               caddr_t name;
+               int     *anamelen;
+               int     compat_43;
+       } *uap;
+       int *retval;
+{
+
+       uap->compat_43 = 1;
+       return (accept1(p, uap, retval));
+}
+#else /* COMPAT_43 */
+
+#define        accept1 accept
+#endif
+
+accept1(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               caddr_t name;
+               int     *anamelen;
+#ifdef COMPAT_43
+               int     compat_43;
+#endif
+       } *uap;
+       int *retval;
+{
+       struct file *fp;
+       struct mbuf *nam;
+       int namelen, error, s;
+       register struct socket *so;
+
+       if (uap->name && (error = copyin((caddr_t)uap->anamelen,
+           (caddr_t)&namelen, sizeof (namelen))))
+               return (error);
+       if (error = getsock(p->p_fd, uap->s, &fp))
+               return (error);
        s = splnet();
        s = splnet();
-       so = fp->f_socket;
-       if ((so->so_options & SO_NONBLOCKING) &&
-           (so->so_state & SS_CONNAWAITING) == 0) {
-               u.u_error = EWOULDBLOCK;
+       so = (struct socket *)fp->f_data;
+       if ((so->so_options & SO_ACCEPTCONN) == 0) {
+               splx(s);
+               return (EINVAL);
+       }
+       if ((so->so_state & SS_NBIO) && so->so_qlen == 0) {
                splx(s);
                splx(s);
-               return;
+               return (EWOULDBLOCK);
+       }
+       while (so->so_qlen == 0 && so->so_error == 0) {
+               if (so->so_state & SS_CANTRCVMORE) {
+                       so->so_error = ECONNABORTED;
+                       break;
+               }
+               if (error = tsleep((caddr_t)&so->so_timeo, PSOCK | PCATCH,
+                   netcon, 0)) {
+                       splx(s);
+                       return (error);
+               }
        }
        }
-       while ((so->so_state & SS_CONNAWAITING) == 0 && so->so_error == 0)
-               sleep((caddr_t)&so->so_timeo, PZERO+1);
        if (so->so_error) {
        if (so->so_error) {
-               u.u_error = so->so_error;
+               error = so->so_error;
+               so->so_error = 0;
                splx(s);
                splx(s);
-               return;
+               return (error);
        }
        }
-       u.u_error = soaccept(so, &sa);
-       if (u.u_error) {
+       if (error = falloc(p, &fp, retval)) {
                splx(s);
                splx(s);
-               return;
+               return (error);
+       }
+       { struct socket *aso = so->so_q;
+         if (soqremque(aso, 1) == 0)
+               panic("accept");
+         so = aso;
        }
        }
-       if (uap->asa)
-               (void) copyout((caddr_t)&sa, (caddr_t)uap->asa, sizeof (sa));
-       /* deal with new file descriptor case */
-       /* u.u_r.r_val1 = ... */
+       fp->f_type = DTYPE_SOCKET;
+       fp->f_flag = FREAD|FWRITE;
+       fp->f_ops = &socketops;
+       fp->f_data = (caddr_t)so;
+       nam = m_get(M_WAIT, MT_SONAME);
+       (void) soaccept(so, nam);
+       if (uap->name) {
+#ifdef COMPAT_43
+               if (uap->compat_43)
+                       mtod(nam, struct osockaddr *)->sa_family =
+                           mtod(nam, struct sockaddr *)->sa_family;
+#endif
+               if (namelen > nam->m_len)
+                       namelen = nam->m_len;
+               /* SHOULD COPY OUT A CHAIN HERE */
+               if ((error = copyout(mtod(nam, caddr_t), (caddr_t)uap->name,
+                   (u_int)namelen)) == 0)
+                       error = copyout((caddr_t)&namelen,
+                           (caddr_t)uap->anamelen, sizeof (*uap->anamelen));
+       }
+       m_freem(nam);
        splx(s);
        splx(s);
+       return (error);
 }
 
 }
 
-/*
- * Connect socket to foreign peer; system call
- * interface.  Copy sa arguments and call internal routine.
- */
-sconnect()
+/* ARGSUSED */
+connect(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               caddr_t name;
+               int     namelen;
+       } *uap;
+       int *retval;
 {
 {
-       register struct a {
-               int     fdes;
-               struct  sockaddr *a;
-       } *uap = (struct a *)u.u_ap;
-       struct sockaddr sa;
-       register struct file *fp;
+       struct file *fp;
        register struct socket *so;
        register struct socket *so;
-       int s;
-COUNT(SCONNECT);
+       struct mbuf *nam;
+       int error, s;
 
 
-       if (copyin((caddr_t)uap->a, (caddr_t)&sa, sizeof (sa))) {
-               u.u_error = EFAULT;
-               return;
-       }
-       fp = getf(uap->fdes);
-       if (fp == 0)
-               return;
-       if ((fp->f_flag & FSOCKET) == 0) {
-               u.u_error = ENOTSOCK;
-               return;
+       if (error = getsock(p->p_fd, uap->s, &fp))
+               return (error);
+       so = (struct socket *)fp->f_data;
+       if ((so->so_state & SS_NBIO) && (so->so_state & SS_ISCONNECTING))
+               return (EALREADY);
+       if (error = sockargs(&nam, uap->name, uap->namelen, MT_SONAME))
+               return (error);
+       error = soconnect(so, nam);
+       if (error)
+               goto bad;
+       if ((so->so_state & SS_NBIO) && (so->so_state & SS_ISCONNECTING)) {
+               m_freem(nam);
+               return (EINPROGRESS);
        }
        }
-       so = fp->f_socket;
-       u.u_error = soconnect(so, &sa);
-       if (u.u_error)
-               return;
        s = splnet();
        s = splnet();
-       if ((so->so_options & SO_NONBLOCKING) &&
-           (so->so_state & SS_ISCONNECTING)) {
-               u.u_error = EINPROGRESS;
-               splx(s);
-               return;
-       }
        while ((so->so_state & SS_ISCONNECTING) && so->so_error == 0)
        while ((so->so_state & SS_ISCONNECTING) && so->so_error == 0)
-               sleep((caddr_t)&so->so_timeo, PZERO+1);
-       u.u_error = so->so_error;
-       so->so_error = 0;
+               if (error = tsleep((caddr_t)&so->so_timeo, PSOCK | PCATCH,
+                   netcon, 0))
+                       break;
+       if (error == 0) {
+               error = so->so_error;
+               so->so_error = 0;
+       }
        splx(s);
        splx(s);
+bad:
+       so->so_state &= ~SS_ISCONNECTING;
+       m_freem(nam);
+       if (error == ERESTART)
+               error = EINTR;
+       return (error);
 }
 
 }
 
-/*
- * Disconnect socket from foreign peer; system call
- * interface.  Copy sa arguments and call internal routine.
- */
-sdisconnect()
+socketpair(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     domain;
+               int     type;
+               int     protocol;
+               int     *rsv;
+       } *uap;
+       int retval[];
 {
 {
-       register struct a {
-               int     fdes;
-               struct  sockaddr *asa;
-       } *uap = (struct a *)u.u_ap;
-       struct sockaddr sa;
-       register struct file *fp;
-       register struct socket *so;
+       register struct filedesc *fdp = p->p_fd;
+       struct file *fp1, *fp2;
+       struct socket *so1, *so2;
+       int fd, error, sv[2];
+
+       if (error = socreate(uap->domain, &so1, uap->type, uap->protocol))
+               return (error);
+       if (error = socreate(uap->domain, &so2, uap->type, uap->protocol))
+               goto free1;
+       if (error = falloc(p, &fp1, &fd))
+               goto free2;
+       sv[0] = fd;
+       fp1->f_flag = FREAD|FWRITE;
+       fp1->f_type = DTYPE_SOCKET;
+       fp1->f_ops = &socketops;
+       fp1->f_data = (caddr_t)so1;
+       if (error = falloc(p, &fp2, &fd))
+               goto free3;
+       fp2->f_flag = FREAD|FWRITE;
+       fp2->f_type = DTYPE_SOCKET;
+       fp2->f_ops = &socketops;
+       fp2->f_data = (caddr_t)so2;
+       sv[1] = fd;
+       if (error = soconnect2(so1, so2))
+               goto free4;
+       if (uap->type == SOCK_DGRAM) {
+               /*
+                * Datagram socket connection is asymmetric.
+                */
+                if (error = soconnect2(so2, so1))
+                       goto free4;
+       }
+       error = copyout((caddr_t)sv, (caddr_t)uap->rsv, 2 * sizeof (int));
+       retval[0] = sv[0];              /* XXX ??? */
+       retval[1] = sv[1];              /* XXX ??? */
+       return (error);
+free4:
+       crfree(fp2->f_cred);
+       fp2->f_count = 0;
+       fdp->fd_ofiles[sv[1]] = 0;
+free3:
+       crfree(fp1->f_cred);
+       fp1->f_count = 0;
+       fdp->fd_ofiles[sv[0]] = 0;
+free2:
+       (void)soclose(so2);
+free1:
+       (void)soclose(so1);
+       return (error);
+}
+
+sendto(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               caddr_t buf;
+               int     len;
+               int     flags;
+               caddr_t to;
+               int     tolen;
+       } *uap;
+       int *retval;
+{
+       struct msghdr msg;
+       struct iovec aiov;
+       int error;
+
+       msg.msg_name = uap->to;
+       msg.msg_namelen = uap->tolen;
+       msg.msg_iov = &aiov;
+       msg.msg_iovlen = 1;
+       msg.msg_control = 0;
+#ifdef COMPAT_43
+       msg.msg_flags = 0;
+#endif
+       aiov.iov_base = uap->buf;
+       aiov.iov_len = uap->len;
+       return (sendit(p, uap->s, &msg, uap->flags, retval));
+}
+
+#ifdef COMPAT_43
+osend(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               caddr_t buf;
+               int     len;
+               int     flags;
+       } *uap;
+       int *retval;
+{
+       struct msghdr msg;
+       struct iovec aiov;
+
+       msg.msg_name = 0;
+       msg.msg_namelen = 0;
+       msg.msg_iov = &aiov;
+       msg.msg_iovlen = 1;
+       aiov.iov_base = uap->buf;
+       aiov.iov_len = uap->len;
+       msg.msg_control = 0;
+       msg.msg_flags = 0;
+       return (sendit(p, uap->s, &msg, uap->flags, retval));
+}
+
+#define MSG_COMPAT     0x8000
+osendmsg(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               caddr_t msg;
+               int     flags;
+       } *uap;
+       int *retval;
+{
+       struct msghdr msg;
+       struct iovec aiov[UIO_SMALLIOV], *iov;
+       int error;
+
+       if (error = copyin(uap->msg, (caddr_t)&msg, sizeof (struct omsghdr)))
+               return (error);
+       if ((u_int)msg.msg_iovlen >= UIO_SMALLIOV) {
+               if ((u_int)msg.msg_iovlen >= UIO_MAXIOV)
+                       return (EMSGSIZE);
+               MALLOC(iov, struct iovec *,
+                     sizeof(struct iovec) * (u_int)msg.msg_iovlen, M_IOV, 
+                     M_WAITOK);
+       } else
+               iov = aiov;
+       if (error = copyin((caddr_t)msg.msg_iov, (caddr_t)iov,
+           (unsigned)(msg.msg_iovlen * sizeof (struct iovec))))
+               goto done;
+       msg.msg_flags = MSG_COMPAT;
+       msg.msg_iov = iov;
+       error = sendit(p, uap->s, &msg, uap->flags, retval);
+done:
+       if (iov != aiov)
+               FREE(iov, M_IOV);
+       return (error);
+}
+#endif
+
+sendmsg(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               caddr_t msg;
+               int     flags;
+       } *uap;
+       int *retval;
+{
+       struct msghdr msg;
+       struct iovec aiov[UIO_SMALLIOV], *iov;
+       int error;
+
+       if (error = copyin(uap->msg, (caddr_t)&msg, sizeof (msg)))
+               return (error);
+       if ((u_int)msg.msg_iovlen >= UIO_SMALLIOV) {
+               if ((u_int)msg.msg_iovlen >= UIO_MAXIOV)
+                       return (EMSGSIZE);
+               MALLOC(iov, struct iovec *,
+                      sizeof(struct iovec) * (u_int)msg.msg_iovlen, M_IOV,
+                      M_WAITOK);
+       } else
+               iov = aiov;
+       if (msg.msg_iovlen &&
+           (error = copyin((caddr_t)msg.msg_iov, (caddr_t)iov,
+           (unsigned)(msg.msg_iovlen * sizeof (struct iovec)))))
+               goto done;
+       msg.msg_iov = iov;
+#ifdef COMPAT_43
+       msg.msg_flags = 0;
+#endif
+       error = sendit(p, uap->s, &msg, uap->flags, retval);
+done:
+       if (iov != aiov)
+               FREE(iov, M_IOV);
+       return (error);
+}
+
+sendit(p, s, mp, flags, retsize)
+       register struct proc *p;
        int s;
        int s;
-COUNT(SDISCONNECT);
+       register struct msghdr *mp;
+       int flags, *retsize;
+{
+       struct file *fp;
+       struct uio auio;
+       register struct iovec *iov;
+       register int i;
+       struct mbuf *to, *control;
+       int len, error;
+#ifdef KTRACE
+       struct iovec *ktriov = NULL;
+#endif
+       
+       if (error = getsock(p->p_fd, s, &fp))
+               return (error);
+       auio.uio_iov = mp->msg_iov;
+       auio.uio_iovcnt = mp->msg_iovlen;
+       auio.uio_segflg = UIO_USERSPACE;
+       auio.uio_rw = UIO_WRITE;
+       auio.uio_procp = p;
+       auio.uio_offset = 0;                    /* XXX */
+       auio.uio_resid = 0;
+       iov = mp->msg_iov;
+       for (i = 0; i < mp->msg_iovlen; i++, iov++) {
+               if (iov->iov_len < 0)
+                       return (EINVAL);
+               if ((auio.uio_resid += iov->iov_len) < 0)
+                       return (EINVAL);
+       }
+       if (mp->msg_name) {
+               if (error = sockargs(&to, mp->msg_name, mp->msg_namelen,
+                   MT_SONAME))
+                       return (error);
+       } else
+               to = 0;
+       if (mp->msg_control) {
+               if (mp->msg_controllen < sizeof(struct cmsghdr)
+#ifdef COMPAT_43
+                   && mp->msg_flags != MSG_COMPAT
+#endif
+               ) {
+                       error = EINVAL;
+                       goto bad;
+               }
+               if (error = sockargs(&control, mp->msg_control,
+                   mp->msg_controllen, MT_CONTROL))
+                       goto bad;
+#ifdef COMPAT_43
+               if (mp->msg_flags == MSG_COMPAT) {
+                       register struct cmsghdr *cm;
 
 
-       if (uap->asa &&
-           copyin((caddr_t)uap->asa, (caddr_t)&sa, sizeof (sa))) {
-               u.u_error = EFAULT;
-               return;
+                       M_PREPEND(control, sizeof(*cm), M_WAIT);
+                       if (control == 0) {
+                               error = ENOBUFS;
+                               goto bad;
+                       } else {
+                               cm = mtod(control, struct cmsghdr *);
+                               cm->cmsg_len = control->m_len;
+                               cm->cmsg_level = SOL_SOCKET;
+                               cm->cmsg_type = SCM_RIGHTS;
+                       }
+               }
+#endif
+       } else
+               control = 0;
+#ifdef KTRACE
+       if (KTRPOINT(p, KTR_GENIO)) {
+               int iovlen = auio.uio_iovcnt * sizeof (struct iovec);
+
+               MALLOC(ktriov, struct iovec *, iovlen, M_TEMP, M_WAITOK);
+               bcopy((caddr_t)auio.uio_iov, (caddr_t)ktriov, iovlen);
        }
        }
-       fp = getf(uap->fdes);
-       if (fp == 0)
-               return;
-       if ((fp->f_flag & FSOCKET) == 0) {
-               u.u_error = ENOTSOCK;
-               return;
+#endif
+       len = auio.uio_resid;
+       if (error = sosend((struct socket *)fp->f_data, to, &auio,
+           (struct mbuf *)0, control, flags)) {
+               if (auio.uio_resid != len && (error == ERESTART ||
+                   error == EINTR || error == EWOULDBLOCK))
+                       error = 0;
+               if (error == EPIPE)
+                       psignal(p, SIGPIPE);
        }
        }
-       so = fp->f_socket;
-       u.u_error = sodisconnect(so, uap->asa ? &sa : 0);
-       if (u.u_error)
-               return;
-       s = splnet();
-       if ((so->so_options&SO_NONBLOCKING) && (so->so_state&SS_ISDISCONNECTING)) {
-               u.u_error = EINPROGRESS;
-               splx(s);
-               return;
+       if (error == 0)
+               *retsize = len - auio.uio_resid;
+#ifdef KTRACE
+       if (ktriov != NULL) {
+               if (error == 0)
+                       ktrgenio(p->p_tracep, s, UIO_WRITE,
+                               ktriov, *retsize, error);
+               FREE(ktriov, M_TEMP);
        }
        }
-       while ((so->so_state & SS_ISDISCONNECTING) && so->so_error == 0)
-               sleep((caddr_t)&so->so_timeo, PZERO+1);
-       u.u_error = so->so_error;
-       so->so_error = 0;
-       splx(s);
+#endif
+bad:
+       if (to)
+               m_freem(to);
+       return (error);
+}
+
+#ifdef COMPAT_43
+orecvfrom(p, uap, retval)
+       struct proc *p;
+       struct args {
+               int     s;
+               caddr_t buf;
+               int     len;
+               int     flags;
+               caddr_t from;
+               int     *fromlenaddr;
+       } *uap;
+       int *retval;
+{
+
+       uap->flags |= MSG_COMPAT;
+       return (recvfrom(p, uap, retval));
+}
+#endif
+
+recvfrom(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               caddr_t buf;
+               int     len;
+               int     flags;
+               caddr_t from;
+               int     *fromlenaddr;
+       } *uap;
+       int *retval;
+{
+       struct msghdr msg;
+       struct iovec aiov;
+       int error;
+
+       if (uap->fromlenaddr) {
+               if (error = copyin((caddr_t)uap->fromlenaddr,
+                   (caddr_t)&msg.msg_namelen, sizeof (msg.msg_namelen)))
+                       return (error);
+       } else
+               msg.msg_namelen = 0;
+       msg.msg_name = uap->from;
+       msg.msg_iov = &aiov;
+       msg.msg_iovlen = 1;
+       aiov.iov_base = uap->buf;
+       aiov.iov_len = uap->len;
+       msg.msg_control = 0;
+       msg.msg_flags = uap->flags;
+       return (recvit(p, uap->s, &msg, (caddr_t)uap->fromlenaddr, retval));
+}
+
+#ifdef COMPAT_43
+orecv(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               caddr_t buf;
+               int     len;
+               int     flags;
+       } *uap;
+       int *retval;
+{
+       struct msghdr msg;
+       struct iovec aiov;
+
+       msg.msg_name = 0;
+       msg.msg_namelen = 0;
+       msg.msg_iov = &aiov;
+       msg.msg_iovlen = 1;
+       aiov.iov_base = uap->buf;
+       aiov.iov_len = uap->len;
+       msg.msg_control = 0;
+       msg.msg_flags = uap->flags;
+       return (recvit(p, uap->s, &msg, (caddr_t)0, retval));
 }
 
 /*
 }
 
 /*
- * Send data on socket.
+ * Old recvmsg.  This code takes advantage of the fact that the old msghdr
+ * overlays the new one, missing only the flags, and with the (old) access
+ * rights where the control fields are now.
  */
  */
-ssend()
+orecvmsg(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               struct  omsghdr *msg;
+               int     flags;
+       } *uap;
+       int *retval;
 {
 {
-       register struct a {
-               int     fdes;
-               struct  sockaddr *asa;
-               caddr_t cbuf;
-               unsigned count;
-       } *uap = (struct a *)u.u_ap;
-       register struct file *fp;
-       struct sockaddr sa;
-COUNT(SSEND);
-
-       fp = getf(uap->fdes);
-       if (fp == 0)
-               return;
-       if ((fp->f_flag & FSOCKET) == 0) {
-               u.u_error = ENOTSOCK;
-               return;
+       struct msghdr msg;
+       struct iovec aiov[UIO_SMALLIOV], *iov;
+       int error;
+
+       if (error = copyin((caddr_t)uap->msg, (caddr_t)&msg,
+           sizeof (struct omsghdr)))
+               return (error);
+       if ((u_int)msg.msg_iovlen >= UIO_SMALLIOV) {
+               if ((u_int)msg.msg_iovlen >= UIO_MAXIOV)
+                       return (EMSGSIZE);
+               MALLOC(iov, struct iovec *,
+                     sizeof(struct iovec) * (u_int)msg.msg_iovlen, M_IOV,
+                     M_WAITOK);
+       } else
+               iov = aiov;
+       msg.msg_flags = uap->flags | MSG_COMPAT;
+       if (error = copyin((caddr_t)msg.msg_iov, (caddr_t)iov,
+           (unsigned)(msg.msg_iovlen * sizeof (struct iovec))))
+               goto done;
+       msg.msg_iov = iov;
+       error = recvit(p, uap->s, &msg, (caddr_t)&uap->msg->msg_namelen, retval);
+
+       if (msg.msg_controllen && error == 0)
+               error = copyout((caddr_t)&msg.msg_controllen,
+                   (caddr_t)&uap->msg->msg_accrightslen, sizeof (int));
+done:
+       if (iov != aiov)
+               FREE(iov, M_IOV);
+       return (error);
+}
+#endif
+
+recvmsg(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               struct  msghdr *msg;
+               int     flags;
+       } *uap;
+       int *retval;
+{
+       struct msghdr msg;
+       struct iovec aiov[UIO_SMALLIOV], *uiov, *iov;
+       register int error;
+
+       if (error = copyin((caddr_t)uap->msg, (caddr_t)&msg, sizeof (msg)))
+               return (error);
+       if ((u_int)msg.msg_iovlen >= UIO_SMALLIOV) {
+               if ((u_int)msg.msg_iovlen >= UIO_MAXIOV)
+                       return (EMSGSIZE);
+               MALLOC(iov, struct iovec *,
+                      sizeof(struct iovec) * (u_int)msg.msg_iovlen, M_IOV,
+                      M_WAITOK);
+       } else
+               iov = aiov;
+#ifdef COMPAT_43
+       msg.msg_flags = uap->flags &~ MSG_COMPAT;
+#else
+       msg.msg_flags = uap->flags;
+#endif
+       uiov = msg.msg_iov;
+       msg.msg_iov = iov;
+       if (error = copyin((caddr_t)uiov, (caddr_t)iov,
+           (unsigned)(msg.msg_iovlen * sizeof (struct iovec))))
+               goto done;
+       if ((error = recvit(p, uap->s, &msg, (caddr_t)0, retval)) == 0) {
+               msg.msg_iov = uiov;
+               error = copyout((caddr_t)&msg, (caddr_t)uap->msg, sizeof(msg));
        }
        }
-       u.u_base = uap->cbuf;
-       u.u_count = uap->count;
-       u.u_segflg = 0;
-       if (useracc(uap->cbuf, uap->count, B_READ) == 0 ||
-           uap->asa && copyin((caddr_t)uap->asa, (caddr_t)&sa, sizeof (sa))) {
-               u.u_error = EFAULT;
-               return;
+done:
+       if (iov != aiov)
+               FREE(iov, M_IOV);
+       return (error);
+}
+
+recvit(p, s, mp, namelenp, retsize)
+       register struct proc *p;
+       int s;
+       register struct msghdr *mp;
+       caddr_t namelenp;
+       int *retsize;
+{
+       struct file *fp;
+       struct uio auio;
+       register struct iovec *iov;
+       register int i;
+       int len, error;
+       struct mbuf *from = 0, *control = 0;
+#ifdef KTRACE
+       struct iovec *ktriov = NULL;
+#endif
+       
+       if (error = getsock(p->p_fd, s, &fp))
+               return (error);
+       auio.uio_iov = mp->msg_iov;
+       auio.uio_iovcnt = mp->msg_iovlen;
+       auio.uio_segflg = UIO_USERSPACE;
+       auio.uio_rw = UIO_READ;
+       auio.uio_procp = p;
+       auio.uio_offset = 0;                    /* XXX */
+       auio.uio_resid = 0;
+       iov = mp->msg_iov;
+       for (i = 0; i < mp->msg_iovlen; i++, iov++) {
+               if (iov->iov_len < 0)
+                       return (EINVAL);
+               if ((auio.uio_resid += iov->iov_len) < 0)
+                       return (EINVAL);
        }
        }
-       u.u_error = sosend(fp->f_socket, uap->asa ? &sa : 0);
-       u.u_r.r_val1 = uap->count - u.u_count;
+#ifdef KTRACE
+       if (KTRPOINT(p, KTR_GENIO)) {
+               int iovlen = auio.uio_iovcnt * sizeof (struct iovec);
+
+               MALLOC(ktriov, struct iovec *, iovlen, M_TEMP, M_WAITOK);
+               bcopy((caddr_t)auio.uio_iov, (caddr_t)ktriov, iovlen);
+       }
+#endif
+       len = auio.uio_resid;
+       if (error = soreceive((struct socket *)fp->f_data, &from, &auio,
+           (struct mbuf **)0, &control, &mp->msg_flags)) {
+               if (auio.uio_resid != len && (error == ERESTART ||
+                   error == EINTR || error == EWOULDBLOCK))
+                       error = 0;
+       }
+#ifdef KTRACE
+       if (ktriov != NULL) {
+               if (error == 0)
+                       ktrgenio(p->p_tracep, s, UIO_READ,
+                               ktriov, len - auio.uio_resid, error);
+               FREE(ktriov, M_TEMP);
+       }
+#endif
+       if (error)
+               goto out;
+       *retsize = len - auio.uio_resid;
+       if (mp->msg_name) {
+               len = mp->msg_namelen;
+               if (len <= 0 || from == 0)
+                       len = 0;
+               else {
+#ifdef COMPAT_43
+                       if (mp->msg_flags & MSG_COMPAT)
+                               mtod(from, struct osockaddr *)->sa_family =
+                                   mtod(from, struct sockaddr *)->sa_family;
+#endif
+                       if (len > from->m_len)
+                               len = from->m_len;
+                       /* else if len < from->m_len ??? */
+                       if (error = copyout(mtod(from, caddr_t),
+                           (caddr_t)mp->msg_name, (unsigned)len))
+                               goto out;
+               }
+               mp->msg_namelen = len;
+               if (namelenp &&
+                   (error = copyout((caddr_t)&len, namelenp, sizeof (int)))) {
+#ifdef COMPAT_43
+                       if (mp->msg_flags & MSG_COMPAT)
+                               error = 0;      /* old recvfrom didn't check */
+                       else
+#endif
+                       goto out;
+               }
+       }
+       if (mp->msg_control) {
+#ifdef COMPAT_43
+               /*
+                * We assume that old recvmsg calls won't receive access
+                * rights and other control info, esp. as control info
+                * is always optional and those options didn't exist in 4.3.
+                * If we receive rights, trim the cmsghdr; anything else
+                * is tossed.
+                */
+               if (control && mp->msg_flags & MSG_COMPAT) {
+                       if (mtod(control, struct cmsghdr *)->cmsg_level !=
+                           SOL_SOCKET ||
+                           mtod(control, struct cmsghdr *)->cmsg_type !=
+                           SCM_RIGHTS) {
+                               mp->msg_controllen = 0;
+                               goto out;
+                       }
+                       control->m_len -= sizeof (struct cmsghdr);
+                       control->m_data += sizeof (struct cmsghdr);
+               }
+#endif
+               len = mp->msg_controllen;
+               if (len <= 0 || control == 0)
+                       len = 0;
+               else {
+                       if (len >= control->m_len)
+                               len = control->m_len;
+                       else
+                               mp->msg_flags |= MSG_CTRUNC;
+                       error = copyout((caddr_t)mtod(control, caddr_t),
+                           (caddr_t)mp->msg_control, (unsigned)len);
+               }
+               mp->msg_controllen = len;
+       }
+out:
+       if (from)
+               m_freem(from);
+       if (control)
+               m_freem(control);
+       return (error);
+}
+
+/* ARGSUSED */
+shutdown(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               int     how;
+       } *uap;
+       int *retval;
+{
+       struct file *fp;
+       int error;
+
+       if (error = getsock(p->p_fd, uap->s, &fp))
+               return (error);
+       return (soshutdown((struct socket *)fp->f_data, uap->how));
+}
+
+/* ARGSUSED */
+setsockopt(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               int     level;
+               int     name;
+               caddr_t val;
+               int     valsize;
+       } *uap;
+       int *retval;
+{
+       struct file *fp;
+       struct mbuf *m = NULL;
+       int error;
+
+       if (error = getsock(p->p_fd, uap->s, &fp))
+               return (error);
+       if (uap->valsize > MLEN)
+               return (EINVAL);
+       if (uap->val) {
+               m = m_get(M_WAIT, MT_SOOPTS);
+               if (m == NULL)
+                       return (ENOBUFS);
+               if (error = copyin(uap->val, mtod(m, caddr_t),
+                   (u_int)uap->valsize)) {
+                       (void) m_free(m);
+                       return (error);
+               }
+               m->m_len = uap->valsize;
+       }
+       return (sosetopt((struct socket *)fp->f_data, uap->level,
+           uap->name, m));
+}
+
+/* ARGSUSED */
+getsockopt(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     s;
+               int     level;
+               int     name;
+               caddr_t val;
+               int     *avalsize;
+       } *uap;
+       int *retval;
+{
+       struct file *fp;
+       struct mbuf *m = NULL;
+       int valsize, error;
+
+       if (error = getsock(p->p_fd, uap->s, &fp))
+               return (error);
+       if (uap->val) {
+               if (error = copyin((caddr_t)uap->avalsize, (caddr_t)&valsize,
+                   sizeof (valsize)))
+                       return (error);
+       } else
+               valsize = 0;
+       if ((error = sogetopt((struct socket *)fp->f_data, uap->level,
+           uap->name, &m)) == 0 && uap->val && valsize && m != NULL) {
+               if (valsize > m->m_len)
+                       valsize = m->m_len;
+               error = copyout(mtod(m, caddr_t), uap->val, (u_int)valsize);
+               if (error == 0)
+                       error = copyout((caddr_t)&valsize,
+                           (caddr_t)uap->avalsize, sizeof (valsize));
+       }
+       if (m != NULL)
+               (void) m_free(m);
+       return (error);
+}
+
+/* ARGSUSED */
+pipe(p, uap, retval)
+       struct proc *p;
+       struct args *uap;
+       int retval[];
+{
+       register struct filedesc *fdp = p->p_fd;
+       struct file *rf, *wf;
+       struct socket *rso, *wso;
+       int fd, error;
+
+       if (error = socreate(AF_UNIX, &rso, SOCK_STREAM, 0))
+               return (error);
+       if (error = socreate(AF_UNIX, &wso, SOCK_STREAM, 0))
+               goto free1;
+       if (error = falloc(p, &rf, &fd))
+               goto free2;
+       retval[0] = fd;
+       rf->f_flag = FREAD;
+       rf->f_type = DTYPE_SOCKET;
+       rf->f_ops = &socketops;
+       rf->f_data = (caddr_t)rso;
+       if (error = falloc(p, &wf, &fd))
+               goto free3;
+       wf->f_flag = FWRITE;
+       wf->f_type = DTYPE_SOCKET;
+       wf->f_ops = &socketops;
+       wf->f_data = (caddr_t)wso;
+       retval[1] = fd;
+       if (error = unp_connect2(wso, rso))
+               goto free4;
+       return (0);
+free4:
+       wf->f_count = 0;
+       fdp->fd_ofiles[retval[1]] = 0;
+free3:
+       rf->f_count = 0;
+       fdp->fd_ofiles[retval[0]] = 0;
+free2:
+       (void)soclose(wso);
+free1:
+       (void)soclose(rso);
+       return (error);
 }
 
 /*
 }
 
 /*
- * Receive data on socket.
+ * Get socket name.
  */
  */
-sreceive()
+#ifdef COMPAT_43
+getsockname(p, uap, retval)
+       struct proc *p;
+       struct args {
+               int     fdes;
+               caddr_t asa;
+               int     *alen;
+               int     compat_43;
+       } *uap;
+       int *retval;
 {
 {
-       register struct a {
+
+       uap->compat_43 = 0;
+       return (getsockname1(p, uap, retval));
+}
+
+ogetsockname(p, uap, retval)
+       struct proc *p;
+       struct args {
                int     fdes;
                int     fdes;
-               struct  sockaddr *asa;
-               caddr_t cbuf;
-               u_int   count;
-       } *uap = (struct a *)u.u_ap;
-       register struct file *fp;
-       struct sockaddr sa;
-COUNT(SRECEIVE);
-
-       fp = getf(uap->fdes);
-       if (fp == 0)
-               return;
-       if ((fp->f_flag & FSOCKET) == 0) {
-               u.u_error = ENOTSOCK;
-               return;
-       }
-       u.u_base = uap->cbuf;
-       u.u_count = uap->count;
-       u.u_segflg = 0;
-       if (useracc(uap->cbuf, uap->count, B_WRITE) == 0 ||
-           uap->asa && copyin((caddr_t)uap->asa, (caddr_t)&sa, sizeof (sa))) {
-               u.u_error = EFAULT;
-               return;
-       }
-       u.u_error = soreceive(fp->f_socket, uap->asa ? &sa : 0);
-       if (u.u_error)
-               return;
-       if (uap->asa)
-               (void) copyout((caddr_t)&sa, (caddr_t)uap->asa, sizeof (sa));
-       u.u_r.r_val1 = uap->count - u.u_count;
+               caddr_t asa;
+               int     *alen;
+               int     compat_43;
+       } *uap;
+       int *retval;
+{
+
+       uap->compat_43 = 1;
+       return (getsockname1(p, uap, retval));
+}
+#else /* COMPAT_43 */
+
+#define        getsockname1    getsockname
+#endif
+
+/* ARGSUSED */
+getsockname1(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     fdes;
+               caddr_t asa;
+               int     *alen;
+#ifdef COMPAT_43
+               int     compat_43;
+#endif
+       } *uap;
+       int *retval;
+{
+       struct file *fp;
+       register struct socket *so;
+       struct mbuf *m;
+       int len, error;
+
+       if (error = getsock(p->p_fd, uap->fdes, &fp))
+               return (error);
+       if (error = copyin((caddr_t)uap->alen, (caddr_t)&len, sizeof (len)))
+               return (error);
+       so = (struct socket *)fp->f_data;
+       m = m_getclr(M_WAIT, MT_SONAME);
+       if (m == NULL)
+               return (ENOBUFS);
+       if (error = (*so->so_proto->pr_usrreq)(so, PRU_SOCKADDR, 0, m, 0))
+               goto bad;
+       if (len > m->m_len)
+               len = m->m_len;
+#ifdef COMPAT_43
+       if (uap->compat_43)
+               mtod(m, struct osockaddr *)->sa_family =
+                   mtod(m, struct sockaddr *)->sa_family;
+#endif
+       error = copyout(mtod(m, caddr_t), (caddr_t)uap->asa, (u_int)len);
+       if (error == 0)
+               error = copyout((caddr_t)&len, (caddr_t)uap->alen,
+                   sizeof (len));
+bad:
+       m_freem(m);
+       return (error);
 }
 
 /*
 }
 
 /*
- * Get socket address.
+ * Get name of peer for connected socket.
  */
  */
-ssocketaddr()
+#ifdef COMPAT_43
+getpeername(p, uap, retval)
+       struct proc *p;
+       struct args {
+               int     fdes;
+               caddr_t asa;
+               int     *alen;
+               int     compat_43;
+       } *uap;
+       int *retval;
 {
 {
-       register struct a {
+
+       uap->compat_43 = 0;
+       return (getpeername1(p, uap, retval));
+}
+
+ogetpeername(p, uap, retval)
+       struct proc *p;
+       struct args {
                int     fdes;
                int     fdes;
-               struct  sockaddr *asa;
-       } *uap = (struct a *)u.u_ap;
-       register struct file *fp;
-COUNT(SSOCKETADDR);
-
-       fp = getf(uap->fdes);
-       if (fp == 0)
-               return;
-       if ((fp->f_flag & FSOCKET) == 0) {
-               u.u_error = ENOTSOCK;
-               return;
+               caddr_t asa;
+               int     *alen;
+               int     compat_43;
+       } *uap;
+       int *retval;
+{
+
+       uap->compat_43 = 1;
+       return (getpeername1(p, uap, retval));
+}
+#else /* COMPAT_43 */
+
+#define        getpeername1    getpeername
+#endif
+
+/* ARGSUSED */
+getpeername1(p, uap, retval)
+       struct proc *p;
+       register struct args {
+               int     fdes;
+               caddr_t asa;
+               int     *alen;
+#ifdef COMPAT_43
+               int     compat_43;
+#endif
+       } *uap;
+       int *retval;
+{
+       struct file *fp;
+       register struct socket *so;
+       struct mbuf *m;
+       int len, error;
+
+       if (error = getsock(p->p_fd, uap->fdes, &fp))
+               return (error);
+       so = (struct socket *)fp->f_data;
+       if ((so->so_state & (SS_ISCONNECTED|SS_ISCONFIRMING)) == 0)
+               return (ENOTCONN);
+       m = m_getclr(M_WAIT, MT_SONAME);
+       if (m == NULL)
+               return (ENOBUFS);
+       if (error = copyin((caddr_t)uap->alen, (caddr_t)&len, sizeof (len)))
+               return (error);
+       if (error = (*so->so_proto->pr_usrreq)(so, PRU_PEERADDR, 0, m, 0))
+               goto bad;
+       if (len > m->m_len)
+               len = m->m_len;
+#ifdef COMPAT_43
+       if (uap->compat_43)
+               mtod(m, struct osockaddr *)->sa_family =
+                   mtod(m, struct sockaddr *)->sa_family;
+#endif
+       if (error = copyout(mtod(m, caddr_t), (caddr_t)uap->asa, (u_int)len))
+               goto bad;
+       error = copyout((caddr_t)&len, (caddr_t)uap->alen, sizeof (len));
+bad:
+       m_freem(m);
+       return (error);
+}
+
+sockargs(mp, buf, buflen, type)
+       struct mbuf **mp;
+       caddr_t buf;
+       int buflen, type;
+{
+       register struct mbuf *m;
+       int error;
+
+       if ((u_int)buflen > MLEN) {
+#ifdef COMPAT_43
+               if (type == MT_SONAME && (u_int)buflen <= 112)
+                       buflen = MLEN;          /* unix domain compat. hack */
+               else
+#endif
+               return (EINVAL);
        }
        }
-       if (copyout((caddr_t)&fp->f_socket->so_addr, (caddr_t)uap->asa, 
-           sizeof (struct sockaddr))) {
-               u.u_error = EFAULT;
-               return;
+       m = m_get(M_WAIT, type);
+       if (m == NULL)
+               return (ENOBUFS);
+       m->m_len = buflen;
+       error = copyin(buf, mtod(m, caddr_t), (u_int)buflen);
+       if (error)
+               (void) m_free(m);
+       else
+               *mp = m;
+       if (type == MT_SONAME) {
+               register struct sockaddr *sa = mtod(m, struct sockaddr *);
+
+#if defined(COMPAT_43) && BYTE_ORDER != BIG_ENDIAN
+               if (sa->sa_family == 0 && sa->sa_len < AF_MAX)
+                       sa->sa_family = sa->sa_len;
+#endif
+               sa->sa_len = buflen;
        }
        }
+       return (error);
+}
+
+getsock(fdp, fdes, fpp)
+       struct filedesc *fdp;
+       int fdes;
+       struct file **fpp;
+{
+       register struct file *fp;
+
+       if ((unsigned)fdes >= fdp->fd_nfiles ||
+           (fp = fdp->fd_ofiles[fdes]) == NULL)
+               return (EBADF);
+       if (fp->f_type != DTYPE_SOCKET)
+               return (ENOTSOCK);
+       *fpp = fp;
+       return (0);
 }
 }