For SNAT, don't store the pre-fragment L2 header before actions are applied.
[sliver-openvswitch.git] / lib / vconn-tcp.c
index 1878d2d..79d8332 100644 (file)
@@ -1,68 +1,65 @@
-/* Copyright (C) 2007 Board of Trustees, Leland Stanford Jr. University.
- *
- * Permission is hereby granted, free of charge, to any person obtaining a copy
- * of this software and associated documentation files (the "Software"), to
- * deal in the Software without restriction, including without limitation the
- * rights to use, copy, modify, merge, publish, distribute, sublicense, and/or
- * sell copies of the Software, and to permit persons to whom the Software is
- * furnished to do so, subject to the following conditions:
- *
- * The above copyright notice and this permission notice shall be included in
- * all copies or substantial portions of the Software.
- *
- * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
- * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
- * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
- * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
- * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
- * FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS
- * IN THE SOFTWARE.
+/* Copyright (c) 2008 The Board of Trustees of The Leland Stanford
+ * Junior University
+ * 
+ * We are making the OpenFlow specification and associated documentation
+ * (Software) available for public use and benefit with the expectation
+ * that others will use, modify and enhance the Software and contribute
+ * those enhancements back to the community. However, since we would
+ * like to make the Software available for broadest use, with as few
+ * restrictions as possible permission is hereby granted, free of
+ * charge, to any person obtaining a copy of this Software to deal in
+ * the Software under the copyrights without restriction, including
+ * without limitation the rights to use, copy, modify, merge, publish,
+ * distribute, sublicense, and/or sell copies of the Software, and to
+ * permit persons to whom the Software is furnished to do so, subject to
+ * the following conditions:
+ * 
+ * The above copyright notice and this permission notice shall be
+ * included in all copies or substantial portions of the Software.
+ * 
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
+ * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
+ * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
+ * NONINFRINGEMENT.  IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
+ * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
+ * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
+ * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+ * SOFTWARE.
+ * 
+ * The name and trademarks of copyright holder(s) may NOT be used in
+ * advertising or publicity pertaining to the Software or any
+ * derivatives without specific, written prior permission.
  */
 
+#include <config.h>
 #include "vconn.h"
-#include <assert.h>
 #include <errno.h>
-#include <netdb.h>
-#include <poll.h>
+#include <inttypes.h>
 #include <sys/types.h>
 #include <netinet/in.h>
 #include <netinet/tcp.h>
 #include <stdlib.h>
 #include <string.h>
 #include <unistd.h>
-#include "buffer.h"
+#include "packets.h"
 #include "socket-util.h"
 #include "util.h"
-#include "openflow.h"
-#include "ofp-print.h"
+#include "openflow/openflow.h"
+#include "vconn-provider.h"
+#include "vconn-stream.h"
 
 #include "vlog.h"
 #define THIS_MODULE VLM_vconn_tcp
 
 /* Active TCP. */
 
-struct tcp_vconn
-{
-    struct vconn vconn;
-    int fd;
-    struct buffer *rxbuf;
-    struct buffer *txbuf;
-};
-
 static int
-new_tcp_vconn(const char *name, int fd, struct vconn **vconnp) 
+new_tcp_vconn(const char *name, int fd, int connect_status,
+              const struct sockaddr_in *sin, struct vconn **vconnp)
 {
-    struct tcp_vconn *tcp;
     int on = 1;
     int retval;
 
-    retval = set_nonblocking(fd);
-    if (retval) {
-        VLOG_ERR("%s: set_nonblocking: %s", name, strerror(retval));
-        close(fd);
-        return retval;
-    }
-
     retval = setsockopt(fd, IPPROTO_TCP, TCP_NODELAY, &on, sizeof on);
     if (retval) {
         VLOG_ERR("%s: setsockopt(TCP_NODELAY): %s", name, strerror(errno));
@@ -70,23 +67,10 @@ new_tcp_vconn(const char *name, int fd, struct vconn **vconnp)
         return errno;
     }
 
-    tcp = xmalloc(sizeof *tcp);
-    tcp->vconn.class = &tcp_vconn_class;
-    tcp->fd = fd;
-    tcp->txbuf = NULL;
-    tcp->rxbuf = NULL;
-    *vconnp = &tcp->vconn;
-    return 0;
+    return new_stream_vconn(name, fd, connect_status, sin->sin_addr.s_addr,
+                            vconnp);
 }
 
-static struct tcp_vconn *
-tcp_vconn_cast(struct vconn *vconn) 
-{
-    assert(vconn->class == &tcp_vconn_class);
-    return CONTAINER_OF(vconn, struct tcp_vconn, vconn); 
-}
-
-
 static int
 tcp_open(const char *name, char *suffix, struct vconn **vconnp)
 {
@@ -104,7 +88,8 @@ tcp_open(const char *name, char *suffix, struct vconn **vconnp)
     host_name = strtok_r(suffix, "::", &save_ptr);
     port_string = strtok_r(NULL, "::", &save_ptr);
     if (!host_name) {
-        fatal(0, "%s: bad peer name format", name);
+        ofp_error(0, "%s: bad peer name format", name);
+        return EAFNOSUPPORT;
     }
 
     memset(&sin, 0, sizeof sin);
@@ -120,164 +105,46 @@ tcp_open(const char *name, char *suffix, struct vconn **vconnp)
         return errno;
     }
 
-    retval = connect(fd, (struct sockaddr *) &sin, sizeof sin);
-    if (retval < 0) {
-        int error = errno;
-        VLOG_ERR("%s: connect: %s", name, strerror(error));
+    retval = set_nonblocking(fd);
+    if (retval) {
         close(fd);
-        return error;
-    }
-
-    return new_tcp_vconn(name, fd, vconnp);
-}
-
-static void
-tcp_close(struct vconn *vconn) 
-{
-    struct tcp_vconn *tcp = tcp_vconn_cast(vconn);
-    close(tcp->fd);
-    free(tcp);
-}
-
-static void
-tcp_prepoll(struct vconn *vconn, int want, struct pollfd *pfd) 
-{
-    struct tcp_vconn *tcp = tcp_vconn_cast(vconn);
-    pfd->fd = tcp->fd;
-    if (want & WANT_RECV) {
-        pfd->events |= POLLIN;
-    }
-    if (want & WANT_SEND || tcp->txbuf) {
-        pfd->events |= POLLOUT;
-    }
-}
-
-static void
-tcp_postpoll(struct vconn *vconn, short int *revents)
-{
-    struct tcp_vconn *tcp = tcp_vconn_cast(vconn);
-    if (*revents & POLLOUT && tcp->txbuf) {
-        ssize_t n = write(tcp->fd, tcp->txbuf->data, tcp->txbuf->size);
-        if (n < 0) {
-            if (errno != EAGAIN) {
-                VLOG_ERR("send: %s", strerror(errno));
-                *revents |= POLLERR;
-            }
-        } else if (n > 0) {
-            buffer_pull(tcp->txbuf, n);
-            if (tcp->txbuf->size == 0) {
-                buffer_delete(tcp->txbuf);
-                tcp->txbuf = NULL;
-            }
-        }
-        if (tcp->txbuf) {
-            *revents &= ~POLLOUT;
-        }
-    }
-}
-
-static int
-tcp_recv(struct vconn *vconn, struct buffer **bufferp)
-{
-    struct tcp_vconn *tcp = tcp_vconn_cast(vconn);
-    struct buffer *rx;
-    size_t want_bytes;
-    ssize_t retval;
-
-    if (tcp->rxbuf == NULL) {
-        tcp->rxbuf = buffer_new(1564);
-    }
-    rx = tcp->rxbuf;
-
-again:
-    if (sizeof(struct ofp_header) > rx->size) {
-        want_bytes = sizeof(struct ofp_header) - rx->size;
-    } else {
-        struct ofp_header *oh = rx->data;
-        size_t length = ntohs(oh->length);
-        if (length < sizeof(struct ofp_header)) {
-            VLOG_ERR("received too-short ofp_header (%zu bytes)", length);
-            return EPROTO;
-        }
-        want_bytes = length - rx->size;
-    }
-    buffer_reserve_tailroom(rx, want_bytes);
-
-    retval = read(tcp->fd, buffer_tail(rx), want_bytes);
-    if (retval > 0) {
-        rx->size += retval;
-        if (retval == want_bytes) {
-            if (rx->size > sizeof(struct ofp_header)) {
-                *bufferp = rx;
-                tcp->rxbuf = NULL;
-                return 0;
-            } else {
-                goto again;
-            }
-        }
-        return EAGAIN;
-    } else if (retval == 0) {
-        return rx->size ? EPROTO : EOF;
-    } else {
-        return retval ? errno : EAGAIN;
-    }
-}
-
-static int
-tcp_send(struct vconn *vconn, struct buffer *buffer) 
-{
-    struct tcp_vconn *tcp = tcp_vconn_cast(vconn);
-    ssize_t retval;
-
-    if (tcp->txbuf) {
-        return EAGAIN;
+        return retval;
     }
 
-    retval = write(tcp->fd, buffer->data, buffer->size);
-    if (retval == buffer->size) {
-        buffer_delete(buffer);
-        return 0;
-    } else if (retval >= 0 || errno == EAGAIN) {
-        tcp->txbuf = buffer;
-        if (retval > 0) {
-            buffer_pull(buffer, retval);
+    retval = connect(fd, (struct sockaddr *) &sin, sizeof sin);
+    if (retval < 0) {
+        if (errno == EINPROGRESS) {
+            return new_tcp_vconn(name, fd, EAGAIN, &sin, vconnp);
+        } else {
+            int error = errno;
+            VLOG_ERR("%s: connect: %s", name, strerror(error));
+            close(fd);
+            return error;
         }
-        return 0;
     } else {
-        return errno;
+        return new_tcp_vconn(name, fd, 0, &sin, vconnp);
     }
 }
 
 struct vconn_class tcp_vconn_class = {
-    .name = "tcp",
-    .open = tcp_open,
-    .close = tcp_close,
-    .prepoll = tcp_prepoll,
-    .postpoll = tcp_postpoll,
-    .recv = tcp_recv,
-    .send = tcp_send,
+    "tcp",                      /* name */
+    tcp_open,                   /* open */
+    NULL,                       /* close */
+    NULL,                       /* connect */
+    NULL,                       /* recv */
+    NULL,                       /* send */
+    NULL,                       /* wait */
 };
 \f
 /* Passive TCP. */
 
-struct ptcp_vconn
-{
-    struct vconn vconn;
-    int fd;
-};
-
-static struct ptcp_vconn *
-ptcp_vconn_cast(struct vconn *vconn) 
-{
-    assert(vconn->class == &ptcp_vconn_class);
-    return CONTAINER_OF(vconn, struct ptcp_vconn, vconn); 
-}
+static int ptcp_accept(int fd, const struct sockaddr *sa, size_t sa_len,
+                       struct vconn **vconnp);
 
 static int
-ptcp_open(const char *name, char *suffix, struct vconn **vconnp)
+ptcp_open(const char *name, char *suffix, struct pvconn **pvconnp)
 {
     struct sockaddr_in sin;
-    struct ptcp_vconn *ptcp;
     int retval;
     int fd;
     unsigned int yes  = 1;
@@ -288,12 +155,11 @@ ptcp_open(const char *name, char *suffix, struct vconn **vconnp)
         return errno;
     }
 
-    if ( setsockopt(fd, SOL_SOCKET, SO_REUSEADDR,&yes,sizeof(yes)) < 0) {
-        VLOG_ERR("%s: setsockopt::SO_REUSEADDR: %s", name, strerror(errno));
+    if (setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, &yes, sizeof yes) < 0) {
+        VLOG_ERR("%s: setsockopt(SO_REUSEADDR): %s", name, strerror(errno));
         return errno;
     }
 
-
     memset(&sin, 0, sizeof sin);
     sin.sin_family = AF_INET;
     sin.sin_addr.s_addr = htonl(INADDR_ANY);
@@ -306,65 +172,29 @@ ptcp_open(const char *name, char *suffix, struct vconn **vconnp)
         return error;
     }
 
-    retval = listen(fd, 10);
-    if (retval < 0) {
-        int error = errno;
-        VLOG_ERR("%s: listen: %s", name, strerror(error));
-        close(fd);
-        return error;
-    }
-
-    retval = set_nonblocking(fd);
-    if (retval) {
-        VLOG_ERR("%s: set_nonblocking: %s", name, strerror(retval));
-        close(fd);
-        return retval;
-    }
-
-    ptcp = xmalloc(sizeof *ptcp);
-    ptcp->vconn.class = &ptcp_vconn_class;
-    ptcp->fd = fd;
-    *vconnp = &ptcp->vconn;
-    return 0;
-}
-
-static void
-ptcp_close(struct vconn *vconn) 
-{
-    struct ptcp_vconn *ptcp = ptcp_vconn_cast(vconn);
-    close(ptcp->fd);
-    free(ptcp);
-}
-
-static void
-ptcp_prepoll(struct vconn *vconn, int want, struct pollfd *pfd) 
-{
-    struct ptcp_vconn *ptcp = ptcp_vconn_cast(vconn);
-    pfd->fd = ptcp->fd;
-    if (want & WANT_ACCEPT) {
-        pfd->events |= POLLIN;
-    }
+    return new_pstream_pvconn("ptcp", fd, ptcp_accept, pvconnp);
 }
 
 static int
-ptcp_accept(struct vconn *vconn, struct vconn **new_vconnp) 
+ptcp_accept(int fd, const struct sockaddr *sa, size_t sa_len,
+            struct vconn **vconnp)
 {
-    struct ptcp_vconn *ptcp = ptcp_vconn_cast(vconn);
-    int new_fd;
+    const struct sockaddr_in *sin = (const struct sockaddr_in *) sa;
+    char name[128];
 
-    new_fd = accept(ptcp->fd, NULL, NULL);
-    if (new_fd < 0) {
-        return errno;
+    if (sa_len == sizeof(struct sockaddr_in) && sin->sin_family == AF_INET) {
+        sprintf(name, "tcp:"IP_FMT, IP_ARGS(&sin->sin_addr));
+        if (sin->sin_port != htons(OFP_TCP_PORT)) {
+            sprintf(strchr(name, '\0'), ":%"PRIu16, ntohs(sin->sin_port));
+        }
+    } else {
+        strcpy(name, "tcp");
     }
-
-    return new_tcp_vconn("tcp" /* FIXME */, new_fd, new_vconnp);
+    return new_tcp_vconn(name, fd, 0, sin, vconnp);
 }
 
-struct vconn_class ptcp_vconn_class = {
-    .name = "ptcp",
-    .open = ptcp_open,
-    .close = ptcp_close,
-    .prepoll = ptcp_prepoll,
-    .accept = ptcp_accept,
+struct pvconn_class ptcp_pvconn_class = {
+    "ptcp",
+    ptcp_open,
 };