Use "error-checking" mutexes in place of other kinds wherever possible.
authorBen Pfaff <blp@nicira.com>
Tue, 20 Aug 2013 20:40:02 +0000 (13:40 -0700)
committerBen Pfaff <blp@nicira.com>
Tue, 20 Aug 2013 20:40:02 +0000 (13:40 -0700)
commit834d6cafe4797861b7547966b4dcc95b374331be
treec4a3e3b60ce4d4438da6ff8c7e84898c75b613ed
parent0891637f67671c0654b9ff6b4c25a654375d24e2
Use "error-checking" mutexes in place of other kinds wherever possible.

We've seen a number of deadlocks in the tree since thread safety was
introduced.  So far, all of these are self-deadlocks, that is, a single
thread acquiring a lock and then attempting to re-acquire the same lock
recursively.  When this has happened, the process simply hung, and it was
somewhat difficult to find the cause.

POSIX "error-checking" mutexes check for this specific problem (and
others).  This commit switches from other types of mutexes to
error-checking mutexes everywhere that we can, that is, everywhere that
we're not using recursive mutexes.  This ought to help find problems more
quickly in the future.

There might be performance advantages to other kinds of mutexes in some
cases.  However, the existing mutex type choices were just guesses, so I'd
rather go for easy detection of errors until we know that other mutex
types actually perform better in specific cases.  Also, I did a quick
microbenchmark of glibc mutex types on my host and found that the
error checking mutexes weren't any slower than the other types, at least
when the mutex is uncontended.

Signed-off-by: Ben Pfaff <blp@nicira.com>
Acked-by: Ethan Jackson <ethan@nicira.com>
22 files changed:
include/sparse/pthread.h
lib/dpif-linux.c
lib/fatal-signal.c
lib/lacp.c
lib/netdev-bsd.c
lib/netdev-dummy.c
lib/netdev-linux.c
lib/netdev-vport.c
lib/netlink-socket.c
lib/ovs-atomic-gcc4+.c
lib/ovs-thread.c
lib/ovs-thread.h
lib/seq.c
lib/stp.c
lib/uuid.c
lib/vlog.c
lib/vlog.h
ofproto/ofproto-dpif-sflow.c
ofproto/ofproto-dpif-upcall.c
ofproto/ofproto-dpif.c
ofproto/ofproto.c
vswitchd/system-stats.c