`
yzd
  • 浏览: 1809321 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

Linux套接字编程中的五个隐患

 
阅读更多
<p><span style="font-size: small;">在 4.2 BSD UNIX® 操作系统中首次引入,Sockets API 现在是任何操作系统的标准特性。事实上,很难找到一种不支持 Sockets API 的现代语言。该 API 相当简单,但新的开发人员仍然会遇到一些常见的隐患。</span></p>
<p><span style="font-size: small;">本文识别那些隐患并向您显示如何避开它们。</span></p>
<p><a name="N10057"></a></p>
<p><span style="font-size: small;">第一个隐患很明显,但它是开发新手最容易犯的一个错误。如果您忽略函数的返回状态,当它们失败或部分成功的时候,您也许会迷失。反过来,这可能传播错误,使定位问题的源头变得困难。</span></p>
<p><span style="font-size: small;">捕获并检查每一个返回状态,而不是忽略它们。考虑清单 1 显示的例子,一个套接字 <code>send</code> 函数。</span></p>
<p><br><a name="N1006B"></a></p>
<table style="width: 100%;" border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="code-outline">
<pre class="displaycode"><span style="font-size: small;">int status, sock, mode;
/* Create a new stream (TCP) socket */
sock = <strong>socket</strong>( AF_INET, SOCK_STREAM, 0 );
...
status = <strong>send</strong>( sock, buffer, buflen, MSG_DONTWAIT );
if (status == -1) {
  /* send failed */
  printf( "send failed: %s/n", strerror(errno) );
} else {
  /* send succeeded -- or did it? */
}
</span></pre>
</td>
</tr></tbody></table>
<p><span style="font-size: small;"><br></span></p>
<p><span style="font-size: small;">清单 1 探究一个函数片断,它完成套接字 <code>send</code> 操作(通过套接字发送数据)。函数的错误状态被捕获并测试,但这个例子忽略了 <code>send</code> 在无阻塞模式(由 <code>MSG_DONTWAIT</code> 标志启用)下的一个特性。</span></p>
<p><span style="font-size: small;"><code>send</code> API 函数有三类可能的返回值:</span></p>
<ul>
<li><span style="font-size: small;">如果数据成功地排到传输队列,则返回 0。</span></li>
<li><span style="font-size: small;">如果排队失败,则返回 -1(通过使用 <code>errno</code> 变量可以了解失败的原因)。</span></li>
<li><span style="font-size: small;">如果不是所有的字符都能够在函数调用时排队,则最终的返回值是发送的字符数。</span></li>
</ul>
<p><span style="font-size: small;">由于 <code>send</code> 的 <code>MSG_DONTWAIT</code> 变量的无阻塞性质,函数调用在发送完所有的数据、一些数据或没有发送任何数据后返回。在这里忽略返回状态将导致不完全的发送和随后的数据丢失。</span></p>
<div class="ibm-alternate-rule"><span style="font-size: small;">
<hr></span></div>
<p><a name="N100A7"></a></p>
<p><span style="font-size: small;">UNIX 有趣的一面是您几乎可以把任何东西看成是一个文件。文件本身、目录、管道、设备和套接字都被当作文件。这是新颖的抽象,意味着一整套的 API 可以用在广泛的设备类型上。</span></p>
<p><span style="font-size: small;">考虑 <code>read</code> API 函数,它从文件读取一定数量的字节。<code>read</code> 函数返回读取的字节数(最高为您指定的最大值);或者 -1,表示错误;或者 0,如果已经到达文件末尾。</span></p>
<p><span style="font-size: small;">如果在一个套接字上完成一个 <code>read</code> 操作并得到一个为 0 的返回值,这表明远程套接字端的对等层调用了 <code>close</code> API 方法。该指示与文件读取相同 —— 没有多余的数据可以通过描述符读取(参见 清单 2)。</span></p>
<p><br><a name="N100CA"></a></p>
<table style="width: 100%;" border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="code-outline">
<pre class="displaycode"><span style="font-size: small;">int sock, status;
sock = <strong>socket</strong>( AF_INET, SOCK_STREAM, 0 );
...
status = <strong>read</strong>( sock, buffer, buflen );
if (status &gt; 0) {
  /* Data read from the socket */
} else if (status == -1) {
  /* Error, check errno, take action... */
} else if (status == 0) {
  /* Peer closed the socket, finish the close */
  <strong>close</strong>( sock );
  /* Further processing... */
}
</span></pre>
</td>
</tr></tbody></table>
<p><span style="font-size: small;"><br></span></p>
<p><span style="font-size: small;">同样,可以用 <code>write</code> API 函数来探测对等套接字的闭包。在这种情况下,接收 <code>SIGPIPE</code> 信号,或如果该信号阻塞,<code>write</code> 函数将返回 -1 并设置 <code>errno</code> 为 <code>EPIPE</code>。</span></p>
<div class="ibm-alternate-rule"><span style="font-size: small;">
<hr></span></div>
<p><a name="N100F0"></a></p>
<p><span style="font-size: small;">您可以使用 <code>bind</code> API 函数来绑定一个地址(一个接口和一个端口)到一个套接字端点。可以在服务器设置中使用这个函数,以便限制可能有连接到来的接口。也可以在客户端设置中使用这个函数,以便限制应当供出去的连接所使用的接口。<code>bind</code> 最常见的用法是关联端口号和服务器,并使用通配符地址(<code>INADDR_ANY</code>),它允许任何接口为到来的连接所使用。</span></p>
<p><span style="font-size: small;"><code>bind</code> 普遍遭遇的问题是试图绑定一个已经在使用的端口。该陷阱是也许没有活动的套接字存在,但仍然禁止绑定端口(<code>bind</code> 返回 <code>EADDRINUSE</code>),它由 TCP 套接字状态 <code>TIME_WAIT</code> 引起。该状态在套接字关闭后约保留 2 到 4 分钟。在 <code>TIME_WAIT</code> 状态退出之后,套接字被删除,该地址才能被重新绑定而不出问题。</span></p>
<p><span style="font-size: small;">等待 <code>TIME_WAIT</code> 结束可能是令人恼火的一件事,特别是如果您正在开发一个套接字服务器,就需要停止服务器来做一些改动,然后重启。幸运的是,有方法可以避开 <code>TIME_WAIT</code> 状态。可以给套接字应用 <code>SO_REUSEADDR</code> 套接字选项,以便端口可以马上重用。</span></p>
<p><span style="font-size: small;">考虑清单 3 的例子。在绑定地址之前,我以 <code>SO_REUSEADDR</code> 选项调用 <code>setsockopt</code>。为了允许地址重用,我设置整型参数(<code>on</code>)为 1 (不然,可以设为 0 来禁止地址重用)。 </span></p>
<p><br><a name="N1013D"></a></p>
<table style="width: 100%;" border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="code-outline">
<pre class="displaycode"><span style="font-size: small;">int sock, ret, on;
struct sockaddr_in servaddr;
/* Create a new stream (TCP) socket */
sock = <strong>socket</strong>( AF_INET, SOCK_STREAM, 0 ):
/* Enable address reuse */
</span><span style="font-size: small;"><em>on = 1;
ret = <strong>setsockopt</strong>( sock, SOL_SOCKET, SO_REUSEADDR, &amp;on, sizeof(on) );</em>
/* Allow connections to port 8080 from any available interface */
memset( &amp;servaddr, 0, sizeof(servaddr) );
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = <strong>htonl</strong>( INADDR_ANY );
servaddr.sin_port = <strong>htons</strong>( 45000 );
/* Bind to the address (interface/port) */
ret = <strong>bind</strong>( sock, (struct sockaddr *)&amp;servaddr, sizeof(servaddr) );
</span></pre>
</td>
</tr></tbody></table>
<p><span style="font-size: small;"><br></span></p>
<p><span style="font-size: small;">在应用了 <code>SO_REUSEADDR</code> 选项之后,<code>bind</code> API 函数将允许地址的立即重用。</span></p>
<div class="ibm-alternate-rule"><span style="font-size: small;">
<hr></span></div>
<p><a name="N10160"></a></p>
<p><span style="font-size: small;">套接字是发送无结构二进制字节流或 ASCII 数据流(比如 HTTP 上的 HTTP 页面,或 SMTP 上的电子邮件)的完美工具。但是如果试图在一个套接字上发送二进制数据,事情将会变得更加复杂。</span></p>
<p><span style="font-size: small;">比如说,您想要发送一个整数:您可以肯定,接收者将使用同样的方式来解释该整数吗?运行在同一架构上的应用程序可以依赖它们共同的平台来对该类型的数据做出相同的解释。但是,如果一个运行在高位优先的 IBM PowerPC 上的客户端发送一个 32 位的整数到一个低位优先的 Intel x86,那将会发生什么呢?字节排列将引起不正确的解释。</span></p>
<div class="ibm-container ibm-alt-header dw-container-sidebar">
<h2><span style="font-size: small;">字节交换还是不呢?</span></h2>
<div class="ibm-container-body">
<p><span style="font-size: small;"><em>Endianness</em> 是指内存中字节的排列顺序。<em>高位优先(big endian)</em> 按最高有效字节在前排列,然而 <em>低位优先(little endian)</em> 按照最低有效字节在前排序。</span></p>
<p><span style="font-size: small;">高位优先架构(比如 PowerPC®)比低位优先架构(比如 Intel® Pentium® 系列,其网络字节顺序是高位优先)有优势。这意味着,对高位优先的机器来说,在 TCP/IP 内控制数据是自然有序的。低位优先架构要求字节交换 —— 对网络应用程序来说,这是一个轻微的性能弱点。</span></p>
</div>
</div>
<p><span style="font-size: small;">通过套接字发送一个 C 结构会怎么样呢?这里,也会遇到麻烦,因为不是所有的编译器都以相同的方式排列一个结构的元素。结构也可能被压缩以便使浪费的空间最少,这进一步使结构中的元素错位。</span></p>
<p><span style="font-size: small;">幸好,有解决这个问题的方案,能够保证两端数据的一致解释。过去,远程过程调用(Remote Procedure Call,RPC)套装工具提供所谓的外部数据表示(External Data Representation,XDR)。XDR 为数据定义一个标准的表示来支持异构网络应用程序通信的开发。</span></p>
<p><span style="font-size: small;">现在,有两个新的协议提供相似的功能。可扩展标记语言/远程过程调用(XML/RPC)以 XML 格式安排 HTTP 上的过程调用。数据和元数据用 XML 进行编码并作为字符串传输,并通过主机架构把值和它们的物理表示分开。SOAP 跟随 XML-RPC,以更好的特性和功能扩展了它的思想。参见 </span><a href="#resources"><span style="font-size: small;">参考资料</span></a><span style="font-size: small;"> 小节,获取更多关于每个协议的信息。</span></p>
<div class="ibm-alternate-rule"><span style="font-size: small;">
<hr></span></div>
<p><a name="N10190"></a></p>
<p><span style="font-size: small;">TCP 不提供帧同步,这使得它对于面向字节流的协议是完美的。这是 TCP 与 UDP(User Datagram Protocol,用户数据报协议)的一个重要区别。UDP 是面向消息的协议,它保留发送者和接收者之间的消息边界。TCP 是一个面向流的协议,它假定正在通信的数据是无结构的,如图 1 所示。</span></p>
<p><br><a name="N1019B"></a><br><span style="font-size: small;"><img src="http://hi.csdn.net/attachment/201105/26/0_1306422714m4nE.gif" alt=""><br></span></p>
<p><span style="font-size: small;">图 1 的上部说明一个 UDP 客户端和服务器。左边的对等层完成两个套接字的写操作,每个 100 字节。协议栈的 UDP 层追踪写的数量,并确保当右边的接收者通过套接字获取数据时,它以同样数量的字节到达。换句话说,为读者保留了写者提供的消息边界。</span></p>
<p><span style="font-size: small;">现在,看图 1 的底部.它为 TCP 层演示了相同粒度的写操作。两个独立的写操作(每个 100 字节)写入流套接字。但在本例中,流套接字的读者得到的是 200 字节。协议栈的 TCP 层聚合了两次写操作。这种聚合可以发生在 TCP/IP 协议栈的发送者或接收者中任何一方。重要的是,要注意到聚合也许不会发生 —— TCP 只保证数据的有序发送。</span></p>
<p><span style="font-size: small;">对大多数开发人员来说,该陷阱会引起困惑。您想要获得 TCP 的可靠性和 UDP 的帧同步。除非改用其他的传输协议,比如流传输控制协议(STCP),否则就要求应用层开发人员来实现缓冲和分段功能。</span></p>
<div class="ibm-alternate-rule"><span style="font-size: small;">
<hr></span></div>
<p><a name="N101B2"></a></p>
<p><span style="font-size: small;">GNU/Linux 提供几个工具,它们可以帮助您发现套接字应用程序中的一些问题。此外,使用这些工具还有教育意义,而且能够帮助解释应用程序和 TCP/IP 协议栈的行为。在这里,您将看到对几个工具的概述。查阅下面的 </span><a href="#resources"><span style="font-size: small;">参考资料</span></a><span style="font-size: small;"> 了解更多的信息。</span></p>
<p><a name="N101BF"></a></p>
<p><span style="font-size: small;"><code>netstat</code> 工具提供查看 GNU/Linux 网络子系统的能力。使用 <code>netstat</code>,可以查看当前活动的连接(按单个协议进行查看),查看特定状态的连接(比如处于监听状态的服务器套接字)和许多其他的信息。清单 4 显示了 <code>netstat</code> 提供的一些选项和它们启用的特性。</span></p>
<p><br><a name="N101D6"></a></p>
<table style="width: 100%;" border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="code-outline">
<pre class="displaycode"><span style="font-size: small;">View all TCP sockets currently active
$ netstat --tcp
View all UDP sockets
$ netstat --udp
View all TCP sockets in the listening state
$ netstat --listening
View the multicast group membership information
$ netstat --groups
Display the list of masqueraded connections
$ netstat --masquerade
View statistics for each protocol
$ netstat --statistics
</span></pre>
</td>
</tr></tbody></table>
<p><span style="font-size: small;"><br></span></p>
<p><span style="font-size: small;">尽管存在许多其他的实用程序,但 <code>netstat</code> 的功能很全面,它覆盖了 <code>route</code>、<code>ifconfig</code> 和其他标准 GNU/Linux 工具的功能。</span></p>
<p><a name="N101EB"></a></p>
<p><span style="font-size: small;">可以使用 GNU/Linux 的几个工具来检查网络上的低层流量。<code>tcpdump</code> 工具是一个比较老的工具,它从网上“嗅探”网络数据包,打印到 <code>stdout</code> 或记录在一个文件中。该功能允许查看应用程序产生的流量和 TCP 生成的低层流控制机制。一个叫做 <code>tcpflow</code> 的新工具与 <code>tcpdump</code> 相辅相成,它提供协议流分析和适当地重构数据流的方法,而不管数据包的顺序或重发。清单 5 显示 <code>tcpdump</code> 的两个用法模式。</span></p>
<p><br><a name="N1020C"></a></p>
<table style="width: 100%;" border="0" cellspacing="0" cellpadding="0"><tbody><tr>
<td class="code-outline">
<pre class="displaycode"><span style="font-size: small;">Display all traffic on the eth0 interface for the local host
$ tcpdump -l -i eth0
Show all traffic on the network coming from or going to host plato
$ tcpdump host plato
Show all HTTP traffic for host camus
$ tcpdump host camus and (port http)
View traffic coming from or going to TCP port 45000 on the local host
$ tcpdump tcp port 45000
</span></pre>
</td>
</tr></tbody></table>
<p><span style="font-size: small;"><br></span></p>
<p><span style="font-size: small;"><code>tcpdump</code> 和 <code>tcpflow</code> 工具有大量的选项,包括创建复杂过滤表达式的能力。查阅下面的 </span><a href="#resources"><span style="font-size: small;">参考资料</span></a><span style="font-size: small;"> 获取更多关于这些工具的信息。 </span></p>
<p><span style="font-size: small;"><code>tcpdump</code> 和 <code>tcpflow</code> 都是基于文本的命令行工具。如果您更喜欢图形用户界面(GUI),有一个开放源码工具 <code>Ethereal</code> 也许适合您的需要。<code>Ethereal</code> 是一个专业的协议分析软件,它可以帮助调试应用层协议。它的插入式架构(plug-in architecture)可以分解协议,比如 HTTP 和您能想到的任何协议(写本文的时候共有 637 个协议)。</span></p>
<div class="ibm-alternate-rule"><span style="font-size: small;">
<hr></span></div>
<p><a name="N10232"></a></p>
<p><span style="font-size: small;">套接字编程是容易而有趣的,但是您要避免引入错误或至少使它们容易被发现,这就需要考虑本文中描述的这 5 个常见的陷阱,并且采用标准的防错性程序设计实践。GNU/Linux 工具和实用程序还可以帮助发现一些程序中的小问题。记住:在查看实用程序的帮助手册时候,跟踪相关的或“请参见”工具。您也许会发现一个必要的新工具。</span></p>
<p><span style="font-size: small;">
</span></p>
<p><a name="resources"></a></p>
<p></p>
<ul>
<li>TCP 状态机有 11 个状态。参见 W. Richard Steven 的 <a href="http://www.research.umbc.edu/~jeehye/cmsc491b/lectures/tcpstate/sld001.htm"><span style="color: #4c6e94;">illustration from TCP/IP Illustrated, Volume 1</span></a> 一书。</li>
<li>在 Wikipedia 上探究 <a href="http://en.wikipedia.org/wiki/Endian"><span style="color: #4c6e94;">Endianness</span></a> 的历史和含意。</li>
<li>了解更多关于 IBM 的开放式、可伸缩和可定制的 <a href="http://www.ibm.com/developerworks/power?S_TACT=105AGX52&amp;S_CMP=cn-a-l"><span style="color: #4c6e94;">Power Architecture</span></a> 的信息。</li>
<li>从 <a href="http://www.cs.cf.ac.uk/Dave/C/node33.html"><span style="color: #4c6e94;">Programming in C</span></a> 课件阅读 RPC/XDR 简介。</li>
<li>获取更多关于 XML-RPC 以及在 Java™ 应用程序中如何使用它的信息,请阅读 “<a href="developerworks/cn/java/j-xmlrpc/index.html"><span style="color: #4c6e94;">Java 编程中的 XML-RPC</span></a>” (developerWorks,2004 年 1 月)。</li>
<li>SOAP 以 XML-RPC 的特性为基础。请在 <a href="http://www.soapware.org/"><span style="color: #4c6e94;">SoapWare.Org</span></a> 上查找规范、工具、教程和文章。</li>
<li>
<a href="http://www.sctp.org/"><span style="color: #4c6e94;">SCTP</span></a> 兼有 TCP 和 UDP 的特性,以及可用性和可靠性。</li>
<li>教程 “<a href="https://www14.software.ibm.com/webapp/iwm/web/preLogin.do?lang=zh_CN&amp;source=dw-cn-l-l-sock"><span style="color: #4c6e94;">Linux Socket 编程,第一部分</span></a>” (developerWorks,2003 年 10 月)讲解如何开始套接字编程以及如何构建一个通过 TCP/IP 连接的 echo 服务器和客户端。“<a href="https://www14.software.ibm.com/webapp/iwm/web/preLogin.do?lang=zh_CN&amp;source=dw-cn-l-l-sock2"><span style="color: #4c6e94;">Linux Socket 编程,第二部分</span></a>” (developerWorks,2004 年 1 月)集中讨论 UDP 并且讲解如何用 C 和 Python 编写 UDP 套接字应用程序(尽管代码会翻译为其他语言)。</li>
<li>
<a href="http://man.linuxquestions.org/?query=netstat&amp;section=0&amp;type=2"><span style="color: #4c6e94;">netstat 手册页</span></a> 提供有关各种使用 netstat 的方法的细节。</li>
<li>
<a href="http://www.charlesriver.com/Books/BookDetail.aspx?productID=70637"><em><span style="color: #4c6e94;">BSD Sockets Programming from a Multilanguage Perspective</span></em></a> (作者 M. Tim Jones),用 6 种不同的语言介绍了套接字编程的技巧。</li>
<li>在 <a href="developerworks/cn/linux"><span style="color: #4c6e94;">developerWorks Linux 专区</span></a> 上查找更多为 Linux 开发人员提供的参考资料。 </li>
</ul>
<p></p>
<p></p>
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics