我使用epoll实现TCP套接字通信来监视所有客户端事件,只有一个线程处理for循环中的所有客户端 . 每个套接字都是非阻塞的 .
现在我刚遇到问题,当客户端发送的数据超过MTU时,意味着几个分片包,服务器总是无法完全读取所有数据 . 如下所示,我首先阅读头部,从头部获取pdu len,然后阅读pdu部分 .
问题是虽然我成功地阅读了头部,紧跟着pdu recv(),但它总是多次返回EAGAIN . 所以我的重试会破裂 . 因为服务器需要处理成千上万的客户端事件,所以我认为让重试始终继续是不可容忍的,这是一个很好的性能消耗 .
我用tcpdump捕获来自客户端的数据包,每个数据包都是最大1448字节的数据片段,但是头只有5个字节,为什么我能成功读取头部,但是下面的数据recv()操作会返回EAGAIN?当数据已经到达recv缓冲区时,是否可能recv返回EAGAIN?在我看来,我可以读取前5个字节,因此必须在recv缓冲区中读取更多数据 .
可能与tcp / ip堆栈中的汇编过程有关 . 代码如下,每个pdu recv,需要10次或更多次重试,也许是成功 .
...
#define HDR_LEN 5
n = epoll(epfd, events, 1000, -1)
for(i =0; i < n; i++)
{
uint8 pHdr[HDR_LEN] = {0};
uint16 pdulen = 0, offset =0;
infd = events[i].fd;
nRead = recv(infd, pHdr, HDR_LEN); // read the data head first
pdulen = ntohs(*(uint16 *)(pHdr+2)); // get the pdu len from the head
uint8 *pbuf = malloc(pdulen+HDR_LEN);
memcpy(pbuf, pHdr, HDR_LEN); // move the head to buf
while(offset != pdulen) // then read the pdu data
{
nRead = recv(infd, pbuf+HDR_LEN+offset, pdulen-offset);
if (nRead <=0)
{
if (nRead == -1 && errno == EAGAIN) // resource temporarily unavailable
{
if (retry < 5)
{
usleep(500);
retry++;
continue;
}
else
break; // already try 5 times, should always continue?
}
else
break;
}
else
{
offset += nRead;
retry = 0;
}
}
if (offset == pdulen)
process(pbuf, pdulen+HDR_LEN); // process the complete data
...
}
...
1 回答
epoll
将告诉您是否可以recv
无阻塞,一次 . 如果recv
消耗套接字中的所有数据,则下一个recv
将阻塞,直到有更多数据,或返回EAGAIN(如果是非阻塞套接字) .一种常见的模式是:
使用
select/poll/epoll
检测何时可以读取套接字 .在就绪套接字上调用
recv
一次,并将接收到的数据附加到缓冲区 .检查缓冲区是否包含足够的数据进行处理 . 如果是,那么处理 . 否则,让
select/poll/epoll
告诉您何时可以阅读更多内容 .