У меня есть модульный тест, который проверяет поведение на блокирующих и неблокирующих сокетах - сервер пишет длинный ответ, и в какой-то момент он больше не может писать, и он блокируется при записи.

Обычно одна сторона пишет, а другая не читает.

В Solaris в какой-то момент я получаю ошибку «Недостаточно места» (после записи 75 МБ) вместо блокировки при записи:

Программа, воспроизводящая проблему:

#include <sys/types.h>
#include <sys/socket.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <errno.h>
#include <string.h>
#include <signal.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <sys/un.h>
#include <netinet/in.h>

char const *address = "127.0.0.1";
#define check(x) do { if( (x) < 0) { perror(#x) ; exit(1); } } while(0)

int main()
{
    signal(SIGPIPE,SIG_IGN);
    struct sockaddr_in inaddr = {};
    inaddr.sin_family = AF_INET;
    inaddr.sin_addr.s_addr = inet_addr(address);
    inaddr.sin_port = htons(8080);

    int res = fork();
    if(res < 0) {
        perror("fork");
        exit(1);
    }
    if(res > 0) {
        int fd = -1;
        int status;
        sleep(1);   
        check(fd = socket(AF_INET,SOCK_STREAM,0));
        check(connect(fd,(sockaddr*)&inaddr,sizeof(inaddr)));
        sleep(5);
        close(fd);

        wait(&status);
        return 0;
    }
    else {
        int acc,fd;
        check(acc = socket(AF_INET,SOCK_STREAM,0));
        int yes = 1;
        check(setsockopt(acc,SOL_SOCKET,SO_REUSEADDR,&yes,sizeof(yes)));
        check(bind(acc,(sockaddr*)&inaddr,sizeof(inaddr)));
        check(listen(acc,10));
        check(fd = accept(acc,0,0));

        char buf[1000];
        long long total= 0;
        do {
            int r = send(fd,buf,sizeof(buf),0);
            if(r < 0) {
                printf("write %s\n",strerror(errno));
                return 0;
            }
            else if(r==0) {
                printf("Got eof\n");
                return 0;
            }
            total += r;
            if(total > 100*1024*1024) {
                printf("Too much!!!!\n");
                return 0;
            }
            printf("%lld\n",total);
        }while(1);
    }
    return 0;
}

Вывод на Solaris (последние две строки)

75768000
write Not enough space

Ожидаемый результат в Linux (последние две строки)

271760
write Connection reset by peer

Что происходит только тогда, когда другая сторона закрывает сокет.

Есть идеи, почему и как я могу это исправить, какие параметры установить?

P.S .: Это OpenSolaris 2009.06, x86

Изменения

  • Добавлен полный код C, воспроизводящий проблему

Ответ:

Это похоже на ошибку в конкретной версии ядра Solaris, библиотеки libc.

1
Artyom 27 Авг 2011 в 11:03

2 ответа

Лучший ответ

Боюсь, что из исходного кода OpenSolaris опция SO_SNDTIMEO не поддерживается: https://hg.java.net/hg/solaris~on-src/file/tip/usr/src/uts/common/inet/sockmods/ socksctp.c # l1233

1
alanc 14 Май 2013 в 02:28

Если вы хотите заблокировать, если нет свободного места, вам нужно написать код для этого. POSIX довольно ясно показывает, что write в сокете эквивалентно send без параметров, и что send "может завершиться ошибкой, если ... [i] nдостаточно ресурсов в системе было доступно для выполнения операции."

0
David Schwartz 14 Май 2013 в 03:05