argc
указывает, сколько имеется аргументов; поскольку в С индексы отсчитываются с нуля, выражение 'argv[argc] == NULL
' всегда верно. Из-за этого, особенно в коде для Unix, вы увидите различные способы проверки окончания списка аргументов, такие, как цикл с проверкой, что счетчик превысил argc
, или 'argv[i] == 0
', или '*argv != NULL
' и т.д. Они все эквивалентны.
2.2.1. Программа echo
V7
Возможно, простейшим примером обработки командной строки является программа V7 echo,
печатающая свои аргументы в стандартный вывод, разделяя их пробелами и завершая символом конца строки. Если первым аргументом является -n
, завершающий символ новой строки опускается. (Это используется для приглашений из сценариев оболочки.) Вот код[28]:
1 #include <stdio.h>
2
3 main(argc, argv) /*int main(int argc, char **argv)*/
4 int argc;
5 char *argv[];
6 {
7 register int i, nflg;
8
9 nflg = 0;
10 if (argc > 1 && argv[1][0] == && argv[1][1] == 'n') {
11 nflg++;
12 argc--;
13 argv++;
14 }
15 for (i=1; i<argc; i++) {
16 fputs(argv[i], stdout);
17 if (i < argc-1)
18 putchar(' ');
19 }
20 if (nflg == 0)
21 putchar('\n');
22 exit(0);
23 }
Всего 23 строки! Здесь есть два интересных момента. Во-первых, уменьшение argc
и одновременное увеличение argv
(строки 12 и 13) являются обычным способом пропуска начальных аргументов. Во-вторых, проверка наличия -n
(строка 10) является упрощением. -no-newline-at-the-end
также работает. (Откомпилируйте и проверьте это!)
Ручной разбор опций обычен для кода V7, поскольку функция getopt()
не была еще придумана.
Наконец, здесь и в других местах по всей книге, мы видим использование ключевого слова register. Одно время это ключевое слово давало компилятору подсказку, что данная переменная должна по возможности размещаться в регистре процессора. Теперь это ключевое слово устарело; современные компиляторы все основывают размещение переменных в регистрах на анализе исходного кода, игнорируя ключевое слово register
. Мы решили оставить использующий это слово код, как есть, но вы должны знать, что оно больше не имеет реального применения.[29]
2.3. Разбор опций: getopt()
и getopt_long()
Примерно в 1980-х группа поддержки Unix для System III в AT&T заметила, что каждая программа Unix использовала для разбора аргументов свои собственные методики. Чтобы облегчить работу пользователей и программистов, они разработали большинство из перечисленных ранее соглашений. (Хотя изложение в System III справки для intro(1) значительно менее формально, чем в стандарте POSIX.)
Группа поддержки Unix разработала также функцию getopt()
, вместе с несколькими внешними переменными, чтобы упростить написание кода, придерживающегося стандартных соглашений. Функция GNU getopt_long()
предоставляет совместимую с getopt()
версию, а также упрощает разбор длинных опций в описанной ранее форме.
2.3.1. Опции с одним символом
Функция getopt()
объявлена следующим образом:
#include <unistd.h> /*POSIX*/
int getopt(int argc, char *const argv[], const char *optstring);
extern char *optarg;
extern int optind, opterr, optopt;
Аргументы argc
и argv
обычно передаются непосредственно от main()
. optstring
является строкой символов опций. Если за какой-либо буквой в строке следует двоеточие, эта опция ожидает наличия аргумента.
Для использования getopt()
вызывайте ее повторно из цикла while
до тех пор, пока она не вернет -1
. Каждый раз, обнаружив действительный символ опции, функция возвращает этот символ. Если опция принимает аргумент, указатель на него помещается в переменную optarg
. Рассмотрим программу, принимающую опцию -а
без аргумента и опцию -b
с аргументом:
int ос; /* символ опции */
char *b_opt_arg;
while ((ос = getopt(argc, argv, "ab:")) != -1) {
switch (oc) {
case 'a':
/* обработка -а, установить соответствующий флаг */
break;
case 'b':
/* обработка -b, получить значение аргумента из optarg */
b_opt_arg = optarg;
break;
case ':':
... /* обработка ошибок, см. текст */
case '?':
default:
... /* обработка ошибок, см. текст */
}
}
В ходе работы getopt()
устанавливает несколько переменных, контролирующих обработку ошибок:
char *optarg
Аргумент для опции, если она принимает аргумент.
int optind
Текущий индекс в argv
. Когда цикл loop
завершается, оставшиеся операнды находятся с argv[optind]
по argv[argc-1]
. (Помните, что 'argv [argc] ==NULL
'.)
int opterr
Когда эта переменная не равна нулю (значение по умолчанию), getopt()
печатает свои собственные сообщения для недействительных опций или отсутствующих аргументов опций.
int optopt
Когда находится недействительный символ опции, getopt()
возвращает либо '?
', либо ':
' (см ниже), a optopt
содержит обнаруженный недействительный символ.
Люди есть люди, программы неизбежно будут иногда вызываться неправильно либо с недействительной опцией, либо с отсутствующим аргументом опции. Обычно в таких случаях getopt()
выводит свои собственные сообщения и возвращает символ '?
'. Однако, вы можете изменить такое поведение двумя способами.
Во-первых, записав 0 в opterr
перед вызовом getopt()
, можно заставить getopt()
не предпринимать при обнаружении проблем никаких действий.
Во-вторых, если первый символ в optstring
является двоеточием, getopt()
не предпринимает никаких действий и возвращает другой символ в зависимости от ошибки следующим образом:
Неверная опция
getopt()
возвращает '?
', a optopt
содержит неверный символ опции (Это обычное поведение).
Отсутствует аргумент опции
getopt()
возвращает ':
'. Если первый символ optstring
не является двоеточием, getopt()
возвращает '?
', делая этот случай неотличимым от случая неверной опции.
29
Когда мы спросили Джима Мейеринга (Jim Meyering), сопроводителя Coreulils, о наличии register
в GNU Coreutils, он дал нам интересный ответ. Он удаляет эти слова при изменении кода, но в остальных случаях оставляет их на месте, чтобы облегчить интеграцию сделанных изменений с существующими версиями —