Выбрать главу

Вы даже не представляете, каких плясок с бубном стоила мне настройка GPRS на моем старом добром Alcatel OneTouch 715! Каждый раз, когда я подносил его к окошку инфракрасного порта ноутбука, Windows XP восторженно восклицала: «Ой, телефончик! Сейчас я его…» — и начинала устанавливать модемы. Да-да, модемы. Один несчастный аппарат определялся как два-три устройства на разных виртуальных COM-портах. Стоило телефону исчезнуть, а затем появиться в зоне действия ИК-порта, как процесс начинался заново. Наконец, когда в системе стояло шесть модемов Alcatel OT 715, а шаман уже был близок к исступлению, телефон неожиданно пискнул и подключился. Видимо, для начала реакции требовалась некая критическая масса модемов, и, вспомнив старое правило — «все работает? ничего не трогай!» — я оставил в компьютере всех шестерых [Эту колонку, кстати, вы читаете именно благодаря шести модемам. Вместе им удалось добиться скорости аж… в 28 кбит/с].

Однако ненадежность подобного вида связи побуждала к дальнейшим изысканиям. Изыскался, как вы понимаете, единственный на настоящий момент более или менее быстрый вариант доступа «по воздуху» — SkyLink, благо в наших краях он вроде бы присутствует (тьфу-тьфу-тьфу!). Я даже присмотрел уже парочку совершенно чудесных — по крайней мере, по описаниям — CDMA-модемов от не очень известной фирмы Сmotech (www.cmotech.ru): один — брелок для порта USB, второй — стационарный, с выносной антенной, встроенным Ethernet-портом и… Wi-Fi-маршрутизатором! В общем, не модем — мечта, а мечты надо реализовывать, — и рука потянулась к телефонной трубке, но…

Ну, вы догадались, конечно. Нету их пока. Виртуально есть — реально отсутствуют. Может быть, появятся к середине июля. А пока — аутотренинг: "Я люблю GPRS! Я люблю GPRS!Это не я (ЗАЧЕРКНУТО)"

Наука: Ложь, наглая ложь и…

Автор: Дмитрий Шабанов

Статья нашего постоянного автора, харьковского зоолога Дмитрия Шабанова посвящена весьма острой проблеме в современной науке (далеко не только биологии!), все больше полагающейся на машинную мудрость. Прогресс аналитических методов позволяет даже в относительно скромных по масштабу работах (например, студенческих проектах) накапливать немыслимые прежде информационные массивы. Естественно, без помощи компьютерной обработки результатов проследить закономерности в получающихся гигантских простынях таблиц очень трудно. Здесь-то исследователя и подстерегают всяческие неприятности, чаще всего связанные с бездумным обращением с данными.

Владислав Бирюков [vvbir@computerra.ru]

…Статистика. На сегодня ее использование — почти обязательное условие выполнения научной работы во многих отраслях, в том числе и в зоологии. Не будет большой новостью, если я скажу, что статистику чаще используют неверно, чем верно. Причины этого различны, и мы постараемся обсудить некоторые из них.

Еще одно вводное замечание. Ошибки в применении статистики делают самые разные специалисты, в том числе и титулованные и — по настоящему! — квалифицированные. Я буду приводить примеры из конкретных работ своих коллег. Эти люди — не хуже прочих, и причина, по которой я цитирую именно их, — знакомство с ними или интерес к их работам. Я не хочу нарушать их инкогнито. Более того, я даже не могу назвать объект их работы. В зоологии есть замечательное свойство, отраженное Борисом Заходером в сказке «Кит и кот». Там, когда происходит неожиданная коллизия (кит и кот поменялись местами), вертолет доставляет на палубу китобойного судна группу ответственных лиц, в составе которой «академик по китам, академик по котам» [И в ответ на китобазу / Вертолет садится сразу. / В нем ответственные лица / Прилетели из столицы: / Доктора, профессора, / Медицинская сестра, / Академик по китам, / Академик по котам, / С ними семьдесят студентов, / Тридцать пять корреспондентов, / Два редактора с корректором, / Кинохроника с прожектором, / Юные натуралисты / И другие специалисты]. Мест в академии всем не хватит, но люди «в теме» понимают, что по китам — это N., а по котам — это или L., или M. Обсуждая конкретные истории, я буду называть определенные объекты. Так вот — это не те объекты. Будем считать, что любое сходство описанных обстоятельств с реальными работами — случайность.

Итак, приступим к рассмотрению коллекции затруднений, которые возникают при использовании статистики в зоологии.

Ошибки плюс вера в «объективность»

Начну с простого случая. Мой коллега — полевик, который лучше управляется с ружьем, чем с компьютером. Он настрелял немерено… ну, допустим, «зайцев» и попросил меня помочь про этих зайцев что-то посчитать. К какой программе обращается в такой ситуации украинский или российский зоолог? Нередко к пакету Statistica от компании StatSoft. Это — серьезный и дорогой продукт. Он так дорог, что без обсуждения специфики отечественных научных и образовательных учреждений вообще непонятно, как он мог получить столь широкое распространение [Когда-то автор попытался легально учить студентов программе Statistica и ради этого пробовал «достучаться» до российского представительства фирмы-изготовителя. Безуспешно]. Одна из причин его популярности — разнообразие предлагаемых функций и высокое качество, но определенную роль играет и консерватизм пользователей. Лет пятнадцать назад московские и киевские зоологи передавали друг другу дискеты с инсталлятором статистического пакета CSS — предыдущей инкарнации Statistica. Так или иначе, этот пакет уже стал как минимум полустандартом.

Так вот, я уточнил, что хочет мой коллега-"зайцевед", и сделал ему файл. Тот посадил за компьютер студента, который забил в этот файл результаты измерений. Дальше вышло вот что. Я спешу на встречу, а мой коллега ловит меня в коридоре и тащит к компьютеру: «покажи, как считать эту… корреляцию». Я показываю: надо вызвать такое-то окошко, здесь выбрать те признаки, связь между которыми надо рассмотреть, и вот тут выскочит результат. Сказав это, я убегаю.

Через неделю меня ловит другой мой коллега, спец в английском языке. Исследователь «зайцев» попросил его перевести тезисы, предназначенные для отправки на Всемирный териологический [Териология — наука о млекопитающих] конгресс. Переводчик удивлен: «Ты действительно насчитал ему достоверную отрицательную корреляцию между длиной тела и весом?»

Встречаю коллегу-"зайцеведа" и спрашиваю: «Вы ведь сами их стреляли? Могли ли вы не обратить внимание на то, что чем добыча крупнее, тем она легче?» «Ты знаешь, я, в общем, и сам удивился, чего ж я это не заметил. Но это же мои субъективные впечатления, а тут машина со всей присущей ей объективностью…»

Пересчитываю его результаты, смотрю корреляцию. Она, ясное дело, положительна. Как там получилась отрицательная — теперь не установить. Хорошо хоть тезисы на конгресс не успели уйти — было б там веселье.

Наивность моего коллеги обнажила общую беду — мы доверяем результатам вычислений больше, чем себе самим. Ошибки делают все, но разумные люди так организуют процесс работы, чтобы ошибки «всплывали» и благодаря этому могли быть исправлены. Здесь нелишне вспомнить один простой рецепт.

С помощью статистики мы ищем те или иные тенденции, отраженные в разнообразии изучаемого материала. Но и тот механизм, которым мы наделены от природы (глаза и мозг), позволяет неплохо вычленять тенденции, скрытые в разнообразии материала. Надо просто «скормить» им информацию в удобоваримом виде. Один из хороших способов не запутаться в критериях — строить графики. Когда вы видите, как располагаются точки, можно перепроверить любой свой вывод. Если какая-то точка «вылетает» (располагается в стороне от основной совокупности), вы можете определить, с каким случаем она связана. Иногда для этого удобно отсортировать строки в окне с данными по возрастанию интересующего вас признака. А для того, чтобы потом можно было вернуться к исходному порядку, удобно сделать столбец с «правильными» номерами строк, сортировка по которому вернет таблицу в исходное состояние.