Назад

Примеры анализа данных

В данном разделе я начинаю публиковать примеры анализа реальных данных. Все желающие приглашаются к сотрудничеству. Однако, мне хотелось бы, чтобы приводимые примеры были интересными и поучительными.

Начну с поучительности. Для меня этот термин означает, например, что постановку решаемой задачи должен понимать и читатель, не являющийся специалистом в рассматриваемой области. Отсюда вытекает, в частности, что постановка задачи должна быть краткой.

Чуть сложнее объяснить, что я имею в виду, когда говорю об интересной задаче. Лично я делю известные статистические закономерности на любопытные и интересные. Приведу пример (см. статью В.И.Арнольда).

Рассмотрим первую цифру числа, выражающего площадь страны. Эта цифра может быть единицей, двойкой..., девяткой. Оказывается, страны, первая цифра площади которых равна единице, составляют примерно 30% общего их числа, а количество стран, первая цифра площади которых равна девяти, примерно в 6 раз меньше; доля "промежуточных" стран монотонно уменьшается. Эта закономерность не зависит от единиц площади: ее можно измерять в квадратных километрах, милях или дюймах - результат получится тем же.

Неравномерное распределение первых цифр наблюдается и во многих других случаях. Так, численности населения стран мира демонстрируют такую же закономерность. Она была открыта в 1881 г. С. Ньюкомом и названа эмпирическим законом Ф. Бенфорда.

Настоящие Математики изобрели довольно надуманные модели, из которых следует, что эту закономерность легко объяснить, применяя эргодическую теорию. Поскольку, однако, ни одна из этих моделей не выдерживает даже самой благожелательной критики, на сегодняшний день закономерность эта, на мой взгляд всего лишь любопытна.

В xUSSR наиболее распространенными являются два статистических пакета: SPSS и STATISTICA; косвенным доказательством их популярности является то, что их легко найти на CD с пиратским софтом. Поскольку, однако, полноценно пользоваться столь сложными программами без документации практически невозможно, я в этих текстах рассказываю, как получить описываемые результаты с помощью SPSS. Причина выбора проста - у меня на компьютере стоит его легальная копия.


Вы можете попасть на эту страницу по одному из следующих адресов:
http://learn.at/infoscope/Statistics/data_analysis/case_studies/preface.html
http://now.at/infoscope/Statistics/data_analysis/case_studies/preface.html
http://read.at/infoscope/Statistics/data_analysis/case_studies/preface.html

Дата последней модификации: 5 июля 2000 г.

Hosted by www.Geocities.ws

1