СОДЕРЖАНИЕ





ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ


КАФЕДРА СТАТИСТИКИ






О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1

"Автоматизированный априорный анализ статистической совокупности
в среде MS Excel"

Вариант №____








Выполнил: ст. III курса гр.________
_____________________
Ф.И.О.
Проверил:________ ___________
Должность Ф.И.О.






Москва, 2005 г.

Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции - как изучаемые признаки единиц.
Таблица 1
Номер предприятия
Среднегодовая стоимость основных производственных фондов, млн.руб.
Выпуск продукции, млн. руб.
1
368,00
360,50
2
434,50
395,50
3
448,50
441,00
4
473,00
490,00
5
305,00
245,00
6
497,50
420,00
7
511,50
567,00
8
382,00
385,00
9
469,50
451,50
10
543,00
563,50
11
200,00
525,00
12
595,50
595,00
13
452,00
469,00
14
497,50
511,00
15
571,00
619,50
16
655,00
665,00
17
487,00
448,00
18
539,50
532,00
19
427,50
332,50
20
546,50
455,00
21
609,50
612,50
22
417,00
346,50
23
329,50
325,50
24
557,00
521,50
25
497,50
455,00
26
462,50
430,50
27
357,50
280,00
28
483,50
437,50
29
560,50
479,50
30
655,00
175,00
31
532,50
455,00
32
389,00
406,00

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Статистический анализ выборочной совокупности
1. Выявить наличие среди исходных данных резко выделяющихся значений признаков ("выбросов" данных) с целью исключения из выборки аномальных единиц наблюдения.
2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую (), моду (Мо), медиану (Ме), размах вариации (R), дисперсию(), средние отклонения - линейное () и квадратическое (?n), коэффициент вариации (V?), структурный коэффициент асимметрии К.Пирсона (Asп).
3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны (), (), ().
4. Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
5. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.


Статистический анализ генеральной совокупности
1. Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
2. Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
3. Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.
Таблица 2
Аномальные единицы наблюдения
Номер предприятия
Среднегодовая стоимость основных производственных фондов, млн.руб.
Выпуск продукции, млн. руб.
11
200,00
525,00
30
655,00
175,00
Таблица 3




Описательные статистики
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн.руб"
Столбец1
Столбец1


Среднее
480
Среднее
456,5166667
Стандартная ошибка
15,45603702
Стандартная ошибка
18,437725
Медиана
485,25
Медиана
453,25
Мода
497,5
Мода
455
Стандартное отклонение
84,65620127
Стандартное отклонение
100,9875789
Дисперсия выборки
7166,672414
Дисперсия выборки
10198,49109
Эксцесс
-0,344943844
Эксцесс
-0,205332365
Асимметричность
-0,152503649
Асимметричность
0,042954448
Интервал
350
Интервал
420
Минимум
305
Минимум
245
Максимум
655
Максимум
665
Сумма
14400
Сумма
13695,5
Счет
30
Счет
30
Уровень надежности(95,4%)
32,22293096
Уровень надежности(95,4%)
38,43918973

Таблица 4а
Предельные ошибки выборки
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн.руб"
Столбец1
Столбец1


Уровень надежности(68,3%)
15,73742139
Уровень надежности(68,3%)
18,77339238

Таблица 4б
Предельные ошибки выборки
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн.руб"
Столбец1
Столбец1


Уровень надежности(99,7%)
50,06831491
Уровень надежности(99,7%)
59,72720045

Таблица 5

Выборочные показатели вариации и асимметрии
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн.руб"
Стандартное отклонение
83,23330663
Стандартное отклонение
99,29018778
Дисперсия
7166,672414
Дисперсия
10198,49109
Среднее линейное отклонение
66,96666667
Среднее линейное отклонение
76,48666667
Коэффициент вариации, %
17,34027222
Коэффициент вариации, %
21,74952089
Коэффициент асимметрии Asп
-0,21025237
Коэффициент асимметрии Asп
0,015275091

Таблица 6
Карман
Частота
1
375
3
445
5
515
11
585
7
655
3



Таблица 7
Интервальный ряд распределения предприятий
по стоимости основных производственных фондов
Группы предприятий по среднегодовой стоимости основных фондов
Число предприятий в группе
Накопленная частость группы, %
305-375
4
13,33%
375-445
5
30,00%
445-515
11
66,67%
515-585
7
90,00%
585-655
3
100,00%

Итого:
30
























Рис.1 График - диаграмма распределение предприятий по стоимости основных производственных фондов и выпуску продукции.
Анализ выборочной совокупности
1. Согласно таблицы 2, количество аномальных наблюдений - два.
2. Рассчитанные выборочные показатели, представленные в двух таблицах, формируем единую таблицу значений выборочных показателей:

Таблица 8
"Описательные статистики выборочной совокупности"
Описательные статистики
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн.руб"
Столбец1
Столбец1


Среднее
480
Среднее
456,5166667
Стандартная ошибка
15,45603702
Стандартная ошибка
18,437725
Медиана
485,25
Медиана
453,25
Мода
497,5
Мода
455
Стандартное отклонение
84,65620127
Стандартное отклонение
100,9875789
Дисперсия выборки
7166,672414
Дисперсия выборки
10198,49109
Эксцесс
-0,344943844
Эксцесс
-0,205332365
Асимметричность
-0,152503649
Асимметричность
0,042954448
Интервал
350
Интервал
420
Минимум
305
Минимум
245
Максимум
655
Максимум
665
Сумма
14400
Сумма
13695,5
Счет
30
Счет
30
Уровень надежности(95,4%)
32,22293096
Уровень надежности(95,4%)
38,43918973

3.а) Степень колеблемости значений признаков в совокупности незначительная, поскольку полученные значения коэффициентов вариации для двух признаков располагаются в пределах 0%<V?<40% т.е. для первого признака коэффициент вариации равен 17,34027222% а для второго признака 21,74952089%.
б) Совокупность по изучаемым признакам является количественно однородной, так как выполняется неравенство V?<33%, характерное для нормальных и близких к нормальному распределений. Поскольку значение показателя вариации для каждого признака невелико, то индивидуальные значения признака мало отличаются друг от друга, единицы наблюдения количественно однородны и следовательно, средняя арифметическая величина каждого признака является надежной характеристикой данной совокупности.
в) Отношение показателей служит индикатором устойчивости данных. Если >0,8 , то значения признака неустойчивы, в них имеются аномальные выбросы. В нашем случае = 0,79104 для первого признака = 0,757386 и для второго признака. Следовательно, данных признаков можно сделать вывод о том, что значения устойчивы и не имеется более аномальных выбросов.


г)
Распределение значений признака по диапазонам рассеяния признака относительно

Границы диапазонов
Количесво значений xi

находящихся в диапазоне

Первый
Второй
Первый
Второй
признак
признак
признак
признак

(395,343-564,656)
(355,529-557,50)
18
18



(311,344-649,120)
(254,541-913,03)
28
29



(226,013-733,986)
(153,553-759,47)
30
30

В нормальном распределении вероятностные оценки диапазонов рассеяния значений признака таковы:
68,3 % войдёт в диапазон ()
95,4 % войдёт в диапазон ()
99,7 % % войдёт в диапазон ( )
В нашем случае вероятностные оценки диапазонов для первого и второго признаков таковы:
63,3% ()
93,3% ()
100% ()
Полученные значения процентного соотношения рассеяния для наших признаков близки к значениям процентного соотношения признаков, распределенных по нормальному закону, исходя из этого можно сделать вывод о том, что наше распределение близко к нормальному.

4.а)
V?1 < V? 2 (V?1 = 17,34027222 V?2 = 21,749520) поэтому колеблемость единиц совокупности для первого признака меньше, чем для второго.
б) количественная однородность единиц выше для второго признака по сравнению с первым, исходя из значений показателя коэффициента вариации.
в) для второго признака средняя арифметическая величина является более надежной характеристикой чем для первого (исходя из значений показателя коэффициента вариации)
г) Поскольку < Me < Mo и Asп1 < 0 для первого признака характерна левосторонняя асимметрия (Asп1 = -0,21025237). Поскольку < Me < Mo и Asп2 > 0 для второго признака характерна правостороння асимметрия (Asп2 = 0,015275091). Так как для обоих признаков 0,25, то асимметрия незначительная.

4. Рассчитаем моду интервального ряда:
млн.руб.
Расхождения между полученными значениями Mo и значениями моды из таблицы 3, т.е. Mo = 497,5 млн.руб. объясняется тем, что в таблице 3 значение Mo = 497,5 млн.руб. получено по фактическим значениям, а для интервального ряда - по центральным значениям.








Анализ генеральной совокупности
1.
Таблица 10
"Описательные статистики генеральной совокупности"
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб."
По столбцу "Выпуск продукции, млн. руб."



Дисперсия
7166,672414
Дисперсия
10198,49109
Стандартное отклонение
84,6560127
Стандартное отклонение
100,9875789
Коэффициент асимметрии Asп
-0,21025237
Коэффициент асимметрии Asп
0,015275091


Эксцесс
-0,344943844
Эксцесс
-0,205335365

Установим степень расхождения между и по формуле :
Для первого признака:

Следовательно, генеральная дисперсия для первого признака больше чем выборочная дисперсия.
Для второго признака:

Из этого следует, что наблюдается степень расхождения между и как для первого, так и для второго признаков.
Степень расхождения :
Генеральное среднее квадратическое отклонение:
82.656201


Рассчитываем прогнозные оценки размаха вариации :
Для признака "Среднегодовая стоимость основных производственных фондов"


-= 507,936-499,398=8,53 млн.руб.
Для признака "Выпуск продукции":


- = 605,922-595,74= 10,18 млн.руб.
2. Средняя ошибка выборки:
Для признака "Среднегодовая стоимость основных производственных фондов"
15,73742169 млн.руб.
Для признака "Выпуск продукции" - 18,77339238 млн.руб
б)
Таблица 11
Предельные ошибки выборки и ожидаемые границы для генеральных средних
Дове-рительная вероя -тность P
Коэффи-циент доверия t
Предельные ошибки
Ожидаемые границы

выборки
для средних

для первого
дпя второго
для первого
дпя второго

признака
признака
признака
признака





0,683
1
15,7374
18,7373
464,2624953737
437,743475,29
0,954
2
29,6587
36,5811
470,341509,658
419,935493,097
0,997
3
50,0683
59,7272
429,931530,068
396,789516,243

Значение показателей и расходятся незначительно и при этом AsN и EkN указывают на умеренную величину асимметрии и эксцесса соответственно, то есть основание полагать, что распределение единиц генеральной совокупности по признаку "Выпуск продукции" будет близко к нормальному.

Экономическое содержание задачи
1. Образующие выборку предприятия типичны, исключения составляют 11-е (200 млн. руб) и 30-е предприятия (655 млн.руб.).
2. а) Для показателя "Среднегодовая стоимость основных производственных фондов: , =59,452 млн.руб.
Для показателя "Выпуск продукции: , =74,177 млн.руб
б) Для показателя Среднегодовая стоимость основных производственных фондов предприятия, входящие в диапазон (), - № 3, 4, 6, 7, 9,10, 13, 14, 17, 18, 19, 20, 22, 24, 25, 26, 28, 29, 31.
Для показателя "Выпуск продукции предприятия, входящие в диапазон ( ), - № 1, 2, 3, 4, 6, 8, 9, 10, 11, 13, 14, 17, 18, 20, 24, 25, 26, 28, 29, 31, 32.
3. Коэффициенты вариации: V?1 = 17,34027, V?2 = 21,74952 (соответственно для первого и для второго признаков), следовательно, по изучаемым экономическим характеристикам предприятия однородны (индивидуальные значения первого признака более количественно однородны). Для первого признака максимальное расхождение 350 млн. руб. для второго 420 млн. руб., поэтому можно утверждать, что выборка составлена из близких по значению предприятий по сравниваемым характеристикам. Максимальное расхождение в значениях показателей для признака "Среднегодовая стоимость основных производственных фондов" - 250 млн.руб.; для признака "Выпуск продукции" - 317,5млн.руб.
4. Модальный интервал -
- Типичные предприятия, входящие в модальный интервал: № - 3, 4, 6, 7,9, 13, 14, 17, 25, 26, 28.
- Предприятия, входящие в группу с наименьшей стоимостью основных фондов : № - 1, 5, 27, 23.
- Предприятия, входящие в группу с наибольшей стоимостью основных фондов : № - 12,30, 21.
- Удельный вес предприятий модального интервала: Р = 11/30 = 0,367 или 36,7%.
- Удельный вес предприятий модального интервала c наименьшими значениями Р = 4/30 = 0,133 или 13,3%.
- Удельный вес предприятий модального интервала c наибольшими значениями Р = 3/30 = 0,100 или 10,0%.
5. Построив гистограмму можно сделать вывод о том, что существует закономерность распределения (оно близко к нормальному). Asп1 = -0,21 Asп2 = 0,01. В совокупности доминируют предприятия с более высокой стоимостью основных фондов.

6. Предельные ошибки выборки:

Доверительная 0,683 11,241 14,025
вероятность: 0,954 23,016 28,717

0,997 35,763 44,621
Границы для средних:
Для признака "Среднегодовая стоимость основных производственных фондов"
0,683
Доверительная 0,954
вероятность: 0,997
Для признака "Выпуск продукции":

Доверительная 0,683
вероятность : 0,954
0.997
Ожидаемый размах вариации показателей:
Для признака "Среднегодовая стоимость основных производственных фондов:
- R = 362,812 - 356,714 = 6,098 млн. руб.
Для признака "Выпуск продукции"
- R = 452,676 - 445,066 = 7,010 млн. руб.










СОДЕРЖАНИЕ