16.12.2021г. ГРУППА 201. МАТЕМАТИКА.
ТЕМА
«Понятие о задачах математической статистики.
Представление числовых данных (таблицы, диаграммы, графики). Решение
практических задач на обработку числовых данных, вычисление их характеристик».
«Статистика
знает все. Известно, сколько какой пищи съедает в год средний гражданин
республики… Известно, сколько в стране охотников, балерин… станков, собак всех
пород, велосипедов, памятников, маяков и швейных машинок… Как много жизни,
полной пыла, страстей и мысли глядит на нас со статистических таблиц!»
И. Ильф, Е.
Петров
1) Какие
статистические данные вам известны?
2) Каким
образом их получают?
3) Можем ли
мы с вами получить информацию, обработать ее, применить для своей
осведомленности и использовать знания при необходимости?
Давайте
вспомним известные вам примеры, в которых информируется об итогах обработанной
информации. (Средний прожиточный минимум на данный период, средняя
продолжительность жизни, средняя зарплата по области, по стране; средняя
успеваемость по группе, по техникуму; среднемесячная температура воздуха и
т.д.)
Слово
«статистика» в переводе означает: состояние, положение вещей.
1) Какого
рода статистика вам известна?
2) О чем нас
информируют статистические данные?
- Экономическая статистика изучает производство и потребление разнообразных видов продукции,
изменение цен, спроса и предложения на товары, прогнозирует рост и падение
производства и потребления, перевозку грузов и
пассажиров различными видами транспорта, природные ресурсы и многое другое
- Медицинская статистика изучает эффективность
различных лекарств и методов лечения, вероятность возникновения некоторого
заболевания в зависимости от возраста, пола, наследственности, условий
жизни, вредных привычек, прогнозирует распространение эпидемий.
- Демографическая статистика изучает рождаемость,
численность населения, его состав (возрастной, национальный,
профессиональный).
- Есть еще статистика финансовая,
налоговая, биологическая и т.д.
1.Статистика
– это научное направление (комплекс наук), объединяющее принципы
и методы работы с числовыми данными, характеризующими массовые явления.
2. Статистика – это отрасль практической деятельности,
направленной на сбор, обработку, анализ статистических данных.
3. Статистика – это совокупность статистических данных,
характеризующих какое-нибудь явление или процесс (например, статистика
рождаемости и смертности в России, статистика успеваемости учащихся и т.п.).
Математическая статистика – это раздел математики который
занимается разработкой методов сбора, описания и анализа экспериментальных
результатов наблюдений, массовых случайных явлений..
Математическая
статистика – наука, основанная на законах теории вероятностей. Статистические
методы обработки данных из самых разных областей жизни имеют много общего. Это
позволило создать универсальные научно обоснованные методы статистических
исследований и проверки статистических гипотез.
Статистические характеристики – это математические понятия, с
помощью которых описываются отличительные особенности и свойства совокупности
данных, полученных с помощью наблюдений или каким-то другим способом. Значение
характеристик состоит еще и в том, что они «подсказывают», с каких
позиций целесообразно анализировать имеющуюся совокупность данных.
Сбор
информации: происходит
массово или выборочно. При этом используется: перепись населения, отчеты
предприятий, текущий учет, опросы, анкетирование, интервьюирование, наблюдения,
статистика больниц, загсов и т.д.
Фундаментальными
понятиями математической статистики являются генеральная совокупность и
выборка. Генеральную совокупность удобно
изображать с использованием круговой диаграммы, выборку – с использованием
части круговой диаграммы.
Способы
образования выборочной совокупности: случайная (отбирая на удачу), механическая (отбирая
через определенный интервал), типическая (случайные выборки из каждой группы),
серийная (разбивается на непересекающиеся серии или группы).
Обработка
собранной информации.
Статистическая информация о результатах наблюдений или экспериментов может
быть представлена в различных формах.
Простейшей из них является запись в порядке их появления – запись в ряд,
называемый простым статистическим рядом
или выборкой.
Отдельные значения, составляющие этот ряд, называют вариантами
или просто данными.
Понятие
объема ряда
Количество вариант в ряду n называют объемом ряда,
или объемом выборки.
Варианты в ряду могут иметь как различные, так и одинаковые значения.
Понятие
ранжированного ряда
Составить ранжированный
ряд - это значит записать варианты в порядке их возрастания.
Характеристики
числового ряда
Пример 1. Пусть ученик получил в течение
года следующие отметки по математике: 5, 2, 4, 5, 5, 4, 4, 5, 5, 5. Какую
четвертную отметку поставит ему учитель?
Многих
школьников волнует подобная проблема, и чаще всего ученики решают ее следующим
естественным образом: складывают все отметки и делят сумму оценок на их
количество.
В нашем
случае (5 + 2 + 4 + 4 + 5 + 5 + 4 + 4 + 5 + 5 + 5) / 10 = 4,4
Число 4,4,
которое получается в результате, называется средним арифметическим.
Поскольку такую оценку в журнал ставить не принято, учитель, скорее всего,
округлит ее до 4.
Средним
арифметическим (или выборочным средним) ряда чисел называется частное от деления суммы
этих чисел на их количество: Среднее арифметическое, конечно, является важной
характеристикой ряда чисел, в нашем случае — отметок за четверть, но
иногда полезно рассматривать и другие средние.
Например,
претендуя на «5», ученик наверняка будет использовать такой аргумент: «Чаще
всего в четверти я получал пятерки!». Статистик в этом случае сказал бы иначе:
«Модой этого ряда является число 5».
Модой (Мо) называют число ряда, которое
встречается в этом ряду наиболее часто.
Можно
сказать, что оно в этом ряду самое «модное». В отличие от среднего
арифметического, которое можно вычислить для любого числового ряда, моды может
вообще не быть.
Например,
пусть тот же ученик получил по русскому языку следующие отметки: 4, 2, 3, 5.
Каждая отметка встречается в этом ряду только один раз, и среди них нет числа,
встречающегося чаще других. Значит, у этого ряда нет моды. А вот среднее
арифметическое, конечно, есть:(4 + 2 + 3 + 5) : 4 = 3,5.
Такой
показатель, как мода, можно использовать не только в числовых рядах. Вы уже
знакомы с социологическими опросами. Если, например, опросить большую группу
учеников, какой предмет вам нравится больше всего, то модой можно назвать тот
предмет, который будут называть чаще остальных. Это одна из причин, по
которой мода широко используется при изучении спроса. Например, при решении
вопросов, в пачки какого веса фасовать масло, какие открывать авиарейсы и т.
п., предварительно изучается спрос и выявляется мода — наиболее часто
встречающийся заказ. И даже выборы президента, с точки зрения статистики, не
более чем определение моды.
Медиана
числового ряда
Медианой ряда, состоящего из нечетного количества чисел, называется число
данного ряда, которое окажется посередине, если этот ряд упорядочить: ,
Me =
Медианой ряда, состоящего из четного количества чисел, называется среднее
арифметическое двух стоящих посередине чисел этого ряда, если этот ряд
упорядочить.,
Me =
Для того чтобы найти медиану ряда чисел, нужно сначала их
упорядочить — составит ранжированный ряд (записать в порядке
убывания).
Пример 2.В
конце года 11 учеников 8 класса сдавали норматив по бегу на 100 метров. Были
зафиксированы следующие результаты:
Ученик
Результат(с)
Данила
15,3
Петя
16,9
Лена
21,8
Катя
18,4
Стаc
16,1
Аня
25,1
Оля
19,9
Боря
15,5
Паша
14,7
Наташа
20,2
Миша
15,4
После того
как все ребята пробежали дистанцию, к преподавателю подошел Петя и спросил,
какой у него результат. «Самый средний результат: 16,9 секунды», — ответил учитель.
«Почему? — удивился Петя. — Ведь среднее арифметическое всех
результатов — примерно 18,3 секунды, а я пробежал на секунду с лишним
лучше. И вообще, результат Кати (18,4) гораздо ближе к среднему, чем мой».
«Твой результат средний, потому что пять человек пробежали лучше, чем ты, и
пять — хуже. То есть ты как раз посередине», — сказал учитель. На
языке статистики результат Пети называется медианой исходного ряда
данных.
Для того
чтобы найти медиану ряда чисел, нужно сначала их упорядочить — составить
ранжированный ряд. В нашем примере он выглядит так:
14,7; 15,3;
15,4; 15,5; 16,1; 16,9; 18,4; 19,9; 20,2; 21,8; 25,1.
Средним
(шестым по счету) числом является 16,9: пять чисел меньше него, пять чисел
больше. Значит, 16,9 — медиана.
Достоинством
медианы является ее большая по сравнению со средним арифметическим «устойчивость
к ошибкам».
Представим
себе, что в наши наблюдения вкралась досадная оплошность: например, при записи
одного из результатов соревнований мы пропустили десятичную запятую и вместо
20,2 написали 202. Тогда среднее арифметическое результатов возрастет с 18,1
секунды до 34,6 секунды, а медиана будет по-прежнему 16,9 секунды!
Медиану используют вместо средней
арифметической, когда крайние варианты упорядоченного ряда (наименьшая и
наибольшая) по сравнению с остальными оказываются чрезмерно большими или
чрезмерно малыми.
Числовой ряд иногда удобно представлять
в виде таблицы, если имеем большой объем информации и данные повторяются.
Представим ряд данных 5, 2, 4, 5, 5, 4, 4, 5, 5, 5 в виде таблицы
X
2
4
5
M
1
3
6
W
1/10
10
3/10
30
6/10
60
В первой строке – значение случайной
величины Х, во второй – частота значений варианты М, в третьей строке –
относительная частота появления события.
По табличным данным тоже можно найти объем
ряда, среднее арифметическое, моду и медиану.
Объем - сложить все данные М
Мода – самое большое значение М
Медиана - Ме
Среднее арифметическое: = cумме
произведений элементов первой строки на частоту появления второй строки, и все
поделить на 10:
Статистические
характеристики: среднее арифметическое, мода, медиана называются средними
результатами измерений.
Обработанные результаты статистики можно
демонстрировать графически.
Пример 3: В первом полугодии 2011 года завод получил прибыль в 10 млн.
рублей. Распределение прибыли по месяцам показано в таблице
В координатной плоскости на оси абсцисс будем отмечать номер месяца (янв. – 1, февр. – 2 и т.д.). На оси ординат будем отмечать прибыль завода
(в млн. руб.).
Отметим точки: (1;1,4),(2;1,3),(3;1,5),(4;2,1),(5;2),(6;1,7) и соединим их
последовательно отрезками.
Полученную ломаную линию называют полигоном частот.
Графики статистического распределения.
Распределение случайных величин можно задавать и демонстрировать
графически.
Гистограмма – помогает наглядно сравнивать по величине несколько объектов.
Полигон частот – показывает промежутки убывания и возрастания, точки максимума и минимума.
Существуют и
другие статистические характеристики, которые называются характеристиками
отклонения.
Размах.
Дисперсия. Среднеквадратичное отклонение
Средние
характеристики числового ряда позволяют оценить его поведение «в среднем».
Но это далеко не всегда полностью характеризует выборку.
Размах — это разность наибольшего и
наименьшего значений ряда данных: …
R =
Пример 4.
Температура на Меркурии колеблется от - 150 до + 350 Удобен ли климат Меркурия
для жизни людей, если на планете Меркурий средняя температура +15?
Например, на планете Меркурий средняя
температура +15°. Исходя из этого статистического показателя, можно подумать,
что на Меркурии умеренный климат, удобный для жизни людей.
Однако на
самом деле это не так. Температура на Меркурии колеблется от — 150° до
+350°.
Значит,
чтобы получить представление о поведении числового ряда, помимо средних характеристик
надо знать характеристики разброса, показывающие, насколько значения
ряда различаются между собой, как сильно они «разбросаны» вокруг средних.
Простейшей такой характеристикой является размах.
Для
температуры на Меркурии, например, размах равен
350° —
(-150°) = 500°. Конечно, такого перепада температур человек выдержать не может.
Размах очень
просто вычисляется, но не всегда несет достоверную информацию, так как на его
величину может сильно повлиять какое-то одно (возможно, ошибочное) значение
статистического ряда.
Вот почему в
реальных статистических исследованиях чаще используют другую характеристику
разброса, которая сложнее вычисляется, но зато меньше подвержена таким
колебаниям.
Прежде чем
определять эту величину, рассмотрим на примере, какой самый естественный способ
вычисления «среднего отклонения от среднего».
Пример 5.
Дан числовой ряд, который представляет собой стоимость одного литра бензина на
10 автозаправочных станциях (в рублях):
32,2; 32,8; 33; 32,9; 33; 32,5; 32,8; 33; 33,2; 32,8.
Найдем
среднее арифметическое этих цен:
(32,2 + 32,8 + 33 + 32,9 + 33 + 32,5 + 32,8 + 33+ 33,2 + 32,8 ) / 10 =
32,82.
Самым
естественным, на первый взгляд, кажется посчитать отклонение от среднего для
каждого члена ряда и затем найти их среднее арифметическое:
((32,2 - 32,82) + (32,8 - 32,82) +(33- 32,82) + … + (32,8 - 32,82)) / 10 =
0.
Мы получили
нуль совсем не случайно: при вычислении «среднего разброса» по такой формуле
часть отклонений входит в сумму со знаком «плюс», часть — со знаком
«минус», а в сумме всегда получается нуль.
Какой же
выход? Можно суммировать, например, модули отклонений — тогда уж нуля
точно не будет. Иногда так и поступают, но с модулем не всегда удобно работать.
Поэтому математики решили, что лучше складывать не модули отклонений, а их
квадраты — они ведь тоже неотрицательные.
Так
появилось понятие дисперсии числового ряда.
Дисперсией
числового ряда называется
среднее арифметическое квадратов отклонений от среднего арифметического.
D =
Найдем
дисперсию числового ряда из нашего примера с ценами на бензин. Среднее
арифметическое мы уже вычислили — оно равно32,82.
Найдем
теперь дисперсию, т. е. среднее арифметическое квадратов отклонений
от среднего:
((32,2 - 32,82)2 + (32,8 - 32,82)2 + (33 -
32,82)2 + … + (32,8 - 32,82)2 ) / 10 = 0,0736.
У дисперсии
есть один существенный недостаток: если исходные значения ряда измеряются в
каких-то единицах (например, в рублях), то у дисперсии
эти единицы возводятся в квадрат («квадратные» рубли).
В нашем
примере среднее значение цены получилось 32 рубля 82 копейки, а вот дисперсия
цен — около 7 … «квадратных копеек».
Избавиться
от таких странных единиц измерения можно, если использовать другую
характеристику разброса — стандартное отклонение.
Стандартным
(или средним квадратичным) отклонением числового ряда называется квадратный корень из
дисперсии:
Обозначают его греческой буквой
Как и при
изучении средних характеристик, попробуем найти характеристики разброса по
таблице частот.
Как мы
знаем, распределение вероятностей случайной величины — это таблица, в
которой указаны значения случайной величины и их вероятности. Для практики не
всегда нужно изучать всю таблицу распределения. Достаточно знать некоторые ее
числовые характеристики. Рассмотрим случайную величину X. Ее
математическое ожидание обычно обозначают Е(Х).Пусть распределение
вероятностей случайной величины X задано таблицей:
Значение
величины X
Х1
Х2
Х3
Хn
Вероятность P1
P2
P3
Pn
Математическим ожиданием случайной величины X называют
число
Е(Х)= х1 ·
Р1 + х2 · Р2 + … + хn ·
Рn.
Математическое
ожидание Е(Х) называют также ожидаемым значением
случайной величины X, средним значением случайной
величины X. Если значения случайной величины измеряются в
каких-либо единицах (например, рост — в сантиметрах, температура — в
градусах), то ее математическое ожидание измеряется в этих же единицах (средний
рост — в сантиметрах, средняя температура — в градусах)
Пример 6.
Для проведения лотереи изготовили 100 билетов. Из них 1 билет с выигрышем в 500
р., 10 билетов с выигрышами по 100 р. и остальные 89 билетов без выигрышей.
Наудачу выбирают один билет. Найдем математическое ожидание выигрыша M(X).
Количество билетов
1
10
89
Выигрыш
500 руб.
100 руб.
0 руб
Вероятность
1/100
1/10
89/100
Для того
чтобы лотерея приносила доход своим устроителям, цена билета должна быть
больше, чем средний выигрыш. Предположим, что билет стоит 20 р. Продав все
билеты, устроители лотереи получат 2000 рублей.
На выплату
выигрышей будет потрачено 1500 рублей.
Таким
образом, доход от лотереи составит 500 рублей.
Разумеется,
может случиться так, что на один купленный нами билет мы получим большой
выигрыш. Но если бы некто решил купить все билеты, то он достоверно потерял бы
500 рублей — по 5 на каждый из 100 билетов.
Так устроены
все лотереи: математическое ожидание
выигрыша на один билет меньше цены этого билета.
Это условие
является непременным, и оно обеспечивает рентабельность лотереи и доход ее
устроителям. Человек, который решил сыграть в лотерею, должен понимать это и
сознательно рисковать своими деньгами.
Задача 1. В небольшой фирме 10
сотрудников: 7 рабочих, мастер, бухгалтер, директор. Зарплата у рабочих: 2000,
у мастера 4000, у бухгалтера 16000, у директора 40000. Найдите, чему будет
равна средняя зарплата на этом предприятии?
Решение:
В этом случае используют другую
статистическую характеристику – медиану.
Задача 2. В таблице приведена
информация о длине некоторых рек, протекающих по территории Ивановской области,
впадающих в реку Волга
9, 34, 45, 54, 58, 132, 152.
а) Найдите среднюю длину рек (среднее
арифметическое);(484:7=69,14)
б)Найдите длину рек в среднем (медиану данных=54);
в) Найти размах длины рек (152 - 9=143)
Ответ: а) 69км, б) 54 км, в) 143
Итак, для характеристики статистической
информации используют среднее арифметическое и медиану. Во многих случаях одна
из характеристик может не иметь никакого содержательного смысла.
Задача 3. В женском обувном
магазине провели статистические исследования и составили соответствующую
таблицу по цене обуви и количества продаж:
Первый и второй этап
статистического исследования уже пройдены: данные собраны и систематизированы.
Осталось произвести анализ данных.
Для данных показателей
надо найти статистические характеристики и объяснить их значение.
n = 8+9+14+15+3+1=50
= = =1426
Mo = 1500 Mo = 1800
Ме = 1500
После ученики должны
ответить на следующие вопросы:
- Из данных ценовых категорий, обувь
за какую цену не следует продавать магазину?
- Обувь, по какой цене следует
распространять?
- К какой цене лучше стремиться?
По каким параметрам
еще можно провести статистические исследования в обувном магазине?
Задача 4. На соревнованиях по
фигурному катанию судьи поставили спортсмену следующие оценки:
5,2 5,4 5,5 5,4 5,1
5,1 5,4 5,5 5,3
Для полученного ряда
чисел найдите среднее арифметическое, размах, медиану и моду. Что характеризует
каждый из этих показателей?
Среднее арифметическое
5,2 характеризует средний уровень оценок.
Размах R = = 5,5 –
5,1=0,4 характеризует разброс оценок.
Мода Мо = 5,4
показывает оценку, которая встречается чаще других.
Медиана Ме = 5,4
показывает, что половина членов ряда не превосходит по величине 5,4.
Задача 5. Двух футболистов, один из которых участвовал в пяти
игровых сезонах, а другой – в шести, сравнить по результативности и
стабильности в забивании голов, если количество мячей, забитых первым
футболистом по сезонам образует ряд: 17,21,20,16,15,19, а вторым:
17,20,18,21,14.
Находим числовые характеристики двух выборок:
Первый футболист: = 18, D(X)
Второй футболист: = 18,D(X)
Таким образом, оба футболиста показывают одинаковую
результативность (среднее число голов за сезон), но первый футболист более
стабилен, так как дисперсия первой выборки меньше.
ЗАДАНИЕ:
1. ОТВЕТЬТЕ НА ВОПРОСЫ:
2. РЕШИТЕ ЗАДАЧИ 6, 7.
1)да 2)нет 3) да 4)да 5)нет 6)да 7)да 8)да
Европа-65, Африка-17, Азия-61, Северная и Центральная Америка-16, Южная Америка-15, Австралия-3, все континенты-34
:
Комментариев нет:
Отправить комментарий