Как рассчитать значение. Как найти среднее арифметическое и среднее геометрическое чисел

В большинстве случаев данные концентрируются вокруг некоей центральной точки. Таким образом, чтобы описать любой набор данных, достаточно указать средне значение. Рассмотрим последовательно три числовые характеристики, которые используются для оценки среднего значения распределения: среднее арифметическое, медиана и мода.

Среднее арифметическое

Среднее арифметическое (часто называемое просто средним) - наиболее распространенная оценка среднего значения распределения. Она является результатом деления суммы всех наблюдаемых числовых величин на их количество. Для выборки, состоящей из чисел Х 1 , Х 2 , …, Х n , выборочное среднее (обозначаемое символом ) равно = (Х 1 + Х 2 + … + Х n ) / n , или

где - выборочное среднее, n - объем выборки, X i – i-й элемент выборки.

Скачать заметку в формате или , примеры в формате

Рассмотрим вычисление среднего арифметического значения пятилетней среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска (рис. 1).

Рис. 1. Среднегодовая доходность 15 взаимных фондов с очень высоким уровнем риска

Выборочное среднее вычисляется следующим образом:

Это хороший доход, особенно по сравнению с 3–4% дохода, который получили вкладчики банков или кредитных союзов за тот же период времени. Если упорядочить значения доходности, то легко заметить, что восемь фондов имеют доходность выше, а семь - ниже среднего значения. Среднее арифметическое играет роль точки равновесия, так что фонды с низкими доходами уравновешивают фонды с высокими доходами. В вычислении среднего задействованы все элементы выборки. Ни одна из других оценок среднего значения распределения не обладает этим свойством.

Когда следует вычислять среднее арифметическое. Поскольку среднее арифметическое зависит от всех элементов выборки, наличие экстремальных значений значительно влияет на результат. В таких ситуациях среднее арифметическое может исказить смысл числовых данных. Следовательно, описывая набор данных, содержащий экстремальные значения, необходимо указывать медиану либо среднее арифметическое и медиану. Например, если удалить из выборки доходность фонда RS Emerging Growth, выборочное среднее доходности 14 фондов уменьшится почти на 1% и составит 5,19%.

Медиана

Медиана представляет собой срединное значение упорядоченного массива чисел. Если массив не содержит повторяющихся чисел, то половина его элементов окажется меньше, а половина - больше медианы. Если выборка содержит экстремальные значения, для оценки среднего значения лучше использовать не среднее арифметическое, а медиану. Чтобы вычислить медиану выборки, ее сначала необходимо упорядочить.

Эта формула неоднозначна. Ее результат зависит от четности или нечетности числа n :

  • Если выборка содержит нечетное количество элементов, медиана равна (n+1)/2 -му элементу.
  • Если выборка содержит четное количество элементов, медиана лежит между двумя средними элементами выборки и равна среднему арифметическому, вычисленному по этим двум элементам.

Чтобы вычислить медиану выборки, содержащей данные о доходности 15 взаимных фондов с очень высокий уровнем риска, сначала необходимо упорядочить исходные данные (рис. 2). Тогда медиана будет напротив номера среднего элемента выборки; в нашем примере №8. В Excel есть специальная функция =МЕДИАНА(), которая работает и с неупорядоченными массивами тоже.

Рис. 2. Медиана 15 фондов

Таким образом, медиана равна 6,5. Это означает, что доходность одной половины фондов с очень высоким уровнем риска не превышает 6,5, а доходность второй половины - превышает ее. Обратите внимание на то, что медиана, равная 6,5, ненамного больше среднего значения, равного 6,08.

Если удалить из выборки доходность фонда RS Emerging Growth, то медиана оставшихся 14 фондов уменьшится до 6,2%, то есть не так значительно, как среднее арифметическое (рис. 3).

Рис. 3. Медиана 14 фондов

Мода

Термин был впервые введен Пирсоном в 1894 г. Мода - это число, которое чаще других встречается в выборке (наиболее модное). Мода хорошо описывает, например, типичную реакцию водителей на сигнал светофора о прекращении движения. Классический пример использования моды - выбор размера выпускаемой партии обуви или цвета обоев. Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»). Мультимодальность распределения дает важную информацию о природе исследуемой переменной. Например, в социологических опросах, если переменная представляет собой предпочтение или отношение к чему-то, то мультимодальность может означать, что существуют несколько определенно различных мнений. Мультимодальность также служит индикатором того, что выборка не является однородной и наблюдения, возможно, порождены двумя или более «наложенными» распределениями. В отличие от среднего арифметического, выбросы на моду не влияют. Для непрерывно распределенных случайных величин, например, для показателей среднегодовой доходности взаимных фондов, мода иногда вообще не существует (или не имеет смысла). Поскольку эти показатели могут принимать самые разные значения, повторяющиеся величины встречаются крайне редко.

Квартили

Квартили - это показатели, которые чаще всего используются для оценки распределения данных при описании свойств больших числовых выборок. В то время как медиана разделяет упорядоченный массив пополам (50% элементов массива меньше медианы и 50% - больше), квартили разбивают упорядоченный набор данных на четыре части. Величины Q 1 , медиана и Q 3 являются 25-м, 50-м и 75-м перцентилем соответственно. Первый квартиль Q 1 - это число, разделяющее выборку на две части: 25% элементов меньше, а 75% - больше первого квартиля.

Третий квартиль Q 3 - это число, разделяющее выборку также на две части: 75% элементов меньше, а 25% - больше третьего квартиля.

Для расчета квартилей в версиях Excel до 2007 г. использовалась функция =КВАРТИЛЬ(массив;часть). Начиная с версии Excel2010 применяются две функции:

  • =КВАРТИЛЬ.ВКЛ(массив;часть)
  • =КВАРТИЛЬ.ИСКЛ(массив;часть)

Эти две функции дают немного различные значения (рис. 4). Например, при вычислении квартилей выборки, содержащей данные о среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска Q 1 = 1,8 или –0,7 для КВАРТИЛЬ.ВКЛ и КВАРТИЛЬ.ИСКЛ, соответственно. Кстати функция КВАРТИЛЬ, использовавшаяся ранее соответствует современной функции КВАРТИЛЬ.ВКЛ. Для расчета квартилей в Excel с помощью вышеприведенных формул массив данных можно не упорядочивать.

Рис. 4. Вычисление квартилей в Excel

Подчеркнем еще раз. Excel умеет рассчитывать квартили для одномерного дискретного ряда , содержащего значения случайной величины. Расчет квартилей для распределения на основе частот приведен ниже в разделе .

Среднее геометрическое

В отличие от среднего арифметического среднее геометрическое позволяет оценить степень изменения переменной с течением времени. Среднее геометрическое - это корень n -й степени из произведения n величин (в Excel используется функция =СРГЕОМ):

G = (X 1 * X 2 * … * X n) 1/n

Похожий параметр – среднее геометрическое значение нормы прибыли – определяется формулой:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

где R i – норма прибыли за i -й период времени.

Например, предположим, что объем вложенных средств в исходный момент времени равен 100 000 долл. К концу первого года он падает до уровня 50 000 долл., а к концу второго года восстанавливается до исходной отметки 100 000 долл. Норма прибыли этой инвестиции за двухлетний период равна 0, поскольку первоначальный и финальный объем средств равны между собой. Однако среднее арифметическое годовых норм прибыли равно = (–0,5 + 1) / 2 = 0,25 или 25%, поскольку норма прибыли в первый год R 1 = (50 000 – 100 000) / 100 000 = –0,5, а во второй R 2 = (100 000 – 50 000) / 50 000 = 1. В то же время, среднее геометрическое значение нормы прибыли за два года равно: G = [(1–0,5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Таким образом, среднее геометрическое точнее отражает изменение (точнее, отсутствие изменений) объема инвестиций за двухлетний период, чем среднее арифметическое.

Интересные факты. Во-первых, среднее геометрическое всегда будет меньше среднего арифметического тех же чисел. За исключением случая, когда все взятые числа равны друг другу. Во-вторых, рассмотрев свойства прямоугольного треугольника, можно понять, почему среднее называется геометрическим. Высота прямоугольного треугольника, опущенная на гипотенузу, есть среднее пропорциональное между проекциями катетов на гипотенузу, а каждый катет есть среднее пропорциональное между гипотенузой и его проекцией на гипотенузу (рис. 5). Это даёт геометрический способ построения среднего геометрического двух (длин) отрезков: нужно построить окружность на сумме этих двух отрезков как на диаметре, тогда высота, восставленная из точки их соединения до пересечения с окружностью, даст искомую величину:

Рис. 5. Геометрическая природа среднего геометрического (рисунок из Википедии)

Второе важное свойство числовых данных - их вариация , характеризующая степень дисперсии данных. Две разные выборки могут отличаться как средними значениями, так и вариациями. Однако, как показано на рис. 6 и 7, две выборки могут иметь одинаковые вариации, но разные средние значения, либо одинаковые средние значения и совершенно разные вариации. Данные, которым соответствует полигон В на рис. 7, изменяются намного меньше, чем данные, по которым построен полигон А.

Рис. 6. Два симметричных распределения колоколообразной формы с одинаковым разбросом и разными средними значениями

Рис. 7. Два симметричных распределения колоколообразной формы с одинаковыми средними значениями и разным разбросом

Существует пять оценок вариации данных:

  • размах,
  • межквартильный размах,
  • дисперсия,
  • стандартное отклонение,
  • коэффициент вариации.

Размах

Размахом называется разность между наибольшим и наименьшим элементами выборки:

Размах = Х Max – Х Min

Размах выборки, содержащей данные о среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска, можно вычислить, используя упорядоченный массив (см. рис. 4): Размах = 18,5 – (–6,1) = 24,6. Это значит, что разница между наибольшей и наименьшей среднегодовой доходностью фондов с очень высоким уровнем риска равна 24,6% .

Размах позволяет измерить общий разброс данных. Хотя размах выборки является весьма простой оценкой общего разброса данных, его слабость заключается в том, что он никак не учитывает, как именно распределены данные между минимальным и максимальным элементами. Этот эффект хорошо прослеживается на рис. 8, который иллюстрирует выборки, имеющие одинаковый размах. Шкала В демонстрирует, что если выборка содержит хотя бы одно экстремальное значение, размах выборки оказывается весьма неточной оценкой разброса данных.

Рис. 8. Сравнение трех выборок, имеющих одинаковый размах; треугольник символизирует опору весов, и его расположение соответствует среднему значению выборки

Межквартильный размах

Межквартильный, или средний, размах - это разность между третьим и первым квартилями выборки:

Межквартильный размах = Q 3 – Q 1

Эта величина позволяет оценить разброс 50% элементов и не учитывать влияние экстремальных элементов. Межквартильный размах выборки, содержащей данные о среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска, можно вычислить, используя данные на рис. 4 (например, для функции КВАРТИЛЬ.ИСКЛ): Межквартильный размах = 9,8 – (–0,7) = 10,5. Интервал, ограниченный числами 9,8 и –0,7, часто называют средней половиной.

Следует отметить, что величины Q 1 и Q 3 , а значит, и межквартильный размах, не зависят от наличия выбросов, поскольку при их вычислении не учитывается ни одна величина, которая была бы меньше Q 1 или больше Q 3 . Суммарные количественные характеристики, такие как медиана, первый и третий квартили, а также межквартильный размах, на которые не влияют выбросы, называются устойчивыми показателями.

Хотя размах и межквартильный размах позволяют оценить общий и средний разброс выборки соответственно, ни одна из этих оценок не учитывает, как именно распределены данные. Дисперсия и стандартное отклонение лишены этого недостатка. Эти показатели позволяют оценить степень колебания данных вокруг среднего значения. Выборочная дисперсия является приближением среднего арифметического, вычисленного на основе квадратов разностей между каждым элементом выборки и выборочным средним. Для выборки Х 1 , Х 2 , … Х n выборочная дисперсия (обозначаемая символом S 2 задается следующей формулой:

В общем случае выборочная дисперсия - это сумма квадратов разностей между элементами выборки и выборочным средним, деленная на величину, равную объему выборки минус один:

где - арифметическое среднее, n - объем выборки, X i - i -й элемент выборки X . В Excel до версии 2007 для расчета выборочной дисперсии использовалась функция =ДИСП(), с версии 2010 используется функция =ДИСП.В().

Наиболее практичной и широко распространенной оценкой разброса данных является стандартное выборочное отклонение . Этот показатель обозначается символом S и равен квадратному корню из выборочной дисперсии:

В Excel до версии 2007 для расчета стандартного выборочного отклонения использовалась функция =СТАНДОТКЛОН(), с версии 2010 используется функция =СТАНДОТКЛОН.В(). Для расчета этих функций массив данных может быть неупорядоченным.

Ни выборочная дисперсия, ни стандартное выборочное отклонение не могут быть отрицательными. Единственная ситуация, в которой показатели S 2 и S могут быть нулевыми, - если все элементы выборки равны между собой. В этом совершенно невероятном случае размах и межквартильный размах также равны нулю.

Числовые данные по своей природе изменчивы. Любая переменная может принимать множество разных значений. Например, разные взаимные фонды имеют разные показатели доходности и убытков. Вследствие изменчивости числовых данных очень важно изучать не только оценки среднего значения, которые по своей природе являются суммарными, но и оценки дисперсии, характеризующие разброс данных.

Дисперсия и стандартное отклонение позволяют оценить разброс данных вокруг среднего значения, иначе говоря, определить, сколько элементов выборки меньше среднего, а сколько - больше. Дисперсия обладает некоторыми ценными математическими свойствами. Однако ее величина представляет собой квадрат единицы измерения - квадратный процент, квадратный доллар, квадратный дюйм и т.п. Следовательно, естественной оценкой дисперсии является стандартное отклонение, которое выражается в обычных единицах измерений - процентах дохода, долларах или дюймах.

Стандартное отклонение позволяет оценить величину колебаний элементов выборки вокруг среднего значения. Практически во всех ситуациях основное количество наблюдаемых величин лежит в интервале плюс-минус одно стандартное отклонение от среднего значения. Следовательно, зная среднее арифметическое элементов выборки и стандартное выборочное отклонение, можно определить интервал, которому принадлежит основная масса данных.

Стандартное отклонение доходности 15 взаимных фондов с очень высоким уровнем риска равно 6,6 (рис. 9). Это значит, что доходность основной массы фондов отличается от среднего значения не более чем на 6,6% (т.е. колеблется в интервале от – S = 6,2 – 6,6 = –0,4 до + S = 12,8). Фактически в этом интервале лежит пятилетняя среднегодовая доходность 53,3% (8 из 15) фондов.

Рис. 9. Стандартное выборочное отклонение

Обратите внимание на то, что в процессе суммирования квадратов разностей элементы выборки, лежащие дальше от среднего значения, приобретают больший вес, чем элементы, лежащие ближе. Это свойство является основной причиной того, что для оценки среднего значения распределения чаще всего используется среднее арифметическое значение.

Коэффициент вариации

В отличие от предыдущих оценок разброса, коэффициент вариации является относительной оценкой. Он всегда измеряется в процентах, а не в единицах измерения исходных данных. Коэффициент вариации, обозначаемый символами CV, измеряет рассеивание данных относительно среднего значения. Коэффициент вариации равен стандартному отклонению, деленному на среднее арифметическое и умноженному на 100%:

где S - стандартное выборочное отклонение, - выборочное среднее.

Коэффициент вариации позволяет сравнить две выборки, элементы которых выражаются в разных единицах измерения. Например, управляющий службы доставки корреспонденции намеревается обновить парк грузовиков. При погрузке пакетов следует учитывать два вида ограничений: вес (в фунтах) и объем (в кубических футах) каждого пакета. Предположим, что в выборке, содержащей 200 пакетов, средний вес равен 26,0 фунтов, стандартное отклонение веса 3,9 фунтов, средний объем пакета 8,8 кубических футов, а стандартное отклонение объема 2,2 кубических фута. Как сравнить разброс веса и объема пакетов?

Поскольку единицы измерения веса и объема отличаются друг от друга, управляющий должен сравнить относительный разброс этих величин. Коэффициент вариации веса равен CV W = 3,9 / 26,0 * 100% = 15%, а коэффициент вариации объема CV V = 2,2 / 8,8 * 100% = 25% . Таким образом, относительный разброс объема пакетов намного больше относительного разброса их веса.

Форма распределения

Третье важное свойство выборки - форма ее распределения. Это распределение может быть симметричным или асимметричным. Чтобы описать форму распределения, необходимо вычислить его среднее значение и медиану. Если эти два показателя совпадают, переменная считается симметрично распределенной. Если среднее значение переменной больше медианы, ее распределение имеет положительную асимметрию (рис. 10). Если медиана больше среднего значения, распределение переменной имеет отрицательную асимметрию. Положительная асимметрия возникает, когда среднее значение увеличивается до необычайно высоких значений. Отрицательная асимметрия возникает, когда среднее значение уменьшается до необычайно малых значений. Переменная является симметрично распределенной, если она не принимает никаких экстремальных значений ни в одном из направлений, так что большие и малые значения переменной уравновешивают друг друга.

Рис. 10. Три вида распределений

Данные, изображенные на шкале А, имеют отрицательную асимметрию. На этом рисунке виден длинный хвост и перекос влево, вызванные наличием необычно малых значений. Эти крайне малые величины смещают среднее значение влево, и оно становится меньше медианы. Данные, изображенные на шкале Б, распределены симметрично. Левая и правая половины распределения являются своими зеркальными отражениями. Большие и малые величины уравновешивают друг друга, а среднее значение и медиана равны между собой. Данные, изображенные на шкале В, имеют положительную асимметрию. На этом рисунке виден длинный хвост и перекос вправо, вызванные наличием необычайно высоких значений. Эти слишком большие величины смещают среднее значение вправо, и оно становится больше медианы.

В Excel описательные статистики можно получить с помощью надстройки Пакет анализа . Пройдите по меню Данные Анализ данных , в открывшемся окне выберите строку Описательная статистика и кликните Ok . В окне Описательная статистика обязательно укажите Входной интервал (рис. 11). Если вы хотите увидеть описательные статистики на том же листе, что и исходные данные, выберите переключатель Выходной интервал и укажите ячейку, куда следует поместить левый верхний угол выводимых статистик (в нашем примере $C$1). Если вы хотите вывести данные на новый лист или в новую книгу, достаточно просто выбрать соответствующий переключатель. Поставьте галочку напротив Итоговая статистика . По желанию также можно выбрать Уровень сложности, k-й наименьший и k-й наибольший .

Если на вкладе Данные в области Анализ у вас не отображается пиктограмма Анализ данных , нужно предварительно установить надстройку Пакет анализа (см., например, ).

Рис. 11. Описательные статистики пятилетней среднегодовой доходности фондов с очень высоким уровнями риска, вычисленные с помощью надстройки Анализ данных программы Excel

Excel вычисляет целый ряд статистик, рассмотренных выше: среднее, медиану, моду, стандартное отклонение, дисперсию, размах (интервал ), минимум, максимум и объем выборки (счет ). Кроме того, Excel вычисляет некоторые новые для нас статистики: стандартную ошибку, эксцесс и асимметричность. Стандартная ошибка равна стандартному отклонению, деленному на квадратный корень объема выборки. Асимметричность характеризует отклонение от симметричности распределения и является функцией, зависящей от куба разностей между элементами выборки и средним значением. Эксцесс представляет собой меру относительной концентрации данных вокруг среднего значения по сравнению с хвостами распределения и зависит от разностей между элементами выборки и средним значением, возведенных в четвертую степень.

Вычисление описательных статистик для генеральной совокупности

Среднее значение, разброс и форма распределения, рассмотренные выше, представляют собой характеристики, определяемые по выборке. Однако, если набор данных содержит числовые измерения всей генеральной совокупности, можно вычислить ее параметры. К числу таких параметров относятся математическое ожидание, дисперсия и стандартное отклонение генеральной совокупности.

Математическое ожидание равно сумме всех значений генеральной совокупности, деленной на объем генеральной совокупности:

где µ - математическое ожидание, X i - i -е наблюдение переменной X , N - объем генеральной совокупности. В Excel для вычисления математического ожидания используется та же функция, что и для среднего арифметического: =СРЗНАЧ().

Дисперсия генеральной совокупности равна сумме квадратов разностей между элементами генеральной совокупности и мат. ожиданием, деленной на объем генеральной совокупности:

где σ 2 – дисперсия генеральной совокупности. В Excel до версии 2007 для вычисления дисперсии генеральной совокупности используется функция =ДИСПР(), начиная с версии 2010 =ДИСП.Г().

Стандартное отклонение генеральной совокупности равно квадратному корню, извлеченному из дисперсии генеральной совокупности:

В Excel до версии 2007 для вычисления стандартного отклонения генеральной совокупности используется функция =СТАНДОТКЛОНП(), начиная с версии 2010 =СТАНДОТКЛОН.Г(). Обратите внимание на то, что формулы для дисперсии и стандартного отклонения генеральной совокупности отличаются от формул для вычисления выборочной дисперсии и стандартного отклонения. При вычислении выборочных статистик S 2 и S знаменатель дроби равен n – 1 , а при вычислении параметров σ 2 и σ - объему генеральной совокупности N .

Эмпирическое правило

В большинстве ситуаций крупная доля наблюдений концентрируется вокруг медианы, образуя кластер. В наборах данных, имеющих положительную асимметрию, этот кластер расположен левее (т.е. ниже) математического ожидания, а в наборах, имеющих отрицательную асимметрию, этот кластер расположен правее (т.е. выше) математического ожидания. У симметричных данных математическое ожидание и медиана совпадают, а наблюдения концентрируются вокруг математического ожидания, формируя колоколообразное распределение. Если распределение не имеет ярко выраженной асимметрии, а данные концентрируются вокруг некоего центра тяжести, для оценки изменчивости можно применять эмпирическое правило, которое гласит: если данные имеют колоколообразное распределение, то приблизительно 68% наблюдений отстоят от математического ожидания не более чем на одно стандартное отклонение, приблизительно 95% наблюдений отстоят от математического ожидания не более чем на два стандартных отклонения и 99,7% наблюдений отстоят от математического ожидания не более чем на три стандартных отклонения.

Таким образом, стандартное отклонение, представляющее собой оценку среднего колебания вокруг математического ожидания, помогает понять, как распределены наблюдения, и идентифицировать выбросы. Из эмпирического правила следует, что для колоколообразных распределений лишь одно значение из двадцати отличается от математического ожидания больше, чем на два стандартных отклонения. Следовательно, значения, лежащие за пределами интервала µ ± 2σ , можно считать выбросами. Кроме того, только три из 1000 наблюдений отличаются от математического ожидания больше чем на три стандартных отклонения. Таким образом, значения, лежащие за пределами интервала µ ± 3σ практически всегда являются выбросами. Для распределений, имеющих сильную асимметрию или не имеющих колоколообразной формы, можно применять эмпирическое правило Бьенамэ-Чебышева.

Более ста лет назад математики Бьенамэ и Чебышев независимо друг от друга открыли полезное свойство стандартного отклонения. Они обнаружили, что для любого набора данных, независимо от формы распределения, процент наблюдений, лежащих на расстоянии не превышающем k стандартных отклонений от математического ожидания, не меньше (1 – 1/ k 2)*100% .

Например, если k = 2, правило Бьенамэ-Чебышева гласит, что как минимум (1 – (1/2) 2) х 100% = 75% наблюдений должно лежать в интервале µ ± 2σ . Это правило справедливо для любого k , превышающего единицу. Правило Бьенамэ-Чебышева носит весьма общий характер и справедливо для распределений любого вида. Оно указывает минимальное количество наблюдений, расстояние от которых до математического ожидания не превышает заданной величины. Однако, если распределение имеет колоколообразную форму, эмпирическое правило более точно оценивает концентрацию данных вокруг математического ожидания.

Вычисление описательных статистик для распределения на основе частот

Если исходные данные недоступны, единственным источником информации становится распределение частот. В таких ситуациях можно вычислить приближенные значения количественных показателей распределения, таких как среднее арифметическое, стандартное отклонение, квартили.

Если выборочные данные представлены в виде распределения частот, приближенное значение среднего арифметического можно вычислить, предполагая, что все значения внутри каждого класса сосредоточены в средней точке класса:

где - выборочное среднее, n - количество наблюдений, или объем выборки, с - количество классов в распределении частот, m j - средняя точка j -гo класса, f j - частота, соответствующая j -му классу.

Для вычисления стандартного отклонения по распределению частот также предполагается, что все значения внутри каждого класса сосредоточены в средней точке класса.

Чтобы понять, как определяются квартили ряда на основе частот, рассмотрим расчет нижнего квартиля на основе данных за 2013 г. о распределении населения России по величине среднедушевых денежных доходов (рис. 12).

Рис. 12. Доля населения России со среднедушевыми денежными доходами в среднем за месяц, рублей

Для расчета первого квартиля интервального вариационного ряда можно воспользоваться формулой:

где Q1 – величина первого квартиля, хQ1 – нижняя граница интервала, содержащего первый квартиль (интервал определяется по накопленной частоте, первой превышающей 25%); i – величина интервала; Σf – сумма частот всей выборки; наверное, всегда равна 100%; SQ1–1 – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль; fQ1 – частота интервала, содержащего нижний квартиль. Формула для третьего квартиля отличается тем, что во всех местах вместо Q1 нужно использовать Q3, а вместо ¼ подставить ¾.

В нашем примере (рис. 12) нижний квартиль находится в интервале 7000,1 – 10 000, накопленная частота которого равна 26,4%. Нижняя граница этого интервала – 7000 руб., величина интервала – 3000 руб., накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль – 13,4%, частота интервала, содержащего нижний квартиль – 13,0%. Таким образом: Q1 = 7000 + 3000 * (¼ * 100 – 13,4) / 13 = 9677 руб.

Ловушки, связанные с описательными статистиками

В этой заметке мы рассмотрели, как описать набор данных с помощью различных статистик, оценивающих его среднее значение, разброс и вид распределения. Следующим этапом является анализ и интерпретация данных. До сих пор мы изучали объективные свойства данных, а теперь переходим к их субъективной трактовке. Исследователя подстерегают две ошибки: неверно выбранный предмет анализа и неправильная интерпретация результатов.

Анализ доходности 15 взаимных фондов с очень высоким уровнем риска является вполне беспристрастным. Он привел к совершенно объективным выводам: все взаимные фонды имеют разную доходность, разброс доходности фондов колеблется от –6,1 до 18,5, а средняя доходность равна 6,08. Объективность анализа данных обеспечивается правильным выбором суммарных количественных показателей распределения. Было рассмотрено несколько способов оценки среднего значения и разброса данных, указаны их преимущества и недостатки. Как же выбрать правильную статистику, обеспечивающую объективный и беспристрастный анализ? Если распределение данных имеет небольшую асимметрию, следует ли выбирать медиану, а не среднее арифметическое? Какой показатель более точно характеризует разброс данных: стандартное отклонение или размах? Следует ли указывать на положительную асимметрию распределения?

С другой стороны, интерпретация данных является субъективным процессом. Разные люди приходят к разным выводам, истолковывая одни и те же результаты. У каждого своя точка зрения. Кто-то считает суммарные показатели среднегодовой доходности 15 фондов с очень высоким уровнем риска хорошими и вполне доволен полученным доходом. Другим может показаться, что эти фонды имеют слишком низкую доходность. Таким образом, субъективность следует компенсировать честностью, нейтральностью и ясностью выводов.

Этические проблемы

Анализ данных неразрывно связан с этическими вопросами. Следует критически относиться к информации, распространяемой газетами, радио, телевидением и Интерентом. Со временем вы научитесь скептически относиться не только к результатам, но и к целям, предмету и объективности исследований. Лучше всего об этом сказал известный британский политик Бенджамин Дизраэли: «Существуют три вида лжи: ложь, наглая ложь и статистика».

Как было отмечено в заметке этические проблемы возникают при выборе результатов, которые следует привести в отчете. Следует публиковать как положительные, так и отрицательные результаты. Кроме того, делая доклад или письменный отчет, результаты необходимо излагать честно, нейтрально и объективно. Следует различать неудачную и нечестную презентации. Для этого необходимо определить, каковы были намерения докладчика. Иногда важную информацию докладчик пропускает по невежеству, а иногда - умышленно (например, если он применяет среднее арифметическое для оценки среднего значения явно асимметричных данных, чтобы получить желаемый результат). Нечестно также замалчивать результаты, которые не соответствуют точке зрения исследователя.

Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 178–209

Функция КВАРТИЛЬ оставлена для совмещения с более ранними версиями Excel

Под понятием среднего арифметического чисел подразумевается результат несложной последовательности расчётов средней величины для ряда чисел, определённых заранее. Необходимо отметить, что такое значение в данное время широко применяется специалистами ряда отраслей. Например, известны формулы при проведении расчётов экономистами или работниками статистической отрасли, где требуется иметь значение данного типа. Кроме этого, этот показатель активно используют и в ряде других отраслей, которые являются смежными с вышеуказанными.

Одной из особенностей расчётов данного значения является простота процедуры. Провести расчёты сможет любой желающий. Для этого не надо иметь специальное образование. Часто нет необходимости применять и вычислительную технику.

В качестве ответа на вопрос как найти среднее арифметическое рассмотрим ряд ситуаций.

Самым простым вариантом расчёта данной величины есть подсчёт её для двух чисел. Процедура проведения расчёта в этом случае является очень простой:

  1. Первоначально требуется провести операцию сложения выбранных чисел. Это часто можно сделать, как говорится, вручную, не используя электронную технику.
  2. После того как сложение произведено и получен его результат необходимо произвести деление. Данная операция подразумевает разделение суммы двух сложенных чисел на два – количество сложенных чисел. Именно такое действие и позволит получить требуемую величину.

Формула

Таким образом, формула для подсчёта требуемой величины в случае с двумя будет выглядеть следующим образом:

(А+В)/2

В этой формуле применяется следующее обозначение:

А и В – это заранее выбранные числа, для которых необходимо находить значение.

Нахождение значения для трёх

Проведение расчёта данной величины в ситуации, когда выбраны три числа, не будет сильно отличаться от предыдущего варианта:

  1. Для этого следует выбрать числа, необходимые в расчёте, и сложить их для получения общей суммы.
  2. После того как данная сумма трёх будет найдена, требуется опять совершить процедуру деления. При этом полученную сумму надо разделить уже на три, что соответствует количеству выбранных чисел.

Формула

Тем самым формула, необходимая при проведении расчётов арифметического трёх, будет выглядеть так:

(А+В+С)/3

В данной формуле принято следующее обозначение:

А, В и С – это числа, к которым необходимо будет находить среднее арифметическое.

Вычисление среднего арифметического четырёх

Как уже видно по аналогии с предыдущими вариантами вычисление данного значения для количества, равного четырём, будет носить следующий порядок:

  1. Выбираются четыре цифры, для которых надо вычислить среднее арифметическое значение. Далее производится суммирование и нахождение конечного результата этой процедуры.
  2. Теперь чтобы получить окончательный результат, следует взять полученную сумму четырёх и разделить её на четыре. Полученные данные и будут требуемым значением.

Формула

Из описанной выше последовательности действий по нахождению среднего арифметического для четырёх, можно получить следующую формулу:

(А+В+С+Е)/4

В данной формуле переменные имеют следующее значение:

А, В, С и Е – это те, к которым необходимо найти значение среднего арифметического.

Применяя данную формулу, всегда можно будет вычислять требуемое значение для данного количества чисел.

Подсчёт среднего арифметического пяти

Выполнение данной операции потребует проведения определённого алгоритма действий.

  1. Прежде всего, надо выбрать пять чисел, для которых будет проходить вычисление среднего арифметического. После данного подбора эти числа, как и в предыдущих вариантах, необходимо просто сложить и получить конечную сумму.
  2. Полученную сумму надо будет поделить по их количеству на пять, что и позволит получить требуемое значение.

Формула

Тем самым аналогично с ранее рассмотренными вариантами получаем такую формулу для подсчёта среднего арифметического:

(А+В+С+Е+Р)/5

В данной формуле переменные имеют такое обозначение:

А, В, С, Е и Р – это числа, для которых необходимо получить среднее арифметическое.

Универсальная формула вычисления

Проводя рассмотрение различных вариантов формул для вычисления среднего арифметического , можно обратить внимание на то, что у них есть общая закономерность.

Поэтому практичнее будет применять общую формулу для нахождения среднего арифметического. Ведь бывают ситуации, когда количество и величина расчётов может быть очень большой. Поэтому разумнее будет использовать универсальную формулу и не выводить каждый раз индивидуальную технологию для расчёта данной величины.

Главным при определении формулы является принцип расчёта среднего арифметическог о.

Данный принцип как было видно из приведённых примеров, выглядит таким образом:

  1. Производится подсчёт количества чисел, которые заданы для получения требуемого значения. Эта операция может быть проведена как вручную при небольшом количестве чисел, так и при помощи вычислительной техники.
  2. Проводится суммирование выбранных чисел. Эта операция в большинстве ситуаций выполняется при помощи вычислительной техники, так как числа могут состоять из двух, трёх и более цифр.
  3. Сумма, которая получена в результате сложения выбранных чисел, должна быть поделена на их количество. Данная величина определяется на первоначальном этапе расчёта среднего арифметического.

Таким образом, общая формула для расчёта среднего арифметического ряда подобранных чисел будет выглядеть следующим образом:

(А+В+…+N)/N

Данная формула содержит следующие переменные:

А и В – это числа, которые выбраны заранее для расчёта их среднего арифметического.

N – это количество чисел, которые были взяты с целью проведения расчёта требуемого значения.

Подставляя каждый раз в данную формулу выбранные числа, мы всегда сможем получить требуемое значение среднего арифметического.

Как видно, нахождение среднего арифметического является несложной процедурой. Однако надо внимательно относиться к проводимым вычислениям и проводить проверку полученного результата. Такой подход объясняется тем, что даже в самых простых ситуациях существует вероятность получения ошибки, которая может повлиять потом на дальнейшие расчёты. В связи с этим рекомендуется применять вычислительную технику, которая способна произвести подсчёты любой сложности.

Среднее арифметическое в excel. Таблицы Excel, как нельзя лучше подходят для всяких вычислений. Изучив, Excel Вы сможете решать задачи по химии, физике, математике, геометрии, биологии, статистике, экономике и многие другие. Мы даже не задумываемся, какой мощный инструмент находится на наших компьютерах, а значит, и не используем его в полную силу. Многие родители думают, что компьютер – это просто дорогая игрушка. А зря! Конечно для того, что бы ребенок мог на нем действительно заниматься, Вам самим необходимо научится на нем работать, а потом и ребенка обучить. Ну это уже другая тема, а сегодня я хочу поговорить с Вами о как найти среднее арифметическое в Excel.

Как найти среднее арифметическое в Excel

О быстром в Excel мы уже с вами говорили, а сегодня поговорим о среднем арифметическом.

Выделим ячейку С12 и с помощью Мастера функций запишем в неё формулу вычисления среднего арифметического. Для этого на панели инструментов Стандартная щелкнем по кнопке —Вставка функции – fx (на рисунке выше красная стрелка сверху). Откроется диалоговое окно Мастер Функций .

  • Выберите в поле Категории Статистические ;
  • В поле Выберите функцию : СРЗНАЧ ;
  • Нажмите кнопку ОК .

Откроется следующее окно Аргументы и функции .

В поле Число1 вы увидите запись С2:С11 – программа сама определила диапазон ячеек, для которых необходимо найти среднее арифметическое.

Щелкните кнопку ОК и в ячейке С12 появится среднее арифметическое баллов.

Оказывается, вычислить среднее арифметическое в excel совсем не сложно. А я всегда боялась всяких формул. Эх, не в то время мы учились.

В вычислении среднего значения теряется.

Среднее значение набора чисел равно сумме чисел S, деленной на количество этих чисел. То есть получается, что среднее значение равно: 19/4 = 4.75.

Обратите внимание

Если потребуется найти среднее геометрическое всего для двух чисел, то инженерный калькулятор вам не понадобится: извлечь корень второй степени (квадратный корень) из любого числа можно при помощи самого обычного калькулятора.

Полезный совет

В отличие от среднего арифметического, на геометрическое среднее не так сильно влияют большие отклонения и колебания между отдельными значениями в исследуемом наборе показателей.

Источники:

  • Онлайн-калькулятор, рассчитывающий среднее геометрическое
  • среднее геометрическое формула

Среднее значение - это одна из характеристик набора чисел. Представляет собой число, которое не может выходить за пределы диапазона, определяемого наибольшим и наименьшим значениями в этом наборе чисел. Среднее арифметическое значение - наиболее часто используемая разновидность средних.

Инструкция

Сложите все числа множества и разделите их на количество слагаемых, чтобы получить среднее арифметическое значение. В зависимости от конкретных условий вычисления иногда проще делить каждое из чисел на количество значений множества и суммировать результат.

Используйте, например, входящий в состава ОС Windows , если вычислить среднее арифметическое значение в уме не представляется возможным. Открыть его можно с помощью диалога запуска программ. Для этого нажмите «горячие клавиши» WIN + R или щелкните кнопку «Пуск» и выберите в главном меню команду «Выполнить». Затем напечатайте в поле ввода calc и нажмите на Enter либо щелкните кнопку «OK». Это же можно сделать через главное меню - раскройте его, перейдите в раздел «Все программы» и в секции «Стандартные» и выберите строку «Калькулятор».

Введите последовательно все числа множества, нажимая после каждого из них (кроме последнего) клавишу «Плюс» или щелкая соответствующую кнопку в интерфейсе калькулятора. Вводить числа тоже можно как с клавиатуры, так и щелкая соответствующие кнопки интерфейса.

Нажмите клавишу с косой (слэш) или щелкните этот в интерфейсе калькулятора после ввода последнего значения множества и напечатайте количество чисел в последовательности. Затем нажмите знак равенства, и калькулятор рассчитает и покажет среднее арифметическое значение.

Можно для этой же цели использовать табличный редактор Microsoft Excel. В этом случае запустите редактор и введите в соседние ячейки все значения последовательности чисел. Если после ввода каждого числа вы будете нажимать Enter или клавишу со стрелкой вниз или вправо, то редактор сам будет перемещать фокус ввода в соседнюю ячейку.

Щелкните следующую за последним введенным числом ячейку, если вам не достаточно только увидеть среднее арифметическое значение. Раскройте выпадающий с изображением греческой сигма (Σ) команд «Редактирование» на вкладке «Главная». Выберите в нем строку «Среднее » и редактор вставит нужную формулу для вычисления среднеарифметического значения в выделенную ячейку. Нажмите клавишу Enter, и значение будет рассчитано.

Среднее арифметическое - одна из мер центральной тенденции, широко используемая в математике и статистических расчетах. Найти среднее арифметическое число для нескольких значений очень просто, но у каждой задачи есть свои нюансы, знать которые для выполнения верных расчетов просто необходимо.

Что такое среднее арифметическое число

Среднее арифметическое число определяет усредненное значение для всего исходного массива чисел. Другими словами, из некоторого множества чисел выбирается общее для всех элементов значение, математическое сравнение которого со всеми элементами носит приближенно равный характер. Среднее арифметическое число используется, преимущественно, при составлении финансовых и статистических отчетов или для расчетов результатов проведенных подобных опытов.

Как найти среднее арифметическое число

Поиск среднего арифметического числа для массива чисел следует начинать с определения алгебраической суммы этих значений. К примеру, если в массиве присутствуют числа 23, 43, 10, 74 и 34, то их алгебраическая сумма будет равна 184. При записи среднее арифметическое обозначается буквой μ (мю) или x (икс с чертой). Далее алгебраическую сумму следует разделить на количество чисел в массиве. В рассматриваемом примере чисел было пять, поэтому среднее арифметическое будет равно 184/5 и составит 36,8.

Особенности работы с отрицательными числами

Если в массиве присутствуют отрицательные числа, то нахождение среднего арифметического значения происходит по аналогичному алгоритму. Разница имеется только при рассчетах в среде программирования, или же если в задаче есть дополнительные условия. В этих случаях нахождение среднего арифметического чисел с разными знаками сводится к трем действиям:

1. Нахождение общего среднего арифметического числа стандартным методом;
2. Нахождение среднего арифметического отрицательным чисел.
3. Вычисление среднего арифметического положительных чисел.

Ответы каждого из действий записываются через запятую.

Натуральные и десятичные дроби

Если массив чисел представлен десятичными дробями, решение происходит по методу вычисления среднего арифметического целых чисел, но сокращение результата производится по требованиям задачи к точности ответа.

При работе с натуральными дробями их следует привести к общему знаменателю, который умножается на количество чисел в массиве. В числителе ответа будет сумма приведенных числителей исходных дробных элементов.

  • Инженерный калькулятор.

Инструкция

Учитывайте, что в общем случае среднее геометрическое чисел находится путем перемножения этих чисел и извлечения из них корня степени, которая соответствует количеству чисел. Например, если нужно найти среднее геометрическое пяти чисел, то из произведения нужно будет извлекать корень степени.

Для нахождения среднего геометрического двух чисел используйте основное правило. Найдите их произведение, после чего извлеките из него квадратный корень, поскольку числа два, что соответствует степени корня. Например, для того чтобы найти среднее геометрическое чисел 16 и 4, найдите их произведение 16 4=64. Из получившегося числа извлеките квадратный корень √64=8. Это и будет искомая величина. Обратите внимание на то, что среднее арифметическое этих двух чисел больше и равно 10. Если корень не извлекается нацело, произведите округление результата до нужного порядка.

Чтобы найти среднее геометрическое более чем двух чисел, тоже используйте основное правило. Для этого найдите произведение всех чисел, для которых нужно найти среднее геометрическое. Из полученного произведения извлеките корень степени, равной количеству чисел. Например, чтобы найти среднее геометрическое чисел 2, 4 и 64, найдите их произведение. 2 4 64=512. Поскольку нужно найти результат среднего геометрического трех чисел, что из произведения извлеките корень третей степени. Сделать это устно затруднительно, поэтому воспользуйтесь инженерным калькулятором. Для этого в нем есть кнопка "x^y". Наберите число 512, нажмите кнопку "x^y", после чего наберите число 3 и нажмите кнопку "1/х", чтобы найти значение 1/3, нажмите кнопку "=". Получим результат возведения 512 в степень 1/3, что соответствует корню третьей степени. Получите 512^1/3=8. Это и есть среднее геометрическое чисел 2,4 и 64.

С помощью инженерного калькулятора можно найти среднее геометрическое другим способом. Найдите на клавиатуре кнопку log. После этого возьмите логарифм для каждого из чисел, найдите их сумму и поделите ее на количество чисел. Из полученного числа возьмите антилогарифм. Это и будет среднее геометрическое чисел. Например, для того чтобы найти среднее геометрическое тех же чисел 2, 4 и 64, сделайте на калькуляторе набор операций. Наберите число 2, после чего нажмите кнопку log, нажмите кнопку "+", наберите число 4 и снова нажмите log и "+", наберите 64, нажмите log и "=". Результатом будет число, равное сумме десятичных логарифмов чисел 2, 4 и 64. Полученное число разделите на 3, поскольку это количество чисел, по которым ищется среднее геометрическое. Из результата возьмите антилогарифм, переключив кнопку регистра, и используйте ту же клавишу log. В результате получится число 8, это и есть искомое среднее геометрическое.

При работе с числовыми выражениями иногда появляется потребность вычисления их среднего значения. называют средним арифметическим. В Excel - табличном редакторе от Microsoft - есть возможность не вручную высчитывать его, а воспользоваться специальными инструментами. В этой статье как раз-таки будут представлены способы, позволяющие узнать и вывести число среднего арифметического.

Способ 1: стандартный

Первостепенно разберем способ, как посчитать среднее арифметическое в Excel, который подразумевает использование стандартного инструмента для этого. Метод является наиболее простым и удобным для использования, однако у него существуют и некоторые недостатки. Но о них позже, а сейчас перейдем к выполнению поставленной задачи.

  1. Выделите ячейки столбца или строки, в которых находятся числовые значения для расчета.
  2. Перейдите во вкладку «Главная».
  3. На панели инструментов в категории «Редактирование» нажмите по кнопке «Автосумма», однако жать необходимо на стрелочку рядом с ней, чтобы появился выпадающий список.
  4. В нем вам необходимо кликнуть по пункту «Среднее».

Как только вы это сделаете, в ячейке рядом появится результат расчета среднего арифметического выделенных значений. Его расположение будет зависеть от блока данных, если вы выделили строку, то находиться результат будет справа от выделения, если столбец, снизу.

Но как было сказано ранее, у данного метода есть и недостатки. Так, у вас не получится рассчитать значение из диапазона ячеек, или же ячеек, расположенных в разных местах. Например, если в вашей таблице смежно находятся два столбца с числовыми значениями, то, выделив их и произведя вышеописанные действия, вы получите результат для каждого столбца в отдельности.

Способ 2: с помощью Мастера функций

Способов, позволяющих найти среднее арифметическое в Excel, существует много, и естественно, что с их помощью есть возможность обойти ограничения, предполагающие предыдущий способ. Сейчас будет рассказано о произведении вычислений путем использования Мастера функций. Итак, вот что вам необходимо сделать.

  1. Нажав левую кнопку мыши, выделите ячейку, в которой хотите видеть результат вычислений.
  2. Откройте окно Мастера функций, нажав по кнопке «Вставить функцию», расположенной слева от строки формул либо использовав горячие клавиши Shift+F3.
  3. В появившемся окне отыщите в списке строку «СРЗНАЧ», выделите ее и нажмите кнопку «ОК».
  4. Появится новое окно для ввода аргументов функции. В нем вы увидите два поля: «Число1» и «Число2».
  5. В первое поле введите адреса ячеек, в которых расположены числовые значения для расчета. Сделать это можно как вручную, так и с помощью специального инструмента. Во втором случае нажмите по кнопке, расположенной в правой части поля для ввода. Окно Мастера свернется и вам необходимо будет выделить мышкой ячейки для расчета.
  6. Если другой диапазон ячеек с данными находится в другом месте листа, тогда укажите его в поле «Число2».
  7. Проделайте ввод данных, пока не укажете все необходимые.
  8. Нажмите кнопку «ОК».

По завершении ввода окно Мастера закроется, а в ячейке, которую вы выделяли в самом начале, появится результат вычислений. Теперь вы знаете второй способ, как рассчитать среднее арифметическое в Excel. Но далеко не последний, поэтому двигаемся дальше.

Способ 3: через панель формул

Данный метод, как рассчитать среднее арифметическое в Excel, мало чем отличается от предыдущего, но в некоторых случаях он может показаться удобнее, поэтому его стоит разобрать. По большей части, данный способ предлагает лишь альтернативный вариант вызова Мастера функций.


Как только все действия списка будут выполнены, перед вами появится окно Мастера функций, где необходимо ввести аргументы. Как это делать вы уже знаете из предыдущего метода, все последующие действия ничем не отличаются.

Способ 4: ручной ввод функции

При желании можно избежать взаимодействия с Мастером функции, если знать формулу среднего арифметического в Excel. В некоторых ситуациях ручной ее ввод во много раз ускорит процесс расчета.

Чтобы разобраться во всех нюансах, необходимо посмотреть на синтаксис формулы, выглядит он следующим образом:

СРЗНАЧ(адрес_ячеек(число); адрес_ячеек(число))

Из синтаксиса следует, что в аргументах функции необходимо прописывать либо адрес диапазона ячеек, в которых находятся числа для подсчета, либо непосредственно сами числа для вычисления. На практике использование данного метода выглядит следующим образом:

СРЗНАЧ(C4:D6;C8:D9)

Способ 5: расчет по условию

  • выделите ячейку, в которой будет совершаться расчет;
  • нажмите кнопку «вставить функцию»;
  • в появившемся окне мастера в списке выделите строку «срзначесли»;
  • нажмите «ОК».

После этого появится окно для ввода аргументов функции. Оно очень похоже на то, что было продемонстрировано ранее, только теперь появилось дополнительное поле - «Условие». Именно в него необходимо вписывать условие. Так, введя «>1500», в расчет будут браться только те значения, которые больше указанного.