Разное

Описательная статистика это: Описательные статистики

Содержание

Описательная статистика — это… Что такое Описательная статистика?

Цель описательной (дескриптивной) статистики — обработка эмпирических данных, их систематизация, наглядное представление в форме графиков и таблиц, а также их количественное описание посредством основных статистических показателей.

В отличие от индуктивной статистики дескриптивная статистика не делает выводов о генеральной совокупности на основании результатов исследования частных случаев. Индуктивная же статистика напротив предполагает, что свойства и закономерности, выявленные при исследовании объектов выборки, также присущи генеральной совокупности.

Методы агрегирования данных

Описательная статистика использует три основных метода агрегирования данных:

  1. Табличное представление
  2. Графическое изображение
  3. Расчет статистических показателей

Табличное представление

Статистическая таблица — система строк и столбцов, в которой в определенной последовательности излагается статистическая информация о социально-экономических явлениях.

Основные статистические показатели

Основные статистические показатели можно разделить на две группы: меры среднего уровня и меры рассеяния.

Меры среднего уровня

Меры среднего уровня дают усредненную характеристику совокупности объектов по определенному признаку.

Меры рассеяния

Меры рассеяния показывают, насколько хорошо данные значения представляют данную совокупность.

Литература

  1. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. — 5-е изд., перераб. и доп. — М.: Финансы и статистика, 2004. — 656 с: ил. ISBN 5-279-02414-7
  2. Bol, Georg. Deskriptive Statistik. — Oldenbourg: Oldenburg Verlag, 2004. — ISBN 3-486-57612-7. (нем.)

Ссылки

  1. Васнев С.А. Статистика (учебное пособие) / электронное издание московского государственного университета печати

Понятие описательной статистики




Описательная статистика – это совокупность методов и способов сбора и суммирования количественных данных, используемая для превращения больших объёмов цифровых данных в форму, удобную для восприятия и обсуждения.

Описательная статистика позволяет обобщать первичные результаты, полученные при наблюдении или в эксперименте. Процедуры здесь сводятся к группировке данных по их значениям, построению распределения их частот, выявлению центральных тенденций распределения (например, средней арифметической) и, наконец, к оценке разброса данных по отношению к найденной центральной тенденции.

Описательная статистика нужна, как правило, для понимания характера совокупности, сырых данных. Включает в себя различные методы агрегирования данных. Общие из них таковы:

1. Частотный анализ

· Анализ гистограммы

· Подгонка распределения

2. Вычисление и анализ показателей центра распределения

· Мода

· Медиана

· Среднее

3. Оценка разброса данных в совокупности

· Стандартное отклонение

· Дисперсия

· Коэффициенты вариации

Расчет средних величин производится разными способами, и, соответственно, применение их тоже зависит от исследуемой совокупности.

Ряд распределения

Ряд распределения — совокупность значений (или интервалов значений) переменной и их частот. Обычно ряд распределения представляют таблицей. Значения переменной X обычно обозначают , соответствующие им частоты — .

Различают абсолютные или относительные частоты. Абсолютная частота представляет собой количество объектов из выборки, обладающих соответствующим значением переменной. Сумма абсолютных частот равна объему выборки.

Совокупность абсолютных частот, упорядоченных по возрастанию значений, называется вариационным рядом. Причина такого названия в том, что значения часто называют вариантами.

Относительная частота может выражаться в долях единицы или в процентах. Сумма относительных частот, выраженных в долях, равна 1, сумма относительных частот в процентах — 100%.



Ряд распределения относительных частот для генеральной совокупности – это ряд распределения случайной величины X/

Если переменная является дискретной, частоты обычно вычисляют для каждого значения, как в этом примере:

значения (xi)
частоты (fi)
относительные частоты (pi) 15/120 30/120 40/120 25/120 10/120
накопленные частоты (Fi)  

Если переменная является непрерывной, значения предварительно должны быть сгруппированы в интервалы (см. Группировка). (См. Таблицу 7 в Приложении.)

Для количественных и порядковых переменных может вычисляться накопленная частота ( ), представляющая собой сумму частот всех значений, от до : . По накопленной частоте можно определить, для какой части выборки значения переменной X не превосходят значения . Так, в примере с 5-балльной шкалой 85 респондентов из 120 поставили оценки, не превосходящие 3 баллов (1, 2 и 3). Во втором примере накопленная частота 41,5% для интервала 20-29 лет свидетельствует о том, что 41,5% населения не достигло 30-летнего возраста.

Если переменная X является непрерывной, её значения предварительно должны быть сгруппированы в интервалы, чтобы можно было из них составить ряд распределения.

Понятие «группировка» в статистике может иметь два основных значения.

1) Группировка – процедура разделения шкалы переменной на интервалы: как правило, применяется к непрерывным переменным. Различают три основных вида группирования количественных шкал. Аналитическая группировка предназначена для изучения характеристик распределения переменной и представляет собой значительное количество интервалов (обычно 12-15) одинаковой длины. Процентильная (перцентильная) группировка позволяет получить интервалы с заданным числом объектов внутри каждого интервала. Типологическая группировка предполагает разделение шкалы на небольшое количество интервалов, имеющих содержательную интерпретацию.

2) Группировка — распределение объектов из выборки по классам, образованным значениями дискретных или интервалами непрерывных переменных. Группировка по нескольким критериям (перекрестная классификация, кросстабуляция) представляет собой распределение объектов по классам, образованным «пересечением» классов по каждому отдельно взятому критерию. Примером такой группировки является поло-возрасто-образовательная структура населения.




Таблица поло-возрасто-образовательная структура населения

Возраст 0-9 10-19 20-29 30-39 40-49 50-59 60-69 70-79 80+
fi 11,3% 16,2% 14% 15,4% 14,9% 9,6% 10,5% 6,3% 1,8% 100%
Fi 11,3% 27,5% 41,5% 56,9% 71,8% 81,4% 91,9% 98,2% 100%  

 











Что такое описательная статистика — СибАК

Практически каждый исследователь сталкивается рано или поздно в своей работе с необходимостью обработки и дальнейшего предоставления статистических данных. Причем это касается самых разных отраслей науки – от технических и медицинских до социологических и культурологических.


Обусловлена такая распространенность тем, что статистические методы помогают получить и обосновать определенные суждения об объектах, субъектах, группах людей и прочем, что обладает определенной внутренней неоднородностью.


Вы можете заказать услугу срочной публикации научных статей в научных журналах. Специалисты издательства СибАК знают, как выполнить работу в сжатые сроки.


Что такое описательная статистика


Те, кто впервые в своей работе сталкивается с обработкой и описанием данных, не всегда четко представляют, в какой форме их корректно отображать и обрабатывать для того, чтобы в дальнейшем подвергнуть статистическому выводу.


Поэтому нужно четко представлять, что такое описательная статистика. Она еще носит название дескриптивной и занимается анализом и обработкой эмпирических данных с проведением необходимой систематизации. Описательная статистика – это сжатая и концентрированная характеристика изучаемого явления, представленная в виде графиков, таблиц, схем и числовых выражений.


Вот что входит в описательную статистику в качестве основных показателей:


  • переменная, которая не является постоянным. Ее можно не только измерять, но и подвергать изменениям в ходе определенных манипуляций;
  • экстремумы, или так называемые максимумы и минимумы значений самой переменной;
  • под вариационными рядами понимают все количественные признаки, которые имеются у каждой единицы статистического наблюдения;
  • среднее – представляется средним арифметическим или выборочным. Здесь есть несколько параметров, таких как гармоническое, геометрическое, арифметическое и квадратическое. Все они нужны для того, чтобы охарактеризовать центр распределения;
  • мода представляет собой наиболее часто встречающееся значение в выборке. Правда, она может отражать также и среднее значение класса, обладающего наибольшей частотой;
  • медиана – это среднее значение чаще всего встречающихся значений выборки;
  • дисперсия – позволяет оценить отклонения в определенном числе наблюдений. Этот параметр относится к показателям рассеяния вариант.

Помимо этого, для осуществления методов описательной статистики используют еще такие показатели, как квартили, асимметрию, статистические моменты, эксцессы, гипотезы, значимости. Каждый из них играет существенную роль для корректного отображения получаемых данных.


Совокупность выше представленных показателей помогает при визуальном представлении данных осуществить:


  • фиксацию их относительно осей, придав тем самым вес в числовом отражении;
  • отобразить, насколько они разбросаны относительно своего центра;
  • показать асимметричность распределения около центрального положения;
  • вывести закон распределения данных при помощи гистограммы, таблицы частот или функции.

Как сделать описательную статистику


При выполнении определенного вида работ и решении задач придерживаются следующего порядка.


  1. Собирают все необходимые исходные данные. При этом учитывают размер выборки. Чтобы получить достоверные данные, минимальное число не может быть меньше 1000. Чем оно будет больше, тем точнее получится итоговый результат.
  2. На втором этапе строят вариационный ряд. Все полученные данные упорядочивают по возрастанию. Чтобы это было удобнее выполнить, находят минимальный и максимальный элементы, а затем относительно них переписывают его в нужной последовательности.
  3. В некоторых случаях для упрощения процедуры обработки допускается вычитание из каждого элемента ряда минимального значения. Таким образом, работа дальше ведется не с конкретными размерами, а только с их отклонениями.
  4. На следующем этапе проводят группировку данных. Для этого их разбивают на R интервалов, число которых соотносят с количеством наблюдений.
  5. Затем определяют частости и эмпирические плотности вероятностей (частость используется для того, чтобы заменить частоты при составлении вариационных рядов).
  6. После этих обработок собранной информации необходимо построить полигон. Но для этого первоначально определяют масштаб по осям.
  7. Когда этот этап выполнен, строят гистограмму и эмпирическую функцию распределения.
  8. Используя данные из гистограммы рассчитывают параметры распределения.
  9. И на финальном этапе оформляют результат, который сводят в таблицу, схему, гистограмму, график или прочее.

Обработку статистических параметров методом описательной статистики необходимо проводить на высшем уровне. В противном случае могут пострадать итоговые выводы и результаты научной работы.


Важность корректного представления данных


Статистическое отображение данных важно в любой научной работе. А для публикаций в журналах, индексируемых наукометрическими базами Web of Science и Scopus, нужно особо тщательно относиться к качеству подаваемого материала.


Можно самому разбираться во всех тонкостях и сложных формулах, которые нужно применять. Но, чтобы облегчить и ускорить процесс статистической обработки в исследовании, лучше обратиться к специалистам, которые доступно объяснят даже самые сложные моменты.


Так, на курсе «Как написать статью для публикации в изданиях, индексируемых в Scopus и Web of Science?» будет рассмотрен цикл «Описательная статистика». На занятиях будут рассмотрены все основные моменты, которые имеют значение для рецензентов и главного редактора издания при принятии решения о публикации статьи или отказе.

ОПИСАТЕЛЬНАЯ СТАТИСТИКА — Студопедия

Описательная статистика— позволяет описывать, подытоживать и воспроизводить в виде таблиц и графиков данные того или иного распределения, вычислять среднее для данного распределения, его размах и дисперсию.

Распределением признака называется закономерность встречаемости разных его значений.

Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Закон распределения может быть задан в виде таблицы, графика или формулы.

Вариационный ряд – ряд данных представленных в порядке возрастания (убывания) признака.

Статистическим рядом называется ряд данных, расположенных в порядке возрастания или убывания с соответствующими им весами (частотами или частостями).

Вариационный и статистический ряды являются статистическими аналогами распределения признака (случайной величины Х).

Параметры распределения — это его числовые характеристики, указывающие, где в «среднем» располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее важными параметрами являются математическое ожидание, дисперсия, показатели асимметрии и эксцесса. В реальных психологических исследованиях мы оперируем не параметрами, а их приближенными значениями, так называемыми оценками параметров. Это объясняется ограниченностью обследованных выборок. Чем больше выборка, тем ближе может быть оценка параметра к его истинному значению.



Меры центральной тенденции – характеристики совокупности переменных (признаков) указывающие на наиболее типичный, репрезентативный для изучаемой выборки результат. К мерам центральной тенденции относятся среднее арифметическое, мода, медиана.

Мода (Мо) – наиболее часто встречаемое значение вариационного ряда.

Варианты определения моды:

1. Если в вариационном ряду лишь одно значение встречается наиболее часто, то мода равна этому значению (варианте).

2. Если два соседних значения имеют одинаковую частоту и эта частота больше частот других значений, то мода вычисляется как среднее арифметическое из этих двух значений.

3. Если два наиболее часто встречаемых значения находятся не рядом, между ними есть значение с меньшей частотой встречаемости, то распределение имеет две моды (бимодальное распределение).


Медиана (Ме) – значение вариационного ряда, делящее этот ряд на две равные части, так что количество значений справа от медианы, равно количеству значений слева от медианы.

Место, (порядковый номер) на котором находиться медиана, можно рассчитать по формуле: NMe = ,

где n – количество значений в вариационном ряду.

Если место, на котором должна находиться медиана, число целое, то медиана равна значению, которое находится на этом расчетном месте.

Если расчетное место (порядковый номер значения) на котором должна находиться медиана число дробное, то медианы вычисляется как среднее арифметическое из двух значений, находящихся справа и слева от вычисленного места медианы.

Пример №1. В вариационном ряду нечетное число значений, n=9.

Значение «Х»
Порядковый номер

Место, на котором располагается медиана, вычисляется:

NMe = = (9+1)/2=5.

На пятом месте в вариационном ряду располагается число «3». Таким образом, медиана равна трем, Me=3. Мы видим, что слева от медианы располагается четыре значения (1, 2, 2, 3) и справа от медианы также располагается четыре значения (4, 4, 4, 5).

Пример №2. В вариационном ряду четное число значений.

Значение «Х»
Порядковый номер

Место, на котором располагается медиана, вычисляется:

NMe=(10+1)/2=5,5.

Расчетное место, на котором должна находиться медиана, число дробное. Это место располагается между порядковыми номерами 5 и 6. В вариационном ряду на этом дробном месте нет значения. Поэтому, медиана рассчитывается как возможное значение переменной «Х», которое могло бы располагаться на этом расчетном месте. Медиана рассчитывается как среднее арифметическое из двух значений, которые располагаются слева и справа от расчетного места. На пятом месте располагается число три, на шестом месте число четыре, поэтому медиана Me=(3+4)/2=3,5. Таким образом, мы видим, что слева от медианы располагается пять значений (1, 2, 2, 3, 3) и справа от медианы также располагается пять значений (4, 4, 4, 5,6).

Среднее арифметическое является оценкой математического ожидания.

Среднее арифметическое:

где xiкаждое наблюдаемое значение признака;

i — индекс, указывающий на порядковый номер данного значения

признака;

n – объем выборки;

— знак суммирования.

Меры изменчивости статистические показатели вариации (разброса) признака (переменной) относительно среднего значения, степени индивидуальных отклонений от центральной тенденции распределения. К мерам изменчивости относятся: вариационный размах, дисперсия, стандартное отклонение.

Вариационный размах: W= xmax — xminхарактеризует ширину вариационного ряда.

Дисперсия (выборочная )(S2) Стандартное отклонение(s)

, n<30., n<30.

Дисперсия (выборочная )(S2) Стандартное отклонение(s)

, n>30., n>30.

Особенности эмпирического распределения описываются при помощи таких показателей как асимметрия и эксцесс. Асимметрия характеризует сдвиг эмпирического распределения относительно нормального теоретического распределения. Эксцесс характеризует островершинность распределения.

Показатель асимметрии (Аs) рассчитывается по формуле:

— среднее арифметическое

Графики распределения случайной величины «х», с различными показателями асимметрии представлены на рисунке 2.

Рис.1. Графики трех распределений признака, которые отличаются по показателю асимметрии.

На рисунке представлены три распределения, различающиеся по знаку асимметрии. Распределение 1 характеризуется положительной асимметрией (левосторонней), распределение 2 – отрицательной (правосторонней), распределение 3 – нормальное распределение. Для симметричных распределений (нормального распределения) показатель асимметрии равен нулю, Аs=0.

В случае, когда какие-либо причины способствуют преимущественному появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное.

Показатель эксцесса (Еs) рассчитывается по формуле:

Графики распределения случайной величины «х», с различными показателями эксцесса представлены на рисунке 2.

Рис.2. Виды распределений признака с различными показателями эксцесса.

На рисунке 2 представлены три различных распределения признака. Распределение 1 характеризуется меньшим диапазоном вариативности и меньшей дисперсией, эксцесс данного распределения больше нуля Es>0. В распределении 1 чаще встречаются значения признака близкие к среднему. В распределении 2 чаще встречаются более высокие и более низкие, чем среднее значение признака, эксцесс данного распределения меньше нуля Es<0. Распределение 3 – нормальное распределение, эксцесс равен нулю.

Коэффициент вариации

Если коэффициент вариации высок, то, как правило, это свидетельствует о неоднородности значений признака.

Описательная статистика — Википедия. Что такое Описательная статистика

Материал из Википедии — свободной энциклопедии

Описательная статистика или дескриптивная статистика (англ. descriptive statistics) занимается обработкой эмпирических данных, их систематизацией, наглядным представлением в форме графиков и таблиц, а также их количественным описанием посредством основных статистических показателей.

Противопоставляется статистическому выводу в том смысле, что не делает выводов о генеральной совокупности на основании результатов исследования частных случаев. Статистический вывод же предполагает, что свойства и закономерности, выявленные при исследовании объектов выборки, также присущи генеральной совокупности.

Методы агрегирования данных

Описательная статистика использует три основных метода агрегирования данных:

  1. Табличное представление
  2. Графическое изображение
  3. Расчет статистических показателей

Табличное представление

Статистическая таблица — система строк и столбцов, в которой в определенной последовательности излагается статистическая информация о социально-экономических явлениях.

Основные статистические показатели

Основные статистические показатели можно разделить на две группы: меры среднего уровня и меры рассеяния.

Меры среднего уровня

Меры среднего уровня дают усредненную характеристику совокупности объектов по определенному признаку.

Меры рассеяния

Меры рассеяния показывают, насколько хорошо данные значения представляют данную совокупность.

Литература

  1. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. — 5-е изд., перераб. и доп. — М.: Финансы и статистика, 2004. — 656 с: ил. ISBN 5-279-02414-7
  2. Bol, Georg. Deskriptive Statistik. — Oldenbourg: Oldenburg Verlag, 2004. — ISBN 3-486-57612-7. (нем.)

Ссылки

  1. Васнев С.А. Статистика (учебное пособие) / электронное издание московского государственного университета печати

Описательная статистика — Википедия

Материал из Википедии — свободной энциклопедии

Описательная статистика или дескриптивная статистика (англ. descriptive statistics) занимается обработкой эмпирических данных, их систематизацией, наглядным представлением в форме графиков и таблиц, а также их количественным описанием посредством основных статистических показателей.

Противопоставляется статистическому выводу в том смысле, что не делает выводов о генеральной совокупности на основании результатов исследования частных случаев. Статистический вывод же предполагает, что свойства и закономерности, выявленные при исследовании объектов выборки, также присущи генеральной совокупности.

Методы агрегирования данных

Описательная статистика использует три основных метода агрегирования данных:

  1. Табличное представление
  2. Графическое изображение
  3. Расчет статистических показателей

Табличное представление

Статистическая таблица — система строк и столбцов, в которой в определенной последовательности излагается статистическая информация о социально-экономических явлениях.

Основные статистические показатели

Основные статистические показатели можно разделить на две группы: меры среднего уровня и меры рассеяния.

Меры среднего уровня

Меры среднего уровня дают усредненную характеристику совокупности объектов по определенному признаку.

Меры рассеяния

Меры рассеяния показывают, насколько хорошо данные значения представляют данную совокупность.

Литература

  1. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. — 5-е изд., перераб. и доп. — М.: Финансы и статистика, 2004. — 656 с: ил. ISBN 5-279-02414-7
  2. Bol, Georg. Deskriptive Statistik. — Oldenbourg: Oldenburg Verlag, 2004. — ISBN 3-486-57612-7. (нем.)

Ссылки

  1. Васнев С.А. Статистика (учебное пособие) / электронное издание московского государственного университета печати

СТАТИСТИКА ОПИСАТЕЛЬНАЯ — это… Что такое СТАТИСТИКА ОПИСАТЕЛЬНАЯ?



СТАТИСТИКА ОПИСАТЕЛЬНАЯ

англ. statistics, descriptive; нем. Statistik, beschreibende. Техника сбора и суммирования количественных данных, используемая для превращения массы цифровых данных в форму, удобную для восприятия и обсуждения.


Antinazi.
Энциклопедия социологии,
2009

  • СТАТИСТИКА НЕПАРАМЕТРИЧЕСКАЯ
  • СТАТИСТИКА ПАРАМЕТРИЧЕСКАЯ

Смотреть что такое «СТАТИСТИКА ОПИСАТЕЛЬНАЯ» в других словарях:

  • Статистика описательная — Описательная статистика комплекс базовых приемов анализа данных вариационного ряда, дающий наиболее общее представление о распределении той или иной характеристики в изучаемой совокупности… Источник: Приказ Роспотребнадзора от 20.09.2010 N 341… …   Официальная терминология

  • СТАТИСТИКА, ОПИСАТЕЛЬНАЯ — Общее обозначение использования статистических процедур для описания, организации и обобщения выборочных данных в основном, описательная статистика – это число, которое представляет некоторые аспекты выборочных данных. Наиболее распространенными… …   Толковый словарь по психологии

  • СТАТИСТИКА ОПИСАТЕЛЬНАЯ — англ. statistics, descriptive; нем. Statistik, beschreibende. Техника сбора и суммирования количественных данных, используемая для превращения массы цифровых данных в форму, удобную для восприятия и обсуждения …   Толковый словарь по социологии

  • Статистика описательная — любая количественная характеристика выборки …   Социологический словарь Socium

  • Статистика в психологии (statistics in psychology) — Первое применение С. в психологии часто связывают с именем сэра Фрэнсиса Гальтона. В психологии под «статистикой» понимается применение количественных мер и методов для описания и анализа результатов психол. исслед. Психологии как науке С.… …   Психологическая энциклопедия

  • ОПИСАТЕЛЬНАЯ СТАТИСТИКА — См. статистика, описательная …   Толковый словарь по психологии

  • СТАТИСТИКА — СТАТИСТИКА. 1. Краткая история, предмет и основные понятия общей статистики. Предметом С. являет ся изучение совокупностей внутренне связанных хотя и внешне обособленных элементов. Внутренняя закономерность последних находит свое проявление… …   Большая медицинская энциклопедия

  • ОПИСАТЕЛЬНАЯ СТАТИСТИКА — ОПИСАТЕЛЬНАЯ СТАТИСТИКА, см. Государствоведение …   Демографический энциклопедический словарь

  • описательная статистика — — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом EN descriptive statistics …   Справочник технического переводчика

  • Описательная статистика — * апісальная статыстыка * descriptive statistics параметры выборки (см.), описывающие набор данных, напр., среднее, медиана, среднеквадратическое отклонение (см.) …   Генетика. Энциклопедический словарь

Описательная статистика и интерпретация статистики

Описательная статистика в SPSS

Как мы только что описали, описательная статистика используется в первую очередь для обобщения данных. SPSS — это статистическое программное обеспечение, которое используется для расчета описательной статистики. В SPSS мы должны выполнить следующие шаги:

  1. В меню «Пуск» щелкните «Меню SPSS».
  2. Выберите «описательная статистика» в меню анализа. После нажатия на меню описательной статистики появится другое меню.
  3. В этом окне выберите переменную, для которой мы хотим вычислить описательную статистику, и перетащите ее в окно переменных. Нажмите на опцию и выберите описательную статистику. После этого нажмите кнопку «ОК». Появится окно результатов и приведенная выше таблица результатов описательной статистики.

В этой таблице собраны все необработанные данные в виде таблицы; эта описательная статистика также используется для сравнения.

Ваш комитет и другие профессиональные читатели вашей диссертации захотят узнать состав вашей выборки и ответы на вопросы в вашем инструменте.Наши консультанты по статистике проведут для вас эту описательную статистику, включая письменное объяснение описательной статистики, таблицы описательной статистики и цифры описательной статистики, где это необходимо, все в формате APA с особым вниманием к требованиям вашего учреждения. Описательная статистика важна для установления достоверности вашей выборки как представления выборочной совокупности. Включение их в вашу диссертацию позволит сравнить с другими аналогичными исследованиями, в то же время рассматривая ваши результаты в перспективе.

Описательная статистика и ресурсы для интерпретации статистики

Барц, А. Э. (1971). Базовая описательная статистика для образования и поведенческих наук (4-е изд.). Оксфорд, Великобритания: Берджесс.

Бернштейн, С., и Бернштейн, Р. (1999). Схема элементов статистики I: Описательная статистика и вероятность. Нью-Йорк: Макгроу-Хилл.

Готкин, Л. Г., и Гольдштейн, Л. С. (1965). Описательная статистика: программный учебник. Нью-Йорк: Джон Вили и сыновья.

Левитас Р. и Гай В. (1996). Интерпретация официальной статистики. Нью-Йорк: Рутледж.

Ли, Дж. К. Р. (1957). В J. C. R. Li (ред.), Введение в статистический вывод (стр. 3-13). Анн-Арбор, Мичиган: The Science Press.

МакХью, М. Л., и Хадсон-Барр, Д. (2003). Описательная статистика, часть II: наиболее часто используемая описательная статистика. Журнал для специалистов по педиатрическому уходу, 8 (3), 111-116.

Макферсон, Г. (2001). Применение и интерпретация статистики: подробное руководство (2-е изд.). Нью-Йорк: Springer-Verlag.

Морган, Г. А., Глинер, Дж. А., и Хармон, Р. Дж. (1999). Измерения и описательная статистика. Журнал Американской академии детской и подростковой психиатрии, 38 (10), 1313-1315.

Statistics Solutions может помочь с количественным анализом, помогая разработать методологию и разделы результатов. Услуги, которые мы предлагаем, включают:

План анализа данных

Измените свои исследовательские вопросы и нулевые / альтернативные гипотезы

Напишите план анализа данных; указать конкретную статистику для ответа на вопросы исследования, допущения статистики и обосновать, почему они являются подходящей статистикой; предоставить ссылки

Обоснуйте размер вашей выборки / анализ мощности, предоставьте ссылки

Объясните вам свой план анализа данных, чтобы вы чувствовали себя комфортно и уверенно

Два часа дополнительной поддержки у вашего статистика

Раздел количественных результатов (описательная статистика, двумерный и многомерный анализ, моделирование структурных уравнений, анализ пути, HLM, кластерный анализ)

Чистый и кодовый набор данных

Проведение описательной статистики (т.е., среднее значение, стандартное отклонение, частота и процент, соответственно)

Проведите анализ, чтобы изучить каждый из вопросов вашего исследования

Результаты повторной записи

Предоставить APA 6 -е издание , таблицы и рисунки

Объяснение выводов по главе 4

Постоянная поддержка всей статистики по главам результатов

Пожалуйста, позвоните по номеру 727-442-4290, чтобы запросить расценки на основе специфики вашего исследования, расписания с использованием календаря на его странице или по электронной почте Info @ StatisticsSolutions.com

.

Описательная статистика

Описательная статистика

Автор (ы)

Микки Хебл

Предварительные требования

нет

Цели обучения

  1. Определить «описательную статистику»
  2. Различия между описательной статистикой и статистикой вывода

Описательная статистика
— числа, которые используются для обобщения и описания данных.В
слово «данные» относится к информации, которая была
собранные в результате эксперимента, опроса, исторической записи,
и т. д. (Кстати, «данные» употребляются во множественном числе. Одна часть информации
называется «данным».) Если мы анализируем свидетельства о рождении,
например, описательная статистика может представлять собой процент
сертификаты, выданные в штате Нью-Йорк, или средний возраст
мать. Любое другое число, которое мы выбираем для вычисления, также считается
описательная статистика для данных, из которых статистика
вычислено.Часто используется несколько описательных статистик в одном
время дать полную картину данных.

Описательная статистика носит чисто описательный характер. Oни
не предполагайте обобщения за пределами
данные под рукой. Обобщая наши данные на другой набор
дела — это дело логического вывода
статистика, которую вы изучите в другом разделе.
Здесь мы сосредоточимся на (простой) описательной статистике.

Некоторая описательная статистика представлена ​​в таблице 1.
В таблице приведены средние зарплаты по разным профессиям в
Соединенные Штаты в 1999 году. (Нажмите здесь
чтобы узнать, сколько зарабатывают люди других профессий.)

Таблица 1. Средняя заработная плата
по разным профессиям в 1999 г.

$ 112 760 педиатров
$ 106 130 стоматологов
$ 100 090 врачей-ортопедов
76 140 долл. США физиков
53 410 долл. США архитекторов
49 720 долл. США школьных, клинических и консультационных психологов
47 910 долл. США бортпроводников
39 560 долл. США учителей начальной школы
38 710 долл. США сотрудников полиции
18 980 долл. США флористов

Подобная описательная статистика дает представление
в американское общество.Интересно отметить, например,
что мы платим людям, которые обучают наших детей и защищают
наши граждане намного меньше, чем мы платим людям, которые заботятся
наших ног или наших зубов.

Для получения более подробной статистики см. Таблицу
2, где показано количество неженатых мужчин на 100 незамужних женщин.
в районе метро США в 1990 году. Из этой таблицы мы видим, что мужчины
больше всего женщин больше в Джексонвилле, Северная Каролина, а женщин больше
люди
большинство в Сарасоте, Флорида.Вы можете видеть, что описательная статистика
может быть полезно, если мы ищем партнера противоположного пола!
(Эти данные взяты из Информационного
Пожалуйста, Альманах.)

Таблица 2. Число неженатых мужчин на 100 незамужних женщин в пригородах США в 1990 г.

Города с преимущественно мужчинами Мужчин на 100 женщин Города с преимущественно женщинами Мужчин на 100 женщин
1.Джексонвилл, Северная Каролина

224

1. Сарасота, Флорида

66

2. Киллин-Темпл, Техас

123

2. Брадентон, Флорида

68

3.Фейетвилл, Северная Каролина

118

3. Алтуна, Пенсильвания

69

4. Бразория, Техас

117

4. Спрингфилд, Иллинойс,

70

5.Лоутон, OK

116

5. Джэксонвилл, TN

70

6. Государственный колледж, Пенсильвания

113

6. Gadsden, AL

70

7.Кларксвилл-Хопкинсвилл, TN-KY

113

7. Уилинг, WV

70

8. Анкоридж, Аляска

112

8. Чарльстон, WV

71

9.Салинас-Сисайд-Монтерей, Калифорния

112

9. St. Joseph, MO

71

10. Брайан-Колледж-Стейшн, Техас

111

10. Линчбург, Вирджиния

71

ПРИМЕЧАНИЕ. К неженатым относятся никогда не состоявшие в браке, овдовевшие и разведенные лица в возрасте 15 лет и старше.

Эта описательная статистика может заставить нас задуматься
почему цифры в этих городах такие разные. Один потенциал
объяснение, например, почему во Флориде больше женщин
чем мужчины могут быть связаны с тем, что пожилые люди склонны
переехать в регион Сарасота, и женщины, как правило, переживают
люди. Таким образом, в Сарасоте может проживать больше женщин, чем мужчин.Однако,
при отсутствии надлежащих данных это только предположения.

Вы, наверное, знаете, что описательный
статистика занимает центральное место в мире спорта. Каждый спорт
событие производит многочисленные статистические данные, такие как процент стрельбы
игроков в баскетбольной команде. Для олимпийского марафона (фут
гонки на 26,2 мили), мы располагаем данными, охватывающими более столетия
конкурса.(Первые современные Олимпийские игры состоялись в 1896 году.)
В следующей таблице показано время выигрыша для мужчин и женщин.
(последние были допущены к соревнованиям только с 1984 года).

Таблица 3. Выигрыши в олимпийском марафоне.

Женщины
Год Победитель Страна Время
1984 Джоан Бенуа США 2:24:52
1988 Роза Мота ПОР 2:25:40
1992 Валентина Егорова UT 2:32:41
1996 Фатума Роба ETH 2:26:05
2000 Наоко Такахаси JPN 2:23:14
2004 Mizuki Noguchi JPN 2:26:20
Мужчины
Год Победитель Страна Время
1896 Спиридон Людовик GRE 2:58:50
1900 Мишель Теато FRA 2:59:45
1904 Томас Хикс США 3:28:53
1906 Билли Шерринг CAN 2:51:23
1908 Джонни Хейс США 2:55:18
1912 Кеннет МакАртур С.Afr. 2:36:54
1920 Ханнес Колехмайнен FIN 2:32:35
1924 Альбин Стенроос FIN 2:41:22
1928 Boughra El Ouafi FRA 2:32:57
1932 Хуан Карлос Забала ARG 2:31:36
1936 Sohn Kee-Chung JPN 2:29:19
1948 Delfo Cabrera ARG 2:34:51
1952 Эмиль Зтопек CZE 2:23:03
1956 Ален Мимун FRA 2:25:00
1960 Абебе Бикила ETH 2:15:16
1964 Абебе Бикила ETH 2:12:11
1968 Мамо Вольде ETH 2:20:26
1972 Фрэнк Шортер США 2:12:19
1976 Вальдемар Черпински E.Ger 2:09:55
1980 Вальдемар Черпински E.Ger 2:11:03
1984 Карлос Лопес ПОР 2:09:21
1988 Гелиндо Бордин ITA 2:10:32
1992 Хван Ён-Чо С.Кор 2:13:23
1996 Джозиа Тугвейн S. Afr. 2:12:36
2000 Gezahenge Abera ETH 2: 10.10
2004 Стефано Бальдини ITA 2:10:55

Есть много описательной статистики, которую мы
можно вычислить из данных в таблице.Чтобы получить представление о
улучшение скорости с годами, давайте разделим мужские
раза на две части, а именно первые 13 гонок (до 1952 г.)
и второй 13 (с 1956 г.). Средний выигрыш
время для первых 13 гонок — 2 часа 44 минуты 22 секунды.
(написано 2:44:22). Среднее время победы за второй 13
гонок — 2:13:18. Это большая разница (более получаса).
Доказывает ли это, что самые быстрые мужчины бегают быстрее? Или
разница только случайно, не больше, чем то, что часто
возникает из-за случайных различий в производительности от года к
год? Мы не можем ответить на этот вопрос с помощью описательной статистики
в одиночестве.Все, что мы можем утверждать, — это то, что эти два средства «наводят на размышления».

Просмотр таблицы 3 приводит ко многим другим вопросам.
Отметим, что Такахаши (ведущая бегунья в 2000 г.)
победили бегунов-мужчин в 1956 г. и всех бегунов-мужчин в
первые 12 марафонов. Этот факт заставляет нас задаться вопросом, является ли пол
разрыв закроется или останется постоянным. Когда мы смотрим на время внутри
каждого пола, мы также задаемся вопросом, насколько они уменьшатся (если на
все) в следующем веке Олимпиады.Можем ли мы однажды стать свидетелями
марафон меньше двух часов? Изучение статистики может помочь вам сделать
разумные догадки об ответах на эти вопросы.

Пожалуйста, ответьте на вопросы:

обратная связь

.

Описательная статистика // Purdue Writing Lab

Описательная статистика

Резюме:

Этот раздаточный материал объясняет, как писать со статистикой, включая быстрые подсказки, написание описательной статистики, написание выводимой статистики и использование визуальных элементов со статистикой.

Среднее значение, мода, медиана, диапазон и стандартное отклонение — все это примеры описательной статистики. Описательная статистика используется, потому что в большинстве случаев невозможно представить все ваши данные в какой-либо форме, которую ваш читатель сможет быстро интерпретировать.

Как правило, при написании описательной статистики вы хотите представить по крайней мере одну форму центральной тенденции (или среднего), то есть либо среднее значение, медиана или мода. Кроме того, вы должны представить одну форму изменчивости , обычно стандартного отклонения.

Меры центральной тенденции и другая широко используемая описательная статистика

Среднее значение, медиана и мода — все это меры центральной тенденции. Они пытаются описать, как может выглядеть типичная точка данных.По сути, все они представляют собой разные формы «среднего». При составлении статистики вы никогда не хотите говорить «среднее», потому что вашему читателю трудно, а то и невозможно понять, имеете ли вы в виду среднее значение, медианное значение или режим.

Среднее

Среднее — это наиболее распространенная форма центральной тенденции, и это то, что обычно имеет в виду большинство людей, когда говорят о среднем значении. Это просто общая сумма всех чисел в наборе данных, деленная на общее количество точек данных.Например, следующий набор данных имеет среднее значение 4: {-1, 0, 1, 16}. То есть 16, разделенное на 4, дает 4. Если нет веской причины использовать одну из других форм центральной тенденции, тогда вы должны использовать среднее значение для описания центральной тенденции.

Медиана

Медиана — это просто среднее значение набора данных. Чтобы вычислить медиану, все значения в наборе данных необходимо упорядочить от самого высокого до самого низкого или наоборот. Если в наборе данных есть нечетное количество значений, то медиану легко вычислить.Если в наборе данных есть четное количество значений, то расчет становится более трудным. Статистики все еще спорят, как правильно рассчитать медиану, когда есть четное количество значений, но для большинства целей уместно просто взять среднее из двух средних значений. Медиана полезна при описании наборов данных, которые искажены или имеют экстремальные значения. Например, доходы игроков в бейсбол обычно сообщаются с использованием медианы, поскольку небольшая часть бейсболистов зарабатывает большие деньги, в то время как большинство игроков зарабатывают более скромные суммы.На медиана меньше влияют экстремальные оценки, чем на среднее значение.

{-2, 1, 3, 10, 500, 1000}

Здесь медиана 6,5: [(3 + 10) / 2]

{30, 30, 50, 50, 60}

Здесь медиана 50.

Режим

Режим — это наиболее часто встречающееся число в наборе данных. Этот режим лучше всего использовать, когда вы хотите указать наиболее частый ответ или элемент в наборе данных. Например, если вы хотите предсказать счет следующего футбольного матча, вы можете узнать, какой результат чаще всего набирает команда гостей, но имея средний балл 15.3 не поможет, если невозможно набрать 15,3 балла. Точно так же средний балл тоже может быть не очень информативным, если вас интересует, какой балл наиболее вероятен.

{1, 2, 3, 4, 10, 10, 10}

Здесь режим 10.

Стандартное отклонение

Стандартное отклонение — это мера изменчивости (это не мера центральной тенденции). Концептуально это лучше всего рассматривать как «среднее расстояние, на которое отдельные точки данных находятся от среднего». Наборы данных, которые сильно сгруппированы вокруг среднего, имеют более низкие стандартные отклонения, чем наборы данных, которые разбросаны.

Например, первый набор данных будет иметь более высокое стандартное отклонение, чем второй набор данных:

{1,2,3,4,5,6,7,8,9}

Стандартное отклонение = 2,58

{4,4,4,5,5,5,6,6,6}

Стандартное отклонение = 0,82

Обратите внимание, что обе группы имеют одинаковое среднее значение (5) и медианное значение (также 5), но две группы содержат разные числа и организованы по-разному. Такая организация набора данных часто называется распределением. Поскольку два набора данных выше имеют одинаковое среднее и медианное значение, но разное стандартное отклонение, мы знаем, что они также имеют разные распределения.Понимание распределения набора данных помогает нам понять, как данные ведут себя.

.

Описательная статистика

Описательная статистика Набор методов для обобщения и отображения данных. относится к набору методов обобщения и отображения данных. Предположим здесь, что данные являются количественными и состоят из оценок по одной или нескольким переменным для каждого из нескольких участников исследования. Хотя в большинстве случаев основной вопрос исследования будет касаться одной или нескольких статистических взаимосвязей между переменными, также важно описать каждую переменную индивидуально.По этой причине мы начнем с рассмотрения некоторых из наиболее распространенных методов описания отдельных переменных.

Распределение переменной

Каждая переменная имеет распределение. Таким образом, оценки переменной распределяются по уровням этой переменной. Таким образом, оценки распределяются по уровням этой переменной. Например, в выборке из 100 студентов колледжа распределение переменной «количество братьев и сестер» может быть таким, что у 10 из них нет братьев и сестер, у 30 — одного брата или сестры, у 40 — двух братьев и сестер, и так далее.В той же выборке распределение переменной «пол» может быть таким, что 44 имеют оценку «мужской», а 56 — «женский».

Таблицы частот

Один из способов отобразить распределение переменной — это таблица частот — таблица для отображения распределения переменной. В первом столбце перечислены значения переменной, а во втором столбце указана частота каждого балла. Например, таблица 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга» представляет собой таблицу частот, показывающую гипотетическое распределение баллов по шкале самооценки Розенберга для выборки из 40 студентов колледжа.В первом столбце перечислены значения переменной — возможные баллы по шкале Розенберга, а во втором столбце указана частота каждого балла. Эта таблица показывает, что было три студента с самооценкой 24, пять с самооценкой 23 и так далее. Из такой таблицы частот можно быстро увидеть несколько важных аспектов распределения, в том числе диапазон баллов (от 15 до 24), наиболее и наименее распространенные баллы (22 и 17, соответственно) и любые крайние баллы, которые имеют место. из остальных.

Таблица 12.1 Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга

Самоуважение Частота
24 3
23 5
22 10
21 8
20 5
19 3
18 3
17 0
16 2
15 1

В отношении таблиц частот стоит отметить еще несколько моментов.Во-первых, уровни, перечисленные в первом столбце, обычно идут от самого высокого вверху до самого низкого внизу, и они обычно не выходят за пределы самого высокого и самого низкого баллов в данных. Например, хотя оценки по шкале Розенберга могут варьироваться от 30 до 0, Таблица 12.1 «Таблица частот, показывающая гипотетическое распределение оценок по шкале самооценки Розенберга» включает только уровни от 24 до 15, потому что это Диапазон включает все оценки в этом конкретном наборе данных.Во-вторых, когда существует много разных оценок по широкому диапазону значений, часто лучше создать сгруппированную таблицу частот, в которой в первом столбце перечислены диапазоны значений, а во втором столбце указана частота оценок в каждом диапазоне. Таблица 12.2 «Сгруппированная таблица частот, показывающая гипотетическое распределение времени реакции», например, представляет собой сгруппированную таблицу частот, показывающую гипотетическое распределение простого времени реакции для выборки из 20 участников. В сгруппированной таблице частот все диапазоны должны быть одинаковой ширины, и обычно их бывает от пяти до 15.Наконец, частотные таблицы также могут использоваться для категориальных переменных, и в этом случае уровни являются метками категорий. Порядок меток категорий несколько произвольный, но часто они перечислены от наиболее часто встречающихся вверху до наименее часто встречающихся внизу.

Таблица 12.2 Сгруппированная таблица частот, показывающая гипотетическое распределение времени реакции

Время реакции (мс) Частота
241–260 1
221–240 2
201–220 2
181–200 9
161–180 4
141–160 2

Гистограммы

Гистограмма График для отображения распределения переменной.Ось x- представляет значения переменной, а ось y- представляет частоту каждой оценки. представляет собой графическое отображение распределения. В нем представлена ​​та же информация, что и в таблице частот, но еще быстрее и проще для понимания. Гистограмма на рисунке 12.1 «Гистограмма, показывающая распределение баллов самооценки, представленных в» представляет распределение баллов самооценки в Таблице 12.1 «Таблица частот, показывающая гипотетическое распределение баллов по шкале самооценки Розенберга».Ось x- гистограммы представляет переменную, а ось y- представляет частоту. Над каждым уровнем переменной на оси x- находится вертикальная черта, которая представляет количество людей с этим баллом. Когда переменная является количественной, как в этом примере, обычно нет промежутка между столбцами. Однако, когда переменная является категориальной, между ними обычно есть небольшой разрыв. (Разрыв в 17 на этой гистограмме отражает тот факт, что в этом наборе данных не было 17 баллов.)

Формы распределения

Когда распределение количественной переменной отображается в виде гистограммы, оно имеет форму. Форма распределения оценок самооценки на Рисунке 12.1 «Гистограмма, показывающая распределение оценок самооценки, представленных на» является типичной. Где-то около середины распределения есть пик и «хвосты», которые сужаются в любом направлении от пика. Распределение на Рисунке 12.1 «Гистограмма, показывающая распределение оценок самооценки, представленных в» является унимодальной, что означает, что она имеет один отчетливый пик, но распределения также могут быть бимодальными, то есть они имеют два различных пика. Рисунок 12.2 «Гистограмма, показывающая гипотетическое бимодальное распределение баллов в реестре депрессии Бека», например, показывает гипотетическое бимодальное распределение баллов по реестру депрессии Бека. Распределения также могут иметь более двух различных пиков, но они относительно редко встречаются в психологических исследованиях.

Рисунок 12.2 Гистограмма, показывающая гипотетическое бимодальное распределение баллов в инвентаре депрессии Бека

Другой характеристикой формы распределения является то, является ли оно симметричным или скошенным. Распределение в центре рисунка 12.3 «Гистограммы, показывающие отрицательно перекошенные, симметричные и положительно перекошенные распределения» симметрично. Относится к распределению, в котором левая и правая стороны почти зеркально отражают друг друга.. Его левая и правая половины являются зеркальным отображением друг друга. Распределение слева имеет отрицательный перекос. Относится к асимметричному распределению. Положительно скошенное распределение имеет относительно длинный положительный хвост, а отрицательно скошенное распределение имеет относительно длинный отрицательный хвост, с его пиком, смещенным к верхней границе диапазона, и относительно длинным отрицательным хвостом. Распределение справа имеет положительный перекос с пиком к нижней границе диапазона и относительно длинным положительным хвостом.

Рисунок 12.3 Гистограммы, показывающие отрицательно перекошенные, симметричные и положительно перекошенные распределения

Выброс — крайний балл, сильно отличающийся от остальных оценок в распределении. — крайний балл, который намного выше или ниже остальных оценок в распределении. Иногда выбросы представляют собой действительно экстремальные значения интересующей переменной. Например, в Опроснике депрессии Бека один человек с клинической депрессией может быть исключением из выборки в остальном счастливых и хорошо функционирующих сверстников.Однако выбросы могут также представлять ошибки или недопонимание со стороны исследователя или участника, неисправности оборудования или аналогичные проблемы. Подробнее о том, как интерпретировать выбросы и что с ними делать, мы поговорим позже в этой главе.

.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *