Можно получить неверные результаты и ложные ярлыки при использовании t-теста пакета анализа Excel

Переводы статьи Переводы статьи
Код статьи: 829252 - Vizualiza?i produsele pentru care se aplic? acest articol.
Развернуть все | Свернуть все

В этой статье

Аннотация

Эта статья пакета анализа t тест с именем Парный двухвыборочный для средних инструмента. Этот инструмент не был изменен, для Microsoft Office Excel 2003 и последующих версиях Excel. Тем не менее это средство дает порочного результаты при отсутствующих данных. Кроме того или нет отсутствующих данных, существуют неправильных подписей в выходных данных средства.

Microsoft Excel 2004 для Macintosh сведений

Статистические функции в Excel 2004 для Mac обновлены с помощью одного и того же алгоритма, которые использовались для обновления статистических функций в Excel 2003 и последующих версиях Excel. Любые сведения в этой статье, описывающие работу или обновление функции в Excel 2003 и последующих версиях Excel, также применимы к Excel 2004 для Mac..

Дополнительная информация

Как правило применяется Парный двухвыборочный t тест (иногда называемый соответствие пары t тест) при наличии до и после измерения одного и того же экспериментов для обработки. Например вес Тема может мер до и после 30-дневной диеты плана.

Как правило, можно избавиться от данных для какого-либо тема, перед измерения или после измерения отсутствует. Неполные данные по теме сведений по этой теме делает бесполезным. К сожалению этот инструмент пакета анализа работает иначе, чем обычно практического занятия. Во-первых этот инструмент пакета анализа подсчитывает число субъектов с до размеров и количества субъектов с после измерения. Если эти суммы не совпадают, сообщение об ошибке, и этот инструмент пакета анализа данных не продолжает. Таким образом например, если 49 тем, кто до и после измерения и fiftieth темы, имеет только до измерения, инструмент пакета анализа не анализа.

Если число субъектов, которые отсутствуют до данных равно числу субъектов, которые отсутствуют после данных, и это число является положительным, средство проводит анализ подходит. Например предположим, 50 субъектов. А тема отсутствует до измерения, и B тема отсутствует значение после 48 темы нет отсутствующих данных. Программа подсчитывает 49 до размеров и 49 после измерения; средство действует как если бы 49 темы без отсутствующих данных. Это нарушает вашей целью устраняя все темы, отсутствует значение до или после значения. Число темы в этом примере следует 48 не 49. Таким образом данное средство используется неправильное число степеней свободы. Кроме того поскольку средство удаляет ни объект тема после измерения, а также тема B до измерения, этих двух измерений, включаются в вычисления означает, что образцы, которые используются в t статистики. Таким образом эти вычисления разности средних, соответствует требованиям.

В целом он не подходит для использования средства, при наличии отсутствующих данных так, как средство либо будет не вычисления или она будет вычислять с формулами, подходит. Последний случай возникает, когда число субъектов с отсутствующими до данных равно числу темы с отсутствующими после данных.

Пример в разделе "Пример использования" данной статьи показаны эти неполадки, а также указывает, толку метки в выходных данных средства. В разделе «Временное решение» этой статьи предлагается временное решение проблемы в случае, когда вы не можете проверить отсутствие отсутствующие данные перед тем как использовать средство.

Пример использования

Чтобы проиллюстрировать проблемы отсутствующие данные, создайте пустой лист Excel и затем скопируйте приведенную ниже таблицу. Выделите ячейку A1 на пустой лист Excel, а затем вставьте записи таким образом, чтобы таблица заполняет A1:I52 ячеек на листе.
Свернуть эту таблицуРазвернуть эту таблицу
Эксперимент 1Попробуйте 2Эксперимент 3Эксперимент 3 удалить
Прежде чемПослеПрежде чемПослеПрежде чемПослетемы с отсутствующих данных
200170200170200170200170
190180190180190180190180
180175180175180175180175
170175170175170175170175
160165160165160165160165
150140150140150140150140
140130140130130130125
130125130125130125120125
120125120125120125110100
110100110100110100
100100100100
Поведение 2 tailed t-теста
= TTEST(A3:A13, B3:B13,2,1)= TTEST(C3:C13, D3:D13, 2, 1)= TTEST(E3:E13, F3:F13, 2, 1)
= TTEST(C3:C12, D3:D12, 2, 1)= TTEST(G3:G11, H3:H11, 2, 1)
Инструмент пакета анализа для эксперимент 1:
t теста: Парный двухвыборочный для средних
Переменной 1Переменной 2
Среднее значение150144.090909090909
Отклонение1100914.090909090909
Наблюдения1111
Господин корреляции0.952384533866487
Гипотетического среднего среднее разницы0
DF10
t Stat1.92092590483801
P (T<=t)></=t)>0.0418403929085198
t критическое одностороннее1.81246110219722
P (T<=t)></=t)>0.0836807858170396
t критическое двустороннее2.22813884242587
Инструмент пакета анализа для эксперимент 2:
Не будет вычислять из-за неравномерного распределения количества точек данных
Инструмент пакета анализа для эксперимент 3:
t-Test: Paired Two Sample for Means
Variable 1Variable 2
Mean151148.5
Variance1210778.055555555556
Observations1010
Pearson correlation0.936537537274845
Hypothesized mean difference0
df9
t Stat0.141327169509421
P(T<=t)></=t)>0.445362157564494
t Critical one-tail1.83311292255007
P(T<=t)></=t)>0.890724315128988
t Critical two-tail2.26215715817358
After the table is pasted into your Excel worksheet, click theПараметры вставкиbutton, and then clickMatch Destination Formatting. With the pasted range still selected, use one of the following procedures, as appropriate for the version of Excel that you are running:
  • В Microsoft Office Excel 2007, нажмите кнопкуДомашняя страницаЩелкнитеФормат:В диалоговом окнеЯчейкигруппы и нажмите кнопкуШирина столбца по ширине.
  • В Excel 2003, выберите пунктСтолбецв менюФормат:меню и выберите пунктАвтоподбор.
You can use the worksheet to compare results of the TTEST function of Excel with the Analysis ToolPak tool. Experiment 1 shows complete data on eleven subjects. The value of TTEST in cell A16 is the probability that the t-statistic will be greater than the observed value, assuming a t-distribution with ten degrees of freedom. This value, 0.837, is also shown in the tool's output in cell B32. The label in cell A32 should read "P(T >= |t|) two-tail", not "P(T<=t) two-tail",="" but="" the="" numeric="" answer="" is="" correct="" because="" there="" is="" no="" missing="" data="" in="" experiment="" 1.="" similarly,="" the="" label="" in="" cell="" a30="" should="" read="" "p(t="">= |t|) one-tail", not "P(T<=t) one-tail".="" the="" "t="" critical"="" cutoffs="" are="" correct.="" they="" correspond="" to="" the="" default="" significance="" level,="" 0.05,="" and="" they="" use="" the="" correct="" number="" of="" degrees="" of="" freedom,=""></=t)></=t)>

Эксперимент 2 отсутствуют один после измерения на одну тему и без отсутствующих данных. Средство отказывается вычисления. Значения ТТЕСТ ячеек A16 и A17 совпадают. В ячейку A16 C3:D13 диапазона ячеек данных используется, в том числе последняя тема, единственным отсутствующих данных. В ячейке A17 C3:D12 диапазона ячеек данных выполняется; это соответствует экспериментом с первых десяти субъектов и без отсутствующих данных. Тот факт, что результаты совпадают указывает на то, что при вызове в ячейку A16 ТТЕСТ ТТЕСТ соответствующим образом отбрасывает темы с отсутствующих данных.

Эксперимент 3 отсутствуют один до измерения и одну отсутствует после измерения на две различные темы. Эксперимент 3 изменения показывает остальные девять темы без отсутствующих данных. Результаты ТТЕСТ в ячейки E16 и E17 одинаковы. В ячейку E16 ТТЕСТ называется эксперимент 3 данные в ячейки E3:F13. В ячейке E17 то функция ТТЕСТ называется эксперимент 3 изменения данных в ячейки G3:H11. Результаты, поскольку ТТЕСТ соответствующим образом отбрасывает темы седьмой и 11 в 3 эксперимент, эти отсутствующие данные. Если выходные данные средства проверки 3 эксперимент, количество до и после значения в ячейках B44 и C44 равно 10 в каждом случае. Просто убедитесь, что SUM(E3:E13) 1510 и SUM(F3:F13) 1485; за 10 наблюдений в каждом диапазоне соответствующие средства 151 и 148,5, показаны в ячейках B42 и C42. Таким образом это средство не имеет удаляются все субъекты и включил измерения после седьмой субъекта и измерения до 11 субъекта в его анализа. Число степеней свободы в ячейке B47 не подходит, так как должно было девять субъектов и восемь df. Это делает неправильной записи прекращения значений в ячейках B50 и B52 (в дополнение к недостоверным подписи операций, находящихся в ячейках A50 и A52.)

Результаты во всех версиях Microsoft Excel

К сожалению это средство не появилось, Excel 2003 и последующих версиях Excel.

Предлагаемое решение для всех версий Excel

Перед тем как использовать средство удалить темы с отсутствующих данных. Тем не менее может не требуется изменить лист Excel таким образом. Процедура удаления темы с отсутствующих данных отображается в следующих шагах. Чтобы избавиться от темы с отсутствуют данные, выполните следующие действия.
  1. Скопируйте данные двух диапазонов в другую область листа.
  2. Проверка данных вверх от общих нижнего из двух диапазонов.
    1. Если нижняя строка содержит отсутствующие данные, снимите флажок нижней строке. Это уменьшает диапазон данных. Перейдите к шагу 3.
    2. Определение строки r над нижней строке, но ближе к нижней с отсутствующими данными.
      1. Копирование всех данных, под строкой r.
      2. Выберите строки-r и вставьте скопированные данные в нее.
      3. Снимите в нижнем ряду данных (который теперь будет дублировать рядом последней строки данных). Это уменьшает диапазон данных.
  3. Повторите шаг 2 до не отсутствующих данных остается.
Примечание.Данное средство можно использовать, если невозможно гарантировать, что нет отсутствующих наблюдений.

Можно дублировать многое, но не все средства выходных данных без преобразования данных. Среднее отклонение и наблюдений без массу усилий, не удается найти соответствующие значения. Инструмент находит недопустимые значения, путем проверки до и после данных отдельно. Средство df является общее значение наблюдений, минус единица; таким образом, существует также подходит при наличии отсутствующих данных. Не удается найти t Stat без массу усилий, поскольку необходимо проверить перед и после данных, в то же время.

Тем не менее можно найти господин корреляции, применяя PEARSON или КОРРЕЛ для двух диапазонов. Обе функции Excel обрабатывает отсутствующие данные соответствующим образом. Кроме того можно найти одностороннее и двустороннее t вероятностей, соответствующих данных путем вызова функции ТТЕСТ Excel и соответствующим образом обрабатывает отсутствующие данные. Для вероятности одностороннее и двустороннее в эксперимент 3 можно вызвать метод ТТЕСТ (E3:E13, F3:F13, 1, 1) и (E3:E13, F3:F13, 2, 1), то функция ТТЕСТ соответственно. Можно также убедиться, что результаты этих функций совпадают с типами инструмента в 1 эксперимент, где средство работает надлежащим образом из-за отсутствия данных не существует. Соответствующие вызовы эксперимент 1 являются ТТЕСТ (A3:A13, B3:B13, 1, 1) и (A3:A13, B3:B13, 2, 1), то функция ТТЕСТ соответственно.

Для критических cutoffs необходимо установить число степеней свободы. В экспериментах 1, 2 и 3 правильное число степеней свободы являются 10, 9 и 8 соответственно. Эти значения всегда имеют один меньше, чем число полезные темы в данных без отсутствующих перед или после измерения. Для эксперимента 3, например, может ввести в ячейку J3, IF(OR(ISBLANK(E3), ISBLANK(F3)), 0, 1 =) и заполнения вниз этой формулы в ячейках J4:J13 и найти df путем ввода в ячейку J14: =SUM(J3:J13) – 1.

После установления df Стьюдраспобр можно использовать функции Microsoft Excel. С уровнем значимости 0,05 вызовы для экспериментов с 1, 2 и 3 соответственно бы Стьюдраспобр (0,05, 10), Стьюдраспобр (0,05, 9) и Стьюдраспобр (0,05, 8). Это вернет значение "t критическое двустороннее". Для получения «t критическое одностороннее значения», можно использовать аналогично вызовы двойной уровень значимости, такие как Стьюдраспобр (0,10, 10), Стьюдраспобр (0,10, 9) и Стьюдраспобр (0,10, 8) соответственно.

Выводы

Не используйте Paired два образца пакета анализа t тест для средних, средство не гарантирует, что отсутствующие точки данных не существует. This article describes suggestions for duplicating most of the tool's functionality by using Excel functions, instead of the Analysis ToolPak.

The tool also provides misleading "P(T<=t)" labels.="" this="" article="" describes="" the="" correct=""></=t)">

Свойства

Код статьи: 829252 - Последний отзыв: 25 ноября 2010 г. - Revision: 2.0
Информация в данной статье относится к следующим продуктам.
  • Microsoft Office Excel 2007
  • Microsoft Excel 2004 for Mac
Ключевые слова: 
kbformula kbexpertisebeginner kbprb kbfunctions kbfuncstat kbmt KB829252 KbMtru
Переведено с помощью машинного перевода
ВНИМАНИЕ! Перевод данной статьи был выполнен не человеком, а с помощью программы машинного перевода, разработанной корпорацией Майкрософт. Корпорация Майкрософт предлагает вам статьи, переведенные как людьми, так и средствами машинного перевода, чтобы у вас была возможность ознакомиться со статьями базы знаний KB на родном языке. Однако машинный перевод не всегда идеален. Он может содержать смысловые, синтаксические и грамматические ошибки, подобно тому как иностранец делает ошибки, пытаясь говорить на вашем языке. Корпорация Майкрософт не несет ответственности за неточности, ошибки и возможный ущерб, причиненный в результате неправильного перевода или его использования. Корпорация Майкрософт также часто обновляет средства машинного перевода.
Эта статья на английском языке:829252

Отправить отзыв

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com