Основы планирования эксперимента. Формальное планирование и оценка валидности как условия установления экспериментального эффекта Что включает формальное планирование эксперимента

Краткое описание

Факторным называется такой план, согласно которому одновременно изучается влияние на зависимую переменную двух или более факторов. Т. к. несколько факторов рассматриваются в рамках одного плана, то в добавление к возможности оценить их воздействие на зависимую переменную по отдельности (главные эффекты) появляется возможность измерить эффекты их совместного влияния на эту переменную (взаимодействия).
Дробные 2**(k-p) факторные планы, вероятно, наиболее часто используемые планы в промышленных экспериментах. Предмет рассмотрения любого 2**(k-p) дробного факторного эксперимента включает число исследуемых факторов, число опытов в эксперименте и наличие блоков опытов эксперимента. После этих основных вопросов следует также определить, позволяет ли число опытов найти план требуемого разрешения и степень смешивания для критического порядка взаимодействий, для данного разрешения.

Введение
1 Простые факторные планы
2 Простые сравнивающие эксперименты
Вывод
Список использованных источников

Содержимое работы - 1 файл

Критерий минимальной аберрации плана. Критерий минимальной аберрации плана является другим необязательным критерием, используемым при поиске 2**(k-p) плана. В некоторых отношениях этот критерий похож на критерий максимальной несмешанности. Формально план с минимальной аберрацией определяется как план с максимальным разрешением "с минимальным числом слов в определяющем взаимоотношении, которое имеет минимальную длину" (Fries & Hunter, 1984). Менее формально, действие критерия основано на выборе генераторов, которые дают наименьшее число пар смешанных взаимодействий критического порядка. Например, план разрешения IV с минимальной аберрацией имел бы минимальное число пар смешанных 2-факторных взаимодействий.

Для пояснения различия между критериями максимальной несмешанности и минимальной аберрации рассмотрим максимально несмешанный план 2**(9-4) и план 2**(9-4) с минимальной аберрацией, как в примере, данном Box, Hunter, и Hunter (1978). Если вы сравните эти два плана, вы увидите, что в максимально несмешанном плане 15 из 36 2-факторных взаимодействий не смешаны с любыми другими 2-факторными взаимодействиями, в то время как в плане с минимальной аберрацией только 8 из 36 2-факторных взаимодействий не смешаны с любыми другими 2-факторными взаимодействиями. План с минимальной аберрацией, однако, дает 18 пар смешанных взаимодействий, в то время как максимально несмешанный план дает 21 пару смешанных взаимодействий. Таким образом, эти критерии приводят к выделению генераторов, дающих различные "лучшие" планы.

К счастью, выбор между критерием максимальной несмешанности и критерием минимальной аберрации не вносит различия в выбранном плане (за исключением, возможно, переобозначения факторов), когда имеется 11 или меньше факторов, - единственное исключение составляет план 2**(9-4), описанный выше (смотрите Chen, Sun, & Wu, 1993). Для планов с более чем 11 факторами оба критерия приводят к весьма различным планам, и нет лучшего совета, как использовать оба критерия, а затем сравнить полученные планы и выбрать план, наиболее отвечающий вашим потребностям. Добавим, что максимизация числа полностью несмешанных эффектов часто имеет больший смысл, чем минимизация числа пар смешанных эффектов.

2 Простые сравнивающие эксперименты

Эксперименты представляют собой запланированное введение фактора в ситуацию с целью установить его связь с изменением в данной ситуации. Вводимый фактор обычно называют вмешательством, воздействием и ли независимой переменной; тогда наблюдаемое изменение будет мерой зависимой переменной. Эксперименты включают подробное описание того, сколько (и каких) групп испытуемых должно быть создано и каким образом предполагается исключить наиболее правдоподобные альтернативные объяснения. Главные задачи сравнивающих экспериментов - связать вмешательство с эффектом и исключить все другие объяснения наблюдаемого изменения. Простейшие эксперименты заключаются в воздействии, оказываемом на одного испытуемого или группу испытуемых, вместе с наблюдениями до и после этого воздействия, проводимыми с целью установления изменение в их состоянии. Эксперименты используются не только для установления связи переменных с их эффектами, но и для исключения альтернативных объяснений, в которых, если употреблять терминологию теории планирования эксперимента, переменные смешиваются. Только когда мы разделяем эти эффекты, мы можем приписать наблюдаемое изменение определенному воздействию, например, цвету фона дисплея; в противном случае мы вынуждены прибегать к смешанному альтернативному объяснению, например, приписывая то же самое изменение влиянию практики. На языке теории планирования эксперимента мы бы сказали, что контролируем смешивание переменных. Как можно этого добиться? Существует четыре общепринятых метода контроля: а) исключение смешиваемого фактора; б) измерение эффекта смешиваемого фактора и введение соответствующей поправки; в) сравнение эквивалентных ситуаций, одна из которых подвергается влиянию смешиваемой переменной и экспериментальному воздействию, тогда как на другую влияет только смешиваемая переменная ; г) варьирование эксперимента воздействия при поддержании смешиваемой переменной на одном уровне, чтобы посмотреть, соответствует ли изменение эффекта схеме изменения воздействия. Несмотря на то, что существуют и др. методы контроля, чаще всего используются именно эти четыре. Базисная логика экспериментальных планов. 1. Стабилизировать ситуацию, ввести воздействие и наблюдать изменение. 2. Если ситуация не может быть стабилизирована и изменяется, то проследить характер изменений, ввести воздействие и установить, привело ли оно к каким-либо нарушениям в характере изменений. 3. Стабилизировать две (или более) эквивалентные ситуации; выбрать одну из них и поддерживать ее постоянство на одном уровне с оставшейся (или оставшимися), за исключением эксперимента воздействия; ввести экспериментальное воздействие в другую ситуацию (или его варианты в оставшиеся ситуации) и отметить различия. 4. Соотнести схему подачи/прекращения эксперимента воздействия с характером наблюдаемого изменения; если можно измерить степень воздействия или силу вмешательства, то соотнести силу или интенсивность вмешательств а с таким релевантным аспектом как величина или предел изменения. (Этот принцип работает только в том случае, если зависимая переменная возвращается в прежнее состояние при прекращении вмешательства, но не действует в таких ситуациях как ситуация научения, эффекты которого отличаются устойчивостью .) Случайное распределение испытуемых на эксперименте и контрольную группы гарантирует, что эти группы, в среднем, "совместно уравниваются по каждому условию", включительно и предположительно связанные с изучаемым явлением , и непредвиденные, даже иррелевантные условия, такие как число кожных пор и длина ногтей. Действительно, Кэмпбелл и Стэнли считают случайное распределение испытуемых по группам довольно важным вследствие того, что оно обеспечивает защиту от "скрытых" переменных, и называют планы, в которых оно не используется, "квазиэкспериментальными", в отличие от использующих его "подлинно экспериментальных планов". Такие факторы как уровень образования, способность к научению, мотивация и социоэкономический статус , часто оказываются альтернативными объяснениями, которые хотели бы исключить посредством обеспечения эквивалентности групп. Это достигается путем стратификации, формирования блоков или попарного уравнивания на основе измерения этих переменных с последующим случайным распределением испытуемых по экспериментам и контрольным группам. Логика сохранения общности всех условий за исключением одного используется и в более сложных планах, таких, например, как факторные. Такие планы позволяют одновременно проверять эффект нескольких переменных, но в них всегда есть одна или более групп, которые отличаются от другой или других групп испытуемых только одним условием или переменной. Милль отмечал, что когда одно явление изменяется по мере изменения другого, то либо одно из них является причиной, а другое следствием (или наоборот), либо оба они связаны с общей причиной. Этой логике следуют такие планы как план с разрывом регрессии (служащим признаком экспериментального эффекта) и план типа АБА/АБАБ, а также корреляционные исследования, цель которых - выяснить насколько тесно величина одной переменной связана с величиной другой переменной. Сделать вывод о причинности на основе корреляции весьма затруднительно, так как ковариация может быть обусловлена действием третьей переменной.

Вывод

Экспериментальные методы широко используются как в науке, так и в промышленности, однако нередко с весьма различными целями. Обычно основная цель научного исследования состоит в том, чтобы показать статистическую значимость эффекта воздействия определенного фактора на изучаемую зависимую переменную.

В условиях промышленного эксперимента основная цель обычно заключается в извлечении максимального количества объективной информации о влиянии изучаемых факторов на производственный процесс с помощью наименьшего числа дорогостоящих наблюдений. Если в научных приложениях методы дисперсионного анализа используются для выяснения реальной природы взаимодействий, проявляющейся во взаимодействии факторов высших порядков, то в промышленности учет эффектов взаимодействия факторов часто считается излишним в ходе выявления существенно влияющих факторов.

Основные принципы планирования эксперимента, обеспечивающие получение максимума информации при минимуме опытов. Отказ от полного перебора возможных входных состояний. Выбор числа уровней варьирования по каждому фактору на основании вида аппроксимации функции отклика. Принцип последовательного планирования, предусматривающий получение простейшей математической модели на основании небольшого числа опытов и, если полученная модель не удовлетворяет исследователя, постепенное усложнение математической модели на основе проведения новых (дополнительных) опытов до тех пор, пока не будет получена модель, которую исследователь признает достаточно хорошей.

Список использованных источников

Encyclopedia of Computer Science. 4th edition. 2000. Grove"s Dictionaries N.Y.
Белоцерковский О.М. 1994. Численное моделирование в механике сплошных сред. М.: Наука
Петров А. А. 1996. Экономика. Модели. Вычислительный эксперимент. М.: Наука
Самарский А.А., Михайлов А.П.. 1997. Математическое моделирование. Идеи. Методы. Примеры. - М., Наука.
Буянов Б. Б., Легович Ю. С., Лубков Н. В., Поляк Г.Л. 1996. Построение систем подготовки управляющих решений с использованием имитационного моделирования Приборы и системы управления. 12: 36 - 40.
Бахур А.Б. 2000. Системные идеи в современной инженерной практике. М.: Пров-пресс.
Попов Ю. П., Самарский А.А. 1983. Вычислительный эксперимент. М. Знание.
Трахтенгерц Э. Л. 1998. Компьютерная поддержка принятия решений. М., Синтэг.
Мандель А.С. 1996. Экспертно-статистические системы в задачах управления и обработки информации. Часть I. Приборы и системы управления. 12: 34-36.

Планирование эксперимента (англ. experimental design techniques) -- комплекс мероприятий, направленных на эффективную постановку опытов. Основная цель планирования эксперимента -- достижение максимальной точности измерений при минимальном количестве проведенных опытов и сохранении статистической достоверности результатов.Планирование эксперимента применяется при поиске оптимальных условий, построении интерполяционных формул, выборе значимых факторов, оценке и уточнении констант теоретических моделей и др.

Планирование эксперимента возникло в 50-х годах XX века из потребности устранить или хотя бы уменьшить систематические ошибки в сельскохозяйственных исследованиях путем рандомизации условий проведения эксперимента. Процедура планирования оказалась направленной не только на уменьшение дисперсии оцениваемых параметров, но также и на рандомизацию относительно сопутствующих, спонтанно изменяющихся и неконтролируемых переменных. В результате удалось избавиться от смещения в оценках. Исследования Р. Фишера знаменуют начало первого этапа развития методов планирования эксперимента. Фишер разработал метод факторного планирования. Йетс предложил для этого метода простую вычислительную схему. Факторное планирование получило широкое распространение. Особенностью факторного эксперимента является необходимость ставить сразу большое число опытов. Развитие теории планирование эксперимента в СССР отражено в работах В. В. Налимова, Ю. П. Адлера, Ю. В. Грановского, Е. В. Марковой, В. Б. Тихомирова.

Методы планирования эксперимента позволяют минимизировать число необходимых испытаний, установить рациональный порядок и условия проведения исследований в зависимости от их вида и требуемой точности результатов. Если же по каким-либо причинам число испытаний уже ограничено, то методы дают оценку точности, с которой в этом случае будут получены результаты. Методы учитывают случайный характер рассеяния свойств испытываемых объектов и характеристик используемого оборудования. Они базируются на методах теории вероятности и математической статистики.

Планирование эксперимента включает ряд этапов.

1. Установление цели эксперимента (определение характеристик, свойств и т. п.) и его вида (определительные, контрольные, сравнительные, исследовательские).
2. Уточнение условий проведения эксперимента (имеющееся или доступное оборудование, сроки работ, финансовые ресурсы, численность и кадровый состав работников и т. п.). Выбор вида испытаний (нормальные, ускоренные, сокращенные в условиях лаборатории, на стенде, полигонные, натурные или эксплуатационные).
3. Выявление и выбор входных и выходных параметров на основе сбора и анализа предварительной (априорной) информации. Входные параметры (факторы) могут быть детерминированными, то есть регистрируемыми и управляемыми (зависимыми от наблюдателя), и случайными, то есть регистрируемыми, но неуправляемыми. Наряду с ними на состояние исследуемого объекта могут оказывать влияние нерегистрируемые и неуправляемые параметры, которые вносят систематическую или случайную погрешность в результаты измерений. Это -- ошибки измерительного оборудования, изменение свойств исследуемого объекта в период эксперимента, например, из-за старения материала или его износа, воздействие персонала и т. д.
4. Установление потребной точности результатов измерений (выходных параметров), области возможного изменения входных параметров, уточнение видов воздействий. Выбирается вид образцов или исследуемых объектов, учитывая степень их соответствия реальному изделию по состоянию, устройству, форме, размерам и другим характеристикам.

На назначение степени точности влияют условия изготовления и эксплуатации объекта, при создании которого будут использоваться эти экспериментальные данные. Условия изготовления, то есть возможности производства, ограничивают наивысшую реально достижимую точность. Условия эксплуатации, то есть условия обеспечения нормальной работы объекта, определяют минимальные требования к точности.

Точность экспериментальных данных также существенно зависит от объёма (числа) испытаний -- чем испытаний больше, тем (при тех же условиях) выше достоверность результатов. Для ряда случаев (при небольшом числе факторов и известном законе их распределения) можно заранее рассчитать минимально необходимое число испытаний, проведение которых позволит получить результаты с требуемой точностью.

5. Составление плана и проведение эксперимента -- количество и порядок испытаний, способ сбора, хранения и документирования данных.

Порядок проведения испытаний важен, если входные параметры (факторы) при исследовании одного и того же объекта в течение одного опыта принимают разные значения. Например, при испытании на усталость при ступенчатом изменении уровня нагрузки предел выносливости зависит от последовательности нагружения, так как по-разному идет накопление повреждений, и, следовательно, будет разная величина предела выносливости.

В ряде случаев, когда систематически действующие параметры сложно учесть и проконтролировать, их преобразуют в случайные, специально предусматривая случайный порядок проведения испытаний (рандомизация эксперимента). Это позволяет применять к анализу результатов методы математической теории статистики.

Порядок испытаний также важен в процессе поисковых исследований: в зависимости от выбранной последовательности действий при экспериментальном поиске оптимального соотношения параметров объекта или какого-то процесса может потребоваться больше или меньше опытов. Эти экспериментальные задачи подобны математическим задачам численного поиска оптимальных решений. Наиболее хорошо разработаны методы одномерного поиска (однофакторные однокритериальные задачи), такие как метод Фибоначчи, метод золотого сечения.

6. Статистическая обработка результатов эксперимента, построение математической модели поведения исследуемых характеристик.

Необходимость обработки вызвана тем, что выборочный анализ отдельных данных, вне связи с остальными результатами, или же некорректная их обработка могут не только снизить ценность практических рекомендаций, но и привести к ошибочным выводам. Обработка результатов включает:

· определение доверительного интервала среднего значения и дисперсии (или среднего квадратичного отклонения) величин выходных параметров (экспериментальных данных) для заданной статистической надежности;
· проверка на отсутствие ошибочных значений (выбросов), с целью исключения сомнительных результатов из дальнейшего анализа. Проводится на соответствие одному из специальных критериев, выбор которого зависит от закона распределения случайной величины и вида выброса;
· проверка соответствия опытных данных ранее априорно введенному закону распределения. В зависимости от этого подтверждаются выбранный план эксперимента и методы обработки результатов, уточняется выбор математической модели.

Построение математической модели выполняется в случаях, когда должны быть получены количественные характеристики взаимосвязанных входных и выходных исследуемых параметров. Это -- задачи аппроксимации, то есть выбора математической зависимости, наилучшим образом соответствующей экспериментальным данным. Для этих целей применяют регрессионные модели, которые основаны на разложении искомой функции в ряд с удержанием одного (линейная зависимость, линия регрессии) или нескольких (нелинейные зависимости) членов разложения (ряды Фурье, Тейлора). Одним из методов подбора линии регрессии является широко распространенный метод наименьших квадратов. Для оценки степени взаимосвязанности факторов или выходных параметров проводят корреляционный анализ результатов испытаний. В качестве меры взаимосвязанности используют коэффициент корреляции: для независимых или нелинейно зависимых случайных величин он равен или близок к нулю, а его близость к единице свидетельствует о полной взаимосвязанности величин и наличии между ними линейной зависимости.

При обработке или использовании экспериментальных данных, представленных в табличном виде, возникает потребность получения промежуточных значений. Для этого применяют методы линейной и нелинейной (полиноминальной) интерполяции (определение промежуточных значений) и экстраполяции (определение значений, лежащих вне интервала изменения данных).

7. Объяснение полученных результатов и формулирование рекомендаций по их использованию, уточнению методики проведения эксперимента.

Снижение трудоемкости и сокращение сроков испытаний достигается применением автоматизированных экспериментальных комплексов. Такой комплекс включает испытательные стенды с автоматизированной установкой режимов (позволяет имитировать реальные режимы работы), автоматически обрабатывает результаты, ведет статистический анализ и документирует исследования. Но велика и ответственность инженера в этих исследованиях: четкое поставленные цели испытаний и правильно принятое решение позволяют точно найти слабое место изделия, сократить затраты на доводку и итерационность процесса проектирования.

Прежде чем перейти к описанию конкретных используемых в психологии планов, перечислим принципы, на которые опирается построение экспериментальных схем.

1. Эксперимент возможен только в том случае, если имеется более чем одно условие НП. Вывод о результате действия НП основывается на сравнении показателей ЗП в отличающихся друг от друга условиях («контрольном» и «экспериментальном», «активном» и «пассивном» или в нескольких отличающихся по заданному критерию условиях).
2. Фиксация и измерение переменных осуществляются в классификации шкал, предложенной Стивенсом: наименований, порядка, интервалов и отношений. Вид переменной (учебные классы, градации яркости светового пятна и т.д.) не задает, однако, способа ее измерения (на качественных или количественных уровнях). Обычно «количественным» экспериментом называют такой, где именно НП измерена количественно.
3. Эксперимент возможен только в случае функционального контроля уровней НП. Это может быть изменение характеристик физических стимулов, управление условиями (и ситуациями) или контроль путем подбора состава групп. В эксперименте обычно используются стратегии уравнивания групп, и испытуемые эквивалентных групп попадают в разные экспериментальные условия. Обеспечение неравенства групп как способа задания НП (пол, возраст, личностные свойства и т.п.) принимает форму квазиэксперимента, или эксперимента с ограничениями форм контроля. Если изменения НП не зависят от исследователя, а берутся «готовыми» (например, как результаты психодиагностики), то у исследователя не может быть уверенности в том, что именно выбранная НП определила показатели ЗП.
4. Факторные (мультивариативные) эксперименты, включающие управление более чем одной НП, строятся как комбинации, повторы (репликации) и другие видоизменения исходных планов с одной НП. Статистические приемы обработки данных могут при этом как предполагать, так и исключать взаимодействия между отдельными переменными.
5. Вводимое экспериментальное воздействие выступает в планах, или схемах, в качестве НП даже в том случае, когда испытуемые не воспринимают разницы условий. Часто только после эксперимента делается вывод, можно ли осуществленную манипуляцию условиями рассматривать как «воздействие» или функциональный контроль НП не имеет результатом действие этой переменной.

Надёжности и точности в исследовании, предусмотреть нюансы, за которыми сложно уследить при бытовом «спонтанном экспериментировании». Зачастую, чтобы скорректировать план, экспериментаторы проводят так называемое пилотное, или пробное, исследование, которое можно рассматривать как «черновик» будущего научного эксперимента.

Энциклопедичный YouTube

1 / 5

Экспериментальная психология

Центральный композитный план (Планирование эксперимента DOE)

Социальная психология. Современный фашизм в эксперименте Джонса "Третья волна"

Психологическое наполнение признаков Аугустинавичюте-Рейнина. Что показал эксперимент (и не только)

BBC - Он и Она - Секреты отношений. Часть 1

Субтитры

Основные вопросы, на которые отвечает экспериментальный план

Экспериментальный план создаётся для того, чтобы ответить на основные вопросы о:

Одним из самых важных вопросов, на которые должен ответить экспериментальный план, - определить, в какой последовательности должно происходить изменение рассматриваемых стимулов (независимых переменных), воздействующих на зависимую переменную . Такое воздействие может варьироваться от простой схемы «A 1 -A 2 », где A 1 - первое значение стимула, A 2 - второе значение стимула, до более сложных, таких, как «A 1 -A 2 -A 1 -A 2 », и т. д. Последовательность предъявления стимулов - очень важный вопрос, напрямую касающийся соблюдения валидности исследования: к примеру, если постоянно предъявлять человеку один и тот же стимул, он может стать менее восприимчив к нему.

Этапы планирования

Планирование включает в себя два этапа :

Содержательное планирование эксперимента:
- Определение ряда теоретических и экспериментальных положений, образующих теоретическую основу исследования.
- Формулировка теоретических и экспериментальных гипотез исследования.
- Выбор необходимого метода эксперимента.
- Решение вопроса выборки испытуемых:
  - Определение состава выборки.
  - Определение объёма выборки.
  - Определение способа формирования выборки.
Формальное планирование эксперимента:
- Достижение возможности сравнения результатов.
- Достижение возможности обсуждения полученных данных.
- Обеспечение экономичного проведения исследования.

Главной целью формального планирования считается исключение максимально возможного числа причин искажения результатов.

Виды планов

Простые планы

Простые планы , или однофакторные, предусматривают изучение влияния на зависимую переменную только одной независимой переменной. Преимущество таких планов состоит в их эффективности при установлении влияния независимой переменной, а также в лёгкости анализа и интерпретации результатов. Недостаток заключается в невозможности сделать вывод о функциональной зависимости между независимой и зависимой переменными.

Опыты с воспроизводимыми условиями

Планы для многоуровневых экспериментов

Если в экспериментах используется одна независимая переменная, ситуация, когда изучаются только два её значения, считается скорее исключением, чем правилом. В большинстве однофакторных исследований три или более значений независимой переменной, - такие планы часто называют однофакторными многоуровневыми . Такие планы могут использоваться как для исследования нелинейных эффектов (то есть случаев, когда независимая переменная принимает более двух значений), так и для проверки альтернативных гипотез . Преимущество таких планов - в возможности определить вид функциональной зависимости между независимой и зависимой переменными. Недостаток, однако же, заключается в больших временных затратах, а также в необходимости привлечь больше участников.

Факторные планы

Факторные планы подразумевают использование более чем одной независимой переменной. Таких переменных, или факторов , может быть сколько угодно, однако обычно ограничиваются использованием двух, трёх, реже - четырёх .

Факторные планы описываются с помощью системы нумерации, показывающей количество независимых переменных и количество значений (уровней), принимаемых каждой переменной. Например, факторный план 2х3 («два на три») имеет две независимые переменные (факторы), первая из которых принимает два значения («2»), а вторая - три значения («3»); факторный план 3х4х5 имеет соответственно три независимые переменные, принимающие «3», «4» и «5» значений соответственно .

В эксперименте, проводимом по факторному плану 2х2, допустим, один фактор, A, может принимать два значения - A 1 и A 2 , а другой фактор, B, может принимать значения B 1 и B 2 . В течение эксперимента согласно плану 2х2 должно быть проведено четыре опыта:

A 1 B 1
A 1 B 2
A 2 B 1
A 2 B 2

Порядок следования опытов может быть различным в зависимости от целесообразности, определяемой задачами и условиями каждого конкретного эксперимента.

Квазиэкспериментальные планы

Квазиэкспериментальные планы - планы для экспериментов, в которых вследствие неполного контроля за переменными нельзя сделать выводы о существовании причинно-следственной связи . Понятие квазиэкспериментального плана было введено Кэмпбеллом и Стэнли в работе «Experimental and quasi-experimental designs for research» (Cambell, D. T. & Stanley, J. C., ). Это делалось с целью преодоления некоторых проблем, встававших перед психологами, которые желали провести исследование в менее строгой обстановке, чем лабораторная . Квазиэкспериментальные планы часто применяются в прикладной психологии .

Виды квазиэксперементальных планов:

1. Планы эксперимента для неэквивалентных групп

2. Планы дискретных временных серий.

Типы:

1. Эксперимент по плану временных серий

2. План серий временных выборок

3. План серий эквивалентных воздействий

4. План с неэквивалентной контрольной группой

5. Сбалансированные планы.

Планы ex post facto

Исследования, в которых сбор и анализ данных производится после того, как событие уже свершилось, называемые исследованиями ex post facto , многие специалисты относят к квазиэкспериментальным . Такие исследования часто осуществляются в социологии, педагогике , клинической психологии и нейропсихологии . Суть исследования ex post facto состоит в том, что экспериментатор сам не воздействует на испытуемых: в качестве воздействия выступает некоторое реальное событие из их жизни.

В нейропсихологии, к примеру, долгое время (и даже сегодня) исследования основывались на парадигме локализационизма, которая выражается в подходе «локус - функция» и утверждает, что поражения определённых структур позволяют выявить локализацию психических функций - конкретный материальный субстрат , в котором они «находятся», в мозге [см. А. Р. Лурия, «Поражения мозга и мозговая локализация высших функций» ; подобные исследования можно отнести к исследованиям ex post facto .

При планировании исследования ex post facto имитируется схема строгого эксперимента с уравниванием или рандомизацией групп и тестированием после воздействия .

Планы экспериментов с малым N

Планы с малым N также называют «планами с одним субъектом », так как индивидуально рассматривается поведение каждого испытуемого. Одной из главных причин использования экспериментов с малым N считается невозможность в некоторых случаях применить результаты, полученные из обобщений на больших группах людей, ни к одному из участников индивидуально (что, таким образом, приводит к нарушению индивидуальной валидности) .

Корреляционное исследование - исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи (корреляции) между несколькими (двумя или более) переменными. От квазиэкспериментального план такого исследования отличается тем, что в нём отсутствует управляемое воздействие на объект исследования .

В корреляционном исследовании учёный выдвигает гипотезу о наличии статистической связи между несколькими психическими свойствами индивида или между определёнными внешними уровнями и психическими состояниями, при этом предположения о причинной зависимости не обсуждаются . Испытуемые должны быть в эквивалентных неизменных условиях. В общем виде план такого исследования можно описать как PxO («испытуемые» x «измерения») .

Виды корреляционных исследований

Сравнение двух групп
Одномерное исследование
Корреляционное исследование попарно эквивалентных групп
Многомерное корреляционное исследование
Структурное корреляционное исследование
Лонгитюдное корреляционное исследование *

* Лонгитюдные исследования считаются промежуточным вариантом между квазиэкспериментом и корреляционным исследованием.

1 Планы для одной независимой переменной

План «истинного» экспериментального исследования отличается от других следующими важнейшими признаками:

1) применением одной из стратегий создания эквивалентных групп, чаще всего - рандомизации;

2) наличием экспериментальной и, как минимум, одной контрольной группы;

3) завершением эксперимента тестированием и сравнением поведения группы, получившей экспериментальное воздействие (X1), с группой, не получившей воздействия Х0.

Классическим вариантом плана является план для 2 независимых групп. В психологии планирование эксперимента начинает применяться с первых десятилетий XXв.

Существуют три основные версии этого плана. При их описании будем пользоваться символизацией, предложенной Кэмпбеллом.

Таблица 5.1

Здесь R- рандомизация, Х- воздействие, О1 - тестирование первой группы, О2 - тестирование второй группы.

1) План для двух рандомизированных групп с тестированием после воздействия. Его автор - известный биолог и статистик Р. А. Фишер . Структура плана показана в табл. 5.1.

Равенство экспериментальной и контрольной групп является совершенно необходимым условием применения этого плана. Чаще всего для достижения эквивалентности групп применяют процедуру рандомизации (см. гл. 4). Этот план рекомендуют использовать в том случае, когда нет возможности или необходимости проводить предварительное тестирование испытуемых. Если рандомизация проведена качественно, то этот план является наилучшим, позволяет контролировать большинство источников артефактов; кроме того, для него применимы различные варианты дисперсионного анализа.

После проведения рандомизации или иной процедуры уравнивания групп осуществляется экспериментальное воздействие. В простейшем варианте используется лишь две градации независимой переменной: есть воздействие, нет воздействия.

Если необходимо использовать не 1 уровень воздействия, то применяются планы с несколькими экспериментальными группами (по числу уровней воздействия) и одной контрольной.

Если же нужно контролировать влияние одной из дополнительных переменных, то применяют план с 2 контрольными группами и 1-й экспериментальной. Измерение поведения дает материал для сравнения 2 групп. Обработка данных сводится к применению традиционных для математической статистики оценок. Рассмотрим случай, когда измерение проводится интервальной шкалой. Для оценки различия в средних показателях групп используют t-критерий Стьюдента. Оценивание различий в вариации измеряемого параметра между экспериментальной и контрольной группами проводится с помощью критерия F. Соответствующие процедуры подробно рассмотрены в учебниках математической статистики для психологов.

Применение плана для 2 рандомизированных групп с тестированием после воздействия позволяет контролировать основные источники внутренней невалидности (как их определяет Кэмпбелл). Поскольку предварительное тестирование отсутствует, исключен эффект взаимодействия процедуры тестирования и содержания экспериментального воздействия и сам эффект тестирования. План позволяет контролировать влияние состава групп, стихийного выбывания, влияние фона и естественного развития, взаимодействие состава группы с другими факторами, позволяет также исключить эффект регрессии за счет рандомизации и сравнения данных экспериментальной и контрольной групп. Однако при проведении большинства педагогических и социально-психологических экспериментов необходимо жестко контролировать исходный уровень зависимой переменной, будь то интеллект, тревожность, знания или статус личности в группе. Рандомизация - лучшая процедура из возможных, но она не дает абсолютной гарантии правильности выбора. Когда существуют сомнения в результатах рандомизации, применяют план с предварительным тестированием.

Таблица 5.2

2) План для двух рандомизированных групп с предварительным и итоговым тестированием. Рассмотрим структуру этого плана (табл. 5.2).

План с предварительным тестированием пользуется популярностью у психологов. Биологи больше доверяют процедуре рандомизации. Психолог прекрасно знает, что каждый человек своеобразен и отличен от других, и подсознательно стремится уловить эти различия с помощью тестов, не доверяя механической процедуре рандомизации. Однако гипотеза большинства психологических исследований, особенно в области психологии развития («формирующий эксперимент»), содержит прогноз определенного изменения свойства индивида под влиянием внешнего фактора. Поэтому план «тест-воздействие-ретест» с применением рандомизации и контрольной группой очень распространен.

При отсутствии процедуры уравнивания групп этот план преобразуется в квазиэкспериментальный (он будет рассмотрен в разделе 5.2).

Главный источник артефактов, нарушающий внешнюю валидность процедуры, - взаимодействие тестирования с экспериментальным воздействием. Например, тестирование уровня знаний по определенному предмету перед проведением эксперимента по заучиванию материала может привести к актуализации исходных знаний и к общему повышению продуктивности запоминания. Достигается это за счет актуализации мнемонических способностей и создания установки на запоминание.

Однако с помощью этого плана можно контролировать другие внешние перемен-ные. Контролируется фактор «истории» («фона»), так как в промежутке между первым и вторым тестированием обе группы подвергаются одинаковым («фоновым») воздействиям. Вместе с тем Кэмпбелл отмечает необходимость контроля «внутригрупповых событий», а также эффекта неодновременности тестирования в обеих группах. В реальности невозможно добиться, чтобы тест и ретест проводились в них одновременно. План превращается в квазиэкспериментальный, например:

Обычно контроль неодновременности тестирования осуществляют два экспериментатора, проводящие тестирование двух групп одновременно. Оптимальной считается процедура рандомизации порядка тестирования: тестирование членов экспериментальной и контрольной групп производится в случайном порядке. То же самое делается и с предъявлением - не предъявлением экспериментального воздействия. Разумеется, такая процедура требует наличия значительного числа испытуемых в экспериментальной и контрольной выборках (не менее 30-35 человек в каждой).

Естественное развитие и эффект тестирования контролируются за счет того, что они одинаково проявляются в экспериментальной и контрольной группах, а эффекты состава групп и регрессии [Кэмпбелл, 1980] контролируются при помощи процедуры рандомизации.

Результаты применения плана «тест-воздействие-ретест» представлены в таблице.

При обработке данных обычно используются параметрические критерии t и F (для данных в интервальной шкале). Вычисляются три значения t: сравнение 1) О1 и О2 ; 2) О3 и О4; 3) О2 и О4. Гипотезу о значимом влиянии независимой переменной на зависимую можно принять в том случае, если выполняются два условия: а) различия между О1 и О2 значимы, а между О3 и О4 - незначимы и б) различия между О2 и О4 значимы. Гораздо удобнее сравнивать не абсолютные значения, а величины прироста показателей от первого тестирования ко второму (δ(i)). Вычисляются δ(i12) и δ(i34) и сравниваются по t-критерию Стьюдента. В случае значимости различий принимается экспериментальная гипотеза о влиянии независимой переменной на зависимую (табл. 5.3).

Рекомендуется также применять ковариационный анализ по Фишеру. При этом показатели предварительного тестирования берутся в качестве дополнительной переменной, а испытуемые разбиваются на подгруппы в зависимости от показателей предварительного тестирования. Тем самым получается следующая таблица для обработки данных по методу MANOVA (табл. 5.4).

Применение плана «тест-воздействие-ретест» позволяет контролировать влияние «побочных» переменных, нарушающих внутреннюю валидность эксперимента.

Внешняя валидность связана с возможностью переноса данных на реальную ситуацию. Главным же моментом, отличающим экспериментальную ситуацию от реальной, является введение предварительного тестирования. Как мы уже отметили, план «тест-воздействие-ретест» не позволяет контролировать эффект взаимодействия тестирования и экспериментального воздействия: предварительно тестируемый испытуемый «сенсибилизируется» - становится более чувствительным к воздействию, так как мы измеряем в эксперименте именно ту зависимую переменную, на которую собираемся воздействовать с помощью варьирования независимой переменной.

Таблица 5.5

Для контроля внешней валидности используется план Р. Л. Соломона, который был предложен им в 1949 г.

3) План Соломона используется при проведении эксперимента на четырех группах:

1. Эксперимент1: R О1 Х О2

2. Контроль 1: R О3 О4

3. Эксперимент 2: R X О5

4. Контроль 2: R О6

План включает исследование двух экспериментальных и двух контрольных групп и по сути является мультигрупповым (типа 2 х 2), но для удобства изложения он рассматривается в этом разделе.

План Соломона представляет собой объединение двух ранее рассмотренных планов: первого, когда не производится предварительное тестирование, и второго - «тест-воздействие-ретест». С помощью «первой части» плана можно контролировать эффект взаимодействия первого тестирования и экспериментального воздействия. Соломон с помощью своего плана выявляет эффект экспериментального воздействия четырьмя разными способами: при сравнении 1) О2 - О1 ; 2) О2 - О4 ; 3) О5 - О6 и 4) О5 - О3 .

Если провести сравнение О6 с О1 и О3, то можно выявить совместное влияние эффектов естественного развития и «истории» (фоновых воздействий) на зависимую переменную.

Кэмпбелл, критикуя предложенные Соломоном схемы обработки данных, предлагает не обращать внимания на предварительное тестирование и свести данные к схеме 2 х 2, пригодной для применения дисперсионного анализа (табл. 5.5).

Сравнение средних по столбцам позволяет выявлять эффект экспериментального воздействия - влияние независимой переменной на зависимую. Средние по строкам показывают эффект предварительного тестирования. Сравнение средних по ячейкам характеризует взаимодействие эффекта тестирования и экспериментального воздействия, что свидетельствует о мере нарушения внешней валидности.

В том случае, когда эффектами предварительного тестирования и взаимодействия можно пренебречь, переходят к сопоставлению О4 и О2 методом ковариационного анализа. В качестве дополнительной переменной берутся данные предварительного тестирования по схеме, приведенной для плана «тест-воздействие-ретест».

Наконец, в некоторых случаях необходимо проверить сохранение во времени эф-фекта воздействия независимой переменной на зависимую: например, выяснить, приводит ли новый метод обучения к долгосрочному запоминанию материала Для этих целей применяют следующий план:

1 Эксперимент 1 R О1 Х О2

2 Контроль 1 R О3 О4

3 Эксперимент 2 R О5 Х О6

4 Контроль 2 R О7 О8

2. Планы для одной независимой переменной и нескольких групп

Иногда сравнения двух групп недостаточно для подтверждения или опровержения экспериментальной гипотезы. Такая проблема возникает в двух случаях: а) при необходимости контроля внешних переменных; б) при необходимости выявления количественных зависимостей между двумя переменными.

Для контроля внешних переменных используются различные варианты факторного экспериментального плана. Что касается выявления количественной зависимости между двумя переменными, то необходимость ее установления возникает при проверке «точной» экспериментальной гипотезы. В эксперименте с участием двух групп в лучшем случае можно установить факт причинной связи между независимой и зависимой переменными. Но между двумя точками можно провести бесконечное множество кривых. Для того чтобы убедиться в наличии линейной зависимости между двумя переменными, следует иметь хотя бы три точки, соответствующие трем уровням независимой переменной. Следовательно, экспериментатор должен выделить несколько рандомизированных групп и поставить их в различные экспериментальные условия. Простейшим вариантом является план для трех групп и трех уровней независимой переменной:

Эксперимент 1: R Х1 О1

Эксперимент 2: R Х2 О2

Контроль: R О3

Контрольная группа в данном случае - это третья экспериментальная группа, для которой уровень переменной Х = 0.

При реализации этого плана каждой группе предъявляется лишь один уровень независимой переменной. Возможно и увеличение числа экспериментальных групп соответственно числу уровней независимой переменной. Для обработки данных, полученных с помощью такого плана, применяются те же статистические методы, что были перечислены выше.

Простые «системные экспериментальные планы», как ни удивительно, очень редко используются в современных экспериментальных исследованиях. Может быть, исследователи «стесняются» выдвигать простые гипотезы, помня о «сложности и многомерности» психической реальности? Тяготение к использованию планов с многими независимыми переменными, более того - к проведению многомерных экспериментов, не обязательно способствует лучшему объяснению причин человеческого поведения. Как известно, «умный поражает глубиной идеи, а дурак - размахом строительства». Лучше предпочесть простое объяснение любому сложному, хотя регрессионные уравнения, где все всему равняется, и запутанные корреляционные графы могут произвести впечатление на некоторые диссертационные советы.

3 Факторные планы

Факторные эксперименты применяются тогда, когда необходимо проверить сложные гипотезы о взаимосвязях между переменными. Общий вид подобной гипотезы: «Если А1, А2,..., Аn, то В». Такие гипотезы называются комплексными, комбинированными и др. При этом между независимыми переменными могут быть различные отношения: конъюнкции, дизъюнкции, линейной независимости, аддитивные или мультипликативные и др. Факторные эксперименты являются частным случаем многомерного исследования, в ходе проведения которого пытаются установить отношения между несколькими независимыми и несколькими зависимыми переменными. В факторном эксперименте проверяются одновременно, как правило, два типа гипотез:

1) гипотезы о раздельном влиянии каждой из независимых переменных;

2) гипотезы о взаимодействии переменных, а именно - как присутствие одной из независимых переменных влияет на эффект воздействия на другой.

Факторный эксперимент строится по факторному плану. Факторное планирование эксперимента заключается в том, чтобы все уровни независимых переменных сочетались друг с другом. Число экспериментальных групп равно числу сочетаний уровней всех независимых переменных.

Сегодня факторные планы наиболее распространены в психологии, поскольку простые зависимости между двумя переменными в ней практически не встречаются.

Существует множество вариантов факторных планов, но на практике применяются далеко не все. Чаще всего используются факторные планы для двух независимых переменных и двух уровней типа 2х2. Для составления плана применяется принцип балансировки. План 2х2 используется для выявления эффекта воздействия двух независимых переменных на одну зависимую. Экспериментатор манипулирует возможными сочетаниями переменных и уровней. Данные приведены в простейшей таблице (табл. 5.6).

Реже используются четыре независимые рандомизированные группы. Для обработки результатов применяется дисперсионный анализ по Фишеру.

Так же редко используются другие версии факторного плана, а именно: 3х2 или 3х3. План 3х2 применяется в тех случаях, когда нужно установить вид зависимости одной зависимой переменной от одной независимой, а одна из независимых переменных представлена дихотомическим параметром. Пример такого плана - эксперимент по выявлению воздействия внешнего наблюдения на успех решения интеллектуальных задач. Первая независимая переменная варьируется просто: есть наблюдатель, нет наблюдателя. Вторая независимая переменная - уровни трудности задачи. В этом случае мы получаем план 3х2 (табл. 5.7).

Вариант плана 3х3 применяется в том случае, если обе независимые переменные имеют несколько уровней и есть возможность выявить виды связи зависимой переменной от независимых. Этот план позволяет выявлять влияние подкрепления на успешность выполнения задании разной трудности (табл. 5.8).

В общем случае план для двух независимых переменных выглядит как N х М. Применимость таких планов ограничивается только необходимостью набора большого числа рандомизированных групп. Объем экспериментальной работы чрезмерно возрастает с добавлением каждого уровня любой независимой переменной.

Планы, используемые для исследования влияния более двух независимых переменных, применяются редко. Для трех переменных они имеют общий вид L х М х N.

Чаще всего применяются планы 2х2х2: «три независимые переменные - два уровня». Очевидно, добавление каждой новой переменной увеличивает число групп. Общее их число 2, где п - число переменных в случае двух уровней интенсивности и К - в случае К-уровневой интенсивности (считаем, что число уровней одинаково для всех независимых переменных). Примером этого плана может быть развитие предыдущего. В случае, когда нас интересует успешность выполнения экспериментальной серии заданий, зависящая не только от общей стимуляции, которая производится в форме наказания - удара током, но и от соотношения поощрения и нака-зания, мы применяем план 3х3х3.

Упрощением полного плана с тремя независимыми переменными вида L х М х N является планирование по методу «латинского квадрата». «Латинский квадрат» применяют тогда, когда нужно исследовать одновременное влияние трех переменных, имеющих два уровня или более. Принцип «латинского квадрата» состоит в том, что два уровня разных переменных встречаются в экспериментальном плане только один раз. Тем самым процедура значительно упрощается, не говоря о том, что экспериментатор избавляется от необходимости работать с огромными выборками.

Предположим, что у нас есть три независимые переменные, с тремя уровнями каждая:

План по методу «латинского квадрата» представлен в табл. 5.9.

Такой же прием используется для контроля внешних переменных (контрбалан-сировка). Нетрудно заметить, что уровни третьей переменной N (А, В, С,) встречаются в каждой строке и в каждой колонке по одному разу. Комбинируя результаты по строкам, столбцам и уровням, можно выявить влияние каждой из независимых переменных на зависимую, а также степень попарного взаимодействия переменных.

«Латинский квадрат» позволяет значительно сократить число групп. В частности, план 2х2х2 превращается в простую таблицу (табл. 5.10).

Применение латинских букв в клеточках для обозначения уровней 3-й переменной (А - есть, В - нет) традиционно, поэтому метод назван «латинский квадрат».

Более сложный план по методу «греко-латинского квадрата» применяется очень редко. С его помощью можно исследовать влияние на зависимую переменную четырех независимых. Суть его в следующем: к каждой латинской группе плана с тремя переменными присоединяется греческая буква, обозначающая уровни четвертой переменной.

Рассмотрим пример. У нас четыре переменные, каждая из которых имеет три уровня интенсивности. План по методу «греко-латинского квадрата» примет такой вид (табл. 5.11).

Для обработки данных применяется метод дисперсионного анализа по Фишеру. Методы «латинского» и «греко-латинского» квадрата пришли в психологию из агробиологии, но большого распространения не получили. Исключением являются некоторые эксперименты в психофизике и психологии восприятия.

Главная проблема, которую удается решить в факторном эксперименте и невозможно решить, применяя несколько обычных экспериментов с одной независимой переменной, - определение взаимодействия двух переменных.

Рассмотрим возможные результаты простейшего факторного эксперимента 2х2 с позиций взаимодействий переменных. Для этого нам надо представить результаты опытов на графике, где по оси абсцисс отложены значения первой независимой переменной, а по оси ординат - значения зависимой переменной. Каждая из двух прямых, соединяющих значения зависимой переменной при разных значениях первой независимой переменной (А), характеризует один из уровней второй независимой переменной (В). Применим для простоты результаты не экспериментального, а корреляционного исследования. Условимся, что мы исследовали зависимость статуса ребенка в группе от состояния его здоровья и уровня интеллекта. Рассмотрим варианты возможных отношений между переменными.

Первый вариант: прямые параллельны - взаимодействия переменных нет (рис. 5.1).

Больные дети имеют более низкий статус, чем здоровые, независимо от уровня интеллекта. Интеллектуалы имеют всегда более высокий статус (независимо от здоровья).

Второй вариант: физическое здоровье при наличии высокого уровня интеллекта увеличивает шанс получить более высокий статус в группе(рис 5.2).

В этом случае получен эффект расходящегося взаимодействия двух независимых переменных. Вторая переменная усиливает влияние первой на зависимую переменную.

Третий вариант: сходящееся взаимодействие - физическое здоровье уменьшает шанс интеллектуала приобрести более высокий статус в группе. Переменная «здоровье» уменьшает влияние переменной «интеллект» на зависимую переменную. Есть и другие случаи этого варианта взаимодействия:

переменные взаимодействуют так, что увеличение значения первой приводит к уменьшению влияния второй с изменением знака зависимости (рис. 5.3).

У больных детей, обладающих высоким уровнем интеллекта, меньше шанс получить высокий статус, чем у больных детей с низким интеллектом, а у здоровых - связь интеллекта и статуса позитивная.

Теоретически возможно представить, что больные дети будут иметь больший шанс получить высокий статус при высоком уровне интеллекта, чем их здоровые низкоинтеллектуальные сверстники.

Последний, четвертый, возможный вариант наблюдаемых в исследованиях отношений между независимыми переменными: случай, когда между ними существует пересекающееся взаимодействие, представленное на последнем графике (рис. 5.4).

Итак, возможны следующие взаимодействия переменных: нулевое; расходящееся (с различными знаками зависимости); пересекающееся.

Оценка величины взаимодействия проводится с помощью дисперсионного анализа, а t-критерий Стьюдента используется для оценки значимости различий групповых X.

Во всех рассмотренных вариантах планирования эксперимента применяется способ балансировки: различные группы испытуемых ставятся в разные экспериментальные условия. Процедура уравнивания состава групп позволяет производить сравнение результатов.

Однако во многих случаях требуется планировать эксперимент так, чтобы все его участники получили все варианты воздействия независимых переменных. Тогда на помощь приходит техника контрбалансировки.

Планы, в которых воплощается стратегия «все испытуемые - все воздействия», Мак-Колл называет ротационными экспериментами, а Кэмпбелл - «сбалансированными планами». Чтобы не было путаницы между понятиями «балансировка» и «контрбалансировка», будем использовать термин «ротационный план».

Ротационные планы строятся по методу «латинского квадрата», но, в отличие от рассмотренного выше примера, по строкам обозначены группы испытуемых, а не уровни переменной, по столбцам - уровни воздействия первой независимой переменной (или переменных), в клеточках таблицы - уровни воздействия второй независимой переменной.

Пример экспериментального плана для 3 групп (А, B, С) и 2 независимых переменных (X,Y) с 3 уровнями интенсивности (1-й, 2-й, 3-й) приводим ниже. Нетрудно заметить, что этот план можно переписать и так, чтобы в клеточках стояли уровни переменной Y (табл. 5.12).

Кэмпбелл включает этот план в число квазиэкспериментальных на основании того, что неизвестно, контролируется ли с его помощью внешняя валидность. Действительно, вряд ли в реальной жизни испытуемый может получить серию таких воздействий, как в эксперименте.

Что касается взаимодействия состава групп с другими внешними переменными, источниками артефактов, то рандомизация групп, согласно утверждению Кэмпбелла, должна минимизировать влияние этого фактора.

Суммы по столбцам в ротационном плане свидетельствуют о различиях в уровне эффекта при разных значениях одной независимой переменной (X или Y), а суммы по строкам должны характеризовать различия между группами. Если группы рандомизированы удачно, то межгрупповых различий быть не должно. Если же состав группы является дополнительной переменной, возникает возможность ее проконтролировать. Схема контрбалансировки не позволяет избежать эффекта тренировки, хотя данные многочисленных экспериментов с применением «латинского квадрата» не позволяют делать такой вывод.

Подводя итог рассмотрению различных вариантов экспериментальных планов, предлагаем их классификацию. Экспериментальные планы различаются по таким основаниям:

1. Число независимых переменных: одна или больше. В зависимости от их числа применяется либо простой, либо факторный план.

2. Число уровней независимых переменных: при 2 уровнях речь идет об установлении качественной связи, при 3 и более - количественной связи.

3. Кто получает воздействие. Если применяется схема «каждой группе - своя комбинация», то речь идет о межгрупповом плане. Если же применяется схема «все группы - все воздействия», то речь идет о ротационном плане. Готтсданкер называет его кросс-индивидуальным сравнением.

Схема планирования эксперимента может быть гомогенной или гетерогенной (в зависимости от того, равно или не равно число независимых переменных числу уровней их изменения).

4 Планы экспериментов для одного испытуемого

Эксперименты на выборках с контролем переменных - ситуация, которую широкого стали использовать в психологии с 1910-1920-х гг. Особое распространение экспериментальные исследования на уравненных группах получили после создания выдающимся биологом и математиком Р. А. Фишером теории планирования экспериментов и обработки их результатов (дисперсионный и ковариационный анализы). Но психологи применяли эксперимент задолго до появления теории планирования исследования выборок. Первые экспериментальные исследования проводились с участием одного испытуемого - им являлся сам экспериментатор либо его ассистент. Начиная с Г. Фехнера (1860), в психологию пришла техника экспериментирования для проверки теоретических количественных гипотез.

Классическим экспериментальным исследованием одного испытуемого стала работа Г. Эббингауза, которая была проведена в 1913 г. Эббингауз исследовал явление забывания с помощью заучивания бессмысленных слогов (изобретенных им же). Он заучивал серию слогов, а затем пытался их воспроизвести через определенное время. В итоге была получена классическая кривая забывания: зависимость объема сохраненного материала от времени, прошедшего с момента заучивания (рис. 5.5).

В эмпирической научной психологии взаимодействуют и борются три исследовательские парадигмы. Представители одной из них, традиционно идущей от естественнонаучного эксперимента, считают единственно достоверным знанием только то, которое добывается в экспериментах на эквивалентных и репрезентативных выборках. Основной аргумент сторонников этой позиции - необходимость контроля внешних переменных и нивелирования индивидуальных различий для нахождения общих закономерностей.

Представители методологии «экспериментального анализа поведения» критикуют сторонников статистического анализа и планирования экспериментов на выборках. По их мнению, нужно проводить исследования с участием одного испытуемого и с применением определенных стратегий, которые позволят в ходе эксперимента редуцировать источники артефактов. Сторонниками этой методологии являются такие известные исследователи, как Б. Ф. Скиннер, Г. А. Мюррейидр.

Наконец, классическое идиографическое исследование противопоставляется как экспериментам с участием одного испытуемого, так и планам, изучающим поведение в репрезентативных выборках. Идиографическое исследование предусматривает изучение индивидуальных случаев: биографий или особенностей поведения отдельных людей. Примером являются замечательные работы Лурии «Потерянный и возвращенный мир» и «Маленькая книжка о большой памяти».

Во многих случаях исследования, проводимые с участием одного испытуемого, являются единственно возможным вариантом. Методология исследования одного испытуемого разрабатывалась в 1970-1980-е гг. многими авторами: А. Кезданом, Т. Кратохвиллом, Б. Ф. Скиннером, Ф.-Дж. МакГиганом и др.

В ходе эксперимента выявляются два источника артефактов: а) ошибки в стратегии планирования и в проведении исследования; б) индивидуальные различия.

Если создать «правильную» стратегию проведения эксперимента с одним испытуемым, то вся проблема сведется лишь к учету индивидуальных различий. Эксперимент с одним испытуемым возможен тогда, когда: а) индивидуальными различиями можно пренебречь в отношении переменных, изучаемых в эксперименте, все испытуемые признаются эквивалентными, поэтому возможен перенос данных на каждого члена популяции; б) испытуемый уникален, и проблема прямого переноса данных неактуальна.

Стратегия экспериментирования с одним испытуемым разработана Скиннером для исследования процесса обучения. Данные в ходе исследования представляются в форме «кривых обучения» в системе координат «время» - «общее число ответов» (кумулятивная кривая). Кривая обучения первоначально анализируется визуально; рассматриваются ее изменения во времени. Если функция, описывающая кривую, изменяется при изменении воздействия А на В, то это может свидетельствовать о наличии причинной зависимости поведения от внешних воздействий (А или В).

Исследование по схеме «один испытуемый» (single-subject research) называется также планированием временных серий. Основным показателем влияния независимой переменной на зависимую при реализации такого плана является изменение характера ответов испытуемого от воздействия на него изменения условий эксперимента во времени. Существует ряд основных схем применения этой парадигмы. Простейшая стратегия - схема А-В. Испытуемый первоначально выполняет деятельность в условиях А, а затем - в условиях В (см. рис. 5.8).

При использовании этого плана возникает закономерный вопрос: а сохранила бы кривая ответов прежний вид, если бы не было воздействия? Проще говоря, эта схема не контролирует эффект плацебо. Кроме того, неясно, что привело к эффекту: может быть, воздействие оказала не переменная В, а какая-либо иная переменная, не учтенная в эксперименте.

Поэтому чаще применяется другая схема: А-В-А. Первоначально регистрируется поведение испытуемого в условиях А, затем условия изменяются (В), а на третьем этапе происходит возвращение прежних условий (А). Изучается изменение функциональной связи между независимой и зависимой переменными. Если при изменении условий на третьем этапе восстанавливается прежний вид функциональной зависимости между зависимой и зависимой переменными, то независимая переменная считается причиной, которая может модифицировать поведение исп ытуемого (рис. 5.9).

Однако и первый, и второй варианты планирования временных серий не позволяют учесть фактор кумуляции воздействий. Возможно, к эффекту приводит сочетание - последовательность условий (А и В). Неочевидно и то, что после возврата к ситуации В кривая примет тот же вид, каким он был при первом предъявлении условий В.

Примером плана, который дважды воспроизводит один и тот же экспериментальный эффект, является схема А-В-А-В. Если при 2-м переходе от условий А к условиям В будет воспроизведено изменение функциональной зависимости ответов испытуемого от времени, то это станет доказательством экспериментальной гипотезы: независимая переменная (А, В) влияет на поведение испытуемого.

Рассмотрим простейший случай. В качестве зависимой переменной выберем общий объем знаний студента. В качестве независимой - занятия физкультурой по утрам (например, гимнастикой ушу). Предположим, что комплекс ушу благоприятно влияет на общее психическое состояние студента и способствует лучшему запоминанию (рис. 5.10).

Очевидно, что занятие гимнастикой благоприятно отразилось на обучаемости.

Существуют различные варианты планирования по методу временных серий. Различают схемы регулярного чередования серий (АВ-АВ), серии стохастических последовательностей и схемы позиционного уравнивания (пример: АВВА). Модификациями схемы А-В-А-В являются схема А-В-А-В-А или более длительная: А- В- А- В- А- В- А.

Применение более «длинных» временных планов увеличивает гарантию обнаружения эффекта, но приводит к утомлению испытуемого и другим кумулятивным эффектам.

Кроме того, план А-В-А-В и его различные модификации не снимают три важнейшие проблемы:

1. Что было бы с испытуемым, если бы никакого воздействия не было (эффект плацебо)?

2. Не является ли последовательность воздействий А-В сама по себе еще одним воздействием (побочной переменной)?

3. Какая причина привела к эффекту: если на месте В не было бы воздействия, повторился бы эффект?

Для контроля эффекта плацебо в серию А-В-А-В включают условия, «имитирующие» либо воздействие А, либо воздействие В. Рассмотрим решение последней проблемы. Но сначала проанализируем такой случай: допустим, студент постоянно занимается ушу. Но периодически на стадионе или в спортивном зале появляется симпатичная девушка (просто зритель) - воздействие В. План А- В- А- В выявил повышение эффективности учебных занятий студента в периоды появления переменной В. Что является причиной: присутствие зрителя как такового или конкретной симпатичной девушки? Для проверки гипотезы о наличии конкретной причины эксперимент строится по следующей схеме: А-В-А-С-А. Например, в четвертый временной период на стадион приходит другая девушка или скучающий пенсионер. Если эффективность занятий значительно снизится (не та мотивация), то это будет свидетельствовать о конкретной причине ухудшения обучаемости. Возможен и вариант проверки воздействия условия А (занятия ушу без зрителей). Для этого надо применить план А-В-С-В. Пусть студент какое-то время в отсутствие девушки прекратит занятия. Если же повторное появление ее на стадионе приведет к тому же эффекту, что и в первый раз, то причина повышения успеваемости - в ней, а не только в занятиях ушу (рис. 5.11).

Прошу не принимать пример всерьез. В действительности происходит как раз все наоборот: увлечение девушками резко снижает успеваемость студентов.

Существует множество приемов проведения исследований с участием одного испытуемого. Примером развития плана А-В является «план альтернативных воздействий». Воздействия А и В рандомизированно распределяются во времени, например по дням недели, если речь идет о разных способах избавления от курения. Затем определяются все моменты, когда было воздействие А; строится кривая, соединяющая соответствующие последовательные точки. Выделяются все моменты времени, когда было «альтернативное» воздействие В, и в порядке следования во времени также соединяются; строится вторая кривая. Затем сравниваются обе кривые и выявляется, какое воздействие более эффективно. Эффективность определяется по величине роста или падения кривой (рис. 5.12).

Синонимами термина «план альтернативных воздействий» являются: «план сравнения серий», «план синхронизированных воздействий», «план множественных расписаний» и т.д.

Другой вариант - реверсивный план. Он применяется для исследования двух альтернативных форм поведения. Первоначально регистрируется базовый уровень проявления обеих форм поведения. Первое поведение может актуализироваться с помощью специфического воздействия, а второе, несовместимое с ним, провоцируется одновременно другим типом воздействия. Эффект двух воздействий оценивается. Через определенное время сочетание воздействий реверсируется так, что первая форма поведения получает воздействие, которое инициировало вторую форму поведения, а вторая - воздействие, релевантное первой форме поведения. Такой план используется, например, при исследовании поведения маленьких детей (рис.5.13).

В психологии обучения применяют метод смены критериев, или «план возрастания критериев». Суть его состоит в том, что регистрируется изменение поведения испытуемого в ответ на прирост (фазы) воздействия. Увеличение регистрируемого параметра поведения фиксируется, и следующее воздействие осуществляется лишь после выхода испытуемого на заданный уровень критерия. После стабилизации уровня исполнения испытуемому предъявляют следующую градацию воздействия. Кривая успешного эксперимента (подтверждающего гипотезу) напоминает сбитую каблуками лестницу, где начало ступени совпадает с началом уровня воздействия, а конец ее - с выходом испытуемого на очередной критерий.

Способом, позволяющим нивелировать «эффект последовательности», является инверсия последовательности воздействий - план А-В-В-А. Эффекты последовательности связаны с влиянием предшествующего воздействия на последующее (иное название - эффекты порядка, или эффекты переноса). Перенос может быть положительным или отрицательным, симметричным или асимметричным. Последовательность А-В-В-А называется позиционно уравненной схемой. Как отмечает Готтсданкер, воздействие переменных А и В обусловлено эффектами раннего или позднего переноса. Воздействие А связано с поздним переносом, а В - с ранним. Кроме того, если присутствует кумулятивный эффект, то два идущих подряд воздействия В могут влиять на субъекта как единое суммарное воздействие. Эксперимент может быть удачным лишь в том случае, если эти эффекты незначительны. Рассмотренные выше варианты планов с регулярным чередованием или со случайными последовательностями чаще всего очень длинны, поэтому их трудно реализовать.

Если подвести краткий итог, можно сказать, что схемы предъявления воздействия применяются в зависимости от возможностей, которые есть у экспериментатора.

Случайная последовательность воздействий получается путем рандомизации заданий. Ее применяют в экспериментах, требующих большого числа проб. Случайное чередование воздействий гарантирует от проявления эффектов последовательности.

При малом числе проб рекомендуется схема регулярного чередования типа А- В-А-В. Следует обратить внимание на периодичность фоновых воздействий, которые могут совпадать с действием независимой переменной. Например, если давать один тест на интеллект утром, а второй - всегда вечером, то под влиянием утомления эффективность выполнения второго теста будет понижаться.

Позиционно уравненная последовательность может быть пригодна лишь тогда, когда число воздействий (заданий) мало и влияние раннего и позднего переноса несущественно.

Но ни одна из схем не исключает проявления дифференцированного асимметричного переноса, когда влияние предшествующего воздействия А на эффект от воздействия В больше, чем влияние предшествующего воздействия В на эффект от воздействия А (или же наоборот).

Разнообразные варианты планов для одного испытуемого обобщили Д. Барлоу и М. Херсен в монографии «Экспериментальные планы для единичных случаев» (Single case experimental designs, 1984)(табл. 5.13).

Таблица 5.13

Основные артефакты в исследовании на одном испытуемом практически неустранимы. Трудно представить, как можно устранить эффекты, связанные с необратимостью событий. Если эффекты порядка или взаимодействия переменных в какой-то мере поддаются контролю, то уже упомянутый эффект асимметричности (дифференцированного переноса) неустраним.

Не меньше проблем возникает и при установлении изначального уровня интенсивности регистрируемого поведения (уровня зависимой переменной). Исходный уровень агрессивности, который мы зарегистрировали у ребенка в лабораторном эксперименте, может быть нетипичным для него, поскольку вызван недавними предшествующими событиями, например ссорой в семье, подавлением его активности сверстниками или воспитателями в детском саду.

Главная же проблема - возможности переноса результатов исследования одного испытуемого на каждого из представителей популяции. Речь идет об учете значимых для исследования индивидуальных различий. Теоретически возможен следующий ход: представление индивидуальных данных в «безразмерном» виде; при этом индивидуальные значения параметра нормируются на величину, равную разбросу значений в популяции.

Рассмотрим пример. В начале 1960-х гг. в лаборатории Б. Н. Теплова возникла проблема: почему все графики, описывающие изменения времени реакции в зависимости от интенсивности раздражителя, у испытуемых различны В. Д. Небылицын [Небылицын В. Д., 1966] предложил предъявлять испытуемым сигнал, который изменяется не в единицах физической интенсивности, а в единицах предварительно измеренного индивидуального абсолютного порога («один порог», «два порога» и т.д.). Результаты эксперимента блестяще подтвердили гипотезу Небылицына: кривые зависимости времени реакции от уровня воздействия, измеренного в единицах индивидуального абсолютного порога, оказались идентичными у всех испытуемых.

Аналогичная схема применяется и при интерпретации данных. В Институте психологии РАН А. В. Дрынков проводил исследования процесса формирования простых искусственных понятий. Кривые научения показывали зависимость успешности от времени. Они оказались различными у всех испытуемых: описывались степенными функциями. Дрынков предположил, что нормировка индивидуальных показателей на величину начального уровня обученности (по оси Y) и на индивидуальное время достижения критерия (по оси X) позволяет получить функциональную зависимость успешности от времени, одинаковую для всех испытуемых. Это подтвердилось: показатели изменения индивидуальных результатов испытуемых, представленные в «безразмерном» виде, подчинялись степенному квадратному закону.

Следовательно, выявление общей закономерности путем нивелирования индивидуальных различий решается каждый раз на основе содержательной гипотезы о влиянии дополнительной переменной на интериндивидуальную вариацию результатов эксперимента.

Остановимся еще раз на одной особенности экспериментов с участием одного испытуемого. Результаты этих экспериментов очень зависят от предубеждений экспериментатора и отношении, которые складываются между ним и испытуемым. При проведении длительной серии последовательных воздействии экспериментатор может неосознанно или осознанно действовать так, чтобы у испытуемого актуализировалось поведение, подтверждающее экспериментальную гипотезу. Вот почему в подобного рода исследованиях рекомендуют применять «слепые опыты» и «двойной слепой опыт». При первом варианте экспериментатор знает, а испытуемый не знает, когда последний получает плацебо, а когда - воздействие. «Двойной слепой опыт» состоит в том, что эксперимент проводит исследователь, незнакомый с гипотезой и не знающий, когда испытуемый получает плацебо или воздействие.

Эксперименты с участием одного испытуемого играют важную роль в психофизиологии, психофизике, психологии научения, когнитивной психологии. Методология таких экспериментов проникла в психологию программированного обучения и социального управления, в клиническую психологию, особенно - в поведенческую терапию, главным пропагандистом которой выступает Айзенк[Айзенк Г. Ю., 1999].

Экспериментом в широком смысле мы называем эмпирическое исследование, организация и проведение которого осуществляется по заранее составленному плану. Отклонение от схемы исследования, предусмотренной планом, могут увести далеко в сторону от решения поставленной задачи.

Грамотно составленный план обеспечивает оптимальные значения показателей валидности, по которым оценивают «качество» проведенного исследования, прежде всего достоверность полученных результатов.

Поэтому, планированию эксперимента в психологии уделяется особое внимание. Планирование эксперимента можно разделить на два этапа - содержательный и формальный:

1) исходя из решаемой проблемы определяется ряд теоретических и экспериментальных положений, которые образуют теоретическую основу исследования (теоретическое обеспечение);
2) формируются теоретические и экспериментальные гипотезы исследования;
3) выбирается необходимый метод эксперимента - полевой, «тренажер», лабораторный;
4) решается вопрос выборки испытуемых;
а) состав выборки (гендерный, возрастной, социальный, профессиональный и т.д.);
б) объем выборки;
в) способ формирования (рандомизированный, попарный, необходимость контрольной группы и т.д.)
2. Задачи формального планирования:
1) достичь возможности сравнения результатов;
2) добиться возможности обсуждения полученных данных;
3) обеспечить экономическое проведение исследования.

Если это не учитывать, то в дальнейшем не возможно будет сравнивать полученные результаты и однозначно их интерпретировать. Эти требования вытекают из особенностей экспериментальных методов вообще и психологически в частности.

Главная цель формального планирования - исключить по возможности максимальное число причин искажения результатов и тем самым минимизировать область ошибок, связанных с данным исследованием.

Необходимым условием успешного формального планирования является предварительный анализ всех возможных факторов экспериментальной ситуации, который начинается еще на этапе содержательного планирования.

Основные вопросы, на которые отвечает экспериментальный план, следующие:

1) Одна или несколько независимых переменных используются в эксперименте;
2) Изменяется ли независимая переменная по величине или остается постоянной;
3) Какие методы контроля требует и допускает экспериментальная ситуация (методы контроля - методы устранения, фиксации или контролирования состояния нерелевантных стимулов);

В методологии экспериментального исследования известны простые и комплексные планы. Все простые планы изучение влияния на процесс одной единственной переменной. Комплексные планы составляются для случая воздействия нескольких переменных.

В подготовке и в планировании эксперимента большую помощь могут оказать пилотажные (предварительные) исследования.

На многие вопросы организации эксперимента нельзя найти ответ ни в литературе, ни в собственном жизненном опыте, ни в соответствующей теории. Только непосредственное пилотажное исследование может показать, например, оптимальные диапазоны необходимых изменений стимулов, степень утомляемости испытуемого в подготовляемом эксперименте, наличие тех или иных нерелевантных стимулов и пр.

Кроме того, в пилотажных исследованиях проверяются составленные экспериментальные планы. Как правело, при этом обнаруживается много поводов для их коррекции.

Не стоит жалеть времени и усилий на составление, проверку и коррекцию экспериментальных планов, потому что в процессе непосредственного проведения эксперимента импровизированные отклонения от установленного плана не приветствуются. Иначе это будет уже совсем другое исследование.(6 стр. 80)

Статьи по теме