Чупров критерий в excel как рассчитать
Перейти к содержимому

Чупров критерий в excel как рассчитать

  • автор:

Визуальная среда непараметрического корреляционного анализа факторов риска у больных с хирургической патологией Текст научной статьи по специальности «Науки о здоровье»

БИОМЕДИЦИНСКАЯ СТАТИСТИКА / АБДОМИНАЛЬНАЯ ХИРУРГИЯ / ФАКТОРЫ РИСКА / СТАТИСТИЧЕСКАЯ ОБРАБОТКА / ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ / НЕПАРАМЕТРИЧЕСКИЙ КОРРЕЛЯЦИОННЫЙ АНАЛИЗ / BIOMEDICAL STATISTICS / ABDOMINAL SURGERY / RISK FACTORS / STATISTICAL PROCESSING SOFTWARE / NONPARAMETRIC CORRELATION ANALYSIS

Аннотация научной статьи по наукам о здоровье, автор научной работы — Лазаренко В.А., Антонов А.Е., Новомлинец Ю.П.

В публикации приводятся этапы разработки приложения «Визуальная среда непараметрического корреляционного анализа факторов риска ». Предлагаемый информационный комплекс обеспечивает возможность расчета коэффициентов ассоциации (Юла, Пирсона, Пирсона с поправкой Йейтса), корреляции (знаков, рангов Спирмена, Фехнера), взаимной сопряженности (Пирсона и Чупрова), критериев х2, t. Программа автоматически оценивает уровни значимости полученных коэффициентов методом сравнения соответствующих им критериев с критическими точками. Полученные данные экспортируются в 11-22 таблицы Microsoft® Excel. Применяется техника совершенствования представления данных в таблицах за счет окраски фона ячеек. Цвет заливки отражает направление и силу связи, уровни значимости показателей. Среда помогает исследователю и практическому врачу-хирургу в формировании индивидуализированной профилактической стратегии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о здоровье , автор научной работы — Лазаренко В.А., Антонов А.Е., Новомлинец Ю.П.

Проблема оптимизации регрессионного анализа в оценке факторов риска, влияющих на развитие хирургических заболеваний гепатопанкреато-дуоденальной зоны

Опыт нейросетевой диагностики и прогнозирования язвенной болезни по результатам анализа факторов риска

Функциональные возможности системы комплексного анализа факторов риска scarf

Диагностика и прогнозирование вероятности возникновения холецистита на основе нейросетевого анализа факторов риска

Нейросетевая диагностика и прогнозирование возраста возникновения панкреатита на основе анализа факторов риска

i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

VISUAL ENVIRONMENT FOR NONPARAMETRIC CORRELATION ANALYSIS OF RISK FACTORS IN PATIENTS WITH SURGICAL DISEASES

The paper provides steps for the development of an application “Visual Environment for Nonparametric Correlation Analysis of Risk Factors ”. The proposed software system provides the possibility of calculating the coefficients of association (by Yule, Pearson, Pearson with Yates’s correction), of correlation (of signs, of grades by Spearman, by Fechner), of mutual conjugacy (by Pearson and Chuprov) as well as x2 and t criteria. The programme automatically evaluates the levels of significance of the coefficients by comparing their corresponding criteria with critical points. The obtained data is exported to 11-22 Microsoft® Excel spreadsheets. The programme uses colouring of cells’ background for enhancing the representation of data. The fill colour reflects the direction and power of coupling and levels of significance. The application helps the researcher and practicing surgeon to develop patient-personalized preventive strategy.

Текст научной работы на тему «Визуальная среда непараметрического корреляционного анализа факторов риска у больных с хирургической патологией»

ВИЗУАЛЬНАЯ СРЕДА НЕПАРАМЕТРИЧЕСКОГО КОРРЕЛЯЦИОННОГО АНАЛИЗА ФАКТОРОВ РИСКА У БОЛЬНЫХ С ХИРУРГИЧЕСКОЙ ПАТОЛОГИЕЙ

Лазаренко В.А., Антонов А.Е., Новомлинец Ю.П.

ФГБОУ ВО «Курский государственный медицинский университет» Минздрава России, г. Курск, Российская Федерация

Аннотация: В публикации приводятся этапы разработки приложения «Визуальная среда непараметрического корреляционного анализа факторов риска». Предлагаемый информационный комплекс обеспечивает возможность расчета коэффициентов ассоциации (Юла, Пирсона, Пирсона с поправкой Йейтса), корреляции (знаков, рангов Спирмена, Фехнера), взаимной сопряженности (Пирсона и Чупрова), критериев х2, t. Программа автоматически оценивает уровни значимости полученных коэффициентов методом сравнения соответствующих им критериев с критическими точками. Полученные данные экспортируются в 11-22 таблицы Microsoft® Excel. Применяется техника совершенствования представления данных в таблицах за счет окраски фона ячеек. Цвет заливки отражает направление и силу связи, уровни значимости показателей. Среда помогает исследователю и практическому врачу-хирургу в формировании индивидуализированной профилактической стратегии.

Ключевые слова: биомедицинская статистика, абдоминальная хирургия, факторы риска, статистическая обработка, программное обеспечение, непараметрический корреляционный анализ.

Актуальность исследования факторов риска (ФР) развития хирургических заболеваний верхнего этажа брюшной полости обусловлена высокой заболеваемостью и значительной частотой развития опасных осложнений [1, 2]. Комплексное понимание картины воздействия ФР необходимо для формирования стратегии эффективной профилактики заболеваний [3-5]. Особое значение имеет и то, что многие из экзогенных ФР, в особенности связанные с образом жизни и питания, вредными привычками, подвержены изменениям в связи со сменой социально-экономических условий, что требует регулярного мониторинга их влияния в популяции [6]. В то же время корреляционный анализ первичных данных является трудозатратой процедурой и требует от хирурга-практика наличия специальных математических знаний [7], вследствие чего зачастую отвергается врачом.

В связи с изложенным нами была определена цель исследования — разработка программного средства для проведения непараметрического корреляционного анализа ФР у больных с хирургическими заболеваниями верхнего этажа брюшной полости (язвенная болезнь, холецистит, панкреатит).

Материалы и методы исследования. В ходе исследования для сбора сведений о ФР были разработаны анкета и накопительная карта [7], содержавшие сведения о состоянии здоровья больного, диагнозе, социальном положении, условиях жизни и различных экзогенных ФР. Для проведения анализа собранных данных нами с использованием языка программирования семейства Pascal было разработано приложение «Визуальная среда непараметрического корреляционного анализа факторов риска» (свидетельство о государственной регистрации программы для ЭВМ № 2014611393).

Результаты и их обсуждение. Разработанное программное средство обеспечивало возможности для проведения непараметрического корреляционного анализа качественных и количественных признаков. За запуск основного (вычислительного) функционала программы отвечает окно «Настройка задания для корреляционного анализа» (рис. 1), открываемое специальной кнопкой на панели инструментов главной формы. Верхняя часть окна «Настройка задания для корреляционного анализа» используется для размещения на ней элементов управления выборочными совокупностями, которые подвергаются анализу. Одновременно среда в зависимости от положения переключателя позволяет выполнять обработку одной или двух групп пациентов, за выбор которых из базы данных отвечают соответствующие выражения фильтров.

Математические алгоритмы программы были сгруппированы в три блока, каждый из которых запускается изолированно.

Первая кнопка «Непараметрический анализ качественных признаков» запускает обработку данных, вычисление коэффициента ассоциации (тетрахорического показателя связи) К. Пирсона га в т.ч. с поправкой Ф. Йейтса Tay на непрерывность вариации, коэффициент ассоциации Юла tq, коэффициента корреляции знаков Rxy,

Вторая кнопка «Непараметрический анализ количественных признаков» запускает расчет коэффициента корреляции Г. Фехнера и коэффициента корреляции рангов К. Спирмена rs.

Третья кнопка «Полихорические показатели связи» запускает обработку качественных признаков, принимающих два или более значения (таких признаков было 29). Вычисляются коэффициент взаимной сопряженности К. Пирсона C. и связанный с ним критерий %2, а также коэффициент взаимной сопряженности А.А. Чупрова K.

Рис. 1. Окно «Настройка задания для корреляционного анализа»

1. В ходе исследования решена задача разработки программного средства для проведения непараметрического корреляционного анализа ФР у больных с хирургическими заболеваниями верхнего этажа брюшной полости.

2. Предлагаемая «Визуальная среда непараметрического корреляционного анализа факторов риска» позволяет проводить анализ качественных и количественных признаков, производить оценку уровней значимостей полученных показателей путем сравнения значений с критическими точками и выводить полученные результаты в форме наглядных таблиц.

1. Хрячков В.В., Кислицин Д.П., Добровольский А.А. Гепатопанкреатобилиарная хирургия. Ханты-Мансийск, 2011.

2. Факторы риска, влияющие на развитие гастроэнтерологической патологии в городе Курске / А.Е. Антонов, В.А. Лазаренко, Ю.П. Новомлинец, Б.С. Суковатых // Вестник новых медицинских технологий. 2007. Т. 14. № 2. С. 20-23.

3. Применение системы оценки технологий здравоохранения в принятии эффективных управленче-

ских решений / Л.И. Светый, В.А. Лопухова, И.В. Та-расенко, А.С. Климкин // Журнал научных статей Здоровье и образование в XXI веке. 2013. Т. 15. № 1-4. С. 234-235.

4. Изучение качества медицинской помощи при оценке технологий здравоохранения / Р.З. Симонян, Г.А. Кайланич, В.А. Лопухова, И.В. Тарасенко // Международный журнал прикладных и фундаментальных исследований. 2016. № 8. С. 185-187

5. Изучение качества внебольничной медицинской помощи в медицинских организациях города Орла / В.А. Лопухова, И.В. Тарасенко, Г.А. Кайланич, Е.А. Кайланич // Современные проблемы науки и образования. 2016. № 5. ЦКЬ: http://www.science-educatюnru/m/artide/view?id=25383 (дата обращения: 28.11.2016).

6. Факторы риска, влияющие на развитие гастроэнтерологической патологии в городе Курске / А.Е. Антонов, В.А. Лазаренко, Ю.П. Новомлинец, Б.С. Суковатых // Вестник новых медицинских технологий. 2007. Т. 14. № 1. С. 137-139.

7. Лазаренко В.А., Антонов А.Е., Бобынцев И.И. Визуальная среда оценки факторов риска у больных с хирургической патологией. Современные проблемы науки и образования. 2016. № 3. ЦКЬ: http://www.sci-ence-educatюnm/ru/artide/view?id=24678 (дата обращения: 28.11.2016)

VISUAL ENVIRONMENT FOR NONPARAMETRIC CORRELATION ANALYSIS OF RISK FACTORS IN PATIENTS WITH SURGICAL DISEASES

Lazarenko V.A., Antonov A.E., Novomlinets U.P.

Kursk State Medical University, Kursk, Russian Federation

Annotation: The paper provides steps for the development of an application «Visual Environment for Nonparametric Correlation Analysis of Risk Factors». The proposed software system provides the possibility of calculating the coefficients of association (by Yule, Pearson, Pearson with Yates’s correction), of correlation (of signs, of grades by Spearman, by Fechner), of mutual conjugacy (by Pearson and Chuprov) as well as x2 and t criteria. The programme automatically evaluates the levels of significance of the coefficients by comparing their corresponding criteria with critical points. The obtained data is exported to 11-22 Microsoft® Excel spreadsheets. The programme uses colouring of cells’ background for enhancing the representation of data. The fill colour reflects the direction and power of coupling and levels of significance. The application helps the researcher and practicing surgeon to develop patient-personalized preventive strategy.

Keywords: biomedical statistics, abdominal surgery, risk factors, statistical processing software, nonparametric correlation analysis.

1. Hrjachkov V.V., Kislicin D.P., Dobrovol’skij A.A. Gepatopankreatobiliarnaja hirurgija. Hanty-Mansijsk, 2011. (in Russian)

2. Risk Factors Influencing on the Development of Gastroenterological Pathology in Kursk City. A.E. Antonov, V.A. Lazarenko, Ju.P. Novomlinets, B.S. Sukovat-ykh. Journal of New Medical Technologies. 2007. Vol. 14. № 2. pp. 20-23 (in Russian).

3. The use of health technology assessment in making effective management decisions / L.I. Svetyy, V.A.

Lopukchova, I.V. Tarasenko, A.S. Klimkin // The journal of scientific articles «Health & education millennium». 2013. Vol. 15. № [1-4]. pp. 234-235. (in Russian)

4. The study of medical care quality in the health technology assessment / R.Z. Simonyan, G.A. Kailanich, V.A. Lopukhova, I.V. Tarasenko // International journal of applied and fundamental research 2016. № 8. pp. 185187 (in Russian)

5. The study of outpatient care quality in medical institutions of the Orel-city / V.A. Lopukhova, I.V. Tarasenko, G.A. Kaylanich, E.A. Kaylanich // Modern problems of science and education. 2016. № 5. Available at: http://www.science-education.ru/ru/arti-cle/view?id=25383 (Accessed 28th November 2016) (in Russian)

6. Risk Factors Influencing on the Development of Gastroenterological Pathology in Kursk City. A.E. An-tonov, V.A. Lazarenko, Ju.P. Novomlinets, B.S. Sukovat-ykh. Journal of New Medical Technologies. 2007. Vol. 14. № 1. pp. 137-139 (in Russian).

7. Lazarenko V.A., Antonov A.E., Bobyntsev I.I. Visual Environment for Risk Factors’ Estimation in Patients with Surgical Diseases. Modern Problems of Science and Education, 2016. №3. Available at: http://www.science-education.ru/ru/arti-cle/view?id=24678 (accessed on November 28, 2016) (in Russian)

Журнал включен в Перечень рецензируемых научных изданий ВАК

Коэффициенты взаимной сопряженности Чупрова и Пирсона

Измерение связи при альтернативной вариации двух признаков осуществляется с помощью коэффициентов ассоциации и контингенции.

При наличии не двух, а более возможных значений каждого из взаимосвязанных признаков также разработаны разные методы измерения тесноты связи.

В качестве критерия наличия связи между качественными показателями с большим числом градаций можно использовать критерий «хи-квадрат». Если признак, положенный в основу группировки по строкам таблицы не зависит от признака, положенного в основу группировки по столбцам, то в каждой строке (столбце) распределение частот должно быть пропорционально распределению их в итоговой строке (столбце). Такое распределение можно рассматривать в известной мере в качестве теоретического, частоты которого рассчитаны в предположении отсутствия связи между изучаемыми признаками.

По таблицам математической статистики устанавливается либо вероятность появления рассчитанного значения соответствующего данному числу степеней свободы в предположении независимости признаков; либо табличное значение критерия «хи-квадрат», соответствующего уровню значимости.

На основе критерия «хи-квадрат» определяются показатели степени тесноты связи: коэффициенты взаимной сопряженности Пирсона и Чупрова.

Коэффициент сопряженности Пирсона рассчитывается по формуле:

где Пример решения задачи

Задача

По данным о распределении 100 предприятий отрасли по производительности труда и себестоимости продукции определить:

  1. Показатель взаимной сопряженности.
  2. Коэффициент взаимной сопряженности Пирсона.
  3. Коэффициент Чупрова.
  4. Сделайте выводы.
Себестоимость продукции Производительность труда Итого
высокая средняя низкая
Высокая 5 6 9 20
Средняя 13 18 19 50
Низкая 22 6 2 30
Итого 40 30 30 100

Если по каким-либо причинам не справляетесь с решением задач, на портале можно заказать выполнение расчетной домашней работы, ИДЗ, РГР, контрольной и даже отдельных задач в разумные сроки. Чтобы вы смогли сделать заказ, я доступен по следующим каналам связи:

Контакты будут для вас
видны на территории
России и Беларуси

Общение без посредников. Удобная оплата переводом на банковскую карту. Опыт работы более 25 лет.

Подробное решение в формате электронного документа получите точно в срок или раньше.

Расчет теоретических частот

Составим расчетную таблицу:

Ячейка 8 1.125
(1,2) 6 6 0
(1,3) 9 6 1.5
(2,1) 13 15 0.6
(2,3) 19 15 1.067
(3,1) 22 12 8.333
(3,2) 6 Расчет коэффициентов Чупрова и Пирсона

Показатель взаимной сопряженности:

Оба рассчитанных коэффициента заметно отличаются от нуля — между себестоимостью продукции и производительностью труда существует слабая связь.

Если по каким-либо причинам не справляетесь с решением задач, на портале можно заказать выполнение расчетной домашней работы, ИДЗ, РГР, контрольной и даже отдельных задач в разумные сроки. Чтобы вы смогли сделать заказ, я доступен по следующим каналам связи::

Контакты будут для вас
видны на территории
России и Беларуси

Общение без посредников. Удобная оплата переводом на банковскую карту. Опыт работы более 25 лет.

Подробное решение в формате электронного документа получите точно в срок или раньше.

Помощь во время экзамена/зачета/самостоятельной в онлайн-режиме строго по предварительной записи. Если вы уже знаете расписание зачетов/экзаменов и вам требуется онлайн-помощь — обращайтесь.

Заказать выполнение работы:

Контакты будут для вас видны

на территории России и Беларуси

Решение расчетных работ на заказ

Если по каким-либо причинам не справляетесь с решением задач, на портале можно заказать выполнение расчетной домашней работы, ИДЗ, РГР, контрольной и даже отдельных задач в разумные сроки.

Чтобы вы смогли сделать заказ, я доступен по следующим каналам связи:

Контакты будут для вас
видны на территории
России и Беларуси

Общение без посредников. Удобная и быстрая оплата переводом на карту. Опыт работы более 25 лет.

Подробное решение, оформленное в формате электронного документа, получите точно в срок или раньше.

Помощь во время экзамена/зачета/самостоятельной в онлайн-режиме строго по предварительной записи. Если вы уже знаете расписание зачетов/экзаменов и вам требуется онлайн-помощь — обращайтесь.

Выборочные вычисления по одному или нескольким критериям

cond_sum1.png

Имеем таблицу по продажам, например, следующего вида: Задача: просуммировать все заказы, которые менеджер Григорьев реализовал для магазина «Копейка».

Способ 1. Функция СУММЕСЛИ, когда одно условие

Если бы в нашей задаче было только одно условие (все заказы Петрова или все заказы в «Копейку», например), то задача решалась бы достаточно легко при помощи встроенной функции Excel СУММЕСЛИ (SUMIF) из категории Математические (Math&Trig) . Выделяем пустую ячейку для результата, жмем кнопку fx в строке формул, находим функцию СУММЕСЛИ в списке: cond_sum2.pngЖмем ОК и вводим ее аргументы: cond_sum3.png

  • Диапазон — это те ячейки, которые мы проверяем на выполнение Критерия. В нашем случае — это диапазон с фамилиями менеджеров продаж.
  • Критерий — это то, что мы ищем в предыдущем указанном диапазоне. Разрешается использовать символы * (звездочка) и ? (вопросительный знак) как маски или символы подстановки. Звездочка подменяет собой любое количество любых символов, вопросительный знак — один любой символ. Так, например, чтобы найти все продажи у менеджеров с фамилией из пяти букв, можно использовать критерий . . А чтобы найти все продажи менеджеров, у которых фамилия начинается на букву «П», а заканчивается на «В» — критерий П*В. Строчные и прописные буквы не различаются.
  • Диапазон_суммирования — это те ячейки, значения которых мы хотим сложить, т.е. нашем случае — стоимости заказов.

Способ 2. Функция СУММЕСЛИМН, когда условий много

Если условий больше одного (например, нужно найти сумму всех заказов Григорьева для «Копейки»), то функция СУММЕСЛИ (SUMIF) не поможет, т.к. не умеет проверять больше одного критерия. Поэтому начиная с версии Excel 2007 в набор функций была добавлена функция СУММЕСЛИМН (SUMIFS) — в ней количество условий проверки увеличено аж до 127! Функция находится в той же категории Математические и работает похожим образом, но имеет больше аргументов:

cond_sum4.png

При помощи полосы прокрутки в правой части окна можно задать и третью пару (Диапазон_условия3Условие3), и четвертую, и т.д. — при необходимости.

Если же у вас пока еще старая версия Excel 2003, но задачу с несколькими условиями решить нужно, то придется извращаться — см. следующие способы.

Способ 3. Столбец-индикатор

Добавим к нашей таблице еще один столбец, который будет служить своеобразным индикатором: если заказ был в «Копейку» и от Григорьева, то в ячейке этого столбца будет значение 1, иначе — 0. Формула, которую надо ввести в этот столбец очень простая:

=(A2=»Копейка»)*(B2=»Григорьев»)

Логические равенства в скобках дают значения ИСТИНА или ЛОЖЬ, что для Excel равносильно 1 и 0. Таким образом, поскольку мы перемножаем эти выражения, единица в конечном счете получится только если оба условия выполняются. Теперь стоимости продаж осталось умножить на значения получившегося столбца и просуммировать отобранное в зеленой ячейке:

cond_sum5.png

Способ 4. Волшебная формула массива

Если вы раньше не сталкивались с такой замечательной возможностью Excel как формулы массива, то советую почитать предварительно про них много хорошего здесь. Ну, а в нашем случае задача решается одной формулой:

=СУММ((A2:A26=»Копейка»)*(B2:B26=»Григорьев»)*D2:D26)

cond_sum6.png

После ввода этой формулы необходимо нажать не Enter , как обычно, а Ctrl + Shift + Enter — тогда Excel воспримет ее как формулу массива и сам добавит фигурные скобки. Вводить скобки с клавиатуры не надо. Легко сообразить, что этот способ (как и предыдущий) легко масштабируется на три, четыре и т.д. условий без каких-либо ограничений.

Способ 4. Функция баз данных БДСУММ

В категории Базы данных (Database) можно найти функцию БДСУММ (DSUM) , которая тоже способна решить нашу задачу. Нюанс состоит в том, что для работы этой функции необходимо создать на листе специальный диапазон критериев — ячейки, содержащие условия отбора — и указать затем этот диапазон функции как аргумент:

=БДСУММ(A1:D26;D1;F1:G2)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *