Прежде чем оценивать какие-либо цифры, нужно понять архитектуру исследования: какой вопрос задавался, кого с кем сравнивали и каким образом распределялось воздействие.
Рандомизированные контролируемые испытания (РКИ) считаются золотым стандартом, поскольку рандомизация равномерно распределяет исходные характеристики между группами, снижая риск систематической ошибки, и повышает уверенность в том, что именно изучаемое вмешательство, а не посторонний фактор, привело к наблюдаемому изменению исхода. Однако в акушерстве и гинекологии рандомизация пациенток не всегда возможна или этична. Если вмешательство затрагивает целое отделение или клинику (например, внедрение протокола ведения родов), отдельных пациенток нельзя разделить на группы без риска смешения эффекта между группами или этических проблем (например, нельзя оказывать поддержку грудного вскармливания пациентке в одной палате и не оказывать соседке). В таких случаях применяются альтернативные дизайны:
- Кластерно-рандомизированные исследования случайным образом распределяют клиники/отделения/регионы (пример: Kramer, M. S., Chalmers, B., Hodnett, E. D., Sevkovskaya, Z., Dzikovich, I., Shapiro, S., … & PROBIT Study Group. (2001). Promotion of Breastfeeding Intervention Trial (PROBIT): a randomized trial in the Republic of Belarus. Jama, 285(4), 413−420.)
- Ступенчатый дизайн, при котором вмешательство последовательно вводится в разных подразделениях, а порядок внедрения может быть рандомизирован (пример: Perkins, R. B., Legler, A., Jansen, E., Bernstein, J., Pierre-Joseph, N., Eun, T. J., … & Hanchate, A. (2020). Improving HPV vaccination rates: a stepped-wedge randomized trial. Pediatrics, 146(1), e20192737.)
- Контролируемый дизайн до-после, в котором есть сопоставимая группа, не подвергавшаяся вмешательству; измерение однократно до и однократно после в обеих группах (пример: Chauleur, C., Gris, J. C., Laporte, S., Chapelle, C., Bertoletti, L., Equy, V., … & STRATHEGE Group. (2018). Benefit of risk score-guided prophylaxis in pregnant women at risk of thrombotic events: a controlled before-and-after implementation study. Thrombosis and haemostasis, 118(09), 1564−1571.)
Есть также и другие варианты дизайнов — временные ряды, разность разностей, адаптивный дизайн, неконтролируемый дизайн до-после. О них можно подробнее почитать тут: «From Research to Practice in OBGYN: How to Critically Interpret Studies in Implementation» (3).
Однако далеко не все исследования в акушерстве могут быть рандомизированными. В клинической литературе широко используются и другие дизайны — каждый со своими задачами, сильными сторонами и ограничениями:
- Когортные исследования — наблюдение за группой женщин (когортой) с течением времени, могут быть про- или ретроспективными. В проспективном когортном исследовании участницы набираются в настоящем и наблюдаются в будущем до наступления исхода (пример: Jennewein, L., Agel, L., Hoock, S. C., Hentrich, A. E., Louwen, F., & Zander, N. (2024). Does overweight and obesity have an impact on delivery mode and peripartum outcome in breech presentation? A FRABAT cohort study. Archives of gynecology and obstetrics, 310(1), 285−292.). В случае ретроспективного когортного исследования используется уже существующая база данных или медицинские карты: авторы как бы возвращаются в прошлое и анализируют, какие воздействия были у женщин и какие исходы у них наступили (пример: Blanc-Petitjean, P., Meunier, G., Sibiude, J., & Mandelbrot, L. (2020). Evaluation of a policy of restrictive episiotomy on the incidence of perineal tears among women with spontaneous vaginal delivery: a ten-year retrospective study. Journal of gynecology obstetrics and human reproduction, 101 870.)
- Исследования случай-контроль. Авторы отбирают участниц с редким исходом (случаи) и сопоставимых женщин без этого исхода (контроли), а затем сравнивают, какие воздействия были в прошлом у тех и других. Этот дизайн особенно эффективен для изучения редких исходов: чтобы набрать достаточно случаев в когортном исследовании, потребовались бы десятки тысяч женщин, а в исследовании дизайна случай-контроль достаточно меньшее количество участниц (пример: Toijonen, A. E., Heinonen, S. T., Gissler, M. V., & Macharey, G. (2020). A comparison of risk factors for breech presentation in preterm and term labor: a nationwide, population-based case-control study. Archives of Gynecology and Obstetrics, 301(2), 393−403.)
- Серия случаев. Представляет собой описание группы пациенток с похожим состоянием или вмешательством, без контрольной группы — такой дизайн позволяет заметить закономерности и генерировать гипотезы, но не позволяет делать выводы о причинно-следственных связях. Это самый низкий уровень доказательности среди аналитических исследований (пример: Panaitescu, A. M., Ciobanu, A. M., Gică, N., Peltecu, G., & Botezatu, R. (2021). Diagnosis and management of cesarean scar pregnancy and placenta accreta spectrum: case series and review of the literature. Journal of Ultrasound in Medicine, 40(9), 1975−1986.)
- Качественные исследования изучают не цифры, а опыт, восприятие и смыслы, которые люди вкладывают в свои переживания. В перинатальной сфере это незаменимый инструмент, поскольку только такие исследования способны продемонстрировать, что на самом деле чувствуют женщины в родах, как медики воспринимают свою работу, с какими барьерами сталкиваются акушерки при внедрении новых протоколов и т. д. Авторы собирают данные через глубинные интервью, фокус-группы, наблюдение или телефонные опросы. Качественные исследования не дают ответа на вопрос «как часто» или «насколько эффективно», но дают ответ на вопрос «как это переживается» и «почему это происходит» (пример: Rubashkin, N., Torres, C., Escuriet, R., & Dolores Ruiz-Berdún, M. (2019). «Just a little help»: A qualitative inquiry into the persistent use of uterine fundal pressure in the second stage of labor in Spain. Birth, 46(3), 517−522.)
- Систематические обзоры и метаанализы занимают вершину иерархии доказательств. Систематический обзор собирает все исследования по одному конкретному вопросу, оценивает их качество и суммирует результаты, а метаанализ дополнительно статистически объединяет данные из нескольких исследований, увеличивая общую выборку и точность оценок эффекта. В акушерстве метаанализы позволяют, например, объединить данные десятков РКИ по эффективности различных методов индукции родов и дать окончательный ответ, который ни одно отдельное исследование дать не могло (подробнее о том, как оценивать качество этого типа работ — ниже).
Чем выше исследование по иерархии доказательств — тем больше уверенность в выводе. Но для ответа на вопрос «что чувствует моя клиентка» качественное исследование скажет больше, чем любой РКИ, поэтому важно выбирать дизайн в соответствии со своими вопросами.