Validation Standards for Automatic Cuff-Based Sphygmomanometers: State of the Art
- Authors: Posokhov I.N.1, Praskurnichiy E.A.1,2, Orlova O.S.1,2, Sukhodolova E.A.2, Lystseva A.V.2, Lobova M.D.1
-
Affiliations:
- International Office, State Research Center - Burnasyan Federal Medical Biophysical Center of Federal Medical Biological Agency
- Pirogov Russian National Research Medical University
- Issue: No 1 (2024)
- Pages: 5-13
- Section: INTERNAL DISEASES
- URL: https://journals.rcsi.science/2782-6430/article/view/351472
- DOI: https://doi.org/10.33266/2782-6430-2024-1-05-13
- ID: 351472
Cite item
Full Text
Abstract
To avoid under- or overdiagnosis of hypertension, the clinician needs to have firm confidence in the measurement tool. Recently, numerous automatic cuff-based sphygmomanometers have become this tool. The solution to this problem appears to be a wider introduction of device validation (accuracy check) activities in research structures. This review presents a number of aspects that are relevant to the ongoing work to develop a global universal standard for such validation.
Full Text
Общепризнано, что для надёжной диагностики артериальной гипертензии и других заболеваний, сопровождающихся выходящими за рамки нормальных значениями артериального давления (АД), требуется точное измерение АД. Согласно исследованиям, даже незначительные (в пределах 1—2 мм рт. ст.) отклонения от требуемой точности приводят к довольно масштабным неблагоприятным последствиям на уровне популяции [1]. Это обусловлено тем, что нормотензия переходит в патологическое явление (то есть в болезнь) в том случае, если АД начинает превышать определённый предел, и, таким образом, этот переход от нормы к патологии зависит исключительно от измерения как такового. Следовательно, для того, чтобы избежать гипоили гипердиагностики гипертензии, клиницисту требуется быть твёрдо уверенным в инструментах измерения, которыми в последнее время становятся многочисленные автоматические манжеточные сфигмоманометры (АМС), используемые для измерения АД в амбулаторных, домашних и офисных условиях [2]. В связи с этим первостепенное значение приобретает оценка точности устройств, доступных на рынке. Положительный результат оценки их точности с учётом всего вышеизложенного обозначает применимость испытанного АМС в клинической практике; сам процесс оценки применимости (или точности) называется «валидация» (от лат. validus – «здоровый, крепкий, сильный»).
Ртутные сфигмоманометры не требуют валидации, поскольку все они служат «золотым стандартом», ведь при измерениях исследователь непосредственно наблюдает ртутный столб и выражает результат в миллиметрах ртутного столба. Для точного измерения здесь требуется лишь отсутствие нарушений слуха и определённая тренировка оператора в правильной интерпретации тонов Короткова. Также не требуют валидации ручные анероидные сфигмоманометры: они требуют тех же самых условий со стороны оператора плюс соответствие циферблатной шкалы высоте ртутного столба, что достигается регулярной калибровкой метрологическими службами. Основным отличием многочисленных АМС является наличие у них разнообразных, отличающихся от модели к модели алгоритмов и функций «подгонки» для получения таких значений АД на дисплее, которые в среднем по популяции были бы близки к эталонным. Принципы этих алгоритмов у каждого производителя свои; более того, они отличаются среди выпускаемых на рынок моделей продуктовой линейки, и даже у одной модели с разными (как это принято в нездоровой практике некоторых фирм) «прошивками» программного обеспечения. Никакие алгоритмы, функции, или принципы не раскрываются производителями публично, поэтому клиницисту для того, чтобы быть твёрдо уверенным в своём инструменте измерения АД, остаётся доверять либо рекламным заверениям о точности «патентованного» АМС, либо публикациям о валидационных исследованиях, проведённых экспертами с разной степенью независимости или аффилированности с использованием научно принятого протокола [2].
История развития научных протоколов валидации
Совершенно очевидно, что цели врачей и производителей АМС отличаются. В индустрии приборостроения на первом месте стоит получение прибыли. Интересы человека, страдающего от заболевания, которые врачи ставят даже выше своих собственных, для производителей, не имеющих клинического воспитания, могут быть второстепенными, а то и вовсе необязательными. Речь о якобы существующей «заботе о здоровье» может идти исключительно лишь в рекламных лозунгах. Эти противоречия в ориентирах врачей и производителей достаточно давно принуждают найти компромисс, обеспечивающий уверенность в диагнозе. Так, «погоня за точностью» описывается в классических учебниках, упоминающих отчаянное заявление известного врача, сделанное в 1918 году: «В настоящее время рынок наводнен всевозможными приборами для оценки артериального давления, поэтому важно, чтобы потенциальный покупатель мог отличить хорошее от плохого» (цит. по [4]).
Однако научную основу способы отличать «хорошее от плохого» начали приобретать только в 1980-х годах. В 1987 году стандарт для автоматических мониторов АД ассоциации по развитию медицинского оборудования США (AAMI) включал специально разработанную процедуру клинической валидации [5]. Затем в 1990 году Британское общество гипертензии (BHS) опубликовало протокол, по которому рекомендовалось проводить валидацию АМС, и который, унаследовав многие особенности стандарта AAMI, также имел и много важных отличий, в частности, внесённых Bland M и Altman D [6]. Стандарт AAMI был пересмотрен в 1992 и 2002 годах, а протокол BHS — в 1993 году [8, 9].
Следует также упомянуть протокол Немецкой лиги гипертензии, представленный в 1999 году [10]. В 2002 году рабочая группа Европейского общества гипертонии (ESH) по измерениям АД разработала Международный протокол ESH-IP, требующий меньший размер выборки (N = 33 по сравнению с N = 85 в протоколах AAMI и BHS) [11]. Меньший размер выборки был временной (и, по всей видимости, неоправданной) мерой, и в 2010 году была опубликована пересмотренная версия ESH-IP с более строгими критериями [12]. Упоминается в литературе и стандарт EN 1060-4, который опубликовал в 2004 году Европейский комитет по стандартизации (CEN) [13]. Еще один стандарт, ANSI/AAMI/ISO, который включил аспекты предыдущих (например, размер выборки и критерии валидации), разработан ISO и был принят Комитетом по сфигмоманометрам AAMI в 2009 году, а затем пересмотрен в 2013 году [14, 15].
Авторы различных протоколов валидации стали осознавать, что как науке, так и пациентам было бы лучше, если бы все устройства для измерения АД оценивались на предмет точности в соответствии с согласованным единым протоколом валидации, получившим глобальное признание. Поэтому эксперты AAMI, ESH и ISO, выступив c международной инициативой, согласились разработать универсальный стандарт валидации АМС и согласовали ключевые аспекты процедуры валидации в качестве основы для единого универсального протокола [16]. Пока для глобального использования рекомендован стандарт ISO 81060-2:2018 [17], а работа над универсальным стандартом AAMI/ESH/ISO всё ещё идёт по настоящее время [18]. Как только эта работа экспертов AAMI/ESH/ISO будет полностью закончена, она будет считаться единым универсальным стандартом и заменит все предыдущие стандарты или протоколы.
Мера эффективности валидации, количество и характеристика добровольцев
Для суждения о мере или для измерения эффективности валидации используют термин «допустимая ошибка» (устоявшийся англоязычный термин:
«tolerable error»). Нужно твёрдо понимать, что «допустимая ошибка» отражает вариативность методологии валидации, а не уровень якобы «нормальной» неточности АМС. Вариативность методологии оценивают вероятностью, с которой «допустимое», то есть меньшее определённого предела, отклонение может встретиться.
В настоящее время эксперты AAMI/ESH/ISO приняли в качестве компромисса, что «допустимая ошибка» должна быть менее 10 мм рт. ст. (при использовании среднего значения трех показаний АД для отдельного человека по сравнению с эталонным методом) и расчетная вероятность её должна быть более 85 %. Компромисс учитывал эффективность валидаций доступных в настоящее время мониторов АД и более ранние требования ANSI/AAMI/ISO [15] и ESH-IP, допускающие ошибку 10 мм рт.ст. с частотой 12–18 % [12].
Ожидается, что установка этого уровня требований позволит отделить устройства с «высокой» или «средней точностью» от устройств с «низкой точностью» (недопустимых). Однако эксперты подчёркивают, что «высокая точность», согласно такому определению, не обязательно означает «отлично» [16]. В этой связи можно привести следующий пример: допустим, что АМС при каждом использовании (то есть абсолютно у всех людей) фактически даёт значения среднего из трёх показаний на 7–8 мм. рт. ст. отличающиеся от значений, полученных эталонным методом. Торговцы таким оборудованием вполне могут ввести неискушённого в требованиях стандартов врача в заблуждение, ссылаясь на «допустимую ошибку» и выдавая её не за меру эффективности валидации, а за якобы «нормальную» неточность.
С точки зрения клинициста, обеспокоенного масштабными последствиями неточного измерения АД на уровне популяции [1], безусловно, необходим даже не компромисс, установленный в настоящее время, а более качественный уровень измерения. В связи с этим эксперты AAMI/ESH/ISO призывают отрасль продолжать усилия по технологическому совершенствованию АМС [16], и есть надежда на то, что в будущем большее количество максимально точных устройств сместит вышеуказанный критерий в сторону более жёстких требований.
Важным вопросом является оптимальный размер выборки (N), по которой определяют вероятность «допустимой ошибки». Меньший N может снизить затраты (времени, ресурсов и др.) на проведение валидационных исследований, однако он одновременно снижает также и мощность исследования, и, кроме этого, не позволяет оценить подгруппы, например, для разных размеров манжет, возрастных или особых групп населения [19]. Расчёты [16] показывают, что N = 35:
- адекватно для устройств с «высокой точностью» (определяемое как средняя разница АД между измерениями эталонного и тестируемого устройства и стандартное отклонение [SD] этой разницы как 0 ± 3–6 мм рт. ст.), при этом вероятность «непрохождения» валидации (или устоявшийся английский термин «fail») составляет менее 14 %;
- адекватно для устройства «низкой точности» (разница 6–8 ± 5, или 0 ± 10–12, или 4–6 ± 8 мм рт. ст.), поскольку вероятность «непрохождения» 94 %;
- неадекватно для устройства «средней точности» (разница 4 ± 5 мм рт. ст.), так как вероятность «непрохождения» составляет 28 %, что неприемлемо много.
Учитывая, что многие из доступных в настоящее время мониторов АД имеют уровень «умеренной точности», специалистами AAMI/ESH/ISO предлагается N = 85. Это также необходимо для стратификации по размеру манжеты (или по другим подгруппам) [17]. В настоящее время совершенно ясно, что в исследование общей популяции следует включать добровольцев старше 12 лет, не получающих или получающих лечение. Из 85 человек мужчин, как и женщин, должно быть не менее 30 %. Не менее 5 % исследованных должны иметь систолическое АД (САД) 100 мм рт. ст. или менее, не менее 5 % — с уровнем не ниже 160 мм рт. ст. Большее количество, 20 % — с давлением не менее 140 мм рт.ст. и не менее 5 % — с диастолическим АД (ДАД) 60 мм рт.ст. или ниже, не менее 5 % — с давлением не ниже 100 мм рт.ст. и не менее 20 % — с давлением не ниже 85 мм рт.ст. [16].
Нововведение: подгруппы по размерам манжет Ранее было хорошо известно, что слишком маленький размер манжеты при аускультативном способе измерения приводит к ложно высокому АД. В настоящее время проведено достаточно исследований, чтобы утверждать о подобных закономерностях и для «осциллометрического» способа, который используют большинство АМС [20]. Поэтому следует учитывать вопросы, связанные с камерами манжет, или, как это обозначают специальным термином в современной литературе, с системой «манжета-рукаартерия». Изменение размера манжеты вызывает не только смещение показаний в сторону больших или меньших значений АД, но и изменение морфологии, используемой для расчёта АД огибающей графика амплитуд «осциллометрических» волн, как показано в исследовании [21]. Поскольку устройства, имеющиеся на рынке, обычно снабжаются не менее чем 2 вариантами манжет с разными размерами, можно утверждать, что автоматический сфигмоманометр совместно с каждой разновидностью манжеты является отдельным вариантом «осциллометрической» системы, и точность каждой из таких систем в идеале должна быть отдельно определена по научно принятому протоколу валидации с N = 85.
Однако на практике данное требование затруднительно для исследователей. Поэтому экспертами AAMI/ESH/ISO было решено, что следует ввести требование стратифицированных по размерам манжет подгрупп так, чтобы обеспечить равномерное представление всех манжет, что и появилось в уже действующем на настоящее время стандарте ISO 810602:2018 [17]. Причём, чтобы точность одной манжеты не «маскировала» точность другой, предложено указывать результаты для каждой манжеты отдельно.
Для АМС, имеющих несколько (n) манжет, каждая манжета должна быть испытана как минимум на 1/(2n) пациентов, при этом как минимум у 40 % пациентов окружность руки должна находиться в пределах верхней половины указанного диапазона манжеты и у не менее 40 % — в нижней половине. Если устройство снабжено единственной манжетой, то имеются дополнительные условия: у не менее 20 % пациентов окружность руки должна находиться в пределах верхнего квартиля, у не менее 20 % — нижнего; у не менее 10 % в верхнем октиле и у не менее 10 % в нижнем октиле [17]. Все манжеты должны быть подробно описаны в отчёте об исследовании.
Особые группы населения: общие соображения Не только окружность руки может влиять на точность АМС, но и принадлежность к некоторым особым группам населения. Выделение такой группы из всеобщей может быть основано на теоретических или клинических доказательствах различий в точности измерений у людей, которые её составляют.
Примером теоретических доказательств могут служить сведения об изменениях гемодинамики и водно-солевого обмена при беременности, фосфатно-кальциевого обмена при гемодиализе, анатомические особенности детей и т.д., а примером клинических – «удачи» в валидационных исследованиях одних АМС и «неудачи» в исследованиях других.
Такое явление, когда автоматическое устройство, демонстрирующее достаточную точность, может не удовлетворять требованиям стандартов в некоторых, специально отобранных, группах населения обнаруживалось уже начиная с времён первых разработанных стандартов [3]. Для врачей узких специальностей (акушеров-гинекологов, педиатров, нефрологов, геронтологов и др.) это означало отсутствие уверенности в правильности диагностики у пациентов, о которых они заботятся в силу своей специальности. В свою очередь, это обусловило необходимость отдельных валидационных исследований в особых группах населения, а также выработки специальных требований протоколов к таким исследованиям.
Исторически рассматривались три основные особые группы населения, требующие отдельной валидации:
- дети младше 3 лет;
- беременные женщины;
- пациенты с фибрилляцией предсердий [22].
Упоминают также людей с окружностью руки более 42 см [16]. Однако в современном действующем стандарте ISO 81060-2:2018 [17] описывают требования только к валидационным исследованиям у детей и беременных женщин. Но рекомендаций по валидации у людей с окружностью руки более 42 см и у пациентов с фибрилляцией предсердий не приводят, главным образом из-за проблем с определением эталонного метода измерения АД в таких ситуациях.
Кроме этого, в 2018 году экспертами AAMI/ESH/ISO указывалось, что существуют дополнительные группы населения, которые потенциально можно рассматривать как «особые», включая подростков в возрасте 12–18 лет; лиц старше 80 лет; пациентов с терминальной стадией заболевания почек, с установленным сердечно-сосудистым заболеванием и др. При этом было заявлено, что существует неопределенность в отношении адекватности существующих данных, что позволяет лишь предположить измененную точность электронных манжетных мониторов АД в этих группах [16].
В дальнейшем была сформирована целевая группа с целью изучения данных «белых пятен» в стандарте валидации АМС, а в 2023 году получены клинические доказательства о целесообразности отдельных валидационных исследований ещё у двух «особых» групп:
- у подростков 12–18 лет;
- у пациентов с хронической болезнью почек (ХБП) [18].
Доказательства заключались в выявлении устройств, которые прошли проверку в общей популяции, но не «сработали» в теоретически потенциально особых группах населения.
В целом, члены целевой группы AAMI/ESH/ISO рассматривали расширенный список из 9 «потенциально» особых групп населения, выбранных на основе теоретических данных. К этим «потенциальным» особым группам относились, кроме вышеуказанных, также и:
- пациенты старше 65 лет;
- пациенты с сахарным диабетом 2 типа;
- пациенты с установленным сердечно-сосудистым заболеванием;
- пациенты с хроническими коронарными синдромами;
- пациенты с застойной сердечной недостаточностью;
- пациенты с инсультом;
- пациенты с заболеванием периферических артерий.
Клинических доказательств по этим теоретически «потенциальным» группам оказалось пока недостаточно, в связи с чем целевая группа AAMI/ESH/ISO призывает медицинскую общественность к дополнительным исследованиям [18]. Критически рассматривая данный призыв, можно, однако, отметить, что отклик на него, скорее всего, возможен лишь в абсолютно независимых от производителей АМС исследовательских структурах. Клинические доказательства подразумевают «неудачи» в валидациях отдельных АМС, то есть отрицательные результаты исследований. К сожалению, исследователи, особенно отечественные, по ряду соображений не стремятся публиковать отрицательные результаты, а также, в надежде получить дополнительные «бонусы», отдают предпочтение таким результатам, которые более выгодны «дружественным» производителям, с которыми стараются найти «общий язык».
Следует отметить и другие вопросы, касающиеся общих положений относительно «особых» групп, включающие достаточное для надёжных выводов количество исследованных пациентов/добровольцев. Согласно формальному расчету размера выборки (N), описанному выше, для каждой особой группы населения желательно иметь выборку из 85–90 пациентов, особенно если устройство снабжено несколькими манжетами, и есть необходимость в равномерном наборе подгрупп с разными размерами манжет, либо оно относится к АМС «средней» точности.
Клинический пример: в исследовании [23] (как и в рекламных материалах производителя) утверждается, что устройство «N» может быть использовано в педиатрической практике. Однако при внимательном рассмотрении отчёта об исследовании можно обнаружить, что величина выборки была равна 30, а SD = 4,9 мм рт. ст. Согласно современным критериям и расчётам [16, 18], мощность исследования недостаточно адекватна, чтобы уверенно рекомендовать устройство для применения его у детей. Тем не менее, на настоящий момент используется компромиссное решение [17]: в исследования «особых» групп следует включать не менее 35 пациентов (а в исследования беременных – не менее 45), при условии, что устройство предварительно успешно прошло валидацию на полном исследовании общей группы населения с участием 85 человек. «Связующее исследование» (в данных ситуациях исследование общей группы), направленное на экстраполяцию клинических результатов, полученных в общей популяции, на различные особые группы населения, широко используется для изучения лекарств, вакцин и медицинских устройств. Однако следует помнить, что если устройство предназначено исключительно для особой группы населения, но не для общей, то необходимо полное исследование с участием 85 пациентов [16].
Специальная педиатрическая группа
Согласно действующему стандарту, если АМС предназначено только для общей группы взрослого населения, в него включают людей старше 12 лет. Однако, если устройство предназначено и для населения в целом, и для детей, в группу исследования можно включить 35 человек в возрасте от 3 до 12 лет (вместе с 50 пациентами в возрасте старше 12 лет); при этом критерии распределения АД должны быть точно такие же, как и описано выше для общей группы [17]. Необходимо также заметить, что в дополнение к формальному анализу общей выборки из 85 пациентов, средняя разница САД и ДАД (тест по сравнению с эталонным устройством) и её SD должны сообщаться также отдельно и для подгруппы в возрасте от 3 до 12 лет, и для подгруппы старше 12 лет [16].
Если же устройство имеет специальный «педиатрический» режим, то необходимо отдельное исследование по стандарту, предписанному для отдельных «особых» групп.
Имеются некоторые детали, на которые должны обращать внимание исследователи точности сфигмоманометров при измерениях АД у детей. Ряд исследований, описание которых можно найти в литературе, показывает, что на оценку 4 и 5 фазы тонов Короткова может сильно влиять подготовка исследователей, и что в качестве индикатора ДАД среди детей и подростков следует использовать 4 фазу, поскольку она показывает меньшую вариабельность между наблюдателями и более точно прогнозирует последующую гипертензию у взрослых [24]. Тем не менее, действующие стандарты предписывают использовать для эталонного ДАД 5 фазу тонов Короткова, а если она не слышна, то в этом случае ребёнка исключать из исследования [16].
Специальная группа «беременность и преэклампсия»
В отличие от универсальных минимальных требований к специальным группам для валидационных исследований, в отношении оценки применимости АМС у беременных женщин в современном стандарте указывают свои правила. Так, размер выборки должен быть равным 45 женщин. При этом подгруппы стратифицируют не по АД, а по клиническому состоянию. Треть группы (15 женщин) должны иметь преэклампсию, определяемую как САД/ДАД не менее чем 140/90 мм рт. ст. при наличии протеинурии, 15 женщин – гестационную гипертензию, определяемую как АД более 140/90 мм рт. ст., впервые обнаруженную во время беременности, без протеинурии, и остальные 15 женщин – с нормальным АД [17]. Ожидается, что в стандартах произойдёт исправление термина «гестационная» в связи с появлением в последних клинических рекомендациях классификации гипертензивных расстройств беременных с указанием «антенатально неклассифицируемой гипертензии» [25].
Те же соображения, что и в предыдущей специальной группе, относительно тонов Короткова, применимы и для группы беременных женщин.
Новая специальная группа: «подростки в возрасте 12–18 лет»
Теоретически, широкий диапазон морфологии волн АД, наблюдаемых у подростков, подчеркивает гетерогенность этой популяции и отражает различные размеры тела и стадии их роста. Молодые люди имеют особые анатомические и физиологические характеристики: или очень эластичные артерии и большие различия между плечевым и центральным АД [26], или малые волны и низкую амплитуду тонов Короткова [27]. У подростков некоторые из вышеупомянутых характеристик гораздо больше похожи на характеристики детей, чем взрослых, на которых проводится большинство проверочных исследований. В недавнем обзоре сообщается о том, что имеются АМС, прошедшие общепопуляционное исследование, но оказались неприемлемо неточными у подростков [18].
Эти данные позволяют утверждать экспертам AAMI/ESH/ISO, что подростки могут рассматриваться как особая группа населения в валидационных исследованиях. Однако, как добавляют указанные эксперты в своём обзоре, необходимы дальнейшие исследования, предпочтительно с участием подростков и взрослых в рамках одного и того же исследования [18].
Новая специальная группа: «хроническая болезнь почек»
ХБП включают гетерогенную группу пациентов со сниженной скоростью клубочковой фильтрации, с протеинурией или без нее, находящихся или не находящихся на гемодиализе. Эти пациенты имеют очень высокий сердечно-сосудистый риск из-за повышенной жесткости артерий и изолированной систолической гипертензии, а ультрафильтрация плазмы и изменение объема внеклеточной жидкости приводят к значительным изменениям ОЦК и вариабельности АД [28].
Целевой группой AAMI/ESH/ISO обнаружены свидетельства того, что осциллометрические АМС могут иметь разную точность у пациентов с ХБП, по сравнению с населением в целом. Это позволяет утверждать, что пациенты с ХБП могут рассматриваться как особая популяция в валидационных исследованиях. Однако, опять, необходимы дальнейшие исследования, особенно у пациентов с поздней стадией ХБП, у которых специфические сердечно-сосудистые изменения особенно выражены [18].
Потенциальная специальная группа
«лица старше 65 лет»
Процесс старения вызывает значительные изменения в физиологии регуляции АД, а также в структуре и функции сердечно-сосудистой системы и, в частности, в свойствах артериальных стенок, которые являются местом непрямого измерения АД с помощью манжет. Артериальная жесткость, вызывающая систолическую гипертензию с низким ДАД, ортостатическую гипотензию, псевдогипертензию и высокую вариабельность АД, является дополнительными проблемами при измерении АД. Все эти явления и изменения выражены у очень пожилого населения (возраст > 80 лет) [29]. Примечательно, что протокол валидации BHS 1993 года был единственным, который классифицировал лиц старше 65 лет как особую группу населения, требующую отдельной валидации, наряду с группами детей и беременных женщин [9].
Тем не менее, целевой группой AAMI/ESH/ISO не удалось в достаточной мере обосновать выделение подгруппы пожилых людей в особую подгруппу (клинических свидетельств оказалось мало), впрочем, это не помешало призвать медицинскую общественность к дальнейшим исследованиям, особенно лиц старше 80 лет, у которых все признаки старения выражены наиболее сильно [18].
Потенциальная особая группа:
«сахарный диабет 2 типа»
Наличие диабета связано с высоким сердечнососудистым риском и более высокой жесткостью артерий, чем у людей, не страдающих диабетом, что может повлиять на точность осциллометрических устройств измерения АД [30]. Как и в предыдущем случае, данных пока недостаточно. Длительность диабета и наличие сердечно-сосудистых факторов риска и заболеваний могут быть ключевыми факторами точности осциллометрических мониторов АД в этой популяции и должны быть приняты во внимание в будущих валидациях [18].
Процедура и ход исследования
В то время как золотым стандартом, с которым необходимо сравнивать испытуемые устройства, является аускультативный метод, ход которого неизменен, тестируемые устройства весьма разнообразны: ряд из них могут регистрировать данные во время нагнетания воздуха в манжету; имеются современные устройства, которые ради комфорта пациента стравливают воздух быстрее, чем это принято во время классического аускультативного метода; и, наконец, имеются хотя и недостаточно совершенные в вычислительном и техническом отношении, но сохранившиеся с прошлого века системы со «ступенчатым» стравливанием. Совершенно очевидно, что такое разнообразие АМС делает невозможным метод валидации с одновременным измерением на одной руке.
В предшествующих современному протоколу стандартах, а именно в стандарте ANSI/AAMI/ISO [15], предлагался метод одновременной регистрации АД на двух руках, который решено сохранить и в настоящее время.
Однако предпочтительным методом сбора данных является метод с последовательным измерением на одной руке: он наиболее хорошо разработан, поддерживается всеми протоколами [5-15]. Стало общепринятым обозначение измерения эталонным (референтным) прибором буквой R, а тестируемым
– буквой Т. Начальное измерение, которое не используются в расчётах точности устройства, обозначают R0 и Т0. Далее вперемежку идут измерения R1, T1, R2, T2, R3, T3 и R4 (следует обратить внимание, что серия измерений начинается и заканчивается эталонным измерением).
Эталонные измерения проводят обязательно аускультативным способом, причём они осуществляются одновременно двумя обученными наблюдателями с использованием двойного стетоскопа, соединенного с Y-образной трубкой, но так, чтобы не иметь представления о показаниях друг друга (например, с использованием специальной перегородки, устанавливаемой на столе). Обязательным условием является тренировка наблюдателей и не ранняя, чем за 12 месяцев, их квалификация на «согласование» (устоявшийся термин «agreement») показателей, согласно критериям, описанным в протоколе BHS [6]. Тренировка заключается в использовании специальных видеозаписей, в которых демонстрируются ртутный столб и соответствующие его движению аудиограммы. Такие видеозаписи были опубликованы BHS; в настоящее время свободно доступен эквивалентный набор упражнений с комментариями на русском языке [31]. Проверка критериев «согласия» между тренирующимися исследователями заключается в проведении у 5 человек 10 измерений АД с использованием одного разветвлённого стетоскопа с получением 50 записей у каждого исследователя и эксперта, при этом:
- 90 % записей АД у исследователей и эксперта не должны отличаться более чем на 5 мм рт. ст., и 98 % — не более чем на 10 мм рт. ст.;
- 85 % записей АД при сравнении между каждым исследователем не должны отличаться более чем на 5 мм рт. ст., и 95 % — не более чем на 10 мм рт. ст.;
- При невыполнение указанных требований требуется повторная тренировка по видеозаписям.
Для процедуры исследования необходим третий наблюдатель (супервайзер), который осуществляет контроль процедуры валидации, адекватности измерений АД эталонным и тестовым устройствами, «согласия» между двумя наблюдателями, которые не должны знать о величине или направлении их разногласий, а также любых других вопросов во время валидации.
Процедура проверки начинается с того, что пациент сидит удобно и расслабленно в течение как минимум 5 минут. Его спина и рука поддерживаются, середина плеча находится на уровне сердца, ноги не скрещиваются, стопы стоят на полу. На протяжении всей процедуры валидации необходимо избегать разговоров и любых других помех. Измерения следует проводить с интервалом не менее 60 с.
Супервайзер проверяет каждую пару тестового/эталонного измерения АД. Если одно из них (тестовое или эталонное АД) необходимо исключить (из-за неисправности тест-устройства или разногласий наблюдателей > 4 мм рт. ст. по САД или ДАД), то супервайзер подаёт команду сделать еще одну пару измерений АД (тестовое и эталонное). Разрешается делать максимум восемь пар (четыре дополнительных пары) измерений.
В отчёте необходимо приводить сравнение АД, полученных наблюдателями во время валидационного исследования (средняя разница, стандартное отклонение и диапазон), а также количество повторных измерений. Пациенты с разницей САД более 12 мм рт. ст. и/или ДАД более 8 мм рт. ст. в любых двух из четырех эталонных (в среднем, у двух наблюдателей) измерений АД (R1–R4) должны быть исключены.
Впервые в стандарте ISO 81060-2:2018 оговаривается применение нертутных (анероидных) сфигмоманометров, с помощью которых могут быть получены эталонные записи АД. Максимально допустимая погрешность их должна составлять 1 мм рт. ст. В начале каждого валидационного исследования точность таких исследований должна быть обеспечена метрологической службой [17].
Каждое из эталонных измерений АД (R0–R4) должно представлять собой среднее значение одновременных показаний двух наблюдателей. Каждое из измерений тестового устройства сравнивается со средним значением предыдущего и следующего эталонного показания АД (например,
T1 со средним значением R1–R2, T2 со средним значением R2–R3, T3 со средним значением R3–R4). Различия рассчитываются путем вычитания эталонного измерения АД из измерения тестируемого устройства. Для оценки данных валидационного исследования должны применяться средняя разница АД (тест по сравнению с эталонным устройством) и ее стандартное отклонение, рассчитанные по определённым формулам [17].
Также должно быть указано количество абсолютных различий АД (тестовое АД минус среднее значение предыдущих и следующих эталонных показаний АД) в пределах 5, 10 и 15 мм рт.ст., как это было принято в протоколе ESH-IP [12]. Эта категоризация важна для того, чтобы данные валидации могли быть понятны различным потенциальным пользователям, то есть врачам, общественности, промышленности и другим. Кроме этого, в отчётах следует приводить стандартизированные диаграммы рассеяния Бланда-Альтмана.
Качество и надежность отчетов о валидационных исследованиях
В последние годы эксперты AAMI/ESH/ISO стали обращать внимание на возможность нарушений протоколов валидаций, которые, возможно, никак не учитываются в процессе рецензирования в научных журналах [16]. Эксперты признают, что для предотвращения таких нарушений и для предоставления полных данных необходимо разработать инструменты и формы (в печатном и электронном виде), аналогичные, например, тем, которые были в пересмотренном ESH-IP [12]. Признаётся также необходимость мер, обеспечивающих прозрачность отбора данных для включения в анализ, то есть указание причин исключения данных и внесение данных в хронологическом порядке при заполнении диапазонов АД (например, электронные онлайн-формы отчетов). Это должно обеспечивать защиту от потенциального исключения неточных данных, когда фактический размер выборки, необходимый для заполнения всех диапазонов АД, превышает заданный размер выборки [16].
В отечественной практике требуется особенное усиление мер, регулирующих валидацию и оборот АМС, включая обеспечение независимости, должной квалификации и сертификации экспертов, проводящих исследование, обязательный аудит полученных ими сведений, а также создание адекватной системы обращения с данными, что важно для в принципе для всех биомедицинских исследований [32]. В плане квалификации исследователей можно отметить требование протокола ISO 81060-2:2018 соблюдать стандарты надлежащей клинической практики (GCP). Однако, к сожалению, эти требования могут вполне успешно игнорироваться авторами, зависящими от щедрых производителей АМС, для которых публикации о валидационных исследованиях служат лишь маркетинговыми инструментами. В качестве предварительных мер в распознавании таких производителей могут быть рекомендованы так называемые «красные флаги», то есть признаки, при наличии которых все публикации, касающихся продуктов таких «приборостроителей» следует более пристально рассматривать на предмет «подозрительных отклонений»:
- две и более статьи о валидациях, отозванные издателями;
- валидационные статьи в журналах одного и того же издательства, особенно издательства, публикующего за плату по модели «open access» (исключение: журнал, специализирующийся на валидациях «Blood Pressure Monitoring»);
- все статьи несмотря на то, что они подписаны разными «авторами», написаны в одном и том же литературном стиле, иллюстрированы похожими и частично совпадающими иллюстрациями;
- «авторы» статей живут и работают по соседству с производителем;
- «авторы» (или реальные авторы) скрывают своё финансирование производителем (например, спонсирование издания монографий);
- избыточное количество в рекламных материалах производителя сертификатов, свидетельств, почётных грамот, не относящихся к клиническим аспектам применения (например, грамоты «почётный экспортёр области», «участник бизнес-форума» и т.п.).
Заключение
Современное состояние дел в стандартах, описывающих проверку точности АМС, характеризуется определённой динамикой развития. В международном медицинском экспертном сообществе сейчас происходит выработка единого универсального стандарта валидации манжеточных устройств для измерения АД. Ряд аспектов процедуры валидации появились в последние несколько лет, подробное описание других аспектов ещё пока ожидается. К важным аспектам относятся исследования новых и потенциальных групп; однако в них есть несколько методологических проблем: специальные и общие группы населения изучались в разных исследовательских центрах, с использованием разных протоколов валидации, зачастую имели небольшой размер выборки, нарушения протокола валидации или даже «предвзятость публикации» (отказ в публикации отрицательных валидаций).
Тем не менее, всё более остро стоит вопрос об удовлетворении потребности всех врачей в том, что обеспечивало бы твёрдую уверенность в используемых инструментах для диагностики состояний, при которых АД выходит за рамки определённых пределов. Решение данного вопроса представляется в более широком внедрении в исследовательских структурах деятельности по валидации АМС – исследований с относительно небольшими затратами ресурсов, легко планируемых в соответствии с уже заложенными ранее принципами, обладающих благодаря теоретическому обоснованию потенциальных групп достаточной научной новизной.
About the authors
I. N. Posokhov
International Office, State Research Center - Burnasyan Federal Medical Biophysical Center of Federal Medical Biological Agency
Email: igor@posohov.ru
Moscow, Russia
E. A. Praskurnichiy
International Office, State Research Center - Burnasyan Federal Medical Biophysical Center of Federal Medical Biological Agency; Pirogov Russian National Research Medical University
Email: igor@posohov.ru
Moscow, Russia
O. S. Orlova
International Office, State Research Center - Burnasyan Federal Medical Biophysical Center of Federal Medical Biological Agency; Pirogov Russian National Research Medical University
Email: igor@posohov.ru
Moscow, Russia
E. A. Sukhodolova
Pirogov Russian National Research Medical University
Email: igor@posohov.ru
Moscow, Russia
A. V. Lystseva
Pirogov Russian National Research Medical University
Email: igor@posohov.ru
Moscow, Russia
M. D. Lobova
International Office, State Research Center - Burnasyan Federal Medical Biophysical Center of Federal Medical Biological Agency
Author for correspondence.
Email: igor@posohov.ru
Moscow, Russia
References
- Campbell NRC, Padwal R, Picone DS, et al. The impact of small to moderate inaccuracies in assessing blood pressure on hypertension prevalence and control rates. J Clin Hypertens (Greenwich). 2020 Jun;22(6):939-942. doi: 10.1111/jch.13915.
- Picone DS, Padwal R, Stergiou GS, et al. How to find and use validated blood pressure measuring devices. J Hum Hypertens. 2023 Feb;37(2):108-114. doi: 10.1038/s41371-022-00718-5.
- Stergiou GS, Alpert BS, Mieke S, Wang J, O’Brien E. Validation protocols for blood pressure measuring devices in the 21st century. J Clin Hypertens (Greenwich). 2018 Jul;20(7):1096-1099. doi: 10.1111/jch.13294.
- Blood pressure measurement (Handbook of Hypertension Vol. 14) EO’Brien, KO’Malley, editors. Elsevier, Alsterdam, 1991. 460 p. ISBN: 978-0444811622
- Association for the Advancement of Medical Instrumentation. American National Standard. Electronic or automated sphygmomanometers ANSI/AAMI SP10-1987. 3330 Washington Boulevard, Suite 400, Arlington, VA 22201-4598, USA: AAMI; 1987.
- O’Brien E, Petrie J, Littler W, et al. The British Hypertension Society protocol for the evaluation of automated and semi-automated blood pressure measuring devices with special reference to ambulatory systems. J Hypertens. 1990 Jul;8(7):607-19. doi: 10.1097/00004872-199007000-00004.
- White WB, Berson AS, Robbins C, et al. National standard for measurement of resting and ambulatory blood pressures with automated sphygmomanometers. Hypertension. 1993 Apr;21(4):504-9. doi: 10.1161/01.hyp.21.4.504.
- Association for the Advancement of Medical Instrumentation. American National Standard. Manual, electronic or automated sphygmomanometers ANSI/AAMI SP10-2002/A1. 3330 Washington Boulevard, Suite 400, Arlington, VA 22201-4598, USA: AAMI; 2003.
- O’Brien E, Petrie J, Littler W, et al. An outline of the revised British Hypertension Society protocol for the evaluation of blood pressure measuring devices. J Hypertens. 1993 Jun;11(6):677-9. doi: 10.1097/00004872-199306000-00013.
- Tholl U, Lüders S, Bramlage P, et al. The German Hypertension League (Deutsche Hochdruckliga) Quality Seal Protocol for blood pressure-measuring devices: 15-year experience and results from 105 devices for home blood pressure control. Blood Press Monit. 2016 Aug;21(4):197-205. doi: 10.1097/MBP.0000000000000186.
- O’Brien E, Pickering T, Asmar R, Myers M, Parati G, et al; Working Group on Blood Pressure Monitoring of the European Society of Hypertension International Protocol for validation of blood pressure measuring devices in adults. Blood Press Monit. 2002 Feb;7(1):3-17. doi: 10.1097/00126097-200202000-00002.
- O’Brien E, Atkins N, Stergiou G, et al. European Society of Hypertension International Protocol revision 2010 for the validation of blood pressure measuring devices in adults. Blood Press Monit. 2010 Feb;15(1):23-38. doi: 10.1097/MBP.0b013e3283360e98.
- Non‐invasive sphygmomanometers ‐ Part 4: Test procedures to determine the overall system accuracy of automated non‐invasive sphygmomanometers. European Committee for Standardization EN 1060‐4:2004. https://shop.bsigroup.com. [Internet] Accessed Feb 29, 2023.
- Non‐invasive sphygmomanometers ‐ Part 2: Clinical validation of automated measurement type. American National Standards Institute. ANSI/AAMI/ISO 81060‐2, 2009. http://webstore.ansi.org. [Internet] Accessed Feb 29, 2023.
- Non‐invasive sphygmomanometers ‐ Part 2: Clinical investigation of automated measurement type. American National Standards Institute. ANSI/AAMI/ISO 81060‐2:2013. http://webstore.ansi.org, [Internet] Accessed Feb 29, 2023.
- Stergiou GS, Alpert B, Mieke S, et al. A universal standard for the validation of blood pressure measuring devices: Association for the Advancement of Medical Instrumentation/European Society of Hypertension/International Organization for Standardization (AAMI/ESH/ISO) Collaboration Statement. J Hypertens. 2018 Mar;36(3):472-478. doi: 10.1097/HJH.0000000000001634.
- International Organization for Standardization. ISO 81060-2:2018. Noninvasive sphygmomanometers: Part 2: Clinical investigation of intermittent automated measurement type. 2018. https://www.iso.org/ standard/73339.html. [Internet] Accessed 29 Dec 2023].
- Stergiou GS, Menti A, Asayama K, et al. Accuracy of automated cuff blood pressure monitors in special populations: International Organization for Standardization (ISO) Task Group report and call for research. J Hypertens. 2023 May 1;41(5):811-818. doi: 10.1097/HJH.0000000000003403.
- Friedman BA, Alpert BS, Osborn D, et al. Assessment of the validation of blood pressure monitors: a statistical reappraisal. Blood Press Monit. 2008 Aug;13(4):187-91. doi: 10.1097/MBP.0b013e3283071a64.
- Ishigami J, Charleston J, Miller ER 3rd, et al. Effects of Cuff Size on the Accuracy of Blood Pressure Readings: The Cuff(SZ) Randomized Crossover Trial. JAMA Intern Med. 2023 Oct 1;183(10):1061-1068. doi: 10.1001/jamainternmed.2023.3264.
- Amoore JN. Oscillometric sphygmomanometers: a critical appraisal of current technology. Blood Press Monit. 2012 Apr;17(2):80-8. doi: 10.1097/MBP.0b013e32835026b0.
- O’Brien E, Atkins N, Staessen J. Factors influencing validation of ambulatory blood pressure measuring devices. J Hypertens. 1995 Nov;13(11):1235-40. PMID: 8984119.
- Ledyaev MY, Stepanova OV, Ledyaeva AM. Validation of the PBLab 24-hour blood pressure monitoring system in a pediatric population according to the 1993 British Hypertension Society protocol. Med Devices (Auckl). 2015 Feb 2;8:115-8. doi: 10.2147/MDER.S78515.
- Freedman DS, Foltz JL, Berenson GS. Differences between the fourth and fifth Korotkoff phases among children and adolescents. Am J Hypertens. 2014 Dec;27(12):1495-502. doi: 10.1093/ajh/hpu064.
- Mancia G, Kreutz R, Brunström M, et al. 2023 ESH Guidelines for the management of arterial hypertension The Task Force for the management of arterial hypertension of the European Society of Hypertension: Endorsed by the International Society of Hypertension (ISH) and the European Renal Association (ERA). J Hypertens. 2023 Dec 1;41(12):1874-2071. doi: 10.1097/HJH.0000000000003480.
- Посохов И.Н., Праскурничий Е.А. Факторы риска и патогенез изолированной систолической гипертензии молодых: современные точки зрения. Практическая медицина. 2021. Т. 19, No 5, С. 8-14 [Posokhov I.N., Praskurnichiy E.A. Risk factors and pathogenesis of isolated systolic hypertension in the young: modern points of view. Practical medicine. 2021. Vol. 19, No 5, P. 8-14 In Russ]
- Lim SH, Kim SH. Blood pressure measurements and hypertension in infants, children, and adolescents: from the postmercury to mobile devices. Clin Exp Pediatr. 2022 Feb;65(2):73-80. doi: 10.3345/cep.2021.00143.
- Sankaranarayanan N, Santos SF, Peixoto AJ. Blood pressure measurement in dialysis patients. Adv Chronic Kidney Dis. 2004 Apr;11(2):134-42. doi: 10.1053/j.arrt.2004.01.005.
- Stergiou GS, Dolan E, Kollias A, et al. Blood pressure measurement in special populations and circumstances. J Clin Hypertens (Greenwich). 2018 Jul;20(7):1122-1127. doi: 10.1111/jch.13296.
- Stergiou GS, Lourida P, Tzamouranis D, Baibas NM. Unreliable oscillometric blood pressure measurement: prevalence, repeatability and characteristics of the phenomenon. J Hum Hypertens. 2009 Dec;23(12):794-800. doi: 10.1038/jhh.2009.20.
- Упражнения по точному измерению АД. [Exercises for accurate blood pressure measurement] https://posohov.ru [Internet] Accessed Feb 29, 2023.
- Мелихов О. Г., Лукерин С. М., Зудин А. Б. Обращение с данными научных исследований в области медицины. Проблемы социальной гигиены, здравоохранения и истории медицины. 2020;28(2):173—177. [Melikhov O. G., Lukerin S. M., Zudin A. B. The handling and using of medical research data. Problemi socialnoi gigieni, zdravookhranenia i istorii meditsini. 2020;28(2):173—177 In Russian] doi: 10.32687/0869-866X-2020-28-2-173-177
Supplementary files

