چک لیست COSMIN برای ارزیابی کیفیت روش شناختی مطالعات در زمینه ویژگی های اندازه گیری ابزارهای اندازه گیری وضعیت سلامت: یک مطالعه بین المللی دلفی The COSMIN checklist for assessing the methodological quality of studies on measurement properties of health status measurement instruments: an international Delphi study
- نوع فایل : کتاب
- زبان : فارسی
- ناشر : اسپرینگر Springer
- چاپ و سال / کشور: 2010
توضیحات
چاپ شده در مجله تحقیقات کیفیت زندگی – Quality of Life Research
رشته های مرتبط روانشناسی و روان سنجی
مقدمه اندازه گیری پیامدهای سلامت در تحقیقات علمی و در عملیات بالینی امری ضروری است. بر اساس امتیازات بدست آمده با ابزارهای اندازه گیری، تصمیمات در مورد کاربرد تستهای تشخیص و درمان گرفته میشوند. ابزارهای اندازه گیری وضعیت سلامت بایستی دارای روایی و پایایی (معتبر و قابل اطمینان) باشند. در غیر این صورت، خطر جدی وجود نتایج غیر دقیق و اریب وجود دارد که میتواند منجر به نتایج غلطی شود. سازمانهایی نظیر سازمان غذا و داروی امریکا (FDA) و آژانس پزشکی اروپا (EMEA) بر ابزارهای اندازه گیری دارای روایی خوب تاکید کردهاند (۱-۲). نیاز به ابزارهای اندازه گیری پیامدهای سلامت قابل اطمینان و معتبر (دارای روایی و پایایی) توسط مارشال به خوبی اثبات شده است به طوری که او در کارازمایی های شیزوفرنی نشان داد که وقتی ابزار اندازه گیری منتشر نشده در مقایسه با ابزارهای منتشر شده استفاده میشوند، نویسندگان و محققان تمایل دارند گزارش کنند که درمان برتر از کنترل است (۳). قبل از استفاده از ابزار اندازه گیری وضعیت سلامت در عملیات بالینی یا تحقیقات، ویژگیهای اندازه گیری آن یعنی پایایی، روایی و حساسیت، را بایستی به طور کافی ارزیابی کرد. مطالعاتی که به ارزیابی ویژگیهای اندازه گیری میپردازند، بایستی از کیفیت روش شناختی بالایی برای تضمین نتایج مناسب در خصوص ویژگیهای اندازه گیری یک ابزار اندازه گیری برخوردار باشند. به منظور ارزیابی کیفیت روش شناختی یک مطالعه بر روی ویژگیهای اندازه گیری، استانداردهایی لازم است. اگرچه بسیاری از استانداردها و معیارها پیشنهاد شدهاند، اینها به چک لیستهای کاربرپسند و قابل کاربرد، تبدیل نشدهاند (۴-۵). به علاوه، این استانداردها توجه کافی را به مطالعاتی که از مدل ” نظریه پاسخ سؤال” استفاده میکنند و یا مبتنی بر اجماع نیستند (۶-۷) مبذول نمیکنند. این چک لیست بایستی در بر گیرنده یک مجموعه کاملی از استانداردها (که اشاره به نیازهای طراحی و روشهای آماری مطلوب دارد) و معیارهای کفایت برای ایجاد ویژگیهای اندازه گیری خوب باشد. اجماع گسترده و زیادی برای دست یابی به پذیرش گسترده یک چک لیست لازم است. تحقیقات در زمینه ویژگیهای اندازه گیری از اهمیت زیادی برای پیامدهای سلامتی که مستقیماً توسط بیماران گزارش میشوند یعنی پیامدهای مرتبط با سلامت گزارش شده توسط بیمار (HR-PRO) برخوردار است. HR-PRO به معنی اندازه گیری هر بهدی از وضعیت سلامت بیمار میباشد که به طور مستقیم توسط بیمار یعنی بدون تفسیر پاسخهای بیمار توسط پزشک یا هر کس دیگر (۲) ارزیابی میشود. شیوههای جمع آوری دادهها برای ابزارهای HR-PRO شامل ابزارهای مصاحبهای، ابزارهای خودکار و یا ابزارهای کامپیوتری میباشند (۲). نمونههایی از HR-PRO شامل پرسشنامههای ارزیابی علایم، وضعیت عملکردی و کیفیت زندگی مرتبط با سلامت میباشند. اینها ساختارهایی هستند که به طور مستقیم قابل اندازه گیری نمیباشند. به دلیل ماهیت ذهنی این ساختارها، ارزیابی این که آیا ابزارهای اندازه گیری این ساختارها را به شیوهای مطمئن و معتبر اندازه گیری میکنند یا خیر، بسیار مهم است. هدف رویکرد COSMIN(استانداردهای مبتنی بر اجماع برای انتخاب ابزارهای اندازه گیری سلامت)، بهبود انتخاب ابزارهای اندازه گیری سلامت میباشد. هدف این مطالعه به عنوان بخشی از این طرح، توسعه یک چک لیست حاوی استانداردهایی برای ارزیابی کیفیت روش شناختی مطالعات بر روی ویژگیهای اندازه گیری است. این چک لیست به صورت همکاری بین رشتهای و بین المللی با همه کارشناسان مرتبط توسعه یافت. ما یک مطالعه دلفی را برای پاسخ به دو سؤال تحقیق انجام دادیم. ۱-کدام ویژگیهای اندازه گیری بایستی در چک لیست گنجانده شوند؟ ۲-چگونه این ویژگیهای اندازه گیری بایستی از حیث طرح مطالعه و تحلیل آماری ارزیابی شوند (یعنی استانداردها)؟ در این مقاله، ما یک چک لیست COSMIN را ارائه کرده و به توصیف توافق هیئت کارشناسان در خصوص آیتمهای گنجانده شده در چک لیست میپردازیم. روشها هدف چک لیست COSMIN چک لیست COSMIN بر ارزیابی کیفیت روش شناختی مطالعات در زمینه ویژگیهای اندازه گیری HR-PRO متمرکز است. ما بر HR-PRO به دلیل پیچیدگی این ابزارها تاکید میکنیم. این ابزارها، ساختارهایی را اندازه گیری میکنند که هم چند بعدی میباشند و هم مستقیماً قابل اندازه گیری نیستند. به علاوه، ما بر کاربردهای ارزش گذارانه ابزارهای HR-PRO یعنی کاربردهای طولی ارزیابی اثرات درمان یا تغییرات در سلامت به مرور زمان تاکید داریم. عبارت” ارزش گذارانه” لازم است زیرا ملزومات ویژگیهای اندازه گیری با توجه به کاربرد ابزار متغیر هستند (۸). برای مثال، ابزارهای مورد استفاده برای ارزیابی بایستی پاسخ گو باشند، در حالی که ابزارهای مورد استفاده برای تمایز و تفکیک این ویژگی را ندارند. کمیته اجرایی COSMIN(پیوست ۱) مرور منابعی را برای تعیین شیوه ارزیابی عمومی ویژگیهای اندازه گیری انجام داده است. دو جست و جو در این رابطه انجام شد:۱-مرور منابع سیستماتیک برای شناسایی همه مقالات مروری سیستماتیک موجود در خصوص ویژگیهای اندازه گیری ابزارهای اندازه گیری وضعیت سلامت (۹) انجام شد. با توجه به این مرور منابع، اطلاعاتی استخراج شد که بر اساس آن ویژگیهای اندازه گیری ارزیابی شده و استانداردهایی برای بررسی ویژگیهای اندازه گیری مطالعات استفاده شدند. برای هر ویژگی اندازه گیری، استانداردهای مختلفی یافته شد که برخی از آنها متناقض میباشند (۹).۲- کمیته اجرایی نیز مرور منابع سیستماتیک دیگری را برای شناسایی مقالات روش شناسی و متون حاوی استانداردها و معیارهای ارزیابی ویژگیهای اندازه گیری ابزارهای اندازه گیری وضعیت سلامت انجام داد. مقالات در صورتی انتخاب شدند که هدف مقاله، ارائه چک لیست یا استانداردهایی برای خواص اندازه گیری باشد. استانداردهای شناسایی شده در منابع فوق به صورت ورودی در مراحل دلفی استفاده شد.
رشته های مرتبط روانشناسی و روان سنجی
مقدمه اندازه گیری پیامدهای سلامت در تحقیقات علمی و در عملیات بالینی امری ضروری است. بر اساس امتیازات بدست آمده با ابزارهای اندازه گیری، تصمیمات در مورد کاربرد تستهای تشخیص و درمان گرفته میشوند. ابزارهای اندازه گیری وضعیت سلامت بایستی دارای روایی و پایایی (معتبر و قابل اطمینان) باشند. در غیر این صورت، خطر جدی وجود نتایج غیر دقیق و اریب وجود دارد که میتواند منجر به نتایج غلطی شود. سازمانهایی نظیر سازمان غذا و داروی امریکا (FDA) و آژانس پزشکی اروپا (EMEA) بر ابزارهای اندازه گیری دارای روایی خوب تاکید کردهاند (۱-۲). نیاز به ابزارهای اندازه گیری پیامدهای سلامت قابل اطمینان و معتبر (دارای روایی و پایایی) توسط مارشال به خوبی اثبات شده است به طوری که او در کارازمایی های شیزوفرنی نشان داد که وقتی ابزار اندازه گیری منتشر نشده در مقایسه با ابزارهای منتشر شده استفاده میشوند، نویسندگان و محققان تمایل دارند گزارش کنند که درمان برتر از کنترل است (۳). قبل از استفاده از ابزار اندازه گیری وضعیت سلامت در عملیات بالینی یا تحقیقات، ویژگیهای اندازه گیری آن یعنی پایایی، روایی و حساسیت، را بایستی به طور کافی ارزیابی کرد. مطالعاتی که به ارزیابی ویژگیهای اندازه گیری میپردازند، بایستی از کیفیت روش شناختی بالایی برای تضمین نتایج مناسب در خصوص ویژگیهای اندازه گیری یک ابزار اندازه گیری برخوردار باشند. به منظور ارزیابی کیفیت روش شناختی یک مطالعه بر روی ویژگیهای اندازه گیری، استانداردهایی لازم است. اگرچه بسیاری از استانداردها و معیارها پیشنهاد شدهاند، اینها به چک لیستهای کاربرپسند و قابل کاربرد، تبدیل نشدهاند (۴-۵). به علاوه، این استانداردها توجه کافی را به مطالعاتی که از مدل ” نظریه پاسخ سؤال” استفاده میکنند و یا مبتنی بر اجماع نیستند (۶-۷) مبذول نمیکنند. این چک لیست بایستی در بر گیرنده یک مجموعه کاملی از استانداردها (که اشاره به نیازهای طراحی و روشهای آماری مطلوب دارد) و معیارهای کفایت برای ایجاد ویژگیهای اندازه گیری خوب باشد. اجماع گسترده و زیادی برای دست یابی به پذیرش گسترده یک چک لیست لازم است. تحقیقات در زمینه ویژگیهای اندازه گیری از اهمیت زیادی برای پیامدهای سلامتی که مستقیماً توسط بیماران گزارش میشوند یعنی پیامدهای مرتبط با سلامت گزارش شده توسط بیمار (HR-PRO) برخوردار است. HR-PRO به معنی اندازه گیری هر بهدی از وضعیت سلامت بیمار میباشد که به طور مستقیم توسط بیمار یعنی بدون تفسیر پاسخهای بیمار توسط پزشک یا هر کس دیگر (۲) ارزیابی میشود. شیوههای جمع آوری دادهها برای ابزارهای HR-PRO شامل ابزارهای مصاحبهای، ابزارهای خودکار و یا ابزارهای کامپیوتری میباشند (۲). نمونههایی از HR-PRO شامل پرسشنامههای ارزیابی علایم، وضعیت عملکردی و کیفیت زندگی مرتبط با سلامت میباشند. اینها ساختارهایی هستند که به طور مستقیم قابل اندازه گیری نمیباشند. به دلیل ماهیت ذهنی این ساختارها، ارزیابی این که آیا ابزارهای اندازه گیری این ساختارها را به شیوهای مطمئن و معتبر اندازه گیری میکنند یا خیر، بسیار مهم است. هدف رویکرد COSMIN(استانداردهای مبتنی بر اجماع برای انتخاب ابزارهای اندازه گیری سلامت)، بهبود انتخاب ابزارهای اندازه گیری سلامت میباشد. هدف این مطالعه به عنوان بخشی از این طرح، توسعه یک چک لیست حاوی استانداردهایی برای ارزیابی کیفیت روش شناختی مطالعات بر روی ویژگیهای اندازه گیری است. این چک لیست به صورت همکاری بین رشتهای و بین المللی با همه کارشناسان مرتبط توسعه یافت. ما یک مطالعه دلفی را برای پاسخ به دو سؤال تحقیق انجام دادیم. ۱-کدام ویژگیهای اندازه گیری بایستی در چک لیست گنجانده شوند؟ ۲-چگونه این ویژگیهای اندازه گیری بایستی از حیث طرح مطالعه و تحلیل آماری ارزیابی شوند (یعنی استانداردها)؟ در این مقاله، ما یک چک لیست COSMIN را ارائه کرده و به توصیف توافق هیئت کارشناسان در خصوص آیتمهای گنجانده شده در چک لیست میپردازیم. روشها هدف چک لیست COSMIN چک لیست COSMIN بر ارزیابی کیفیت روش شناختی مطالعات در زمینه ویژگیهای اندازه گیری HR-PRO متمرکز است. ما بر HR-PRO به دلیل پیچیدگی این ابزارها تاکید میکنیم. این ابزارها، ساختارهایی را اندازه گیری میکنند که هم چند بعدی میباشند و هم مستقیماً قابل اندازه گیری نیستند. به علاوه، ما بر کاربردهای ارزش گذارانه ابزارهای HR-PRO یعنی کاربردهای طولی ارزیابی اثرات درمان یا تغییرات در سلامت به مرور زمان تاکید داریم. عبارت” ارزش گذارانه” لازم است زیرا ملزومات ویژگیهای اندازه گیری با توجه به کاربرد ابزار متغیر هستند (۸). برای مثال، ابزارهای مورد استفاده برای ارزیابی بایستی پاسخ گو باشند، در حالی که ابزارهای مورد استفاده برای تمایز و تفکیک این ویژگی را ندارند. کمیته اجرایی COSMIN(پیوست ۱) مرور منابعی را برای تعیین شیوه ارزیابی عمومی ویژگیهای اندازه گیری انجام داده است. دو جست و جو در این رابطه انجام شد:۱-مرور منابع سیستماتیک برای شناسایی همه مقالات مروری سیستماتیک موجود در خصوص ویژگیهای اندازه گیری ابزارهای اندازه گیری وضعیت سلامت (۹) انجام شد. با توجه به این مرور منابع، اطلاعاتی استخراج شد که بر اساس آن ویژگیهای اندازه گیری ارزیابی شده و استانداردهایی برای بررسی ویژگیهای اندازه گیری مطالعات استفاده شدند. برای هر ویژگی اندازه گیری، استانداردهای مختلفی یافته شد که برخی از آنها متناقض میباشند (۹).۲- کمیته اجرایی نیز مرور منابع سیستماتیک دیگری را برای شناسایی مقالات روش شناسی و متون حاوی استانداردها و معیارهای ارزیابی ویژگیهای اندازه گیری ابزارهای اندازه گیری وضعیت سلامت انجام داد. مقالات در صورتی انتخاب شدند که هدف مقاله، ارائه چک لیست یا استانداردهایی برای خواص اندازه گیری باشد. استانداردهای شناسایی شده در منابع فوق به صورت ورودی در مراحل دلفی استفاده شد.
Description
Introduction Measurement of health outcomes is essential in scientific research and in clinical practice. Based on the scores obtained with measurement instruments, decisions are made about the application of subsequent diagnostic tests and treatments. Health status measurement instruments should therefore be reliable and valid. Otherwise there is a serious risk of imprecise or biased results that might lead to wrong conclusions. Organisations such as the US Food and Drug Administration (FDA) and the European Medicines Agency (EMEA) require that measurement instruments must be well validated for its purpose [1, 2]. The need for reliable and valid measurement instruments of health outcomes was clearly demonstrated by Marshall, who showed in schizophrenia trials that authors were more likely to report that treatment was superior to control when an unpublished measurement instrument was used in the comparison, rather than a published instrument [3]. Before a health status measurement instrument can be used in research or clinical practice, its measurement properties, i.e. reliability, validity and responsiveness, should be assessed and considered adequate. Studies evaluating measurement properties should be of high methodological quality to guarantee appropriate conclusions about the measurement properties of an instrument. To evaluate the methodological quality of a study on measurement properties, standards are needed. Although many standards and criteria have been proposed, these have not been operationalised into user-friendly and easily applicable checklists (e.g. [4, 5]). Moreover, these standards do not pay attention to studies that apply Item Response Theory (IRT) models, or are not consensus based (e.g. [6, 7]). Such a checklist should contain a complete set of standards (which refers to the design requirements and preferred statistical methods) and criteria of adequacy for what constitutes good measurement properties. Broad consensus is necessary in order to achieve wide acceptance of a checklist. Research on measurement properties is particularly important for health outcomes that are directly reported by patients, i.e. health-related patient-reported outcomes (HR-PROs). A HR-PRO is a measurement of any aspect of a patient’s health status that is directly assessed by the patient, i.e. without the interpretation of the patient’s responses by a physician or anyone else [2]. Modes of datacollection for HR-PRO instruments include intervieweradministered instruments, self-administered instruments, or computer-administered instrument [2]. Examples of HR-PROs are questionnaires assessing symptoms, functional status, and health-related quality of life. These are constructs which are not directly measurable. Because of the subjective nature of these constructs, it is very important to evaluate whether the measurement instruments measure these constructs in a valid and reliable way. The COSMIN initiative (COnsensus-based Standards for the selection of health Measurement Instruments) aims to improve the selection of health measurement instruments. As part of this initiative, the aim of this study was to develop a checklist containing standards for evaluating the methodological quality of studies on measurement properties. The checklist was developed as a multidisciplinary, international collaboration with all relevant expertise involved. We performed a Delphi study to address two research questions: 1. Which measurement properties should be included in the checklist? 2. How should these measurement properties be evaluated in terms of study design and statistical analysis (i.e. standards)? In this paper, we present the COSMIN checklist, and describe the agreement of the panel concerning the items included in the checklist. Methods Focus of the COSMIN checklist The COSMIN checklist is focused on evaluating the methodological quality of studies on measurement properties of HR-PROs. We choose to focus on HR-PROs, because of the complexity of these instruments. These instruments measure constructs that are both multidimensional and not directly measurable. In addition, we focused on evaluative applications of HR-PRO instruments, i.e. longitudinal applications assessing treatment effects or changes in health over time. The specification of evaluative is necessary, because the requirements for measurement properties vary with the application of the instrument [8]. For example, instruments used for evaluation need to be responsive, while instruments used for discrimination do not. The COSMIN Steering Committee (Appendix 1) searched the literature to determine how measurement properties are generally evaluated. Two searches were performed: (1) a systematic literature search was performed to identify all existing systematic reviews on measurement properties of health status measurement instruments [9]. From these reviews, information was extracted on which measurement properties were evaluated, and on standards that were used to evaluate the measurement properties of the included studies. For each measurement property, we found several different standards, some of which were contradictory [9]. (2) The steering committee also performed another systematic literature search (available on request from the authors) to identify methodological articles and textbooks containing standards for the evaluation of measurement properties of health status measurement instruments. Articles were selected if the purpose of the article was to present a checklist or standards for measurement properties. Standards identified in the aforementioned literature were used as input in the Delphi rounds.