白内障患者报告结局条目库的研制

引用本文

黄锦海, 朱森淼, 涂瑞雪, 章思芳, 刘艳华, 赵陈培, 彭芳丽, 曹思, 王勤美, 高蓉蓉. 白内障患者报告结局条目库的研制[J]. 中华眼视光学与视觉科学杂志, 2017,19(9): 518-527.
Jinhai Huang, Senmiao Zhu, Ruixue Tu, Sifang Zhang, Yanhua Liu, Chenpei Zhao, Fangli Peng, Si Cao, Qinmei Wang, Rongrong Gao. The Development of a Cataract-specific Item Bank to Measure Patient-reported Outcomes[J]. CHINESE JOURNAL OF OPTOMETRY OPHTHALMOLOGY AND VISUAL SCIENCE, 2017,19(9): 518-527. 复制到剪切板

Doi:10.3760/cma.j.issn.1674-845X.2017.09.002
Permissions

《中华眼视光学与视觉科学杂志》所有

白内障患者报告结局条目库的研制

黄锦海, 朱森淼, 涂瑞雪, 章思芳, 刘艳华, 赵陈培, 彭芳丽, 曹思, 王勤美, 高蓉蓉

325027 温州医科大学附属眼视光医院眼视光学院浙江省眼科医院国家眼视光工程技术研究中心眼科和视光仪器评估与应用研究所

通讯作者:高蓉蓉,Email：beargrr@163.com

收稿日期: 2017-07-29

基金资助: 国家卫生计生委科学计划基金-浙江省医药卫生重大科技计划项目（WKJ-ZJ-1530）; 浙江省康恩贝医院管理软科学研究项目（2015ZHA-KEB206）; 浙江省公益技术应用研究计划项目（2016C33082）

摘要

目的：基于Rasch模型研制白内障患者报告结局（PROs）条目库,为准确、全面和动态评估白内障PROs奠定基础。方法：横断面调查研究。根据纳入标准选取我院已确诊的白内障住院患者,采用本课题组前期基于循证医学方法构建的白内障PROs条目池对其进行问卷调查。通过Rasch分析各维度条目选项概率曲线（CPC）、测量精密性、条目拟合指标（infit/outfit MNSQ）、单维性、匹配度和条目功能差异（DIF）等测量特性指标,并反复迭代、提炼,直至得到测量特性优良的条目。采用Pearson相关分析评估各维度和视力的相关性。结果：共纳入296例白内障患者,其中男130例,女166例,年龄70（63,77）岁,受过小学及以上教育者178例（60.1%）,术前双眼日常生活视力（LogMAR）为0.0~3.0,中位数为0.6。条目库共纳入3个维度,其中视觉相关活动受限维度23个条目,视觉症状维度14个条目,精神心理健康11个条目,所有条目选项数量均为4个。视觉相关活动受限维度中,选项类别阈值分别为-1.84、0.04、1.79,被试分离信度/被试分离系数（PSR/PSI）为0.93/3.59,主成分分析（PCA）第一成分未解释方差特征值为2.61,匹配度为-0.81,DIF值均小于1;该维度得分与好眼视力（ r=0.619, P < 0.01）和双眼视力（ r=0.622, P < 0.01）有相关性。视觉症状维度中,选项类别阈值分别为-1.83、-0.18、2.00,PSR/PSI为0.88/2.68,PCA第一成分未解释方差特征值为2.53,匹配度为-1.35,2个条目在眼部并发症方面的DIF值大于1,其余DIF值均小于1;该维度得分与好眼视力（ r=0.482, P < 0.01）和双眼视力（ r=0.492, P < 0.01）有相关性。精神心理健康维度中,选项类别阈值分别为-2.83、0.03、2.80,PSR/PSI为0.88/2.68,PCA第一成分未解释方差特征值为2.79,匹配度为-0.34,所有条目DIF值均小于1;该维度得分与好眼视力（ r=0.425, P < 0.01）和双眼视力（ r=0.426, P < 0.01）有相关性。上述所有条目infit和outfit值均介于0.50~1.50之间。结论：基于Rasch分析研制的白内障PROs条目库覆盖了视觉相关活动受限、视觉症状和精神心理健康3个方面,全面地反应了白内障PROs的内涵,且条目简明易懂,临床可操作性好,具有较好的测量特性。

关键词: 白内障; 患者报告结局; 条目库; Rasch模型

The Development of a Cataract-specific Item Bank to Measure Patient-reported Outcomes

Jinhai Huang, Senmiao Zhu, Ruixue Tu, Sifang Zhang, Yanhua Liu, Chenpei Zhao, Fangli Peng, Si Cao, Qinmei Wang, Rongrong Gao

Eye Hospital ,Wenzhou Medical University, Wenzhou 325027, China

Corresponding author: Rongrong Gao, Eye Hospital, Wenzhou Medical University, Wenzhou 325027, China (Email: beargrr@163.com)

Fund:This study was funded by Zhejiang Provincial & Ministry of Health Research Fund for Medical Sciences (WKJ-ZJ-1530), Scientific Research Fund of Zhejiang Provincial Kangenbei (2015ZHA-KEB206), and Science and Technology Planning Project of Zhejiang Province (2016C33082).

Abstract

Objective: To develop a Rasch-based item bank for the assessment of Cataract-specific patient-reported outcomes (PROs) that can be evaluated precisely, comprehensively and dynamically.Methods: In this cross-sectional study, patients diagnosed with cataract in the Eye Hospital of Wenzhou Medical University were enrolled. Cataract patients answered an item pool of cataract PROs that was established by following the guidelines of the international PRO development process. Rasch analysis was used to test the category probability curve (CPC), measure precision, infit/outfit MNSQ, unidimensionality, targeting and differential item functioning (DIF). The items were refined until reliable characteristics were developed for the item bank. A Pearson correlation analysis was used to test each dimension for its correlation with visual acuity.Results: A total of 296 patients (130 males) were recruited for this study. Of those, 60.1% were illiterate with a median age of 70 years, an interquartile range of 63 to 77 years, and a preoperative binocular visual acuity (LogMAR) range from 0.0 to 3.0 (median 0.6). The conceptual framework of the item bank consisted of three domains. The Rasch analysis led to the following item banks: "Vision-related activity limitation" (23 items), "Visual symptoms" (14 items) and "Emotional well-being" (11 items). All items had four response options. The vision-related activity limitation domain had a category threshold order of -1.84, 0.04, 1.79, a person separation reliability/person separation index (PSR/PSI) of 0.93/3.59, an eigenvalue of principal component analysis of 2.61, and targeting of -0.81 none of the items had a DIF. This domain had a moderate correlation with better visual acuity ( r=0.619, P<0.01) and binocular visual acuity ( r=0.622, P<0.01). The vision symptoms domain had a category threshold order of -1.83, -0.18, 2.00, a PSR/PSI of 0.88/2.68, an eigenvalue of principal components analysis of 2.53, and targeting of -1.35. Two items showing a DIF of ocular comorbidities. This domain had a moderate correlation with better visual acuity ( r=0.482, P<0.01) and binocular visual acuity ( r=0.492, P<0.01). The emotional well-being domain had a category threshold order of -2.83, 0.03, 2.80, a PSR/PSI of 0.88/2.68, an eigenvalue of principal components analysis of 2.79, targeting of -0.34. None of the items had a DIF. This domain showed moderate correlation with better visual acuity ( r=0.425, P<0.01) and binocular visual acuity ( r=0.426, P<0.01). All items were trimmed to meet the goodness of fit statistic criteria of 0.50-1.50.Conclusions: This study, which is based on the Rasch analysis, developed a cataract item bank that covers all three common concern domains of cataract patients. It is a comprehensive assessment denoting the PROs of cataract patients and is easy to understand and administer. It not only shows perfect psychometric properties but is also appropriate for measuring PROs in Chinese cataract patients.

Keyword: cataract; patient-reported outcomes; item bank; Rasch model

Show Figures

白内障是全世界首要的致盲性眼病^[1], 其导致的视功能损害易对患者的视觉健康、日常活动和精神心理等方面造成影响, 致使患者生活质量（Quality of life, QoL）下降。在临床实践中, QoL作为全面衡量健康状态的指标, 可有效用于白内障手术时机的选择及诊疗效果的评价^{[2, 3]}。近年来, 患者报告结局（Patient reported outcomes, PROs）作为患者对疾病造成影响的自我感觉和对治疗效果满意度的主观评价^[4], 已广泛应用于眼科临床试验和公共卫生等领域^{[5, 6]}。

目前, 眼科领域PROs测量工具主要以量表为主^[7]。然而现有的大部分眼科量表是基于经典测验理论（Classical test theory, CTT）研制而成, 而CTT的条目统计量依赖于测验的被试样本, 其假设的平行测验在实际情况中是不可能实现的, 因此难以获得准确的测量特性^{[8, 9]}; 其次, 绝大部分量表仅涉及QoL一个或两个方面, 未能全面涵盖PROs的各方面情况^[10]; 此外, 不同量表之间的测量结果无法直接进行比较, 目前缺乏统一的评估工具^[11]。针对上述情况, Pesudovs^[12]指出, 构建PROs条目库（Item bank）将有效克服以上缺陷, 在建立条目池（Item pool）的基础上, 通过Rasch分析评价条目的测量特性, 筛选、合并及删除测量特性不佳的条目, 从而形成具有良好测量特性的条目库^[13]。基于Rasch分析研制的条目库具有优良的测量特性, 其测试内容可以覆盖QoL各个方面, 其难度值可以覆盖被试者的各个水平, 几乎可避免测试中出现天花板和地板效应^[14]。Fries等^[15]研究表明, 条目库与CAT系统相结合的患者报告结局测量系统（Patient reported outcomes measure information system, PROMIS）相比较于目前的纸笔作答方式具有更高的准确性和敏感性。

目前眼科领域的PROs 条目库研制尚处于空白阶段。本研究以前期构建的白内障条目池为基础^[16], 对临床患者进行测试, 收集相关数据, 并基于Rasch分析研制白内障PROs条目库, 为今后眼科领域PROs条目库的构建提供参考。

1 对象与方法

1.1 对象

纳入标准：①年龄大于18岁, 不伴发其他严重眼部疾病或严重系统疾病; ②确诊为单眼或双眼年龄相关性白内障至少3个月; ③认知正常, 理解能力良好。选取2015年1月至2016年1月于温州医科大学附属眼视光医院确诊的白内障患者。本研究遵循赫尔辛基宣言, 通过温州医科大学附属眼视光医院伦理委员会批准, 并获得所有研究对象知情同意。所有入选患者均签署知情同意书。

1.2 研究方法

记录患者姓名、性别、年龄、教育水平和伴随疾病等基本资料。采用标准对数视力表进行视力检查, 记录单、双眼日常生活视力（Snellen视力）, 统计时将Snellen视力转换成LogMAR视力。采用本课题组前期基于循证医学方法研制的条目池进行问卷调查^[16], 该条目池由3个维度组成, 分别为视觉相关活动受限（Vision-related activity limitation）维度、视觉症状（Visual symptom）维度和精神心理健康（Emotional well-being）维度。调查时向患者强调近1个月来双眼视物时, 仅视功能损害而非其他疾病造成的QoL影响。有阅读能力者自行完成, 无阅读能力者由调查者代为阅读后, 与患者面对面交流后代为填写。

1.3 测量特性分析

通过Rasch模型分析条目池的下列测量特性：①选项阈值顺序（Category probability curve, CPC）：是反映选项类别是否有序设置的一个重要参数, 当患者难以区分选项难度, 选择某个选项的患者过少或选项类别定义不清时, 选项等级会出现混乱, 即出现无序临界点。②测量精密性（Measure precision）：是指问卷对不同潜在特征人群的区分能力, 包含被试者分离指数（Person separate index, PSI）和被试者分离信度（Person separate reliability, PSR）, 当PSI≥ 2.0且PSR≥ 0.8时, 认为该量表具有良好的测量精密性。③条目拟合指标（infit/outfit MNSQ）：反映统计资料和Rasch模型之间的拟合程度, 以infit均方和outfit的均方（Mean-squares, MNSQ）表示。④单维性（Unidimensionality）：采用主成分分析（Principal components analysis, PCA）表示, 当测量解释的原始方差占总方差的比例> 50%, 条目解释的原始方差特征值大于第一成分未解释方差特征值的3.0倍, 并且第一成分未解释方差特征值 < 3.0, 则该量表为单维性好^[17]。⑤匹配度（Targeting）：反映条目难度与个人能力间的匹配程度, 条目难度与个人能力值的差异越小表明越匹配。⑥条目功能差异（Differential item functioning, DIF）：是指对于某个特定条目, 来自不同类别, 但能力相同患者的得分之间存在差异, 一般认为当DIF值> 1时为显著水平。根据测量特性指标, 进行筛选、合并及删除, 通过反复迭代计算直至得到测量特性理想的条目集合, 即条目库。

1.4 统计学方法

横断面调查研究。所有数据均由2名成员分别录入, 确认数据完全一致后进行分析。采用Winsteps软件（版本3.75.0, 美国俄勒冈州比弗顿）和SPSS 20.0进行统计分析。计量资料均采用Shapiro-Wilk法进行正态性检验, 符合正态分布的数据, 采用$\bar{x}$± s进行统计描述; 不符合正态分布的数据采用M（P₂₅, P₇₅）进行统计描述。通过Pearson相关性分析评价单、双眼视力与各维度得分的相关程度。以P < 0.05为差异有统计学意义。

2 结果

2.1 一般情况

本研究共纳入白内障术前患者296例, 其中男130例, 女166例, 年龄为70（63, 77）岁, 受过小学及以上教育者178例（60.1%）, 首次白内障手术者276例（93.2%）, 术前双眼日常生活视力（LogMAR）为0.0~3.0, 中位数为0.6。伴有眼部并发症者89例（30.1%）, 全身并发症者185例（62.5%）。

2.2 视觉相关活动受限维度

2.2.1 首次Rasch分析纳入视觉相关活动受限维度41个条目进行分析^[16]。选项类别阈值分别为-1.61、0.21、1.40。PSR/PSI为0.94/3.96。除条目2、3、6、7、22、40外, 其余条目infit和outfit值均介于0.50~1.50之间。条目1、2、14、19、30、31、32缺失率均大于60%, 认为上述条目适用性不良, 故考虑删除。匹配度为-0.58。在性别、好眼视力分类、首眼或次眼手术、全身并发症等类别上DIF值均大于1。该维度第一成分未解释方差特征值为3.72, 单维性不佳。

2.2.2 多次迭代分析删除首次Rasch分析中缺失率大于50%的条目后, 共纳入34个条目进行分析, 结果显示该维度第一成分未解释方差特征值为3.49, 单维度依旧不佳, 仍需进一步分析。通过Misfit和单维性分析, 依次迭代删除条目3、6、7、15、16、17、21、22、29、37、40后进行分析。选项类别阈值分别为-1.84、0.04、1.79, CPC见图1, 表明选项类别设置合理。PSR/PSI为0.93/3.59。infit和outfit值均介于0.50~1.50之间。匹配度为-0.81, 视觉相关活动受限维度的个人-条目匹配图见图2。DIF均值小于1。该维度通过条目解释的原始方差特征值（23.05）为第一成分未解释方差特征值（2.61）的8.8倍, 后者小于3.0且占比为4.4%, 说明该维度单维性成立。该维度共计41个条目经Rasch分析, 依次迭代删除测量特性不佳的条目, 最终纳入23个条目, 其难度值和拟合度见表1。该维度条目与好眼视力（r=0.619, P < 0.01）、差眼视力（r=0.377, P < 0.01）和双眼视力（r=0.622, P < 0.01）均有相关性。

	Figure Option View Download New Window
	图1. 视觉相关活动受限维度的选项阈值顺序Figure 1. Category probability curves for vision-related activity limitations domain.

	Figure Option View Download New Window
	图2. 视觉相关活动受限维度的个人-条目匹配图Figure 2. Person item map for vision-related activity limitations domain.

表1 视觉相关活动受限维度的条目难度值和拟合度 Table 1 Item difficulty and fitness for vision-related activity limitations domain

2.3 视觉症状维度

2.3.1 首次Rasch分析纳入视觉症状维度24个条目进行分析^[16]。选项类别阈值分别为-0.84、-0.02、0.86。PSR/PSI为0.87/2.64。除条目46、68外, 其余条目infit和outfit值均介于0.50~1.50之间, 故予以删除。所有条目丢失率均小于50%。该维度匹配度为-0.94。在好眼视力分类中, 第48、51条目的DIF大于1, 首眼或次眼手术、眼部并发症分类中, 分别有第46、51条目的DIF值大于1。该维度第一成分未解释方差特征值为5.54, 单维性不佳。

2.3.2 多次迭代分析通过Misfit分析, 依次迭代删除条目46、47、68、69、64、62、63、65; 通过单维性分析, 依次迭代删除条目56、57、58、59、60、61后共纳入14个条目进行分析。选项类别阈值分别为-1.83、-0.18、2.00, CPC见图3, 表明选项类别设置合理。得到PSR/PSI为0.88/2.68。infit和outfit值均介于0.50~1.50之间。匹配度为-1.35, 视觉症状维度的个人-条目匹配图见图4。眼部并发症方面中, 第50、51条目的DIF值大于1。该维度通过条目解释的原始方差特征值为18.35, 是第一成分未解释方差特征值（2.53）的7.3倍, 且后者小于3.0, 说明该维度单维性成立。该维度共计24个条目经Rasch分析, 依次迭代删除测量特性不佳的条目, 最终纳入14个条目, 条目难度值和拟合度见表2。该维度条目与好眼视力（r=0.482, P < 0.01）、差眼视力（r=0.368, P < 0.01）和双眼视力（r=0.492, P < 0.01）均有相关性。

	Figure Option View Download New Window
	图3. 视觉症状维度的选项阈值顺序Figure 3. Category probability curves for visual symptoms domain.

	Figure Option View Download New Window
	图4. 视觉症状维度的个人-条目匹配图Figure 4. Person item map for visual symptoms domain.

表2 视觉症状维度的条目难度值和拟合度 Table 2 Item difficulty and fitness for visual symptoms domain

2.4 精神心理健康维度

2.4.1 首次Rasch分析纳入精神心理健康维度25个条目进行分析^[16]。选项类别阈值分别为-2.03、0.00、2.03。PSR/PSI为0.93/3.58。除条目91、76外, 其余条目infit和outfit值均介于0.50~1.50之间, 故予以删除该2条条目。该维度匹配度为-0.89。在性别分类中, 第86个条目DIF值大于1; 首眼或次眼手术分类中, 第87、91个条目DIF值大于1。该维度第一成分未解释方差特征值为3.86, 单维性不佳。

2.4.2 多次迭代分析通过Misfit分析, 依次迭代删除条目91、76、87、86; 通过单维性分析, 依次迭代删除条目70、71、72、73、74、75、83、84、85、93后共纳入11个条目进行分析。选项类别阈值分别为-2.83、0.03、2.80, CPC见图5, 表明选项类别设置合理。得到PSR/PSI为0.88/2.68。infit和outfit值均介于0.50~1.50之间。所有条目应答率较高。匹配度为-0.34, 表明匹配度理想, 精神心理健康维度的个人-条目匹配图见图6。不存在DIF值大于1的条目。该维度通过条目解释的原始方差特征值为15.49, 是第一成分未解释方差特征值（2.79）的5.6倍, 且后者小于3.0, 说明该维度单维性成立。该维度共计25个条目经Rasch分析, 依次迭代删除测量特性不佳的条目, 最终纳入11个条目, 条目难度值和拟合度见表3。该维度条目与好眼视力（r=0.425, P < 0.01）、差眼视力（r=0.347, P < 0.01）和双眼视力（r=0.426, P < 0.01）均有相关性。

	Figure Option View Download New Window
	图5. 精神心理健康维度的选项阈值顺序Figure 5. Category probability curves for psychological well-being domain.

	Figure Option View Download New Window
	图6. 精神心理健康维度的个人-条目匹配图Figure 6. Person item map for psychological well-being domain.

表3 精神心理健康维度的条目难度值和拟合度 Table 3 Item difficulty and fitness for psychological well-being domain

3 讨论

在眼科领域中, 虽然有许多单一的白内障相关的PROs测量工具, 但至今没有任何一种测量方式能够全面、准确、智能化地测量PROs^[12]。以往的临床试验和计算机模拟表明, 动态条目库系统可有效弥补上述缺陷^{[18, 19]}。本研究基于上述背景, 初步研制出了白内障PROs条目库。

然而, 条目库的研制必须以条目池作为前提条件^[20]。本课题组前期根据美国食品药品监督管理局（FDA）等权威机构的指南构建了白内障PROs条目池, 其包含视觉相关活动受限、视觉症状及精神心理健康等维度, 可以全面涵盖白内障患者PROs的各个方面^[16]。在此基础上, 采用现代项目反应理论（Item response theory, IRT）来修订、评价条目池的测量特性是研制条目库的唯一途径^[13]。而Rasch模型作为单参数IRT模型, 是在克服CTT的不足后发展起来的现代测量理论, 其相比较于CTT具有以下优点：①对被试者的能力估计不依赖于特定的测验题目, 将被试者能力和测验难度放在同一尺度上进行估计, 被试者的能力值不受测验难度影响。②对于同一个条目, 被试者对测验项目的正确反应概率与项目特征函数曲线相拟合（Item characteristic curve, ICC）。③测验信息函数的概念代替了信度理论, 用测验估计患者能力并提供信息量来表示测量精度, 避免了平行测验的假定, 并给出不同能力值患者的测量精度^{[21, 22]}。目前已被FDA等权威机构认可并广泛用于PROs测量工具的构建与评估^{[23, 24, 25]}。在1项评估心血管疾病患者日常活动的研究中, Baumeister等^[26]首先构建了心血管疾病日常活动相关的条目池, 再通过Rasch分析评价条目测量特性, 从含有181个条目的条目池研制成含有33个条目的条目库, 并具有良好的测量特性, PSR为0.81且不存在DIF。近期, Petersen等^[27]在构建情感功能条目库研究中, 通过Rasch分析将含有38个条目的条目池研制成含有24个条目的条目库, 亦有较好的测量特性。

目前眼科领域中, 关于PROs 条目库构建的研究鲜见报道。Pesudovs^[12]于2010年首次报道了白内障条目池研究, 其采用Rasch分析对条目池进行简单分析。视觉相关活动受限维度通过Misfit分析, 删减5个条目后PSR/PSI为0.99/8.11, 而本研究也具有良好的测量精度（PSR/PSI为0.93/3.59）。在匹配度方面, 本研究优于Pesudovs的研究结果（Targeting：-0.81 vs. -1.64）^[12]。在选项类别顺序和单维性方面, 本研究表现出较好的单维性和选项类别顺序, 条目DIF值均小于1.0, 最终纳入23个条目; 在之前的研究中, 视觉症状维度包含24个条目, 通过Misfit分析, 删减2个条目后表现出较好的测量精度（PSR/PSI为0.84/2.33）和匹配度（Targeting：-0.56）^[12]。而本研究相比其具有更好的测量精度（PSR/PSI：0.88/2.68）, 但匹配度低于前者（Targeting为-1.35 vs. -0.56）, 其原因是由于本研究纳入人群的视觉症状总体偏轻度。本研究也具有较好的选项类别顺序和单维性, 按眼部并发症分类显示2个条目DIF值大于1.0, 其余均小于1.0, 最终纳入14个条目; 本研究精神心理健康维度, 其选项类别顺序、测量精度（PSR/PSI：0.88/2.68）、匹配度（Targeting：-0.34 vs. -2.11）、单维性和DIF均具有较好的测量特性。此外, Pesudovs的研究中并未进行各维度的选项类别顺序、单维性和DIF的研究, 也没有剔除测量特性不佳的条目并反复迭代计算, 因此无法构建有效的条目库。本研究还发现视觉相关活动受限维度、视觉症状维度和精神心理健康维度条目与好眼视力、双眼视力均有相关性, 验证了本条目库具有较好的测量信度。

综上, 本研究通过前期的条目池构建, 大量的患者调查以及基于Rasch分析, 研制出了具有优良测量特性的白内障PROs条目库, 并首次全面阐述了各维度的测量特性。随着时代的变迁, QoL的内涵将发生变化, 因此可以根据不同时期患者的各方面特征, 纳入更多有效且测量特性较好的条目, 任何新增或删除的条目可通过Rasch分析得到有效判定, 从而获得更好的匹配度, 有效发挥条目库动态变化的优点^[28]。在今后的研究中, 高质量PROs条目库可与CAT系统相结合, 在不牺牲测试精度的情况下能有效减少测试条目, 大幅度减轻患者的测试负荷^[29], 有效克服传统PROs测量工具的缺陷^[30]。

利益冲突申明本研究无任何利益冲突

作者贡献声明黄锦海：酝酿和设计实验, 分析、解释数据; 起草文章, 对文章的知识性内容作批评性审阅; 统计分析, 获取研究经费、指导。朱森淼、涂瑞雪、章思芳、刘艳华、赵陈培：实施研究, 采集数据, 分析、解释数据; 起草文章, 对编辑部的修改意见进行核修。彭芳丽、曹思：采集数据, 分析、解释数据; 对文章的知识性内容作批评性审阅; 支持性贡献。王勤美：酝酿和设计实验, 实施研究; 对文章的知识性内容作批评性审阅; 获取研究经费、行政、技术或材料支持、指导; 支持性贡献。高蓉蓉：酝酿和设计实验, 分析、解释数据; 起草文章, 对文章的知识性内容作批评性审阅; 支持性贡献; 对编辑部的修改意见进行核修

The authors have declared that no competing interests exist.

参考文献

View Option

[1]	Pascolini D, Mariotti SP. Global estimates of visual impairment: 2010 Br J Ophthalmol, 2012, 96(5): 614-618. DOI: 10.1136/bjophthalmol-2011-300539. [本文引用:1]
[2]	Swanson MW. Medical decision-making capacity and cataract surgery. Optom Vis Sci, 2012, 89(10): e23-26. DOI: 10.1097/OPX.0b013e31826a3d85. [本文引用:1]
[3]	Lundström M, Stenevi U. Analyzing patient-reported outcomes to improve cataract care. Optom Vis Sci, 2013, 90(8): 754-759. DOI: 10.1097/OPX.0b013e3182956c32. [本文引用:1]
[4]	Willke RJ, Burke LB, Erickson P. Measuring treatment impact: a review of patient-reported outcomes and other efficacy endpoints in approved product labels. Controlled Clin Trials, 2004, 25(6): 535-552. DOI: 10.1016/j.cct.2004.09.003. [本文引用:1]
[5]	Fenwick E, Rees G, Pesudovs K, et al. Social and emotional impact of diabetic retinopathy: a review. Clin Experiment Ophthalmol, 2012, 40(1): 27-38. DOI: 10.1111/j.1442-9071.2011.02599.x. [本文引用:1]
[6]	Hobart JC, Cano SJ, Zajicek JP, et al. Rating scales as outcome measures for clinical trials in neurology: problems, solutions, and recommendations. Lancet Neurol, 2007, 6(12): 1094-1105. DOI: 10.1016/S1474-4422(07)70290-9. [本文引用:1]
[7]	Khadka J, McAlinden C, Pesudovs K. Quality assessment of ophthalmic questionnaires: review and recommendations. Optom Vis Sci, 2013, 90(8): 720-744. DOI: 10.1097/OPX.0000000000000001. [本文引用:1]
[8]	Khadka J, Pesudovs K, McAlinden C, et al. Reengineering the glaucoma quality of life-15 questionnaire with rasch analysis. Invest Ophthalmol Vis Sci, 2011, 52(9): 6971-6977. DOI: 10.1167/iovs.11-7423. [本文引用:1]
[9]	Gothwal VK, Wright TA, Lamoureux EL, et al. Measuring outcomes of cataract surgery using the Visual Function Index-14. J Cataract Refract Surg, 2010, 36(7): 1181-1188. DOI: 10.1016/j.jcrs.2010.01.029. [本文引用:1]
[10]	Lundström M, Pesudovs K. Questionnaires for measuring cataract surgery outcomes. J Cataract Refract Surg, 2011, 37(5): 945-959. DOI: DOI:10.1016/j.jcrs.2011.03.010. [本文引用:1]
[11]	Thissen D, Reeve BB, Bjorner JB, et al. Methodological issues for building item banks and computerized adaptive scales. Qual Life Res, 2007, 16(Suppl 1): 109-119. DOI: 10.1007/s11136-007-9169-5. [本文引用:1]
[12]	Pesudovs K. Item banking: a generational change in patient-reported outcome measurement. Optom Vis Sci, 2010, 87(4): 285-293. DOI: 10.1097/OPX.0b013e3181d408d7. [本文引用:5]
[13]	National Institutes of Health. Background and Concept of PROMIS. http://www.healthmeasures.net/explore-measure-ment-systems/promis. [本文引用:2]
[14]	Fries J, Rose M, Krishnan E. The PROMIS of better outcome assessment: responsiveness, floor and ceiling effects, and Internet administration. J Rheumatol, 2011, 38(8): 1759-1764. DOI: 10.3899/jrheum.110402. [本文引用:1]
[15]	Fries JF, Cella D, Rose M, et al. Progress in assessing physicalfunction in arthritis: PROMIS short forms and computerizedadaptive testing. J Rheumatol, 2009, 36(9): 2061-2066. DOI: 10.3899/jrheum.090358. [本文引用:1]
[16]	黄锦海, 朱森淼, 高蓉蓉, 等. 基于循证医学构建白内障患者报告结局条目池. 中华眼视光学与视觉科学杂志, 2016, 18(6): 326-332. DOI: 10.3760/cma.j.issn.1674-845X.2016.06.003. [本文引用:6]
[17]	Lin X, Li M, Wang M, et al. Validation of Catquest-9SF questionnaire in a Chinese cataract population. PLoS One, 2014, 9(8): e103860. DOI: 10.1371/journal.pone.0103860. [本文引用:1]
[18]	Haley SM, NI P, Hambleton RK, et al. Computer adaptive testing improved accuracy and precision of scores over rand om item selection in a physical functioning item bank. J Clin Epidemiol, 2006, 59(11): 1174-82. DOI: DOI:10.1016/j.jclinepi.2006.02.010. [本文引用:1]
[19]	Pilkonis PA, Yu L, Dodds NE, et al. Item banks for substance use from the Patient-Reported Outcomes Measurement Information System (PROMIS(®)): Severity of use and positive appeal of use. Drug Alcohol Depend, 2015, 156: 184-192. DOI: 10.1016/j.drugalcdep.2015.09.008. [本文引用:1]
[20]	Smits N. On the effect of adding clinical samples to validation studies of patient-reported outcome item banks: a simulation study. Qual Life Res, 2016, 25(7): 1635-1644. DOI: 10.1007/s11136-015-1199-9. [本文引用:1]
[21]	Blanchin M, Hardouin JB, Le NT, et al. Comparison of CTT and Rasch-based approaches for the analysis of longitudinal Patient Reported Outcomes. Stat Med, 2011, 30(8): 825-838. DOI: 10.1002/sim.4153. [本文引用:1]
[22]	Yang FM, Kao ST. Item response theory for measurement validity. Shanghai Arch Psychiatry, 2014, 26(3): 171-177. DOI: DOI:10.3969/j.issn.1002-0829.2014.03.010. [本文引用:1]
[23]	Wolfe EW. Equating and item banking with the Rasch model. J Appl Meas, 2000, 1(4): 409-434. [本文引用:1]
[24]	Rose M, Bjorner JB, Gand ek B, et al. The PROMIS Physical Function item bank was calibrated to a stand ardized metric and shown to improve measurement efficiency. J Clin Epidemiol, 2014, 67(5): 516-526. DOI: 10.1016/j.jclinepi.2013.10.024. [本文引用:1]
[25]	Schutte L, Wissing MP, Ellis SM, et al. Rasch analysis of the Meaning in Life Questionnaire among adults from South Africa, Australia, and New Zealand . Health Qual Life Outcomes, 2016, 14(1): 12. DOI: 10.1186/s12955-016-0414-x. [本文引用:1]
[26]	Baumeister H, Abberger B, Haschke A, et al. Development and calibration of an item bank for the assessment of activities ofdaily living in cardiovascular patients using Rasch analysis. Health Qual Life Outcomes, 2013, 11: 133. DOI: 10.1186/1477-7525-11-133. [本文引用:1]
[27]	Petersen MA, Gamper EM, Costantini A, et al. An emotional functioning item bank of 24 items for computerized adaptivetesting (CAT) was established. J Clin Epidemiol, 2016, 70: 90-100. DOI: 10.1016/j.jclinepi.2015.09.002. [本文引用:1]
[28]	Tulsky DS, Kisala PA, Lai JS, et al. Developing an item bank to measure economic quality of life for individuals with disabilities. Arch Phys Med Rehabil, 2015, 96(4): 604-613. DOI: 10.1016/j.apmr.2014.02.030. [本文引用:1]
[29]	Gardner W, Kelleher KJ, Pajer KA. Multidimensional adaptive testing for mental health problems in primary care. Med Care, 2002, 40(9): 812-823. DOI: 10.1097/01.MLR.0000025436.30093.77. [本文引用:1]
[30]	Chien TW, Wang WC, Huang SY, et al. A web-based computer-ized adaptive testing (CAT) to assess patient perception in hospitalization. J Med Internet Res, 2011, 13(3): e61. DOI: 10.2196/jmir.1785. [本文引用:1]

2012

0.0

... 白内障是全世界首要的致盲性眼病^[1],其导致的视功能损害易对患者的视觉健康、日常活动和精神心理等方面造成影响,致使患者生活质量（Quality of life,QoL）下降 ...

2012

0.0

... 在临床实践中,QoL作为全面衡量健康状态的指标,可有效用于白内障手术时机的选择及诊疗效果的评价^[2,3] ...

2013

0.0

... 在临床实践中,QoL作为全面衡量健康状态的指标,可有效用于白内障手术时机的选择及诊疗效果的评价^[2,3] ...

2004

0.0

... 近年来,患者报告结局（Patient reported outcomes,PROs）作为患者对疾病造成影响的自我感觉和对治疗效果满意度的主观评价^[4],已广泛应用于眼科临床试验和公共卫生等领域^[5,6] ...

2012

0.0

2007

0.0

2013

0.0

... 目前,眼科领域PROs测量工具主要以量表为主^[7] ...

2011

0.0

... 然而现有的大部分眼科量表是基于经典测验理论（Classical test theory,CTT）研制而成,而CTT的条目统计量依赖于测验的被试样本,其假设的平行测验在实际情况中是不可能实现的,因此难以获得准确的测量特性^[8,9] ...

2010

0.0

2011

0.0

... 其次,绝大部分量表仅涉及QoL一个或两个方面,未能全面涵盖PROs的各方面情况^[10] ...

2007

0.0

... 此外,不同量表之间的测量结果无法直接进行比较,目前缺乏统一的评估工具^[11] ...

2010

0.0

... 针对上述情况,Pesudovs^[12]指出,构建PROs条目库（Item bank）将有效克服以上缺陷,在建立条目池（Item pool）的基础上,通过Rasch分析评价条目的测量特性,筛选、合并及删除测量特性不佳的条目,从而形成具有良好测量特性的条目库^[13] ...

... 3 讨论在眼科领域中,虽然有许多单一的白内障相关的PROs测量工具,但至今没有任何一种测量方式能够全面、准确、智能化地测量PROs^[12] ...

... Pesudovs^[12]于2010年首次报道了白内障条目池研究,其采用Rasch分析对条目池进行简单分析 ...

... 64）^[12] ...

... 56）^[12] ...

0.0

... 在此基础上,采用现代项目反应理论（Item response theory,IRT）来修订、评价条目池的测量特性是研制条目库的唯一途径^[13] ...

2011

0.0

... 基于Rasch分析研制的条目库具有优良的测量特性,其测试内容可以覆盖QoL各个方面,其难度值可以覆盖被试者的各个水平,几乎可避免测试中出现天花板和地板效应^[14] ...

2009

0.0

... Fries等^[15]研究表明,条目库与CAT系统相结合的患者报告结局测量系统（Patient reported outcomes measure information system,PROMIS）相比较于目前的纸笔作答方式具有更高的准确性和敏感性 ...

2016

0.0

黄锦海, 朱森淼, 高蓉蓉, 等. 基于循证医学构建白内障患者报告结局条目池. 中华眼视光学与视觉科学杂志, 2016, 18(6): 326-332. DOI: 10.3760/cma.j.issn.1674-845X.2016.06.003.

Objective Based on the principles of evidence-based medicine, the present study aimed to develop a cataract-specific item pool for the assessment of quality of life (QoL) in ophthalmic patients and the efficacy of specific therapy. Methods The item pool for patient reported outcomes (PROs) of cataract was established based on the guideline of the international PROs development process. Databases including PubMed, Embase, CNKI, WanFang Data, VIP, CBM were thoroughly searched. The items pool of PROs was established using the following steps: Confirm conceptual framework, identify extant items in cataract-specific instruments and the qualitative literature, select items and cross-cultural adaptation, focus groups and semi-structured interviews, item classification and selection, identify items stem and response options, expert review and revision of items, cognitive interviews and develop final version of instrument. Results The conceptual framework of item pool consists of vision-related activity limitation (VRAL) domain, vision symptoms domain and emotional well-being domain. After manual scanning for cataract-specific instruments, 19 questionnaires were extracted for the initial item pool development. After the original identification of items, focus groups and semi-structured interviews, item classification and selection, expert review and cognitive interviews, the number of items were 249, 204, 118 and 94, respectively. After cognitive interviews, all items were sorted into VRAL domain, vision symptoms domain and emotional well-being domain, which contained 41, 28 and 25 items, respectively. Total items utilized four response options. Conclusion Based on the principles of evidence-based medicine for PROs, the final item pool contained majority of the items under VRAL, vision symptoms and emotional well-being domains. Consequently, the language of items under each domain was simplified for interpretation by the patients, and possessed perfect content validity. This cataract-specific item pool has corrected the defects of PROs instruments in ophthalmology, and provided a formal reference for establishing item pools.

目的研制基于循证医学方法的白内障患者报告结局（PROs）条目池，为合理评估白内障PROs奠定了基础，并为其他类似研究提供参考。方法循证医学研究。遵循国际PROs测量工具研制流程构建白内障PROs条目池。首先建立条目池理论框架，再通过计算机检索美国国立图书馆医学文献检索系统（PubMed）、荷兰医学文摘数据库（Embase）、中国知网（CNKI）、万方期刊论文数据库（WanFang Data）、维普中文科技期刊全文数据库（VIP）、中国生物医学文献数据库（CBM）等数据库，纳入所有白内障PROs测量工具，进一步按照条目初筛、跨文化调试、患者访谈、条目分类及再次筛选、专家评审、确立条目主干及选项、人群验证等步骤构建白内障PROs条目池。结果条目池理论框架由视觉症状、视觉相关活动受限和精神心理健康等3个维度构成。通过文献检索后纳入19个PROs量表，条目初筛后纳入249个条目，患者访谈后保留204个条目，条目分类及再次筛选后保留118个条目，专家评审后保留94个条目，人群验证后形成的白内障条目池最终版本包括94个条目，其中视觉症状维度28个条目、视觉相关活动受限维度41个条目、精神心理健康维度25个条目，所有条目选项个数均为4个。结论本研究基于PROs循证医学方法，规范地构建了包含视觉症状、视觉相关活动受限和精神心理健康这三大维度的白内障PROs条目池，具有语言通俗易懂、内容全面并能反应视功能损害等特点，改善了目前眼科领域PROs测量工具的缺陷，为白内障PROs条目池构建的规范化提供了参考。

... 本研究以前期构建的白内障条目池为基础^[16],对临床患者进行测试,收集相关数据,并基于Rasch分析研制白内障PROs条目库,为今后眼科领域PROs条目库的构建提供参考 ...

... 采用本课题组前期基于循证医学方法研制的条目池进行问卷调查^[16],该条目池由3个维度组成,分别为视觉相关活动受限（Vision-related activity limitation）维度、视觉症状（Visual symptom）维度和精神心理健康（Emotional well-being）维度 ...

... 1 首次Rasch分析纳入视觉相关活动受限维度41个条目进行分析^[16] ...

... 1 首次Rasch分析纳入视觉症状维度24个条目进行分析^[16] ...

... 1 首次Rasch分析纳入精神心理健康维度25个条目进行分析^[16] ...

... 本课题组前期根据美国食品药品监督管理局（FDA）等权威机构的指南构建了白内障PROs条目池,其包含视觉相关活动受限、视觉症状及精神心理健康等维度,可以全面涵盖白内障患者PROs的各个方面^[16] ...

2014

0.0

... 0,则该量表为单维性好^[17] ...

2006

0.0

... 以往的临床试验和计算机模拟表明,动态条目库系统可有效弥补上述缺陷^[18,19] ...

2015

0.0

... 以往的临床试验和计算机模拟表明,动态条目库系统可有效弥补上述缺陷^[18,19] ...

2016

0.0

... 然而,条目库的研制必须以条目池作为前提条件^[20] ...

2011

0.0

... ③测验信息函数的概念代替了信度理论,用测验估计患者能力并提供信息量来表示测量精度,避免了平行测验的假定,并给出不同能力值患者的测量精度^[21,22] ...

2014

0.0

2000

0.0

... 目前已被FDA等权威机构认可并广泛用于PROs测量工具的构建与评估^[23,24,25] ...

2014

0.0

... 目前已被FDA等权威机构认可并广泛用于PROs测量工具的构建与评估^[23,24,25] ...

2016

0.0

... 目前已被FDA等权威机构认可并广泛用于PROs测量工具的构建与评估^[23,24,25] ...

2013

0.0

... 在1项评估心血管疾病患者日常活动的研究中,Baumeister等^[26]首先构建了心血管疾病日常活动相关的条目池,再通过Rasch分析评价条目测量特性,从含有181个条目的条目池研制成含有33个条目的条目库,并具有良好的测量特性,PSR为0 ...

2016

0.0

... 近期,Petersen等^[27]在构建情感功能条目库研究中,通过Rasch分析将含有38个条目的条目池研制成含有24个条目的条目库,亦有较好的测量特性 ...

2015

0.0

... 随着时代的变迁,QoL的内涵将发生变化,因此可以根据不同时期患者的各方面特征,纳入更多有效且测量特性较好的条目,任何新增或删除的条目可通过Rasch分析得到有效判定,从而获得更好的匹配度,有效发挥条目库动态变化的优点^[28] ...

2002

0.0

... 在今后的研究中,高质量PROs条目库可与CAT系统相结合,在不牺牲测试精度的情况下能有效减少测试条目,大幅度减轻患者的测试负荷^[29],有效克服传统PROs测量工具的缺陷^[30] ...

2011

0.0