眼科临床研究中双眼数据的处理
应桂双, 梁远波
Pennsylvania, USA, Center for Preventive Ophthalmology and Biostatistics, Scheie Eye Institute, University of Pennsylvania(应桂双)
325027 温州医科大学附属眼视光医院临床科研中心(应桂双、梁远波)
通信作者:应桂双,Email:gsying@mail.med.upenn.edu
摘要

目的 描述如何选择合适的统计方法来分析眼科研究中的两眼数据。方法 针对在眼科研究中常用的两眼设计与配对设计中所产生的两眼数据,我们介绍了可用来分析两眼数据的各种统计方法,包括比较均值,比较两组中位数,两组率及两组生存率。并以不适合的和适合的统计分析方法比较了<60岁与≥60岁患者的双眼眼压作为例子。结果 一只眼睛数据的分析只会导致偏差或降低比较效率。没有考虑两眼相关性的统计方法所得的 P值( P=0.02)比考虑两眼相关性的统计方法的 P值( P= 0.098)小。结论 当两只眼睛的数据均适合用来分析时,应使用适当的统计分析方法来调整双眼间的相关性。只用单眼数据或者忽略双间眼相关分析可能会导致不正确的结论。

关键词: 两眼相关性; 统计分析; 两眼数据; 配对数据
Analysis of Correlated Two Eyes Data for Ophthalmic Clinical Research
Guishuang Ying1,2, Yuanbo Liang2
1Center for Preventive Ophthalmology and Biostatistics, Scheie Eye Institute, University of Pennsylvania, Pennsylvania, America
2Center for Clinical Ophthalmic and Optometric Research, Wenzhou Medical University, Wenzhou 325027, China
Corresponding author: Guishuang Ying, Center for Preventive Ophthalmology and Biostatistics, Scheie Eye Institute, University of Pennsylvania, Pennsylvania, USA; Center for Clinical Ophthalmic and Optometric Research, Wenzhou Medical University, Wenzhou 325027, China (Email: gsying@mail.med.upenn.edu)
Abstract

Objective: To describe the proper statistical approach in ophthalmic research for analyzing correlated data for contralateral eyes of the same subjects.Methods: For data from a paired design and a design for two eyes that are commonly used in ophthalmic research, we described the appropriate statistical approaches for analyzing the correlated data for both eyes of the same subjects. As an example, we compared the intraocular pressure between patients < 60 vs. ≥60 years of age, using the inappropriate and appropriate statistical analysis approaches.Results: The inappropriate analysis of data for one eye leaded only to a biased or inefficient estimate of the difference between two groups. The analysis of data for both eyes of the same subjects without accounting for inter-eye correlation had a smaller p-value ( P=0.02) than the analysis that accounted for inter-eye correlation ( P=0.098).Conclusions: Appropriate statistical analytical approaches should be used to account for the inter-eye correlation. The statistical analysis using data for only one eye or ignoring the inter-eye correlation can lead to an incorrect conclusion.

Keyword: inter-eye correlation; statistical analysis; ophthalmic data; paired data.

在眼科临床研究中, 研究者通常会同时收集同一名受试者的双眼数据(如眼压、视力等), 且在多数情况下, 这些数据均可用来回答相关临床问题。美国AREDS2研究(Age-related Eye Disease study 2) 就是这方面的一个典型研究实例。该研究为比较叶黄素+玉米黄质和ω -3脂肪酸治疗年龄相关性黄斑变性疗效的多中心随机化临床试验[1], 随机化分组是以患者为基础, 而数据分析和疗效评价(年龄相关性黄斑变性有无进展)则是以眼为基础。

当两只眼睛的数据均适合用来分析时, 两眼数据之间存在的相关性给统计分析带来了一定的挑战性, 因为通常使用的统计分析方法假定每个个体的数据之间彼此独立, 而从一个人的两只眼睛中获取的数据往往有较强的正相关性[2]。眼科学和视觉学研究人员经常没意识到分析两眼时必须考虑两眼间的相关性, 或不知道如何去调整两眼间的相关性。在这里, 我们谈谈如何合理统计分析临床研究中的两眼数据。

1 统计方法的选择

统计方法的选择取决于临床研究中一个人的双眼是否接受同样的处理及研究者要回答什么样的临床问题。当双眼均符合纳入标准时, 通常用的眼科试验设计包括: (1)配对设计。所有参与者, 一只眼睛接受治疗处理, 而另一只眼睛作为对照(没有接受处理, 或接受另一治疗处理)。用这配对设计的前提是不存在交叉效应(即治疗不会同时影响治疗眼和控制眼), 如激光治疗或局部手术的眼睛。(2)两眼采用相同处理的试验设计。一个人的两只眼睛接受同样的处理, 即一些参与者两眼接受同样治疗处理, 而另一些参与者两眼作对照处理(没有接受治疗, 或接受另一治疗)。当两只眼睛都符合条件用来研究, 并且治疗是系统性的(例如AREDS2中口服用叶黄素+玉米黄质和欧米加-3脂肪酸), 用两眼设计是很合理的。

不同的试验设计所产生的数据需要用不同的统计方法。对于配对试验设计, 通常用配对统计分析方法来分析, 即用配对t检验来比较两组正态分布数据, Wilcoxon符号秩和检验来比较两组非正态分布数据, 用McNemar's test比较两组率的差异。

2 两眼采用相同处理的试验设计统计学方法选择

对于两眼采用相同处理的试验设计, 一个人的两只眼睛接受同样的处理或分在同一比较组, 从这两眼中获的数据往往有较强的正相关性。这两眼的正相关性意味着一个人的两眼所提供的数据信息比单独两个人的单眼所提供的信息量要少。在一个极端的情况下, 当两只眼睛都提供相同的信息完全一样时, 一个人的另一只眼相当于没有提供额外信息。所以一个人的两眼所提供的数据不能当作单独两个人的单眼数据来一样处理。在统计分析时这两眼的相关性必须要考虑进去。

2.1 既往研究统计学方法选择的误区

2.1.1 无视两眼的正相关性 这种分析方法把一个人的双眼提供的数据当作两个人的单眼提供的数据处理, 所以是绝对错误的统计方法。因为无视两眼的正相关性会导致有偏估计, 即低估了标准差和标准误, 从而使95%可信区间偏窄和P值过小。低估标准差的程度是和两眼的相关性成正比。这种不恰当的统计方法会导致错误的研究结论, 即当事实上两组之间不存在显著统计学意义的差异时, 会错误地认为两组之间的差异达到了显著水准。这不恰当的统计方法可能会导致无效的治疗方法在临床中使用, 不能给患者带来益处。

2.1.2 选一只眼睛数据进行分析 虽然选一只眼睛数据进行分析避开了调整两眼的相关性的必要, 但除非两只眼睛所提供的数据完全一样, 不用另一只眼睛所提供的数据进行分析都会导致数据信息的遗失, 从而使95%可信区间过宽和P值过大。这不恰当的统计方法可能会导致有效的治疗方法不能在临床中使用。

2.1.3 两只眼睛均值进行分析 用均值进行分析亦会导致数据信息的遗失, 低估两个连续变量之间的相关性。当两眼数据不是连续变量时, 计算两只眼睛均值是不合理的。

2.2 两眼采用相同处理的试验设计统计学方法建议

最合理的分析法应当是同时分析两眼数据, 并校正其关联性。为了解决这一难题, 统计学家对此开展了大量的研究, 不断提出新的分析方法, 以应对不同类型的眼科研究数据。比较成熟且常用的方法有采用Clustered Wilcoxon Rank Sum test以比较非正态分布数据的两组差异[3]、混合效应模型(Mixed Effects Model)比较组间正态分布数据差异[4, 5]、多元线性回归模型[或广义线性模型(Generalized linear model, GLM)]和广义估计方程(Generalized estimating equation, GEE)以比较组间均值或率的差异[6], 以及使用Cox比例风险模型(Cox proport-ional hazardous Model)和Sandwich Robust Estimate等方法研究组间生存率的差异[7]。上述方法均是基于各类统计模型进行的无偏估计, 同时校正了数据内部存在的关联性, 所获得的方差和标准误相对比较符合实际情况, 从而确保了研究结论的正确性, 目前在SAS、R、SPSS和STATA等常用的统计软件中均可以实现上述分析[8]

2.3 实例分析

为了便于读者更好、更直观地理解上述几种方法的异同及调整两眼间相关性的重要性, 我们以Katz[9]所发表文章中的数据为例(见表1), 以比较不同分析方法所得到结果的异同(见表2)。

表1 不同年龄段人群双眼眼压列表 Table 1 Intraocular pressure of different age groups
表2 不同分析方法对不同年龄段人群眼压组间差异比较 Table 2 The comparison of intraocular pressure between different age groups with different statistical methods

笔者在本例中共计采集了15名不同年龄段受试者的双眼眼压。我们感兴趣的临床问题是:年轻患者的眼压是否不同于老年患者的眼压。为进行统计比较, 我们将受试者分为两组, 即60岁以下组和60岁以上组。这15名受试者的双眼眼压之间存在着很强的相关性, 相关系数为0.81(95%CI:0.54~0.93)。我们用多种统计分析方法比较2个年龄组的眼压, 包括分析单眼数据和双眼数据(有或者没有调整两眼的正相关性)。

很显然不同的分析方法给出了非常不同的结果(见表2), 从而导致不同的结论。当仅用一只眼的眼压数据做2组比较时, 2组间左眼眼压差平均为6 mmHg(P=0.030), 而2组间右眼眼压差平均为2 mmHg(P=0.400)。当双眼的眼压同时用来做2组比较时, 2组间平均眼压差都是4 mmHg, 但它们所对应的P值是非常不同。忽略两眼间相关性的分析导致低估了P值(P=0.020), 从而判定年轻患者的眼压显著低于老年患者的眼压。用GEE校正两眼间相关性后的P值为0.098, 低于比较左右眼平均眼压所得的P值(P=0.110)或用较高眼压眼所得的P值(P=0.170), 说明用左右眼平均值或仅用一只眼睛所提供的数据进行分析都会导致数据信息的遗失, 从而降低了检验效率。这例子说明当两只眼睛的数据都可用来分析时, 我们应该同时分析双眼数据并且调整两眼间的相关性来解决临床相关的问题。

作者贡献声明 应桂双:收集数据, 参与选题、设计及资料的分析和解释; 撰写论文; 对编辑部的修改意见进行修改。梁远波:参与选题、设计及资料的解释, 修改论文中关键性结果、结论, 对编辑部的修改意见进行核修。

The authors have declared that no competing interests exist.

参考文献
[1] Age-Related Eye Disease Study 2 Research Group. Lutein+zea-xanthin and omega-3 fatty acids for age-related macular degeneration: the Age-Related Eye Disease Study 2 (AREDS2) rand omized clinical trial. JAMA, 2013, 309(19): 2005-2015. DOI: DOI:10.1001/jama.2013.4997. [本文引用:1]
[2] Ray WA, O'Day DM. Statistical analysis of multi-eye data in ophthalmic research. Invest Ophthalmol Vis Sci, 1985, 26(8): 1186-1188. [本文引用:1]
[3] Rosner B, Glynn RJ, Lee ML. Incorporation of clustering effectsfor the Wilcoxon rank sum test: a large-sample approach. Biometrics, 2003, 59(4): 1089-1098. [本文引用:1]
[4] Glynn RJ, Rosner B. Accounting for the correlation between fellow eyes in regression analysis. Arch Ophthalmol, 1992, 110(3): 381-387. [本文引用:1]
[5] Glynn RJ, Rosner B. Regression methods when the eye is theunit of analysis. Ophthalmic Epidemiol, 2012, 19(3): 159-165. DOI: DOI:10.3109/09286586.2012.674614. [本文引用:1]
[6] Liang KY, Zeger SL. Regression analysis for correlated data. Annu Rev. Pub. Health, 1993, 14: 43-68. [本文引用:1]
[7] Wei LJ, Glidden DV. An overview of statistical methods for multiple failure time data in clinical trials. Stat Med, 1997, 16(8): 833-839; discussion 841-851. [本文引用:1]
[8] Ying GS, Liu CC. Analysis of the clustered data using SAS® systems. NESUG Conference Proceedings, 2006. [本文引用:1]
[9] Katz J. Two eyes or one? The data analyst's dilemma. Ophthalmic Surg, 1988, 19(8): 585-589. [本文引用:1]