研究人员说,参与基因研究的人在基因上更有可能这样做。
这项突破性的研究使科学家们有能力识别和解决参与偏见,标志着基因研究中的一个重大挑战。
当收集到的基因数据不能代表预期的研究人群时,就会出现偏倚。
我们的研究在参与者的遗传数据中确定了可检测的参与偏差足迹,这可以在统计学上利用,以提高参与者和非参与者的研究准确性
遗传学是研究基因和性状如何从一代传给下一代的学科。
该研究的主要作者、大数据研究所的博士候选人Stefania Benonisdottir说:“目前,大多数基因研究都是基于包含大量参与者和丰富信息的基因数据库。
“然而,有些人比其他人更有可能被纳入这些数据库,这可能会产生一个被称为确定偏差的问题,即收集的基因数据不能代表预期的研究人群。”
为了研究基因数据和参与偏见之间的联系,牛津大学Leverhulme人口科学中心和大数据研究所的研究人员求助于包含50万人信息的英国生物银行。
利用英国生物银行的数据,该研究发现,一个人参与的可能性与基因有关。
研究人员认为,他们的发现强调了参与可能是一种重要的人类特征,而这种特征以前一直被低估。
它还可能引入一种新的统计框架,从而对基因数据进行更准确的分析。
来自Leverhulme人口科学中心和大数据研究所的资深作者Augustine Kong教授说:“确定偏差在遗传学研究中提出了统计挑战,特别是在大数据时代。
这种偏差的调整通常依赖于参与者和非参与者之间已知的差异,在回答涉及仅对参与者观察到的变量(如基因型)的问题时,会引入不完善之处。
“我们的研究在参与者的基因数据中发现了参与偏见的可检测足迹,这可以在统计学上被利用,以提高参与者和非参与者的研究准确性。”
研究人员查看了来自英国生物银行的3万多名有血缘关系的英国白人的基因数据。
他们发现,参与研究的遗传因素与受教育程度和体重指数等特征的遗传因素相关,但又不同。
研究发现,参与的基因成分可以通过家庭传递,并可能影响人们一生中对许多不同研究的参与。
研究结果发表在《自然遗传学》杂志上。