redlou 在过去的20年中,基于DNA的分子标记技术已经在植物和动物中得到广泛应用。其中之一就是用于构建全基因组的分子图谱以及对单一性状和复杂性状进行遗传分析。此类研究都是在构建作图群体的基础上来进行的连锁分析(linkage analysis),利用的数据有 分子标记数据(marker data)和性状数据(Trait data),在整个genome上系统的收索quantitative trait loci (QTL).最经典Lander& Botstein(1989)提出的interval mapping 和 zeng(1993)改进的composite interval mapping. 用2个marker 数据推断介于其之间某(检验)位点的基因型(genotype),再用统计模型建立起genotype和 trait data之间的关系。他们所用的统计模型是含缺失数据的linear model,用极大似然比来检验给定位点上是否有QTL. 近十几年来,一直是统计遗传的一个热门方向,很多新的统计方法都被应用与qtl mapping,包括参数 半参数 非参数,lm glm nlm... 上面的方法不适合于研究复杂性状的基因。由此产生了另外一些方法,其中具有代表性的就是基于连锁不平衡的关联分析方法(assiociationanalysis)。 在人类的疾病基因研究中,一般有两种方法:一是条件对照法(case-control, CC);二是传递连锁不平衡法(transmission disequilibrium test, TDT)(Spielman et al., 19993)。 最简单的关联分析的做法是进行条件—对照分析(Case-controls Study)。条件对照已被广泛应用于疾病易感位点的关联分析中。此法的有点是易于获得大量群体样本,能有效地进行基因分型,能直接比较两组中遗传标记的等位基因频率和基因型频率,若通过统计分析得到了显著的差异,则认为此位点同疾病相关联。虽然此法易于操作,但还是需要对其结果进行认真分析。这种方法倾向于坚定DNA突变体,由于群体的亚结构,这种DNA突变体可能是与疾病之间假关联的。因此,选择一个适当的对照组很重要。在条件一对照研究中出现阳性结果时,产生关联可以有3种原因:一是这个位点就是致病位点;二是这个位点与疾病位点存在连锁不平衡(LD);三是这种关联性是由于混杂因素(Confounder)造成的虚假联系。所谓的混杂因素指的是这一因素与疾病和检测位点均有关联。 Spielman(1993)提出的TDT (transmission disequilibrium test)传递不平衡检验方法,至今很受大家推崇。传递不平衡检验(TDT)的优点是它是一个对连锁的检验,而不仅仅是连锁不平衡。在连锁存在的情况下,此法能有效地应用于关联分析。TDT考虑了等位基因从杂合子双亲传递到受累后代的概率,而且这些概率偏离0.5的情况只发生在当标记和疾病位点连锁的时候(假设群体中标记位点总体上不存在对孟德尔分离的偏离)。总的来说,TDT在所有情形下都是一个有效的连锁不平衡检验,但对连锁不平衡的敏感程度依赖于样本中独立的祖先疾病等位基因的数目。由于大多数用于TDT分析的样本会包含许多单独的家系,TDT可以被认为是对连锁的检验,而随着连锁不平衡程度的增加其效能也跟着增加。我们需要注意的是由于关联分析和连锁分析的研究方法和侧重点不同,在研究中可能会得到不同的结果。两个位点相关联并不一定连锁,因为这种关联可能是由于随机漂变、人群层化引起的连锁不平衡所致;同样连锁也不一定关联,即使两个位点同处于一条染色体上,且之间的距离很接近,但是它们并不一定处于连锁不平衡中,也就不能在关联分析中表现出阳性。
huapower 想请教一下一个问题: 表4 VAS 评分总体分布〔n = 17,例次( %) 〕 组别 < 3分 3~5 分 > 5 分 B1 63(61.8) 22 (21.6) 17 (16.6) B2 90 (88.2) 6 (5.9 ) 6(5.9) B3 93 (91.2) 5 (4.9) 4 (3.9) FT 88 (86.2) 7(6.9) 7(6.9) 请问:比较这几组数据组间有无差异性,知道的请给个答案,谢谢
wanhongshen 连锁分析和关联分析各有优缺点,目前有人把两种方式结合起来:nested association mapping (巢式关联分析。) 人类中不能够用作物中的连锁分析,不过在那里,你不可能随便拿人做F2等群体