簡介定位基因位置的研究方法   by 盧誌明 蘇清泉 藍守仁 謝中誠, 2000-03-15

前 言

本文將簡略介紹遺傳流行病學相關的分子生物學發展、以及連鎖分析(linkage analysis)與相關性分析(association analysis)的理論與應用。

人類基因輿圖計畫

據估計每一個人有10萬個基因,全部基因輿圖(genome)大約有30億個鹼基對,大約1/10鹼基對的密碼順序用於儲存這10萬個基因的訊息,每個基因平均有3,000鹼基對(1)。找尋基因位置的困難可想而知,但近年科學家已找到不少基因的位置,例如:亨丁頓氏症、阿茲海默氏症、肺囊性纖維化症、杜顯氏肌肉萎縮症、肌張力萎縮症、家族性結腸癌、范瑞克林豪生氏神經纖維瘤病、破碎X染色體症候群(1)。這些重要發現都有賴於分子生物學的進展與「連鎖分析」的應用。早年遺傳學家只能透過少數具多形性狀的基因座來測量遺傳訊息(2)。現在由於「人類基因輿圖計畫」(3-6)(Human Genome Project)及相關研究的成果,遺傳流行病學家已掌握了更多研究疾病機轉的工具。在5年間(1990-1995),「人類基因輿圖計畫」已完成部分的基因輿圖(genetic map)與物理輿圖(physical map)的標定,細菌、酵母菌、果蠅的基因輿圖定序、改善辨識與定位基因的方法,建立基因輿圖電腦資料庫(例如:GenBank, www.ncbi/nlm.nih.gov; GDB, www.gdb.org),以及了解分子診斷對醫學倫理的衝擊(7)。

基因標記

基因輿圖與物理輿圖不同之處,在於前者是以「重組機率」(recombination fraction)為測量的基礎,以1cM(centimorgan)代表重組機率為1%,目前的解像力已可達2-5cM,也就是兩個基因相距達2-5cM即可被分別辨識出來;而後者是以鹼基對數為單位(kb,代表千個鹼基對;Mb,代表百萬個鹼基對),目前的解像力已可達100kb, 1Mb大約等於1cM(7)。

基因輿圖上的「路標」是基因標記(genetic markers),它可以表現出人類特徵(例如決定血型的基因),知道它在染色體上的位置及遺傳型式的基因,它必需可以被檢測、且具多形性狀,才能被用來定位致病基因。早期連鎖分析(linkage analysis)所用的基因標記都是人類遺傳表現的特徵,例如:色盲、人類白血球抗原(HLA)、血型、酵素、蛋白(1)。近年由於分子遺傳學技術的進展,已經發展出多種具備多形性的DNA樣本。其中一個例子就是「限制片段長度多形性狀」(8)( restriction fragment length polymorphism; RFLP)。

RFLP源於被限制內切核酸瓷(restriction endonucleases)依特殊鹼基對順序切斷的DNA片段。例如:一種叫做EcoRI的限制內切核酸瓷,它會尋找鹼基對順序為GAATTC(互補DNA為CTTAAG)的一段DNA,然後在G、A之間將其切斷,形成具有「黏端」(cohesive ends)的一段DNA(有些限制內切核酸瓷是在對稱處切斷DNA,此時會產生平端(flush ends)。由於RFLP的長度是依特殊鹼基對順序的位置而定,所以會切出多種不同長度(多形性)的RFLP。但RFLP相對於龐大的人類基因庫而言,實屬太罕見,用它繪成的基因輿圖的解像力還是很低。

另一種基因標記是「VNTR」(9-10)(variable number of tandem repeats),因為人類的基因圖譜含有許多重覆的片斷,但每個人重覆這些片段的次數不同,這種多形性使VNTR成為可用的基因標記。

還有一種很有用的基因標記「CA重覆」(11)(CA repeats),它是利用人類基因圖譜中cytosine-adenine順序反覆((dC-dA)n.(dG-dT)n)出現的特性,與VNTR類似,每個人重覆這些片斷的次數不同,但是它出現的機率比RFLP、VNTR高很多,實驗室操作又比較簡單,所以成為目前最有用的基因標記。

重組機率

連鎖分析可以藉重組機率判斷一個致病基因座與基因標記之間的距離,也就是兩者是否「連鎖」(linkage)。以連鎖分析定位致病基因座或基因標記之所以可行,是因減數分裂原期(prophase I)時,兩條同源染色體會互換(crossing over)彼此部份的DNA,在互換之後會產生二條與原先的兩條染色體都不一樣的新染體(12)。兩個基因座在重組(互換)之後仍位於同一染色體的機率,和這兩個基因座之間的距離有關,距離越遠則重組機率越大,本文之前已提過1cM代表重組機率為1%,而1cM大約等於100萬個鹼基對的距離(7)。兩個基因座位於同一染色體上,則稱這兩個基因座是「連鎖的」。越靠近的連鎖基因座,減數分裂後越有機會仍舊「連鎖」。

除了基因座間的距離之外,交換次數也會影響連鎖。交換次數是奇數的話,在減數分裂後兩個基因座就不連鎖,但交換次數是偶數時,則繼續連鎖。當兩基因座距離夠遠,則發生奇數次交換與偶數次交換的機率相等(各50%)。也就是說:距離甚遠的兩基因座,在減數分裂後同時遺傳給下一代的機率,和位於其它染色體上的基因座是一樣的,都是50%(1)。

考慮孟德爾氏遺傳(即每個基因座只有兩個對偶基因),基因座A的對偶基因分別是A、a,基因座B的對偶基因是B、b,基因型AA、Aa、aa的表現型都不一樣且可觀察。如果親代同一染色體上的對偶基因是AB,而子代的同一染色體上的對偶基因也是AB,則基因座A與基因座B連鎖,否則就是不連鎖。將子代的不連鎖(即有重組)人數除以子代總人數,可得到重組機率(13)。實際上,由於可用的資訊不足,通常很難直接計算重組機率,其中的一些問題將於下一節討論。

連鎖分析

沿用前一節的符號,親代必須是Aa,才能經由觀察子代得知有無與基因座B連鎖。親代若是AA則所有子代都是同樣的對偶基因A,則無法得到足以辨識連鎖與否的資訊。所以親代雙方的基因型必需是AaBb才能獲得充份的資訊。但當親代的基因型都是AaBb時,則無法決定子代承傳的對偶基因(例如A)是父母中的那一方給予的。另一個問題是,如果親代的基因型是AaBb,則同一染色體的對偶基因可能是AB、ab,也可能是Ab、aB(13)(現在已可用分子生物技術確定)。另外,在其他生物可以透過交配實驗產生研究所需的各種組合,但是在人類只能收集既有的家族,等待資訊充分的家族出現(13)。1955年Morton提出「Lod分數法」(LOD score method)以解決重組機率計算的問題(14-17),當時RFLP尚未出現(8)(直到1980年才被發表)。

Lod分數法

Morton在1956年報告他以Lod分數法,計算14個家族的Rhesus基因座(決定Rh血型)與卵圓形紅血球症基因座的重組機率,結果兩基因座的重組機率是0.033(15)。

當時已知卵圓形紅血球症是一種自體顯性遺傳病,Rh血型的遺傳型式(mode of inheritance)也是已知,而遺傳型式已知是估計Lod分數的必要條件。

他假設某一個家族的兩遺傳特徵(例如Rh血型與卵圓形紅血球症)的重組機率為θ,又重組機率為θ的可能性為L(θ)。如果兩遺傳特徵未連鎖,則θ=0.5(請參考上一節的說明),未連鎖的可能性為L(0.5)。令LR(θ)代表L(θ)與L(0.5)之比,第i家族的可能性為L1(θ),因為家族之間的遺傳模式彼此獨立,所以根據機率的乘法法則,n個家族的全體可能性為L1(θ)L2(θ)…Ln(θ)。

全體的LR(θ)為

LR(θ)=(L1(θ)/L1(0.5))L2(θ)/L2(0.5))……(Ln(θ)/Ln(0.5))。

然後取以十為底的對數,上式可簡化為:

log10LR(θ)=log10(L1(θ)/L1(0.5))+log10(L2(θ)/L2 (0.5))+……+log10(Ln(θ)/Ln(0.5))。

以最大可能性估計法(maximum likelihood estimate),令上式log10LR(θ)的微分式等於零,則可得到使LR(θ)有最大值的(即最可能的)θ值。log10LR(θ)被稱為勝算比對數分數(lod score, decimal log likelihood odds score)。勝算比對數分數在台灣譯為「Lod分數」,在中國則譯為「優勢對數評分」。

假設現在有X、Y兩個家族的譜系表如圖一,方塊為男性、圓形為女性,黑色代表有病、白色代表正常。假設該疾病已知是顯性遺傳(以A代表致病對偶基因,a代表正常對偶基因),發病率為100%。兩家族的祖父均有病(Aa)且基因標記基因型為BB,祖母無病(aa)且基因標記基因型為bb,母親有病,所以母親的基因型是AaBb,母親的對偶基因A與B均來自祖父,所以此基因組合記為AB/ab,而父親均為aB/aB。這位母親遺傳給小孩的基因有四種可能組合:兩基因座連鎖的AB(小孩有病)、ab(小孩正常),兩基因座未連鎖的Ab(小孩有病)、aB(小孩正常)。假設兩家族的三個小孩來自母親的基因標記對偶基因均為B,則由圖1顯示:兩家族的男孩為AB/aB,Y家族的女孩aB/aB。若重組機率θ=0.1,則有一個兩基因座連鎖的小孩的機率為0.9,有一個兩基因座未連鎖的小孩的機率為0.1。這些計算已顯示於表1。

表1最後一行顯示最大的Lod分數出現於θ=0.5。也就是如果只有這兩個家族的資料,基因標記與疾病基因座將被認為不存在的連鎖關係。如果增加一個Z家族,它的Lod分數與X家族相同,則最大的Lod分數將出現於θ=0.3。事實上,最大的Lod分數將出現於θ=0.3左右,可能是θ=0.31或θ=0.29,現代電腦可算出精確的結果。

只要θ<0.5,連鎖就有可能。但是重組機率要多小才算是夠小呢﹖根據Elston與Lange的計算,當θ=0.3時兩基因座連鎖的可能性是20%(18)。Morton指出:使連鎖的偽陽性率低於5%的Lod分數是3(14),「Lod分數」大於3的意義是連鎖(θ<0.5)的可能性為不連鎖(θ=0.5)的可能性的1,000倍。

Rao等人的報告顯示:實證上Lod分數等於三確實可使偽陽性率維持在5%(19)。以上的推論都是基於假設:研究的基因座遵守孟德爾律、遺傳特徵有兩種,基因型與表現型的關係已知,對偶基因的發生率已知,如果發病與減低的或與年齡相依的發病率(reduced/age-dependent penetrate)有關,則發病率必需已知,也就是必需事前知道遺傳型式,這些參數都必需正確地選用,然後可以正確地引用Lod=3這個標準值(13)。此外,計算Lod分數須知道遺傳型式,而有些疾病到目前為止仍無法以分離分析(segregation analysis)得知遺傳型式,這類疾病在應用Lod分數法時有其困難。不過Greenberg的研究發現:Lod分數越大,則越接近正確的遺傳型式(20)。

罹病兄弟姐妹配對法

「罹病兄弟姐妹配對法」(21-24)(affected sib-pair method)是以兄弟姐妹為研究對象,探討父母四個不同的對偶基因座與致病基因座的關係,這種研究法不須事前已知遺傳型式。假若某基因標記有A、B、C、D四個不同的對偶基因,父親的基因型為AB,母親為CD,若子代有對偶基因A,則這個A就是來自父親,這種能夠辨認子代的對偶基因來源的,稱為「血統證明」(1)( identity-by-descent; IBD)。若基因標記的基因座與致病基因座相連,則有遺傳病的子代應該同時繼承了基因標記基因座與致病基因座。假設父親的致病基因座上是一個致病對偶基因,同時有基因標記A,則一個子代有病時,應該也有基因標記A。

若父親的基因型為AB,母親為AC,則無法分辨出子代的A是父母的那一方給予的,僅能辨認親代與子代的對偶基因相同,無法決定子代對偶基因的真正來源的,稱為「形貌證明」(23-24)(identity-by-state; IBS)。「形貌證明」的資訊不如「血統證明」豐富,所以需要更多的研究對象才能達到與後者相同的顯著水準,檢力較低,這當然導致研究成本增加(25),優點則是研究對象不再限於兄弟姐妹。

罹病親屬配對法

「罹病親屬配對法」(26-29)(affected relative pair method)是罹病兄弟姐妹配對法的擴大應用,它把全部罹病親屬都視為研究對象,而且不需知道或假設遺傳型式,只需引用「形貌證明」的資訊。

在Weeks與Lange的論文中(26),他們假設Zij代表配對罹病親屬i與j的對偶基因(指基因標記)一致的期望機率,Gif、Gim、Gjf、Gjm分別代表i得自父親與母親的對偶基因、及j得自父親與母親的對偶基因。則:

Zij=1/4δ(Gif, Gjf)+1/4δ(Gif, Gjm)+1/4δ(Gim, Gjf)+1/4δ(Gim, Gjm),若G與G'是同樣的對偶基因,則δ(G, G')=1,否則δ(G, G')=0。例如i的基因型為AA,j為AB,則

Zij=1/4δ(A, A)+1/4δ(A, B)+1/4δ(A, A)+1/4δ(A, B)=0.5。

如果考慮各對偶基因的發生率不同,則可將δ(G,G')乘上f(G)予以加權:

Zij=1/4δ(A, A)f(A)+1/4δ(A, B)f(A)+1/4δ(A, A)f(A)+1/4δ(A, B)f(A)。

對δ(A, B)而言,以f(A)或f(B)加權是一樣的,結果都是0。若p為對偶基因G的發生率,f(G)可以是1、或1/√p、或1/p,選1代表忽略對偶基因的發生率,選1/p則是越罕見的對偶基因加權越大。由於上述公式未除以總加權量,此時Zij可能大於一。假設對偶基因A的發生率為1/2,B為1/4,選擇f(G)=1/p,則加權後Zij=1。如果這家族有n位罹病者有可用的基因型資訊,依據組合計算,可組成n(n-1)/2對罹病親屬,將這n(n-1)/2個Zij相加,可得到該家族(命名為m家族)的Z值(Zm)。

根據Weeks與Lange的推演(26),假設m家族有nm位罹病且基因型已知的親屬,則該家族的Z值加權量(ωm)應是ωm=√(nm-1)/√Var(Zm), Var(Zm)為m家族的Z值變異數,E(Zm)為m家族的Z值期望值。最後以下式進行檢定:

T=Σm{ωm[Zm-E(Zm)]}/√Σm[ωm2Var(Zm)],

如果nm夠大,T值將呈標準常態分配。即T>1.96,表示基因標記基因座與疾病基因座連鎖。

Log分數法必須知道或假設一個遺傳模式,由於一般慢性病與癌症常常是多因子疾病,因此遺傳模式很複雜,加上家族間的遺傳模式常常不同,所以若以Log分數評估連鎖,則誤差率會較大。對於多因子、遺傳型式未知的疾病而言,罹病親屬配對法是最合適的設計。罹病親屬配對法原則上亦可適用於定性的遺傳特徵(如有病或無病),但相對於分析定量的遺傳特徵(如血糖值),它的檢力會變低(7)。

多點分析

以上所討論的連鎖分析都只限於估計兩個基因座的連鎖,但一個致病基因附近應該有很多種基因標記,而且由只有兩個基因座的「兩點分析」(two-point analysis)改為多個基因座的「多點分析」(multipoint analysis),因為至少有一個基因是異型接合子的機率增加(若一個基因是異型接合子的機率為p,則n個基因中至少有一個異型接合子的機率為1-(1-p)n,1-(1-p)n恆大於p),遺傳資訊隨之增加,所以多點分析可增加連鎖分析的檢力、更精確地定位致病基因座、增加遺傳諮詢與產前檢查的準確性(13, 30)。多點分析因為涉及的基因座增加,所以可以想像其計算將遠比只有一個重組機率的兩點分析複雜,不過現在的電腦可以解決這些計算的問題(31, 33)。 遺傳異質性

孟德爾氏遺傳病(單一致病對偶基因引發的遺傳病)常見單由一個發生突變的對偶基因引起疾病,因而罹病者之間的致病對偶基因並不是同一個,有時不同的突變對偶基因發生於同一個基因座,有時不同基因座的突變對偶基因引起相同的疾病。這種不同的致病對偶基因引起相同的遺傳病特徵的情形稱為遺傳異質性(genetic heterogeneity)(13)。遺傳異質性可以發生在不同的突變、不同或相同的基因座、不同的遺傳型態、不同的臨床表現或生化發現,這是研究孟德爾氏遺傳病的連鎖分析時很重要的觀念。

複雜遺傳病

大多數的疾病都不是孟德爾氏遺傳病,但可能與遺傳因子有關,這類罹病者的一等親罹病危險性大約是一般人的2至10倍,這個危險性比(risk ratio)遠低於孟德爾氏遺傳病。這類疾病可能受多個彼此互相影響的基因控制(13),例如早發性阿茲海默癡呆症受到三個基因的控制(34-36),乳癌則已發現二個相關基因座(37-40)。研究這類疾病的策略和孟德爾氏遺傳病不同。對孟德爾氏遺傳病而言,如果是隱性遺傳則適合的研究家族是父母正常、很多罹病子代,若父母是近親婚配則資訊更多;如果是顯性遺傳則適合的研究家族是越多代越好、罹病者越多越好,因為越多代越能得到每個人的充分資計。對非孟德爾氏遺傳病而言,研究對象最好是罹病的親屬,例如罹病親屬配對、罹病兄弟姐妹配對。這種方法的優點就是毋須事前知道遺傳型態(13)。

檢力與樣本大小

連鎖分析的檢力與基因的效應大小及對偶基因的發生率有關。假設某基因座有兩個對偶基因A、a,它們的發生率分別是p、q(=1-p),三個基因型為AA、Aa、aa,令γ1為Aa與aa的罹病危險性之比,γ2為AA與Aa的罹病危險性之比,λ為罹病者子女與一般人的罹病危險性之比,λs為罹病者兄弟姐妹與一般人的罹病危險性之比,假如γ1=γ2=γ,則λo=1+ω, λs=(1+1/2ω)2, ω=pq(γ-1)2/(pγ+q)2。罹病兄弟姐妹配對法的檢力及使檢定結果達到顯著差異所需的樣本數可由λs查表得之(41)。根據Risch與Merikangas的計算,λs=2時需要119對兄弟姐妹配對,才能使檢定結果達到顯著差異(13, 41)。但是若λs小於1.5-1.2時,則需要307-1,368對兄弟姐妹配對(13, 41),因此複雜疾病的研究進展不如孟德爾氏遺傳病是可以預期的。

相關性分析

雖然連鎖分析與相關性分析(42)都用於研究遺傳病與特定基因的關係,但二者的研究設計、測量、意義都不一樣。連鎖分析分析某一疾病是否可歸因於特定的染色體區間(1),假設某癌症有兩個版本的對偶基因標記,X、Y,某家族的患者通常攜帶X版,如果他們將癌症遺傳給下一代,則下一代攜帶X版基因標記的機率應該遠大於攜帶Y版基因標記。但另一家族,若以攜帶Y版為主,如果遺傳癌症給下一代,則下一代攜帶Y版基因標記的機率應該較大。相關性分析則分析無親屬關係的病例與對照,某特定對偶基因的出現率是否不同(1)。如果無親屬關係的攝護腺癌患者90%有某個版本的對偶基因,無親屬關係的對照病患只有10%有該版本對偶基因,通常可下結論說,該版本對偶基因與攝護癌相關。總而言之,連鎖分析探討的是特定基因座與疾病的關係,而相關性分析則是探討特定版本的對偶基因與疾病的關係。相關性分析比連鎖分析敏感,但是只能指出疾病與對偶基因的相關,而不能建立兩者的因果關係。而連鎖分析的設計,子代必定是先繼承致病對偶基因,然後才罹病,因此可以看到因果關係。

假設基因座A的對偶基因分別是A、a,基因座B的對偶基因是B、b,若基因座A出現對偶基因A、a的機率為P(A)、P(a),基因座B出現對偶基因B、b的機率為P(B)、P(b),在理論上似乎兩個基因座出現對偶基因A、B的機率(P(AB))應符合獨立事件的機率乘法法則,則P(AB)=P(A)×P(B),同理P(Ab)=P(A)×P(b)。如果遺傳是以這種方式進行,即使已知基因座A的對偶基因是A,仍無法知道另一基因座上的對偶基因是B或b。但研究證明,對偶基因並非隨機配對,例如:胰島素依賴型糖尿病患的胰島素基因座的對偶基因是致病對偶基因,則Class I對偶基因出現於鄰近的5'FP基因座的可能就增高,也就是P(Ab)致(A)×P(b)(43-45)。這種對偶基因不隨機分配的現象稱為連鎖不平衡(linkage disequilibrium)(1)。這種特性的原因與兩基因座距離越近則重組機率越低出現,再加上人類數十萬年的遺傳歷史,因此使某些對偶基因配對特別容易同時出現。利用此種現象,只要比較「無親屬關係」的罹病者與正常對照者的特定對偶基因發生率,就可以知道基因標記基因座是否鄰靠疾病基因座,或者這個基因標記基因座就是疾病基因座。

相關性分析基因標記的選擇只能就目前已有的知識去選擇。被選的那個基因稱為候選基因(1)(candidate gene)。例如:阿茲海默癡呆症的病理發現病人腦中有含β-amyloid的斑塊,所以控制製造β-amyloid的APP基因成為阿茲海默癡呆症的候選基因(1)。

相關性分析雖然容易執行,但據Crowe對精神疾病(大多數是複雜疾病)的研究,如果要使偽陽性率維持在5%的水準,則顯著水準必須定在0.00001(46)。另一問題是遺傳病和基因有關,在經驗上常見某一人種的罹病率較高,找尋同一人種的配對者難度因而提高。因此基因子傳遞不平衡檢定(44)(transmission/disequilibrium tests; TDT)成為相關性分析最受歡迎的方法。

基因子傳遞不平衡檢定

基因子傳遞不平衡檢定以罹病者的父母為對照組,父母的基因型被認為是攜帶一個致病對偶基因的異型接合子,然後評估該對偶基因被傳至子代的頻率。在Spielman等人的論文中(44),假設疾病基因座的對偶基因分別是A(致病對偶基因)、a,基因標記基因座的對偶基因是B、b、……,為了便於討論假設每一家族只有一罹病者,n為進入研究的家族數,因此基因標記基因座共有4n個父母的對偶基因及2n個小孩的對偶基因,令有w個對偶基因B及2n-y個對偶基因b被傳至子代,也就是有2n-w個對偶基因B及y個對偶基因b沒被傳至子代。如果不管父母的基因型,則可用卡方檢定算出對偶基因B、b與致病對偶基因的相關性:χ2=4n(w-y)2/[(w+y)/ (4n-w-y)],自由度為一。前述方法只能檢定這個無效假設:基因指標與疾病無關。

如果從父母這方考慮,共有2n位父母,之中把對偶基因B傳給子女而另一個對偶基因b未傳下去(記為B/b)的人有j位,同樣的,B/B、b/B、b/b的情況各有i、k、l位,則χ2=(j-k)2/(j+k),自由度為一。這個χ2稱為「TDT」,記做χ2td。如果每個家族有兩個罹病子代,計算將變成很複雜,但現在有統計套裝軟體可幫忙計算。

統計套裝軟體

LINKAGE(47)與S.A.G.A.(48)是常見的用於連鎖分析與相關性分析的套裝軟體。其中LINKAGE是免費的,可由下列網址下載:ftp://linkage.rockefeller.edu/software/ linkage。S.A.G.A.(Statistical Analysis for Genetic Epidemiology)則是付費軟體,相關資料可查下列網址:http://darwin.cwru.edu/pub/sage.html。

LINKAGE程式提供計算重組率最概估計(ILINK、CILINK)、Lod分數(MILINK)、與遺傳危險性(LINKMAP、CMAP)所需的統計程式。其中ILINK、LINKMAP用於分析一般家族資料,CILINK、CMAP用於分析三代家族資料。在開始程式分析之前,需以文書軟體建立一個族譜檔(PEDFILE)及一個基因座檔(DATAFILE),前者描述家族遺傳表現的訊息,後者包含基因座、重組率、基因座的序位等訊息。

S.A.G.A程式提供計算Lod分數(LODLINK)、罹病兄弟姐妹配對(SIBPAL)、罹病親屬配對(RELPAL)、與基因子傳遞不平衡檢定(TDTEX)所需的統計程式。LODLINK可以直接使用研究遺傳模式的程式(REGC、REGD、REGTL、REGTN)所產生的資料。

結 語

連鎖分析早期曾為缺乏有用的基因標記而進步緩慢。Botstein等人在1980年發現RFLP(8), Nakamuna等人在1987年發現VTNR(9),Weber與May在1989年發現CA重覆(10),使缺乏基因標記的問題得以解決。此外,在統計分析方面,也有Lod分數法、罹病親屬配對法、罹病兄弟姐妹配對法、基因子傳遞不平衡檢定等不同的方法被發表。大量計算的問題可由套裝軟體代勞。人類基因輿圖計畫以基因標記為路標,導致大量基因標記的發現,間接提供連鎖分析最需要的資訊。近十年,每隔一小段時間就可發現一種致病基因的位置,本文一開始曾大略提到其中的一些疾病。遺傳流行病學使得多年來不明原因的人類重大疾病,例如癌症、腦與精神疾病的病因與致病機轉,似乎已見突破困局的可能。從近年國外發表的文獻數量來看,遺傳流行病學將成為下一世紀最有潛力的流行病學領域之一(49)。

參考文獻

1.Faraone SV, Tsuang MT: Methods in psychiatric genetics. In: Tsuang MT, Tohen M, Zahner GEP(eds): Textbook in Psychiatric Epidemiology. New York: Wiley-Liss, 1995; 81-134.
2.Harris H: The Principles of Human Biochemical Genetics. 3rd rev ed. Amsterdam, The Netherlands, Elsevier/North-Holland Biomedical Press, 1980.
3.Green ED, Waterston RH: The Human Genome Project: prospects and implications for clinical medicine. JAMA 1991; 266: 1966-1975.
4.Engel LW: The Human Genome Project: history, goals, and progress to date, Arch Pathol Lab Med 1993; 117: 459-65.
5.Olson MV: The Human Genome Project. Proc Natl Acad Sci USA 1993; 90: 4338-4344.
6.Green ED, Cox DR, Myers RM: The Human Genome Project and its impact on the study of human disease. In: Scriver CR, Beaudet AL, Sly WS, et al (Eds):The Metabolic and Molecular Bases of Inherited Disease. Vol 1. 7th ed. New York, McGraw-Hill, 1995; 401-436.
7.Ellsworth DL, Hallman DM, Boerwinkle E: Impact of the human genome project on epidemiologic research. Epidemiol Rev 1997; 19: 3-13.
8.Botstein d, White RL, Skolnick M, et al: Construction of a genetic linkage map in man using restriction fragment length polymorphisms, Am J Hum Genet 1980; 32: 314-331.
9.Nakamura Y, Leppert M, O'Connell P, et al.: Variable number of tandem repeat (VNTR) markers for human gene mapping. Science 1987; 235: 1616-1622.
10.Nakamura Y, Carlson M, Krapcho D, et al: New approach for isolation of VNTR markers. Am J Hum Genet 1988; 43: 854-859.
11.Weber JL, May PE: Abundant class of human DNA polyorphisms which can be typed using the polymerase chain reaction. Am j hum Genet 1989; 44: 388-396.
12.Jorde LB, Carey JC, White RL: Basic cell biology: Structure and function of Genes and chromosomes. In: Jorde LB, Carey JC, White RL(Eds): Medical Genetics, St. Louis, Mosby, 1994, 7-29.
13.Risch N: Evolving methods in genetic epidemiology. II. Genetic linkage from an epidemiologic perspective. Epidemiol Rev 1997; 19: 24-32.
14.Morton NE: Sequential tests for the detection of linkage. Am J Hum Genet 1955; 7: 277-318.
15.Morton NE: The detection and estimation of linkage between the genes for elliptocytosis and the Rh blood type. Am J Hum Genet 1956; 8: 80-96.
16.Ott J: Analysis of Human Genetic Linkage. Rev ed. Baltimore: The John Hopkins University Press, 1991; 1-302.
17.Ott J: Linkage analysis and family classification under heterogeneity. Ann Hum Genet 1983; 47: 311-320.
18.Elston RC, Lange K: The prior probability of autosomal linkage. Ann Hum Genet 1975; 38:341-350.
19.Rao DC, Keats BJB, Morton NE, et al: Variability of human linkage data. Am J Hum Genet 1978; 30: 516-529.
20.Greenberg DA: Inferring mode of inheritance by comparison of lod scores. Am J Med Genet 1989; 34: 480-486.
21.Penrose LS: The detection of autosomal linkage in data which consist of pairs of brothers and sisters of unspecified parentage. Ann Eugen 1935; 6: 133-138.
22.Haseman JK, Elston RC: The investigation of linkage between a quantitative trait and a marker locus. Behav Genet 1972; 2: 3-19.
23.Lange K: The affected sib-pair method using identity by state relations. Am J Hum Genet 1986; 39: 148-150.
24.Lange K: A test statistic for the affected-sib method. Ann Hum Genet 1986; 50: 283-290.
25.Bishop DT, Williamson JA: The power of identity-by-state methods for linkage analysis. Am J Hum Genet 1990; 46: 254-265.
26.Weeks DE, Lange K: The affected-pedigree-member method of linkage analysis. Am J Hum genet 1988; 42: 315-326.
27.Amos CI: Robust variance-components approach for assessing genetic linkage in pedgrees. Am J Hum Genet 1994; 54: 535-543.
28.Risch N, Zhang H: Extreme discordant sib pairs for mapping quantitative trait loci in humans. Science 1995; 268: 1584-1589.
29.Ward PJ: Some developments on the affected-pedigree-member method of linkage analysis. Am J Hum Genet 1993; 52: 1200-1215.
30.Spence MA: Genetic linkage: sampling issues and multipoint mapping. J Psychiatr, Res 1987; 21: 631-637.
31.Lathrop GM, Lalouel JM, Julier C, et al: Strategies for multilocus linkage analysis in humans. Proc Natl Acad Sci USA 1984; 81: 3443-3446.
32.Lander ES, Green P, Abrahamson J, et al: MAPMAKER:an interactive computer package for constructing primary genetic linkage map of experimental and natural populations. Genomics 1987; 1: 174-181.
33.Lange K, Weeks DE, Boehnke M: Programs for pedigree analysis: MENDEL, FISHER, and dGENE. Genet Epidemiol 1988; 5: 471-472.
34.Goate A, Chartier-Harlin MC, Mullan M, et al: Segregation of a missense mutation in the amyloid precursor protein gene with familial Alzheimer's disease. Nature 1991; 349: 704-706.
35.Hall JM, Lee MK, Newman B, et al: Linkage of early-onset familial breast cancer to chromosome 17q21. Science 1990; 250: 1684-1689.
36.Sherrington R, Rogaev EI, Liang Y, et al: Cloning of gene bearing missense mutations in early-onset familial Alzheimer's disease. Nature 1995; 375: 754-760.
37.Levy-Lahad E, wasco W, Poorkaj P, et al: Candiate gene for the chromosome 1 familial Alzheimer's disease locus. Science 1995; 250: 1684-1689.
38.Wooster R, Neuhausen SL, Mangion J, et al: Localization of a breast cancer susceptbility gene, BRCA2, to chromosome 13q12-13. Science 1994; 265: 2088-2090.
39.Miki Y, Swensen J, Shattuck-Eidens D, et al: A strong candidate for the breast and ovarian cancer susceptibility gene BRCA1. Science 1994; 266: 66-71.
40.Wooster R, Bignell G, Lancaster J, et al: Identification of the breast cancer susceptibility gene BRCA2. Nature 1995; 378: 789-792.
41.Risch N, Merikangas K: The future of genetic studies of complex human diseases. Science 1996; 273: 1516-1517.
42.Khoury MJ, Beaty TH, Cohen BH: Fundamentals of Genetic Epidemiology. New York: Oxford University Press, 1993.
43.Vogel F, Motulsky AG: Human Genetics: Problems and Approaches. Berlin: Springer-Verlag, 1986.
44.Spielman RS, McGinnis RE, Ewens WJ: Transmission test of linkage disequilibrium: the insulin gene region and insulin-dependent diabetes mellitus (IDDM). Am J Hum Genet 1993; 52: 506-516.
45.Thomson G: Mapping disease genes: family-based association studies. Am J Hum Genet 1995; 57: 487-498.
46.Crowe RR: Candiate genes in psychiatry: an epidemiological perspective. am J Med Genet Neuropsychiatry Genet 1993; 48: 74-77.
47.LINKAGE, version 2.1. ftp://linkage. rockefeller. edu/ software/linkage. New York: Department, 1999.
48.S.A.G.A.: Statistical Analysis for Genetic Epidemiology, release 3.1. Cleveland, Ohio: Department of Epidemiology and Biostatistics, Case Western Reserve University, 1999.
49.陳建仁:臺灣流行病學的過去、現在與未來。景福會刊1998。

台灣醫界 2000, Vol.43, No.3
http://www.med-assn.org.tw/

Hosted by www.Geocities.ws

1