都道府県単位の日本人の遺伝的構造

 都道府県単位の日本人の遺伝的構造に関する研究(Watanabe et al., 2020)が報道され、話題になっているようです。日本語の解説記事もあります。この研究はオンライン版での先行公開となります。本論文では、日本人の遺伝的構造を解明するため、47都道府県単位と、さらに大きな9地域区分(北海道・東北・関東・中部・近畿・中国・四国・九州・沖縄)単位で遺伝的データが分析されました。この区分は、以下の本論文の図1で示されます。
画像

 日本列島には、アイヌと主に沖縄の琉球人という二つの小集団と、その他の大多数を占める「本土」日本人という大集団が存在します。日本人の人口史については、変容・置換・交雑という3モデルが提示されており、現在有力なのは、交雑モデルの一つである「二重構造モデル」です。このモデルでは、現代日本人は先住民である「縄文人(縄文文化関連個体群)」とアジア東部大陸部からの移民との混合により形成された、と想定されます。頭蓋形態に関する以前の研究では、アイヌと琉球人が「本土」日本人より「縄文人」に近く、東北地方の人々は形態的にアイヌに近い、と示唆されています。遺伝学的にも、アイヌと琉球人は「本土」日本人よりも「縄文人」の遺伝的影響を強く受けており、とくにアイヌではその影響がひじょうに高い、と推測されています(関連記事)。

 これまでの遺伝学的研究で、「本土」日本人と沖縄県民との間の遺伝的差異は示されていますが、「本土」日本人の都道府県間の遺伝的差異はよく理解されていません。以前の研究で、主成分分析から東北地方の人々が沖縄県民に近く、「縄文人」の遺伝的影響が強い、と示唆されています。しかし、東北地方の全県の人々が遺伝的に沖縄県民に近いのか不明で、さらに四国・中国地方の人々は対象とされていませんでした。本論文では、47都道府県全ての11069人のゲノム規模一塩基多型データが分析され、都道府県水準での日本人の遺伝的構造が明らかにされます。これは、ヤフー株式会社が提供するゲノム解析サービス「HealthData Lab」の顧客11069名の138688ヶ所の常染色体一塩基多型遺伝子型データに基づいています。その地域的内訳は、本論文の表1で示されています。

 まず、個体水準で主成分分析が行なわれ、琉球人(おもに沖縄県民)と「本土」日本人(おもに沖縄県以外の46都道府県民)が遺伝的に明瞭に分かれる、と確認されました。なお、本論文で用いられたデータにアイヌは含まれていないと考えられます。常染色体上の138688ヶ所の一塩基多型遺伝子型データから各個体の主成分得点が求められ、プロットされました。次に、47都道府県のそれぞれから50名ずつ無作為抽出されて各一塩基多型のアレル(対立遺伝子)頻度が計算され、中華人民共和国の北京の漢人も含めてペアワイズにf2統計量(2集団間の遺伝距離を測る尺度の一つで、一塩基多型データに対するf2統計量は、一塩基多型ごとにあれる頻度の集団間差の2乗を計算し、それらの平均値として与えられます)を求めてクラスタ分析(多数の変数、つまり多次元データからデータ点間の非類似度を求め、データ点をグループ分けする多変量解析手法の一つで、グループ分けが階層的になされる階層的手法と、特定のクラスター数に分類する非階層的手法があり、本論文では階層的手法の一つであるウォード法が用いられました)が行なわれました。

 日本人11069人と103人の漢人を対象とした主成分分析では、漢人に近い個体を除くと、日本人は沖縄県民を中心とする「琉球クラスタ」と本土日本人を中心とする「本土日本クラスタ」に大きく二分されました(図1)。本土日本クラスタ内では、東北の個体群が沖縄県民と、近畿および四国の個体群が漢人と比較的近い、と明らかになりました。以下、日本人と漢人を対象とした主成分分析結果を示した本論文の図2です。
画像

 ADMIXTURE分析(K=2からK=5まで)では、系統の割合が沖縄県民と他の都道府県民との間でかなり異なっていました。K=2では(図3)、青色成分が沖縄県民の系統の大半を占めています。沖縄県を除く都道府県では、青色成分の割合が近畿と四国で比較的低く、東北・関東・九州で比較的高い、と明らかになりました。以下、K=2の場合のADMIXTURE分析結果を示した本論文の図3です。
画像

 都道府県単位のクラスタ分析では、沖縄県民が他の全都道府県民と大きく異なり、沖縄県民を除く都道府県民は大きく3クレード(単系統群)に区分されました。クレード1は東北の全県、クレード2は四国と近畿の全府県、クレード3は中国と九州の全県を含みます。したがって、これら5地域(東北・四国・近畿・中国・九州)は比較的遺伝的には均質と考えられます。f2統計に基づくと、九州、とくに鹿児島県民が遺伝的には沖縄県民に最も近い、と明らかになりました。

 47都道府県単位での主成分分析では、同じ地域の都道府県が近くに位置づけられました(図5)。PC1軸では、沖縄県が他の都道府県から離れており、東北と九州の諸県は沖縄県と比較的近くに位置します。沖縄から最も遠いのは、近畿と四国の諸府県です。PC2軸は緯度および軽度と強く相関しており、各都道府県の地理的位置が反映されていることを示します。以下、47都道府県単位での主成分分析結果を示した本論文の図5です。
画像

 主成分分析結果を示す上記の図2は、近畿と四国の人々が他の都道県民よりも遺伝的に漢人に近いことを示唆します。これを確認するためf2統計が行なわれ、近畿と四国の人々が他のほとんどの都道県民よりもかなり漢人に近い、と明らかになりました。本論文の分析では、47都道府県民のうち、漢人と遺伝的に最も近いのは奈良県民です。

 これらの分析結果を踏まえると、以前の研究と同様に、日本列島の現代人集団は遺伝的に沖縄と本土日本に区分される、と改めて確認されました。ただ、上述のように本論文ではアイヌは含まれないと考えられるので、アイヌを含めると二分ではなく三分されるでしょう。上述のように、以前の研究で本土日本人よりも琉球人の方が遺伝的には縄文人と近い、と示されていました。つまり、本土日本人は琉球人よりも、アジア東部大陸部からの(おそらくは弥生時代以降の)移民に遺伝的に近いことになります。これは、上記の図3で示されたK=2のADMIXTUREにおいて、青を縄文人由来、橙を弥生時代以降の移民に由来すると仮定した場合に確認されます。

 アジア東部大陸部からの弥生時代以降の移民は、遺伝的に漢人に近いと予測されます。上記の図5で示された主成分分析のPC1軸で沖縄から最も遠い近畿と四国の府県は、他のほとんどの都道県よりも漢人に近い、と明らかになりました。図5のPC1軸は、縄文人とアジア東部大陸部からの弥生時代以降の移民という二つの祖先集団との遺伝的類似性を反映しているようです。遺伝的に、東北と九州の個体群は他地方よりも縄文人に近く、一方で近畿と四国の個体群はアジア東部大陸部からの弥生時代以降の移民に近いようです。アイヌは北海道の在来集団ですが、現代の北海道民のほとんどは明治時代以降の本土日本からの移民の子孫です。したがって、アイヌは遺伝的に本土日本人よりも琉球人の方と類似していますが、現代の北海道民は琉球人と類似していません。縄文人系統の地域差が、現代日本人集団の遺伝的構造の主因かもしれません。

 主成分分析では、地理的位置が本土日本人の遺伝的構造に関わる主因の一つであることも明らかになりました。上記の図5のPC2軸と緯度もしくは経度との有意な相関は、隣接する都道府県間の移動によるものと考えられます。この結果は予測できましたが、ゲノム規模の一塩基多型遺伝子型データを用いて都道府県水準で大規模な分析を行なった本論で初めて示されました。

 本論文は、四国の住民が本土日本人の中では比較的漢人に近いことを始めて示しました。上記の図2では、四国の人々はわずかしか漢人クラスタと本土日本人クラスタとの間に位置づけられないので、四国の現代人は、中国人や朝鮮人とあまり混合していない可能性があります。したがって、アジア東部大陸部からの弥生時代以降の移民の遺伝的構成は四国でよく保存されている、と考えられます。アジア東部大陸部からの移民により導入された水稲耕作は九州北部で始まったので、この移民はまず九州北部に到来した可能性が高そうです。もしそうならば、アジア東部大陸部から四国への移住には、中国や九州を経由して瀬戸内海を渡る必要があります。それにも関わらず、四国は中国や九州よりも遺伝的に漢人に近く、弥生時代以降の渡来系統の程度がアジア東部大陸部からの移民の移動経路と必ずしも一致しない、と示唆されます。四国の人々のゲノムに関する将来の研究では、弥生時代以降におけるアジア東部大陸部からの移民の遺伝的背景が解明されるかもしれません。しかし、近畿の現代人と漢人との遺伝的類似性に関しては、図2の2集団間で位置づけられた個体群のように、最近の混合に由来するかもしれません。

 上記の図5で示される主成分分析では、東北だけではなく九州も沖縄県に近くなっています。これは図2の主成分分析により支持され、九州の一部個体が本土日本クラスタと沖縄クラスタの間に位置づけられます。その一因は、九州と沖縄の地理的近さで、最近になって九州に沖縄県から移住した人々や、沖縄県出身の両親がいるからです。九州の各県では鹿児島県が沖縄県に最も近くなっています。これは、鹿児島県に属する奄美群島が、かつて沖縄本島に存在した琉球王国の支配下にあったからと考えられます。九州と沖縄の遺伝的近縁性は、上述のように地理的近さが一因と考えられますが、九州北部の3県(福岡・佐賀・長崎)も沖縄に遺伝的に近くなっています。上述のように、アジア東部大陸部からの弥生時代以降の移民は九州北部にまず到来したと考えられますが、九州北部の現代人よりも四国や近畿の現代人の方が遺伝的には漢人と近くなっています。この結果は、アジア東部大陸部からの移民が、弥生時代に九州北部に存在した縄文人とあまり混合しなかったことを示唆しますが、これは将来解決されるべき問題です。

 また、日本人のさまざまな疾患に関連する多型を特定するため、遺伝的関連研究が行なわれてきました。偽陽性を回避するため、症例と対照の遺伝的背景はできるだけ一貫している必要があります。ゲノム規模関連研究では、ゲノム拡張係数もしくは主成分分析スコアの使用により、集団階層化による偽陽性は回避できるかもしれません。しかし、原因となる一塩基多型が被験者の遺伝的不均質に寄与している場合、こうした調整が偽陰性を引き起こすかもしれません。これらの問題に完全に対処することは困難ですが、本論文の結果は、患者と対照群は、上述の各クレード(クレード1~3および沖縄)内の都道府県から募集する必要がある、と示唆します。

 まとめると、本土日本人は遺伝的に不均一で、これは、各地域で縄文人とアジア東部大陸部からの弥生時代以降の移民との間の混合の程度と、近隣の都道府県間の限定的な移住によりもたらされた可能性があります。


 以上、本論文についてざっと見てきました。本論文は都道府県単位での日本人の遺伝的構造を示しており、ひじょうに有益だと思います。ただ、日本列島の現代人集団の遺伝的構造の地域差がどのように形成されてきたのか解明するには、やはり日本列島全域での通時的な古代ゲノムデータが必要となります。その意味で、現代日本人、さらにはその地域差の形成過程を、本論文から過剰に読み取ってはならない、とは思います。あくまでも、本論文はそうした問題に関して重要な基礎的情報を提供した、と考えるべきでしょう。

 本論文が提示する現代日本人の遺伝的構造の地域差は興味深く、今後の研究でより詳細に解明されていく、と期待されます。本論文では、日本列島の現代人のうち本土集団と琉球集団が取り上げられています。どちらも、日本人起源論で以前から提示されている「二重構造モデル」で説明されます。上述のように、縄文人とアジア東部大陸部からの弥生時代以降の移民との混合により、日本列島の現代人集団は形成された、というわけです。ただ、本論文で取り上げられていないアイヌ集団に関しては、上述のように縄文人の遺伝的影響が本土集団および琉球集団よりもずっと高く、本土集団との混合が前近代より進行していたとはいえ(関連記事)、アジア東部大陸部からの弥生時代以降の移民の遺伝的影響は本土集団および琉球集団よりもはるかに低いでしょう。

 このアジア東部大陸部からの弥生時代以降の移民と遺伝的構成が最も類似していると推測されるのは、現時点で確認されている古代人では新石器時代黄河流域集団となります(関連記事)。このモデルでは、新石器時代黄河流域集団は出アフリカ現生人類(Homo sapiens)集団の中で位置づけられます。出アフリカ現生人類は、ユーラシア東部系統と西部系統に分岐し、ユーラシア東部系統は南方系統と北方系統に分岐します。ユーラシア東部南方系統に位置づけられるのは、現代人ではパプア人やオーストラリア先住民やアンダマン諸島人、古代人ではアジア南東部狩猟採集民のホアビン文化(Hòabìnhian)集団です。一方、ユーラシア東部北方系統からはアジア東部系統が分岐し、アジア東部系統はさらに南方系統と北方系統に分岐します。アジア東部北方系統は新石器時代黄河流域集団、アジア東部南方系統は新石器時代の福建省や台湾の集団(おそらくは長江流域新石器時代集団も)に代表され、オーストロネシア語族現代人の主要な祖先集団(祖型オーストロネシア語族集団)です(関連記事)。

 現代において、日本列島本土集団や漢人やチベット人などアジア東部現代人集団の主要な遺伝的祖先はアジア東部北方系統ですが、漢人は北部から南部への遺伝的勾配で特徴づけられ、それはアジア東部北方系統とアジア東部南方系統との混合により形成された、と推測されます。チベット人はアジア東部北方系統とユーラシア東部南方系統との、日本列島本土集団はアジア東部北方系統と縄文人との混合により形成されましたが、いずれもアジア東部北方系統の遺伝的影響の方がずっと高くなっています(80%以上)。縄文人は、ユーラシア東部南方系統(45%)とアジア東部南方系統(55%)との混合と推定されています。

 本論文では、日本列島の現代人集団のうち本土集団と琉球集団は、先住の縄文人とアジア東部大陸部からの弥生時代以降の移民の混合と指摘されていますが、後者は基本的に新石器時代黄河流域集団に代表されるアジア東部北方系統と考えられます。ただ、稲作の北上に伴って黄河流域でも後期新石器時代にはアジア東部南方系統の割合の増加が指摘されているように(関連記事)、アジア東部大陸部から日本列島への弥生時代以降の移民も、アジア東部北方系統を基本としつつ、アジア東部南方系統の遺伝的影響を受けている、と推測されます。

 本論文の結果を踏まえると、沖縄県民ではアジア東部北方系統の遺伝的影響が他の都道府県民(本土集団)よりも低く、本土集団でも地域差がある、と言えそうです。本論文が指摘するように、アジア東部大陸部からの弥生時代以降の移民はまず九州北部に到来したと考えられるのに、その遺伝的影響は九州よりも近畿と四国で高くなっています。本論文はこれに関して、アジア東部大陸部からの移民が、弥生時代に九州北部に存在した縄文人とあまり混合しなかった可能性を示唆します。ただ、ヤマト政権成立後に、アジア東部北方系統の遺伝的構成の人々が朝鮮半島から日本列島に到来し(いわゆる渡来人)、畿内に優先的に居住したことを反映している可能性も考えられます。弥生時代だけではなく、古墳時代以降の混合も地域差を形成したかもしれない、というわけです。四国に関しては、近畿との歴史的なつながりを反映しているかもしれません。また関東の現代人がクレードを形成しなかったことについては、近代以降の各地からの移住の影響が大きいかもしれません。これらの問題の解明には、やはり広範囲で通時的な古代ゲノムデータが必要で、今後の研究の進展が期待されます。


参考文献:
Watanabe Y, Isshiki M, and Ohashi J.(2020): Prefecture-level population structure of the Japanese based on SNP genotypes of 11,069 individuals. Journal of Human Genetics.
https://doi.org/10.1038/s10038-020-00847-0

大河ドラマ『麒麟がくる』第28回「新しき幕府」

 1568年(西暦は厳密な換算ではなく、1年単位での換算です)9月、織田信長は足利義昭を奉じて上洛し、松永久秀も信長に面会に行きますが、自分が三好三人衆と通じていると疑われているのではないか、と懸念していました。じっさい、諸勢力の処遇を論じる評定にて、足利義輝の殺害に久秀が加担していたので処分すべきと三淵藤英は主張しますが、信長家臣の柴田勝家は、久秀の功績を主張して激論となります。義昭は、信長の主張通り久秀を受け入れるよう、藤英を説得します。久秀は信長に茶器を献上して歓心を買い、筒井順慶など大和の豪族と戦うつもりだ、と明智光秀(十兵衛)に言い、さらに朝倉義景の動きが怪しい、と光秀に伝えます。義昭は、幕府再興のために摂津晴門を政所で起用するよう信長に打診し、信長も受け入れますが、義輝を補佐できなかった晴門の起用に、細川藤孝も明智光秀(十兵衛)も不安に思います。1569年1月、義昭が拠点としていた本圀寺を三好三人衆が襲撃しますが、義昭には援軍が到来し、三好三人衆は撤退します。光秀は、幕府の中に三好と通じている者がいる、と推測します。信長は義昭の新たな居城の建築に取り掛かりますが、光秀は石仏が用いられていることに気づきます。信長は、子供の頃に仏像を粗末に扱い、母親に罰が当たると叱られたものの、何も起きなかった、と無邪気に言います。そんな信長に光秀は違和感を抱いていたようです。

 今回から摂津晴門が登場となります。晴門はいかにも守旧的な典型的悪役といった感じですが、これまでの作風からして、単純な悪役にはならず、晴門なりの主義主張も描かれるのではないか、と思います。今回は、今後の展開で重要となるやり取りも描かれました。松永久秀は筒井順慶を討つと意気込んでいましたが、義昭は順慶を赦免して優遇し、そのために久秀は義昭と対立します。また、久秀は光秀に、義昭に投降したり命乞いに来たりした者を見苦しいと言っており、これは久秀の最期とも関連しそうです。まあ久秀もこの後、一度は信長に投降して赦されていますが。石仏の件は、光秀が信長に対して明確な違和感を抱く契機になったという点で、たいへん注目されます。光秀は信長に重用されますが、最終的には本能寺の変に至ります。今回のような信長への違和感というか不安感の蓄積により、光秀は信長に叛いた、という流れになるのでしょうか。本作も後半に入り、そろそろ本能寺の変の原因も気になっていたところなので、今回の描写はとくに印象に残りました。