NBDC Research ID: hum0014.v33

 

研究内容の概要

目的: 日本人における疾患関連遺伝子の特定、日本人における転移因子挿入多型の網羅的探索

方法: Human610-Quad BeadChip、HumanHap550v3 Genotyping BeadChip、HumanOmniExpress-12 BeadChip、HumanExome BeadChip、 OmniExpressExome Beadchip(Illumina社)、high-density oligonucleotide arrays (Perlegen Sciences社)、もしくはインベーダー法(Hologic Japan社)により遺伝子型を決定し、心筋梗塞、2型糖尿病、アトピー性皮膚炎、心房細動、Body Mass Index(BMI)、開放隅角緑内障、58形質、初潮・閉経年齢、喫煙習慣、身長、42疾患(4疾患は以前のリリースと一部重複あり)、食習慣、および冠動脈疾患のゲノムワイド関連解析(Genome Wide Association Study:GWAS)や2型糖尿病腎症および2型糖尿病発症のGWASメタ解析を実施した。51疾患患者26.9万名のSNPアレイ解析を実施した。また、Illumina社 HiSeq 2500/X Fiveを用いて、BBJ第1コホート1,026+1,007名、心筋梗塞1,765症例、認知症199症例、胃がん256+2,067症例、大腸がん617症例、糖尿病2,162症例の全ゲノムシークエンス(Whole Genome Sequencing:WGS)を実施した。乳がん7,104症例と対照者23,731名における遺伝性乳がん原因11遺伝子翻訳領域、遺伝性前立腺がん7,636症例と対照者12,366名における遺伝性前立腺がん原因8遺伝子翻訳領域、バイオバンクジャパン11,234名における23遺伝子、膵がん1,005症例、大腸がん12,503症例および対照者23,705名、腎がん740症例および対照者5,996名、リンパ腫1,982症例、胃がん10,366症例および対照者37,592名の遺伝性腫瘍関連27遺伝子翻訳領域ならびに腎がん740症例および対照者5,996名の腎がん関連13遺伝子翻訳領域のTarget Capture Sequencingを実施した。遺伝性乳がん原因11遺伝子翻訳領域、遺伝性前立腺がん原因8遺伝子翻訳領域、バイオバンクジャパン11,234名における23遺伝子、遺伝性腫瘍関連27遺伝子翻訳領域および腎がん関連13遺伝子翻訳領域のTarget Capture Sequencingを実施した。バイオバンクジャパン1,037名のWGSデータから作成したvcfファイルと1000ゲノムプロジェクト(Phase3v5)2504名のvcfファイルを統合し、genotype imputation用reference panelを作成した。バイオバンクジャパン137,693名について、男女別にCox回帰分析を実施した。当研究室が開発したソフトウェアを用い、バイオバンクジャパンの第1コホート4,880名のWGSデータから転移因子多型の同定を行った。バイオバンクジャパンの心房細動ケース9,826人とコントロール140,446人で心房細動GWASを実施し、さらに欧米人の心房細動GWAS(http://csg.sph.umich.edu/willer/public/afib2018; 60,620人ケースと970,216人コントロール、FinnGen; https://www.finngen.fi/en; 7,244人ケースと56,378人コントロール)とメタ解析を行った。メタ解析の結果からポリジェニックリスクスコアを構築した。

対象: オーダーメイド医療実現化プロジェクトおよびオーダーメイド医療の実現プログラム参加者

URL: http://www.biobankjp.org/index.html

 

データID内容制限公開日
hum0014.v1.freq.v1

心筋梗塞1,666症例および

対照健常者3,198名のGWAS

非制限公開 2014/09/30
hum0014.v2.jsnp.934ctrl.v1

健常者934名の遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
35疾患

35疾患各約190症例における遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
hum0014.v2.jsnp.182ec.v1

食道がん182症例の遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
hum0014.v2.jsnp.92als.v1

筋萎縮性側索硬化症92症例の遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
hum0014.v3.T2DM-1.v1

2型糖尿病9,817症例および

対照者6,763名のGWAS

非制限公開 2016/01/28
hum0014.v3.T2DM-2.v1

2型糖尿病5,646症例および

対照者19,420名のGWAS

非制限公開 2016/01/28
hum0014.v4.AD.v1

アトピー性皮膚炎患者1,472症例および

対照者7,966名のGWAS

非制限公開 2016/02/02
hum0014.v5.AF.v1 心房細動患者8,180症例および対照者28,612名のGWAS 非制限公開 2017/05/18
JGAS000101 心房細動患者8,180症例のPhenotypeデータ、Genotypeデータ 制限公開(Type I) 2017/05/18
hum0014.v6.158k.v1 158,284名のBMIのGWAS 非制限公開 2017/09/08
JGAS000114

158,284名のBMIデータ

182,505名のGenotypeデータ

制限公開(Type I) 2017/09/08
hum0014.v7.POAG.v1

開放隅角緑内障3,980症例および

対照者18,815名のGWAS

非制限公開 2018/04/04
hum0014.v8.58qt.v1 162,255名の58臨床検査値のGWAS 非制限公開 2018/05/01
JGAS000114 162,255名の58臨床検査値のPhenotypeデータ 制限公開(Type I) 2018/05/01

hum0014.v9.Men.v1

hum0014.v9.MP.v1

初潮年齢データを有する女性67,029名および閉経年齢データを有する女性43,861名のGWAS 非制限公開 2018/08/07
JGAS000114 BBJ第1コホート1,026名のWGSデータ 制限公開(Type I) 2018/08/13
JGAS000140 乳がん7,104症例と対照者23,731名の遺伝性乳がん原因11遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2018/10/16
hum0014.v12.T2DMwN.v1

2型糖尿病腎症2,809症例および

2型糖尿病対照5,592症例のGWASメタ解析

非制限公開 2018/12/10
hum0014.v13.T2DMmeta.v1

2型糖尿病36,614症例および

対照者155,150名のGWASメタ解析

非制限公開 2019/01/25
hum0014.v14.smok.v1 日本人集団165,436名における喫煙習慣のGWAS 非制限公開 2019/03/26
JGAS000114 バイオバンクジャパン1,037名のWGSデータと1000ゲノムプロジェクト(Phase3v5)2504名のWGSのvcfファイルを統合したgenotype imputation用のreference panel 制限公開(Type I) 2019/09/27
hum0014.v15.ht.v1 159,095名の身長のGWAS 非制限公開 2019/09/27
JGAS000203 遺伝性前立腺がん7,636症例と対照者12,366名の遺伝性前立腺がん原因8遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2019/10/07
hum0014.v17 40疾患のGWAS 非制限公開 2019/10/08
hum0014.v18 乳がんのGWAS 非制限公開 2019/11/26
hum0014.v19 日本人集団165,084名における食習慣のGWAS 非制限公開 2020/04/20
hum0014.v20.cad.v1 冠動脈疾患のGWAS 非制限公開 2020/08/17
hum0014.v21 虚血性心疾患のGWAS 非制限公開 2020/08/25
JGAS000293 2003年から2007年度にバイオバンク・ジャパンに登録されたサンプル(約20万例)から抽出された11,234名の23遺伝子における全てのエクソン領域のTarget Capture Sequencingn解析より得られた体細胞変異データおよびSNPアレイにより得られた染色体変異データ 制限公開(Type I) 2021/05/21
JGAS000114 にデータ追加 JGAD000220のWGSデータのbam/gvcfデータ 制限公開(Type I) 2021/07/13
JGAS000327 膵がん1,005症例の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2021/11/26
JGAS000346 大腸がん12,503症例および対照者23,705名の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2021/11/26
JGAS000381 心筋梗塞1,765症例、認知症199症例のWGSデータ 制限公開(Type I) 2022/01/25
JGAS000414 腎がん740症例および対照者5,996名の遺伝性腫瘍関連27遺伝子および腎がん関連13遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2022/04/01
hum0014.v27.surv.v1 BBJ第1コホート137,693名の生存に関するGWAS 非制限公開 2022/12/31
hum0014.v28.MEs.v1 BBJ第1コホート4,880名のmobile element多型頻度情報 非制限公開 2023/04/05
hum0014.v29.AF.v1

心房細動患者9,826症例および対照者140,446名のGWAS(BBJ)

心房細動患者77,690症例および対照者1,167,040名のGWASメタ解析(BBJ、欧米人、FinnGen)

非制限公開 2023/04/05
JGAS000347 リンパ腫1,982症例の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2023/04/20
JGAS000592 胃がん10,366症例の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2023/04/20
JGAS000592 対照者37,592名(BBJの非がん対象者)の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2023/04/20
JGAD000690 JGAD000220(BBJ1,026名のWGS)の加工データ(CRAM、gVCF) 制限公開(Type I) 2023/09/01
JGAD000758 JGAD000220(BBJ1,026名のWGS)の加工データ(joint call)(aggregate VCF) 制限公開(Type I) 2023/09/01
JGAD000679 JGAD000220(reference panel)の加工データ(NBDC-DDBJ imputation server用データ) 制限公開(Type I) 2023/09/01
JGAS000647 BBJ第1コホート1,007名のWGSデータ 制限公開(Type I) 2024/01/11
JGAS000698 胃がん256症例のWGSデータ 制限公開(Type I) 2024/05/27
JGAS000703 BBJ第1コホートおよび第2コホート26.9万名のSNPアレイデータ 制限公開(Type I) 2024/05/27
JGAS000699 大腸がん617症例のWGSデータ 制限公開(Type I) 2024/05/27
JGAS000700 糖尿病2,162症例のWGSデータ(low-depth) 制限公開(Type I) 2024/05/27
JGAS000701 胃がん2,067症例のWGSデータ(low-depth) 制限公開(Type I) 2024/05/27

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら

 

分子データ

hum0014.v1.freq.v1

対象 心筋梗塞:1,666症例、対照健常者:3,198名
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [Human610-Quad BeadChip、HumanHap550v3 Genotyping BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina Human610-Quad Beadchip
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後) 455,781 SNPs (hg18/GRCh36)
NBDC Dataset ID

hum0014.v1.freq.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 71.3 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v2.jsnp.934ctrl.v1

対象 健常者:934名(JSNP)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanHap550v3 Genotyping BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina HumanHap550v3 Genotyping BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後) 515,286 SNPs
NBDC Dataset ID

hum0014.v2.jsnp.934ctrl.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 32.2 MB(zip [xls])
コメント(利用にあたっての制限事項) NBDC policy

 

35疾患(JSNP)

対象

悪性腫瘍 (肺がん、乳がん、胃がん、大腸・直腸がん、前立腺がん)

心血管系疾患 (心不全、心筋梗塞,不安定狭心症、安定狭心症、不整脈、閉塞性動脈硬化症)

脳血管障害 (脳梗塞、脳動脈瘤)

呼吸器疾患 (間質性肺炎&肺線維症、肺気腫、気管支喘息)

慢性肝疾患 (C型慢性肝炎、肝硬変)

眼疾患 (白内障、緑内障)

その他 (てんかん、歯周病、尿路結石、ネフローゼ症候群、子宮筋腫、子宮内膜症、

骨粗鬆症、関節リウマチ、筋萎縮性側索硬化症、花粉症、アトピー性皮膚炎、

過敏性症候群(薬疹)、高脂血症、糖尿病、バセドウ病)

各約190症例

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Perlegen Sciences [high-density oligonucleotide arrays]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) -
遺伝子型決定アルゴリズム(ソフトウェア) -
フィルタリング -
マーカー数(QC後) 約20万SNPs (b129)
データセット

悪性腫瘍 (肺がん乳がん胃がん大腸・直腸がん前立腺がん

心血管系疾患 (心不全心筋梗塞不安定狭心症安定狭心症不整脈閉塞性動脈硬化症

脳血管障害 (脳梗塞脳動脈瘤

呼吸器疾患 (間質性肺炎&肺線維症肺気腫気管支喘息

慢性肝疾患 (C型慢性肝炎肝硬変

眼疾患 (白内障緑内障

その他 (てんかん歯周病尿路結石ネフローゼ症候群子宮筋腫子宮内膜症

骨粗鬆症関節リウマチ筋萎縮性側索硬化症花粉症アトピー性皮膚炎

過敏性症候群(薬疹)高脂血症糖尿病バセドウ病

(データのダウンロードは上記疾患名をクリックしてください)

Dictionary file

コメント(利用にあたっての制限事項) NBDC policy

*各SNVの染色体上のポジションはdbSNP build 129に基づいています。他のbuildに基づいた位置情報を希望される場合はお問い合わせください。

 

hum0014.v2.jsnp.182ec.v1

対象 食道がん:182症例(JSNP)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanHap550v3 Genotyping BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina HumanHap550v3 Genotyping BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後) 503,734 SNPs
NBDC Dataset ID

hum0014.v2.jsnp.182ec.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 6.6 MB(zip [txt])
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v2.jsnp.92als.v1

対象 筋萎縮性側索硬化症:92症例(JSNP)
規模 large-scale case-control association study
対象領域(Target Captureの場合) -
Platform Hologic Japan [Invader]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Invader assay system(Third Wave Technologies)
遺伝子型決定アルゴリズム(ソフトウェア) ABI PRISM SDS versions 2.0 - 2.2
フィルタリング SNP call rate ≥ 0.95(疾患群、対照群), HWE P ≥1.0 x 10^-2(対照群)
マーカー数(QC後) 48,939 SNPs
NBDC Dataset ID

hum0014.v2.jsnp.92als.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 3.2 MB(zip [txt])
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v3.T2DM-1.v1

対象

2型糖尿病:9,817症例、

対照者:6,763名(健常者および糖尿病を合併していない脳動脈瘤、食道がん、子宮体がん、肺気腫、緑内障の患者)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [OmniExpressExome Beadchip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina OmniExpressExome Beadchip kit
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, MAF < 0.01 HWE P < 1 x 10^-6 in control
マーカー数(QC後) 552,915 SNPs (hg19)
NBDC Dataset ID

hum0014.v3.T2DM-1.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 84.0 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v3.T2DM-2.v1

対象

2型糖尿病:5,646症例、

対照者:19,420名 (糖尿病を合併していない大腸-直腸がん、乳がん、前立腺がん、肺がん、胃がん、

閉塞性動脈硬化症、不整脈、脳梗塞、心筋梗塞、胆嚢・胆管がん、膵がん、過敏性症候群(薬疹)、

関節リウマチ、筋萎縮性側索硬化症、肝がん、肝硬変、骨粗鬆症、子宮筋腫の患者)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [Human610-Quad BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina Human610-Quad Beadchip kit
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, MAF < 0.01 HWE P < 1 x 10^-6 in control
マーカー数(QC後) 479,088 SNPs (hg18)
NBDC Dataset ID

hum0014.v3.T2DM-2.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 72.6 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v4.AD.v1

対象

アトピー性皮膚炎:1,472症例、

対照者:7,966名(健常者およびアトピー性皮膚炎と気管支喘息のいずれも合併していない脳動脈瘤、食道がん、子宮体がん、肺気腫、緑内障の患者)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress-12 BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress-12 BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) minimac [imputation(1000 genomes Phase I v3 )]
関連解析(ソフトウェア) mach2dat [GWAS]
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, 対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01

                           GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

マーカー数(QC後) 約770万 SNVs(hg19)
NBDC Dataset ID

hum0014.v4.AD.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量

ADGWAS_auto.txt (525 MB)

ADGWAS_X_females.txt (17 MB)

ADGWAS_X_males.txt (15 MB)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000101 / hum0014.v5.AF.v1

対象

心房細動:8,180症例

対照者:28,612名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2dat [GWAS]
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, 対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01

                           GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

                              R square < 0.9

マーカー数(QC後) 約500万 SNVs(hg19)
Phenotype情報 性別、年齢

NBDC Dataset ID /

Japanese Genotype-phenotype

Archive Dataset ID

【GWAS集計情報】

hum0014.v5.AF.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

【個別データ(心房細動群のみ

Phenotype:JGAD000101

Genotype:JGAD000102

総データ量

GWAS:485 MB(txt)

Phenotype、Genotype:1 GB(txt)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 / hum0014.v6.158k.v1

対象 182,505名(内、BMI研究で使用した対象数:158,284名)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2qtl (v1.1.3)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 を除外。

マーカー数(QC後)

常染色体:約600万 SNVs (hg19)

X染色体:約15万 SNVs (hg19)

NBDC Dataset ID /

Japanese Genotype-phenotype

Archive Dataset ID

【GWAS】

hum0014.v6.158k.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

【個別データ】

Phenotypeデータ(BMI):JGAD000124

Genotypeデータ:JGAD000123

遺伝型情報に関する詳細

アレイプローブの取り扱いに関する情報

総データ量

GWAS:406 MB(zip)

Phenotypeデータ(BMI):3.32 MB(txt.gz)

Genotypeデータ:26.3 GB(csv.gz)

コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v7.POAG.v1

対象

開放隅角緑内障(ICD10:H401):3,980症例(男性:1,997、女性:1,983)

対照者:18,815名(男性:7,817、女性:10,998)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア) minimac(ver. 0.1.1)[imputation(1000 genomes Phase I v3 )]
関連解析(ソフトウェア) mach2dat(ver. 1.0.19)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.5%,

          対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01  

        GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

Imputation後のQC:Imputation quality (Rsq) < 0.7を除外。

         さらに、ベータが4未満もしくは4を超えるものは公開用に除外。

マーカー数(QC後)

常染色体:5,961,428 SNPs(hg19)

男性X染色体:147,351 SNPs(hg19)

女性X染色体:147,353 SNPs(hg19)

NBDC Dataset ID

hum0014.v7.POAG-1.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 113 MB(txt.zip)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 / hum0014.v8.58qt.v1

対象 162,255名の58臨床検査値
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2qtl(v1.1.3)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 を除外。

マーカー数(QC後)

常染色体:5,961,600 SNVs(hg19)

X染色体:147,353 SNVs(hg19)

NBDC Dataset ID /

Japanese Genotype-phenotype

Archive Dataset ID

血糖・脂質関連 総コレステロール JGAD000144
HDLコレステロール JGAD000145
LDLコレステロール JGAD000146
中性脂肪 JGAD000147
血糖 JGAD000148
ヘモグロビンA1c JGAD000149
血清蛋白質 総蛋白 JGAD000150
アルブミン JGAD000151
非アルブミン蛋白 JGAD000152
アルブミン/グロブリン比 JGAD000153
腎機能 尿素窒素 JGAD000154
血清クレアチニン JGAD000155
推算糸球体濾過量 JGAD000156
尿酸 JGAD000157
電解質 ナトリウム JGAD000158
カリウム JGAD000159
クロール JGAD000160
カルシウム JGAD000161
無機リン JGAD000162
肝機能 総ビリルビン JGAD000163
硫酸亜鉛混濁試験 JGAD000164
アスパラギン酸アミノ基転移酵素 JGAD000165
アラニンアミノ基転移酵素 JGAD000166
アルカリフォスファターゼ JGAD000167
ガンマグルタミルトランスフェラーゼ JGAD000168
その他の検査値 活性化部分トロンボプラスチン時間 JGAD000169
プロトロンビン時間 JGAD000170
フィブリノーゲン JGAD000171
クレアチンキナーゼ JGAD000172
乳酸脱水素酵素 JGAD000173
C反応性蛋白 JGAD000174
血球数 白血球数 JGAD000175
好中球数 JGAD000176
好酸球数 JGAD000177
好塩基球数 JGAD000178
単球数 JGAD000179
リンパ球数 JGAD000180
赤血球数 JGAD000181
ヘモグロビン濃度 JGAD000182
ヘマトクリット値 JGAD000183
平均赤血球容積 JGAD000184
平均赤血球ヘモグロビン量 JGAD000185
平均赤血球ヘモグロビン濃度 JGAD000186
血小板数 JGAD000187
血圧 収縮期血圧 JGAD000188
拡張期血圧 JGAD000189
平均血圧 JGAD000190
脈圧 JGAD000191
心エコー 心室中隔壁厚 JGAD000192
後壁厚 JGAD000193
左室拡張末期径 JGAD000194
左室収縮末期径 JGAD000195
左室心筋重量 JGAD000196
左室心筋重量係数 JGAD000197
相対的壁厚 JGAD000198
左室内径短縮率 JGAD000199
左室駆出率 JGAD000200
E/A比 JGAD000201

(GWAS統計情報のダウンロードは上記形質名をクリックしてください)

Dictionary file

総データ量

GWAS:平均 123 MB(zip)

Phenotypeデータ(58形質):平均 2.4 MB(txt.gz)

コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v9.Men.v1 / hum0014.v9.MP.v1

対象

初潮年齢データを有する女性67,029名

閉経年齢データを有する女性43,861名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2qtl (v1.1.3)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.5%,

          対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01  

        GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

Imputation後のQC:Imputation quality (Rsq) < 0.7を除外。

         さらに、ベータが4未満もしくは4を超えるものは公開用に除外。

マーカー数(QC後) 9,296,729 SNPs (hg19)
NBDC Dataset ID

初潮:hum0014.v9.Men.v1

閉経:hum0014.v9.MP.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

初潮:Dictionary file

閉経:Dictionary file

総データ量

初潮:181 MB(txt.gz)

閉経:186 MB(txt.gz)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 (JGAD000220 / JGAD000410 / JGAD000690 / JGAD000758)

対象 2003年から2007年度にバイオバンク・ジャパンに登録された47疾患患者:1,026名
規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq Nano DNA Library Preparation Kit
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 160 bp
クオリティコントロール方法

リードのbase qualityが全体的に悪い検体、リード毎の%GCの結果にて異常を示した検体を除去。

Alignment後、Low mapping rate検体、Insert sizeがおかしい検体、メタデータの性別情報とalingment結果より推定される性別情報が不一致な検体、性染色体異常疑いの検体を除去。

Genotyping時に、VQSR、DP/GP filter (DP < 5, GQ < 20, DP > 60 && GQ < 95を除去)、heterozygosity filter (F>=0.05 を除去)、HWE filter (p < 10-6を除去)、Repeat & Low Complexity filterを実施。

1000 genomes projectと合わせたPCAを実施し、日本人クラスタから大きく外れる検体を除外。

その後、Genome-In-A-Bottleプロジェクトから公開されているHighConfidenceRegionリストに記載のある領域のバリアントにフラグを付与。

重複するリードの除去 Picard 2.10.6
リアライメントおよびベースクオリティのキャリブレーション GATK 3.7
マッピング方法 BWA mem 0.7.12
マッピングクオリティ GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列 GRCh37/hg19(hs37d5)
平均カバー率(Depth) 31.8x
変異検出方法 GATK 3.7 HaplotypeCaller
SNV数(QC後)

76,768,387(常染色体)

2,898,518(X 染色体)

INDEL数(QC後)

10,202,908(常染色体)

410,435(X 染色体)

Japanese Genotype-phenotype Archive Dataset ID

JGAD000220(fastq)

JGAD000410(bam、vcf):GEnome Medical alliance Japan(GEM Japan, GEM-J)の取り組みとして、GATK Best Practicesに準拠した方法により、GRCh37の参照ゲノム配列へのマッピングおよびバリアント検知を実施した際のデータです。詳しくはこちらをご覧ください。

NBDCおよび生命情報・DDBJ センターによる加工データのID

JGAD000690

JGAD000758(joint call)

加工方法はこちら

総データ量

JGAD000220:73 TB(fastq)

JGAD000410:49 TB(bam、vcf)

JGAD000690:52.1 TB(bam、bai、vcf、document)

JGAD000758:203.8 GB(vcf_aggregate、tabix)

コメント(利用にあたっての制限事項) NBDC policy

日本人集団ゲノム関連解析情報データベース「Jenger」にて、当該データの概要データ(アリル頻度情報)をダウンロードできます。

 

JGAS000140

対象

乳がん(ICD10:C509):7,104症例

対照者:23,731名

規模 Target Capture
対象領域(Target Captureの場合) 遺伝性乳がんの原因11遺伝子(ATM, BRCA1, BRCA2, CDH1, CHEK2, NBN, NF1, PALB2, PTEN, STK11, TP53)の翻訳領域
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) 2X Platinum Multiplex PCR Master Mix (Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 *1
断片化の方法 -
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp x 2
Japanese Genotype-phenotype Archive Dataset ID JGAD000209
総データ量 1 TB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

※1 Hum Mol Genet. 25,:5027-5034 (2016)

 

hum0014.v12.T2DMwN.v1

対象

[GWAS-1]

  2型糖尿病腎症:2,380症例、2型糖尿病対照(腎症非発症群):5,234症例

[GWAS-2]

  2型糖尿病腎症:429症例、2型糖尿病対照(腎症非発症群):358症例

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [OmniExpressExome Beadchip、Human610-Quad BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン)

Illumina OmniExpressExome Beadchip kit 

Illumina Human610-Quad Beadchip kit

遺伝子型決定アルゴリズム(ソフトウェア)

MACH and Minimac(1000 Genomes phased JPT, CHB and Han Chinese South data n = 275, March 2012)

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2dat
フィルタリング

sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.1%,

対照者群で HWE P < 1 x 10-6

マーカー数(QC後) 7,521,072 SNPs(hg19)
NBDC Dataset ID

hum0014.v12.T2DMwN.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 310 MB(csv.zip)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v13.T2DMmeta.v1

対象

[GWAS-1]

  2型糖尿病(ICD-10:E11):9,804症例、対照者:6,728名

[GWAS-2]

  2型糖尿病(ICD-10:E11):5,639症例、対照者:19,407名

[GWAS-3]

  2型糖尿病(ICD-10:E11):18,688症例、対照者:121,950名

[GWAS-4]

  2型糖尿病(ICD-10:E11):2,483症例、対照者:7,065名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome、Human610-Quad BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome、Human610-Quad Beadchip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase 3)]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2dat (v1.0.24)
フィルタリング

GenotypingのQC:

GWAS1, GWAS3, GWAS4除外基準

(i) hetero count < 5

(ii) 各chipでHWE P < 1.0 × 10^-6

(iii) in-house WGSデータとのジェノタイプ一致率 < 0.99

(iv) SNV call rate < 0.99

 

GWAS2除外基準

(i) SNV call rate < 0.99

(ii) MAF < 0.01

(iii) differential missingness P < 1.0 × 10^-6

(iv) HWE P < 1.0 × 10^-6

 

ImputationのQC:

リファレンスパネルで HWE P < 1 × 10^-6 もしくは MAF < 0.01を除外

3つ以上のGWASでImputation quality (Rsq) < 0.3となったものを除外

マーカー数(QC後) 12,557,761 SNPs(hg19)
NBDC Dataset ID

hum0014.v13.T2DMmeta.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 257 MB(txt)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v14.smok.v1

対象 165,436名の喫煙習慣データ
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア)

BOLT-LMM(v2.2)

ProbABEL(v0.4.5; for X chromosome)

フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 and MAF < 0.01を除外

マーカー数(QC後)

常染色体:5,961,480 SNVs(hg19)

男性X染色体(喫煙開始年齢):163,412 SNVs(hg19)

女性X染色体(喫煙開始年齢):146,130 SNVs(hg19)

男性X染色体(喫煙本数):166,111 SNVs(hg19)

女性X染色体(喫煙本数):146,114 SNVs(hg19)

男性X染色体(喫煙歴):166,138 SNVs(hg19)

女性X染色体(喫煙歴):146,146 SNVs(hg19)

男性X染色体(禁煙歴の有無):166,142 SNVs(hg19)

女性X染色体(禁煙歴の有無):146,118 SNVs(hg19)

NBDC Dataset ID

hum0014.v14.asi.v1(喫煙開始年齢)

hum0014.v14.cpd.v1(喫煙本数)

hum0014.v14.ens.v1(喫煙歴)

hum0014.v14.fcs.v1(禁煙歴の有無)

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 1.9 GB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 reference panel

対象

・1,026名のWGSデータ(JGAD000220)を含むバイオバンクジャパン1,037名のWGSデータのvcfファイル(WGSデータの分子データは上記参照のこと)

・1000ゲノムプロジェクト(Phase3v5)2,504名のWGSのvcfファイル(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/

規模 WGS解析により検出された変異情報の統合(常染色体およびX染色体上のvariants)
対象領域(Target Captureの場合) -
クオリティコントロール方法

We set exclusion criteria for genotypes as follows:

(1) DP < 5, (2) GQ < 20, or (3) DP > 60 and GQ < 95, and regarded these genotypes as missing.

Variants with call rates < 90% were excluded before variant quality score recalibration (VQSR).

After VQSR, we excluded variants located in low-complexity regions (LCR), as defined by mdust software were excluded.

Finally, we used BEAGLE to impute missing genotypes.

重複するリードの除去 picard (versions 1.106)
リアライメントおよびベースクオリティのキャリブレーション GATK (version 3.2-2)
マッピング方法 BWA-MEM (version 0.7.5a)
マッピングクオリティ MAPQ < 20 を除外(HaplotypeCaller)
マッピングの際のリファレンス配列 GRCh37/hg19, hs37d5
平均カバー率(Depth) aimed at 30x depth
変異検出方法 GATK HaplotypeCaller (version 3.2-2)
vcfファイルの統合方法

常染色体:Impute2

X染色体:Beagle(男性)、Impute2(女性)

リファレンスパネルに含まれるvariant数 61,608,817 variants(常染色体:59,387,070variants、X染色体:2,221,747variants)
Japanese Genotype-phenotype Archive Dataset ID JGAD000220
NBDCおよび生命情報・DDBJ センターによる加工データのID

JGAD000679

加工方法はこちら

総データ量 約15 GB(vcf.gz)
コメント(利用にあたっての制限事項) NBDC policy

バイオバンクジャパン1037名のデータに対して実施。

 

hum0014.v15.ht.v1

対象

バイオバンクジャパンに参加した159,095名

(男性:86,257名、女性:72,838名)

規模 genome wide variants
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア) Minimac3 [imputation reference panel using WGS data of the biobank Japan project (N=1,037) and 1KGP p3v5 ALL (N=2,504)]
関連解析(ソフトウェア) BOLT-LMM (ver2.2)、mach2qtl
フィルタリング

Sample QCs:1) call rate < 98%、2) closely related samples (PI_HAT > 0.175)、3) outlier from Japanese cluster determined by PCA using GCTA を除外。

Imputation後のQC:Imputation quality (Rsq) < 0.3 を除外。

マーカー数(QC後)

常染色体:27,211,524 variants(hg19)

男性X染色体:684,533 variants(hg19)

女性X染色体:684,533 variants(hg19)

NBDC Dataset ID

hum0014.v15.ht.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 約663 MB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000203

対象

遺伝性前立腺がん(ICD10:C61):7,636症例

対照者:12,366名

規模 Target Capture
対象領域(Target Captureの場合) 遺伝性前立腺がんの原因8遺伝子(ATM, BRCA1, BRCA2, BRIP1, CHEK2, HOXB13, NBN, PALB2)の翻訳領域
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) 2X Platinum Multiplex PCR Master Mix (Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 *1
断片化の方法 -
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp x 2
Japanese Genotype-phenotype Archive Dataset ID JGAD000288
総データ量 2.2 TB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v17 / hum0014.v18 / hum0014.v21

対象

42疾患(ICD10 code)

不整脈(I499)、気管支喘息(J459)、アトピー性皮膚炎(L209)、

胆嚢・胆管がん(C23, C240)、白内障(H269)、

脳動脈瘤(I671)、子宮頸がん(C539)、B型慢性肝炎(B181)、

C型慢性肝炎(B182)、COPD(J449)、肝硬変(K746)、

大腸・直腸がん(C189, C20)、心不全(I509, I500)、薬疹(L270)、

子宮体がん(C549)、子宮内膜症(N809)、てんかん(G409)、

食道がん(C159)、胃がん(C169)、緑内障(H409)、バセドウ病(E050)、

造血器腫瘍(C81-96)、肝がん(C220)、肺線維症(J849, J841)、

脳梗塞(I639)、ケロイド(L910)、肺がん(C349)、

ネフローゼ症候群(N049)、骨粗鬆症(M8199)、卵巣がん(C56)、

膵がん(C259)、歯周病(K054)、ASO(I709)、花粉症(J301)、

前立腺がん(C61)、肺結核(A169)、関節リウマチ(M0690)、

糖尿病(E14)、尿路結石症(N209)、子宮筋腫(D259)、乳がん(C509)

虚血性心疾患(I200、I209、I219)

規模 genome wide variants
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac3 [imputation(1000 genomes Phase 3 v5 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) SAIGE(v0.29.4.2)
フィルタリング

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 を除外

マーカー数(QC後)

常染色体:8,712,794 variants(hg19)

X染色体:207,198 variants(hg19)

NBDC Dataset ID 不整脈 hum0014.v17.AR.v1
気管支喘息 hum0014.v17.BA.v1
アトピー性皮膚炎 hum0014.v17.AD.v1
胆嚢・胆管がん hum0014.v17.GCc.v1
白内障 hum0014.v17.Cat.v1
脳動脈瘤 hum0014.v17.CA.v1
子宮頸がん hum0014.v17.CeC.v1
B型慢性肝炎 hum0014.v17.CHB.v1
C型慢性肝炎 hum0014.v17.CHC.v1
COPD hum0014.v17.COPD.v1
肝硬変 hum0014.v17.Cir.v1
大腸・直腸がん hum0014.v17.CC.v1
心不全 hum0014.v17.HF.v1
薬疹 hum0014.v17.DE.v1
子宮体がん hum0014.v17.UC.v1
子宮内膜症 hum0014.v17.EM.v1
てんかん hum0014.v17.Ep.v1
食道がん hum0014.v17.EC.v1
胃がん hum0014.v17.GC.v1
緑内障 hum0014.v17.Gla.v1
バセドウ病 hum0014.v17.GD.v1
造血器腫瘍 hum0014.v17.HT.v1
肝がん hum0014.v17.LiC.v1
肺線維症 hum0014.v17.IP.v1
脳梗塞 hum0014.v17.CI.v1
ケロイド hum0014.v17.Kel.v1
肺がん hum0014.v17.LuC.v1
ネフローゼ症候群 hum0014.v17.NS.v1
骨粗鬆症 hum0014.v17.OP.v1
卵巣がん hum0014.v17.OC.v1
膵がん hum0014.v17.PaC.v1
歯周病 hum0014.v17.PD.v1
ASO hum0014.v17.PAD.v1
花粉症 hum0014.v17.Hay.v1
前立腺がん hum0014.v17.PrC.v1
肺結核 hum0014.v17.PT.v1
関節リウマチ hum0014.v17.RA.v1
糖尿病 hum0014.v17.DM.v1
尿路結石症 hum0014.v17.Uro.v1
子宮筋腫 hum0014.v17.UF.v1
乳がん hum0014.v18.BC.v1
虚血性心疾患 hum0014.v21.CAD.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

Sample size file

総データ量

常染色体:0.9-1.3 GB程度(txt)

X染色体:20-30 MB程度(txt)

コメント(利用にあたっての制限事項) NBDC policy

緑内障(hum0014.v7.POAG.v1)、心房細動(hum0014.v5.AF.v1)、アトピー性皮膚炎患(hum0014.v4.AD.v1)、2型糖尿病(hum0014.v3.T2DM-2.v1)と一部重複あり。

 

hum0014.v19

対象 165,084名の食習慣(13項目)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

GenCall software(GenomeStudio)

MACH

minimac (v.0.1.1) [imputation(1000 genomes Phase I v3 )]

関連解析(ソフトウェア)

BOLT-LMM(v2.2)for autosomes

ProbABEL(v0.4.5)for X chromosome

フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.005

Imputation referenceのQC:

 HWE P < 1 x 10^-6、MAF < 0.01に該当するSNVを除外

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 and MAF < 0.01を除外

マーカー数(QC後)

常染色体:5,961,480 variants(hg19)

X染色体:148,568 variants for female、170,117 variants for male(hg19)

NBDC Dataset ID 飲酒歴の有無 hum0014.v19.drink.v1
1週間あたりの飲酒量 hum0014.v19.dpw.v1
コーヒー摂取頻度 hum0014.v19.cafe.v1
緑茶摂取頻度 hum0014.v19.tea.v1
牛乳摂取頻度 hum0014.v19.milk.v1
ヨーグルト摂取頻度 hum0014.v19.ygt.v1
チーズ摂取頻度 hum0014.v19.cheese.v1
納豆摂取頻度 hum0014.v19.natto.v1
豆腐摂取頻度 hum0014.v19.tofu.v1
魚摂取頻度 hum0014.v19.fish.v1
小魚摂取頻度 hum0014.v19.sfish.v1
野菜摂取頻度 hum0014.v19.vege.v1
肉摂取頻度 hum0014.v19.meat.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 各形質:約420 MB(txt.zip)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v20.cad.v1

対象

冠動脈疾患(ICD10:I20-25):25,892症例

対象者:142,336名

規模 genome wide variants
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

GenCall software(GenomeStudio)

minimac3(BBJ-CAD reference panel)

関連解析(ソフトウェア) PLINK2
フィルタリング Imputation後のQC: Imputation quality (Rsq) < 0.3 または MAF < 0.0002 を除外
マーカー数(QC後) 常染色体:19,707,525 variants(hg19)
NBDC Dataset ID

hum0014.v20.gwas.v1(統計解析データ)

hum0014.v20.prs.v1(ポリジェニックリスクスコア)

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 約413 MB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000293(Target Capture)

対象 2003年から2007年度にバイオバンク・ジャパンに登録されたサンプル(約20万例)から抽出された11,234名
規模 Target Capture
対象領域(Target Captureの場合)

下記の23遺伝子における全てのエクソン領域

ASXL1, CBL, CEBPA, DDX41, DNMT3A, ETV6, EZH2, GATA2, GNAS, GNB1, IDH1, IDH2, JAK2, KRAS, MYD88, NRAS, PPM1D, RUNX1, SF3B1, SRSF2, TET2, TP53, U2AF1

Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名)

ライブラリ作成は下記の論文に記載された方法で実施した。

Momozawa, Y., et al. Low-frequency coding variants in CETP and CFB are associated with susceptibility of exudative age-related macular degeneration in the Japanese population. Hum Mol Genet 25, 5027-5034 (2016).

断片化の方法 -
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp
クオリティコントロール方法 Depth 20以上の領域が98%以上のサンプルを解析対象とした。
マッピング方法 bwa
マッピングクオリティ ≥40
マッピングの際のリファレンス配列 hg19
平均カバー率 x800
変異検出方法 Genomon pipeline
フィルタリング方法 Genomon pipeline
Japanese Genotype-phenotype Archive Dataset ID JGAD000399
総データ量 5.3 MB(txt)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000293(SNPアレイ)

対象 2003年から2007年度にバイオバンク・ジャパンに登録されたサンプル(約20万例)から抽出された11,234名
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、OmniExpressExome]
ライブラリソース 末梢血から抽出したDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina Infinium OmniExpress, Infinium OmniExpressExome v.1.0, or v.1.2
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
染色体変異検出アルゴリズム(ソフトウェア)

ハプロタイプ情報に基づくアリル不均衡の検出法(下記の論文を参照)

Terao, C., et al. Chromosomal alterations among age-related haematopoietic clones in Japan. Nature (2020).

フィルタリング 上記の3バージョンのアレイの全てでカバーされているSNPsを使用した
マーカー数(QC後) 515,355
Japanese Genotype-phenotype Archive Dataset ID JGAD000400
総データ量 5.3 MB(csv)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000327 / JGAS000346 / JGAS000414 / JGAS000347 / JGAS000592

対象

膵がん(ICD10:C25):1,005症例

大腸がん(ICD10:C18、C19、C20):12,503症例

腎がん(ICD10:C64):740症例

リンパ腫(ICD10:C81、C82、C83、C84、C85、C86、C88、C91):1,982症例

胃がん(ICD10:C16):10,366症例

対照者:23,705名+5,996名+37,592名

規模 Target Capture
対象領域(Target Captureの場合) 遺伝性腫瘍関連27遺伝子(APC, ATM, BARD1, BMPR1A, BRCA1, BRCA2, BRIP1, CDK4, CDKN2A, CDH1, CHEK2, EPCAM, HOXB13, NBN, NF1, MLH1, MSH2, MSH6, MUTYH, PALB2, PMS2, PTEN, RAD51C, RAD51D, SMAD4, STK11, TP53)の翻訳領域
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) 2X Platinum Multiplex PCR Master Mix(Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 *1
断片化の方法 -
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp x 2
Japanese Genotype-phenotype Archive Dataset ID

膵がん:JGAD000438

大腸がん:JGAD000458

23,705名の対照者:JGAD000459

腎がんと5,996名の対照者:JGAD000531

リンパ腫:JGAD000460

胃がん:JGAD000720

37,592名の対照者:JGAD000721

総データ量

JGAD000438:78 GB(fastq)

JGAD000458:956 GB(fastq)

JGAD000459:1.9 TB(fastq)

JGAD000531:961.8 GB(fastq)

JGAD000460:126 GB(fastq)

JGAD000720、JGAD000721:3.4 TB(fastq)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000414

対象

腎がん(ICD10:C64):740症例

対照者:5,996名

規模 Target Capture
対象領域(Target Captureの場合) 腎がん関連13遺伝子(VHL、 BAP1、FH、FLCN、MET、TSC1、TSC2、MITF、SDHA、SDHB、SDHC、SDHD、CDC73)の翻訳領域
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) 2X Platinum Multiplex PCR Master Mix (Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 *1
断片化の方法 -
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp x 2
Japanese Genotype-phenotype Archive Dataset ID

JGAD000531

総データ量

961.8 GB(fastq)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000381

対象

2003年から2017年度にバイオバンク・ジャパンに登録された症例:1,964名

    心筋梗塞(ICD10:I21):1,765症例

    認知症(ICD10:F00-03):199症例

規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq X Five]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq DNA PCR-Free Prep kit
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 151 bp
クオリティコントロール方法

リードのbase qualityが全体的に悪い検体、リード毎の%GCの結果にて異常を示した検体を除去。

Alignment後、Low mapping rate検体、Insert sizeがおかしい検体、メタデータの性別情報とalingment結果より推定される性別情報が不一致な検体、性染色体異常疑いの検体を除去。

Genotyping時に、VQSR、DP/GP filter (DP < 5, GQ < 20, DP > 60 && GQ < 95を除去)、heterozygosity filter (F>=0.05 を除去)、HWE filter (p < 10-6を除去)、Repeat & Low Complexity filterを実施。

1000 genomes projectと合わせたPCAを実施し、日本人クラスタから大きく外れる検体を除外。

その後、Genome-In-A-Bottleプロジェクトから公開されているHighConfidenceRegionリストに記載のある領域のバリアントにフラグを付与。

重複するリードの除去 Picard 2.10.6
リアライメントおよびベースクオリティのキャリブレーション GATK 3.7
マッピング方法 BWA mem 0.7.12
マッピングクオリティ GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列 GRCh37/hg19(hs37d5)
平均カバー率(Depth) 心筋梗塞:15.0x、認知症:30.0x
変異検出方法 GATK 3.7 HaplotypeCaller
SNV数(QC後)

76,768,387(常染色体)

2,898,518(X 染色体)

INDEL数(QC後)

10,202,908(常染色体)

410,435(X 染色体)

Japanese Genotype-phenotype Archive Dataset ID

JGAD000495(fastq)

JGAD000496(bam、vcf):GEnome Medical alliance Japan(GEM Japan, GEM-J)の取り組みとして、GATK Best Practicesに準拠した方法により、GRCh37の参照ゲノム配列へのマッピングおよびバリアント検知を実施した際のデータです。詳しくはこちらをご覧ください。

総データ量 188.4 TB(fastq、bam、vcf)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v27.surv.v1

対象 BBJ第1コホート:137,693名
規模 genome wide variants
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア)

mach2qtl(v1.1.3)

SPACox

フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 を除外。

マーカー数(QC後) 6,108,833 variants(hg19)
NBDC Dataset ID

hum0014.v27.surv.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 789 MB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v28.MEs.v1

対象

BBJ第1コホート4880名のWGSデータ(下記データを含む)

    ・1,026名のWGSデータ(JGAD000220

    ・心筋梗塞症例1,765名および認知症症例199名のWGSデータ(JGAD000495

    ・胃がん症例255名のWGSデータ(AGDD_000005

    ・アジアゲノムプロジェクトの1007名

    ・大腸・直腸がん症例の617名

    ・AGDD_000005のQCで除かれた1名

    ・JGAD000220のQCで除かれた10名

規模 mobile element多型頻度情報
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq X/2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq DNA PCR-Free Sample Prep Kit、TruSeq Nano DNA HT Sample Prep Kit
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 151 bp(HiSeq X)、126 bp(HiSeq 2500)
クオリティコントロール方法 -
マッピング方法 BWA-MEM
マッピングクオリティ -
マッピングの際のリファレンス配列 GRCh37(hs37d5)
平均カバー率(Depth) 15×以上(内、1235名:25×以上)
mobile element検出方法 MEGAnE *2
mobile element数

24,933(4880名)

10,997(1235名)

NBDC Dataset ID

hum0014.v28.MEs.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 1.1 MB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

※2 doi: 10.1101/2022.03.25.485726

 

hum0014.v29.AF.v1

対象

心房細動(ICD10:I48):77,690症例、対照者:1,167,040名

    BBJ:心房細動:9,826症例、対照者:140,446名

    欧米人:心房細動:60,620症例、対照者:970,216名

    FinnGen:心房細動:7,244症例、対照者:56,378名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース

末梢血から抽出したgDNA

欧米GWAS:http://csg.sph.umich.edu/willer/public/afib2018

FinnGen GWAS:https://www.finngen.fi/en

検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

GenCall software(GenomeStudio)

minimac [imputation(1000 genomes Phase I v3 )]

関連解析(ソフトウェア) PLINK2
フィルタリング

BBJ GWAS:imputation quality(Rsq) < 0.3 または MAF < 0.001 を除外

メタ解析GWAS:MAF < 1% を除外

ポリジェニックリスクスコア算出方法 Pruning and thresholding method
メタ解析方法 MANTRA、METAL
マーカー数(QC後)

BBJ GWAS:16,817,144 SNPs

メタ解析GWAS:5,158,449 SNPs

NBDC Dataset ID

hum0014.v29.AF.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量

BBJのGWAS集計情報:424 MB(txt)

メタ解析のGWAS集計情報:78 MB(txt)

ポリジェニックリスクスコア:59 KB(txt)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000647

対象 2003年から2007年度にバイオバンク・ジャパンに登録された47疾患患者:1,007名
規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq Nano DNA Library Preparation Kit
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp
クオリティコントロール方法

・常染色体,X PAR,X NonPAR 女性

    DP < 2 または GQ < 20 の genotype を missing に設定,call rate < 90% を除外

・X NonPAR 男性,Y

    DP < 1 または GQ < 20 の genotype を missing に設定,call rate < 90% を除外

・X NomPAR

    女性の HWE_P

重複するリードの除去 Picard 2.10.10
リアライメントおよびベースクオリティのキャリブレーション GATK 3.8
マッピング方法 BWA-MEM(version 0.7.13)
マッピングクオリティ GATK 3.8 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列 hs37d5
平均カバー率(Depth) 19.93455
変異検出方法 GATK Haplotype Caller(version 3.8)
SNV数(QC後)

常染色体:71,643,487

X PAR:82,997

X nonPAR:2,618,495

Y染色体:171,271

※ AC=0を含むレコード数

Japanese Genotype-phenotype Archive Dataset ID

JGAD000777

総データ量 41.6 TB(fastq、 vcf)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000698

対象 バイオバンク・ジャパン第1コホートに含まれる胃がん(ICD10:C16):256症例
規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq Nano DNA Library Preparation Kit
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 2 × 125 bp
Japanese Genotype-phenotype Archive Dataset ID JGAD000831
総データ量 21.5 TB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000703

対象 バイオバンク・ジャパン第1コホートおよび第2コホートに含まれる51疾患いずれかの患者:26.9万名(重複を含む)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanHap550、Human610-Quad v1、HumanExome-12 v1、Infinium OmniExpress-24、Infinium HumanOmniExpressExome-8、Infinium HumanOmniExpressExome-8 v1.2、Infinium HumanOmniExpressExome-8 v1.3、Infinium HumanOmniExpressExome-8 v1.4、Infinium HumanOmniExpressExome-8 v1.6]
ライブラリソース 末梢血から抽出したDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanHap550 kit、Human610-Quad kit v1、HumanExome-12 kit v1、Infinium OmniExpress-24 kit、Infinium HumanOmniExpressExome-8 kit、Infinium HumanOmniExpressExome-8 kit v1.2、Infinium HumanOmniExpressExome-8 kit v1.3、Infinium HumanOmniExpressExome-8 kit v1.4、Infinium HumanOmniExpressExome-8 kit v1.6
遺伝子型決定アルゴリズム(ソフトウェア) -
フィルタリング -
マーカー数(QC後) -
Japanese Genotype-phenotype Archive Dataset ID JGAD000836
総データ量 3.1 TB(idat)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000699

対象 バイオバンク・ジャパン第1コホートおよび第2コホートに含まれる大腸がん(ICD10:C18、C19、C20):617症例
規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq Nano DNA Library Preparation Kit
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 2 × 125 bp
Japanese Genotype-phenotype Archive Dataset ID JGAD000832
総データ量 25.5 TB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000700 / JGAS000701

対象

バイオバンク・ジャパン第1コホートに含まれる糖尿病(ICD10:E11):2,162症例

バイオバンク・ジャパン第1コホートに含まれる胃がん(ICD10:C16):2,067症例

規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq Nano DNA Library Preparation Kit
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 2 × 125 bp
Japanese Genotype-phenotype Archive Dataset ID

糖尿病:JGAD000833

胃がん:JGAD000834

総データ量

JGAD000833:20.0 TB(fastq)

JGAD000834:18.7 TB(fastq)

コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 久保 充明

所 属 機 関: 理化学研究所 統合生命医科学研究センター 疾患多様性医科学研究部門

プロジェクト/研究グループ名: オーダーメイド医療の実現プログラム

URL: http://www.biobankjp.org/index.html

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
文部科学省 科学技術試験研究委託事業費 オーダーメイド医療の実現プログラム(第3期) -
日本医療研究開発機構(AMED) オーダーメイド医療の実現プログラム 疾患関連遺伝子等の探索を効率化するための遺伝子多型情報の高度化 JP17km0305002
日本医療研究開発機構(AMED) 次世代がん医療創生研究事業(P-CREATE) 大規模シーケンス解析に基づく、造血器腫瘍のゲノム、エピゲノムにおける、空間的・時間的多様性の研究 JP19cm010650
日本医療研究開発機構 革新的先端研究開発支援事業(AMED-CREST) 加齢や炎症に伴う組織の再構築と機能低下 JP19gm1110011
科学研究費助成事業 基盤研究(S) 先端ゲノミクスを駆使したがんの初期発生とクローン進化に関わる分子基盤の解明 19H05656
日本医療研究開発機構(AMED) 疾病克服に向けたゲノム医療実現プロジェクト ゲノム創薬基盤推進研究事業 乳がん・大腸がん・膵がんに対する適切な薬剤投与を可能にする大規模データ基盤の構築 JP19kk0305010
科学研究費助成事業 若手研究 転移因子の挿入多型と疾患とのゲノムワイド関連解析 22K15385
科学研究費助成事業 基盤研究(B) 心不全発症の基盤となる心筋脆弱性を規定する遺伝要因の解明 21H02919
科学研究費助成事業 基盤研究(S) ゲノム免疫:内在性ウイルスの抗ウイルス活性の動作原理解明と機能資源としての確保 20H05682
科学研究費助成事業 基盤研究(B) ヘルペスウイルスのゲノムへの組み込みと再活性化: 大規模解析から探る疾患との関連 21H02972
日本医療研究開発機構(AMED) ゲノム医療実現バイオバンク利活用プログラム(B-Cure) 利活用を目的とした日本疾患バイオバンクの運営・管理 JP19km0605001
日本医療研究開発機構(AMED) 循環器疾患・糖尿病等生活習慣病対策実用化研究事業 心房細動・重篤合併症予防を実現する多層的・統合的エビデンス創出研究 JP22ek0210164
日本医療研究開発機構(AMED) ゲノム医療実現バイオバンク利活用プログラム 全ゲノム解析と組織オミックス解析による心房細動の病態解明と精密医療 JP21tm0724601
日本医療研究開発機構(AMED) ゲノム医療実現バイオバンク利活用プログラム マルチオミックス連関による循環器疾患における次世代型精密医療の実現 JP20km0405209
日本医療研究開発機構(AMED) 難治性疾患実用化研究事業 難治性心血管疾患におけるマルチオミックス解析による病態解明と精密医療 JP20ek0109487

 

関連論文

タイトルDOIデータID
1 A genome-wide association study identifies PLCL2 and AP3D1-DOT1L-SF3A2 as new susceptibility loci for myocardial infarction in Japanese. doi:10.1038/ejhg.2014.110 hum0014.v1.freq.v1
2 A functional variant in ZNF512B is associated with susceptibility to amyotrophic lateral sclerosis in Japanese. doi:10.1093/hmg/ddr268 hum0014.v2.jsnp.92als.v1
3 Functional variants in ADH1B and ALDH2 coupled with alcohol and smoking synergistically enhance esophageal cancer risk. doi: 10.1053/j.gastro.2009.07.070 hum0014.v2.jsnp.182ec.v1
4 SNPs in KCNQ1 are associated with susceptibility to type 2 diabetes in East Asian and European populations. doi: 10.1038/ng.208 T2DM (JSNP)
5 Common variants in a novel gene, FONG on chromosome 2q33.1 confer risk of osteoporosis in Japanese. doi: 10.1371/journal.pone.0019641 Osteoporosis (JSNP)
6 Genome-wide association studies in the Japanese population identify seven novel loci for type 2 diabetes. doi: 10.1038/ncomms10531

hum0014.v3.T2DM-1.v1

hum0014.v3.T2DM-2.v1

7 Multi-ancestry genome-wide association study of 21,000 cases and 95,000 controls identifies new risk loci for atopic dermatitis. doi: 10.1038/ng.3424 hum0014.v4.AD.v1
8 Genome-wide association study identifies eight new susceptibility loci for atopic dermatitis in the Japanese population. doi: 10.1038/ng.2438 hum0014.v4.AD.v1
9 Identification of six new genetic loci associated with atrial fibrillation in the Japanese population. doi: 10.1038/ng.3842 hum0014.v5.AF.v1
10 Genome-wide association study identifies 112 new loci for body mass index in the Japanese population. doi:10.1038/ng.3951

hum0014.v6.158k.v1

JGAD000123

JGAD000124

11 Genome-wide association study identifies seven novel susceptibility loci for primary open-angle glaucoma. doi: 10.1093/hmg/ddy053 hum0014.v7.POAG.v1
12 Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. doi:10.1038/s41588-018-0047-6

hum0014.v8.58qt.v1

JGAD000144-JGAD000201

13 Elucidating the genetic architecture of reproductive ageing in the Japanese population doi: 10.1038/s41467-018-04398-z

hum0014.v9.Men.v1

hum0014.v9.MP.v1

14 Deep whole-genome sequencing reveals recent selection signatures linked to evolution and disease risk of Japanese. doi: 10.1038/s41467-018-03274-0 JGAD000220
15 Germline pathogenic variants of 11 breast cancer genes in 7,051 Japanese patients and 11,241 controls. doi: 10.1038/s41467-018-06581-8 JGAD000209
16 A Variant within the FTO confers susceptibility to diabetic nephropathy in Japanese patients with type 2 diabetes doi: 10.1371/journal.pone.0208654 hum0014.v12.T2DMwN.v1
17 Identification of 28 new susceptibility loci for type 2 diabetes in the Japanese population doi: 10.1038/s41588-018-0332-4 hum0014.v13.T2DMmeta.v1
18 GWAS of smoking behaviour in 165,436 Japanese people reveals seven new loci and shared genetic architecture. doi: 10.1038/s41562-019-0557-y

hum0014.v14.asi.v1

hum0014.v14.cpd.v1

hum0014.v14.ens.v1

hum0014.v14.fcs.v1

19 Characterizing rare and low-frequency height-asssociated variants in the Japanese population doi: 10.1038/s41467-019-12276-5

JGAD000220 (fastq)

JGAD000220 (reference panel)

hum0014.v15.ht.v1

20 Germline pathogenic variants in 7,636 Japanese patients with prostate cancer and 12,366 controls. doi: 10.1093/jnci/djz124 JGAD000288
21 Large-scale genome-wide association study in a Japanese population identifies novel susceptibility loci across different diseases doi: 10.1038/s41588-020-0640-3

hum0014.v17

hum0014.v18

hum0014.v21

22 GWAS of 165,084 Japanese individuals identified nine loci associated with dietary habits doi: 10.1038/s41562-019-0805-1 hum0014.v19
23 Population-specific and transethnic genome-wide analyses identify distinct and shared genetic risk loci for coronary artery disease. doi: 10.1038/s41588-020-0705-3 hum0014.v20.cad.v1
24 Genetic characterization of pancreatic cancer patients and prediction of carrier status of germline pathogenic variants in cancer-predisposing genes doi: 10.1016/j.ebiom.2020.103033 JGAD000438
25 Population-based Screening for Hereditary Colorectal Cancer Variants in Japan doi: 10.1016/j.cgh.2020.12.007

JGAD000458

JGAD000459

26 Genome-wide association study reveals BET1L associated with survival time in the 137,693 Japanese individuals. doi: 10.1038/s42003-023-04491-0 hum0014.v27.surv.v1
27 Cross-ancestry genome-wide analysis of atrial fibrillation unveils disease biology and enables cardioembolic risk prediction doi: 10.1038/s41588-022-01284-9 hum0014.v29.AF.v1
28 Association between germline pathogenic variants in cancer-predisposing genes and lymphoma risk doi: 10.1111/cas.15522

JGAD000460

JGAD000721

29 Helicobacter pylori, Homologous-Recombination Genes, and Gastric Cancer doi: 10.1056/NEJMoa2211807

JGAD000720

JGAD000721

30 Germ line DDX41 mutations define a unique subtype of myeloid neoplasms doi: 10.1182/blood.2022018221

JGAD000399

JGAD000400

31 Combined landscape of single-nucleotide variants and copy number alterations in clonal hematopoiesis doi: 10.1038/s41591-021-01411-9

JGAD000399

JGAD000400

32 Characterizing rare and low-frequency height-associated variants in the Japanese population doi: 10.1038/s41467-019-12276-5 JGAD000777
33 Chromosomal alterations among age-related haematopoietic clones in Japan doi: 10.1038/s41586-020-2426-2

JGAD000777

JGAD000836

34 Detection of trait-associated structural variations using short-read sequencing doi: 10.1016/j.xgen.2023.100328 JGAD000831

 

制限公開データの利用者一覧

研究代表者所属機関国・州名研究題目利用データID利用期間
Mark Daly Broad Institute of MIT and Harvard JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/09/11-2023/07/31
岡田 随象 大阪大学大学院医学系研究科・遺伝統計学 JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/09/20-2021/03/31
上辻 茂男 株式会社スタージェン JGAD000123 2018/10/04-2019/03/31
徳永 勝士 東京大学大学院医学系研究科人類遺伝学教室 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/11/13-2026/11/08
角田 達彦 東京医科歯科大学・難治疾患研究所・医科学数理分野 オーダーメイド医療のためのビッグデータ解析に関する研究 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/12/18-2021/06/19
Liming Liang Harvard T.H. Chan School of Public Health, Department of Epidemiology JGAD000123 2019/01/21-2021/12/31
長崎 正朗 京都大学 大学院医学研究科附属ゲノム医学センター 学際融合教育研究推進センター 日本人大規模全ゲノム情報を基盤とした多因子疾患関連遺伝子の同定を加速する情報解析技術の開発と応用(ゲノム情報解析技術開発) JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2019/01/31-2027/03/31
小川 誠司 京都大学大学院医学研究科 腫瘍生物学講座 JGAD000209 2019/02/04-2021/03/31
上辻 茂男 株式会社スタージェン JGAD000123 2019/03/13-2022/03/31
河野 隆志 国立研究開発法人国立がん研究センター JGAD000123, JGAD000124, JGAD000220 2019/04/15-2019/12/31
堀江 重郎 順天堂大学大学院医学研究科・遺伝子疾患先端情報学 JGAD000123, JGAD000220 2019/05/14-2024/03/31
角田 達彦 東京医科歯科大学・難治疾患研究所・医科学数理分野 オーダーメイド医療のためのシーケンス、画像データなどの解析に関する研究 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2019/06/06-2023/08/31
木下 健吾 東北大学 東北メディカル・メガバンク機構 日本人全ゲノムデータベースの構築 JGAD000220 2019/06/24-2022/03/31
白石 航也 国立研究開発法人国立がん研究センター研究所 ゲノム生物学研究分野 ゲノム解析に基づく宿主並びに腫瘍における免疫応答ネットワーク機構の解明 JGAD000124 2019/08/05-2023/03/31
上辻 茂男 株式会社スタージェン 統計解析事業部 尿酸代謝に関連する遺伝子を操作変数としたメンデル無作為化解析 JGAD000123, JGAD000124,
JGAD000146, JGAD000148,
JGAD000149, JGAD000155,
JGAD000156, JGAD000157,
JGAD000174, JGAD000188
2019/08/16-2024/03/31
上辻 茂男 株式会社スタージェン 統計解析事業部 網羅的な臨床検査値のメンデル無作為解析 JGAD000123, JGAD000124,
JGAD000144-JGAD000201
2019/08/22-2024/03/31
小笠原 理 国立遺伝学研究所 生命情報・DDBJセンター JGA/AGDゲノムデータを利用したヒトゲノム解析ワークフローの評価 JGAD000123, JGAD000220 2019/10/11-2024/03/31
小川 誠司 京都大学 医学研究科 造血器腫瘍における遺伝子異常の網羅的解析 JGAD000102, JGAS000123,
JGAD000220
2019/11/14-2024/03/31
岡﨑 康司 順天堂大学 大学院医学研究科 難治性疾患診断・治療学 疾患コホート研究ネットワークによる疾患マーカー探索研究 JGAD000123 2020/06/04-2023/03/31
秦 千比呂 国立遺伝学研究所 生命情報・DDBJセンター 日本人乳癌患者シーケンスデータにおけるhypomorphic変異同定 JGAD000209 2020/06/04-2023/03/31
河合 洋介 国立国際医療研究センター ゲノム医科学プロジェクト ヤポネシア人の起源をさぐるための現代人ゲノム塩基配列の大規模解析 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/06/19-2022/03/31
岩田 仲生 藤田医科大学 医学部 精神神経科学 遺伝子解析によるこころの健康とこころの病気に対するかかりやすさ(発症脆弱性)や薬の効きめや副作用(治療反応性)等の解明に関する研究 JGAD000123, JGAD000124 2020/08/17-2022/12/31
Atray Dixit Coral Genomics, Inc. Derivation and Evaluation of Functional Response Scores JGAD000101, JGAD000123,
JGAD000124, JGAD000144-JGAD000201, JGAD000220
2020/08/24-2021/07/21
Hae Kyung Im Biological Sciences Division, University of Chicago Predicted Gene Expression: High Power, Mechanism, and Direction of Effect JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/09/15-2023/06/23
Hongyu Zhao Department of Biostatistics, Yale School of Public Health Leveraging multi-ethnic data and functional annotations in causal variant identification, genetic correlation estimation, and genetic risk prediction JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/09/24-2024/03/01
Charleston Chiang Center for Genetic Epidemiology, Keck School of Medicine, University of Southern Califolnia Investigating the evolution of complex genetic architecture in participants of Biobank Japan JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/09/28-2025/07/01
上辻 茂男 株式会社スタージェン 統計解析事業部 ステント血栓症発症の遺伝的要因の探索のためのゲノムワイド関連研究 JGAD000123, JGAD000124,
JGAD000145, JGAD000146,
JGAD000149, JGAD000151,
JGAD000155, JGAD000156,
JGAD000158, JGAD000159,
JGAD000163,
JGAD000165-JGAD000167,
JGAD000170,
JGAD000172-JGAD000175,
JGAD000182,
JGAD000187-JGAD000189,
JGAD000192-JGAD000196,
JGAD000200, JGAD000201
2020/10/26-2025/03/31
Ali Torkamani Scripps Research Institute Genomics Deep Learning JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/11/16-2023/07/10
中山 一大 東京大学大学院 新領域創成科学研究科 先端生命科学専攻 褐色脂肪組織活性に寄与するゲノム多型の探索 JGAD000123, JGAD000124 2020/11/26-2023/09/18
藤尾 圭志 東京大学大学院医学系研究科 アレルギー・リウマチ内科 日本人免疫細胞eQTLデータと日本人大規模GWASデータの統合解析 JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/12/14-2025/03/31
菊地 正隆 東京大学 大学院新領域創成科学研究科 日本 日本人リファレンスパネルを用いたゲノムデータ補完 JGAD000220 2020/12/14-2027/06/31
松田 文彦 京都大学大学院医学研究科 附属ゲノム医学センター 日本人の遺伝的多様性の解明(G751-5) JGAD000220 2021/01/05-2025/03/31
野口 恵美子 筑波大学 医学医療系 アレルギー疾患における遺伝要因の探索研究 JGAD000220 2021/03/16-2032/03/31
佐藤 憲子 東京医科歯科大学 難治疾患研究所 分子疫学 地域コホート縦断データに基づく肥満・糖尿病発症・進行の遺伝・環境リスクの解析 JGAD000220 2021/04/09-2023/03/31
河野 隆志 国立研究開発法人国立がん研究センター研究所 ゲノム生物学研究分野 AYA(Adolescence and Young Adult)世代がんの個別化予防に資する遺伝要因の同定を目指す研究 JGAD000209, JGAD000220 2021/05/20-2025/03/31
永田 安伸 日本医科大学 血液内科 新たな遺伝学的異常を用いた造血器腫瘍発症メカニズムの探索 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2021/05/26-2026/03/31
川上 純 長崎大学病院 リウマチ・膠原病内科 免疫チェックポイント阻害薬ニボルマブが誘発する1型糖尿病、間質性肺疾患の発症に関連する原因遺伝子多型・変異の探索的研究 JGAD000220 2021/06/14-2022/03/30
藤本 明洋 東京大学大学院 医学系研究科 人類遺伝学教室 全ゲノムシークエンスデータの解析による突然変異・遺伝的多様性・転写異常の包括的解析 JGAD000220, JGAD000410 2021/09/16-2024/11/30
朝野 仁裕 大阪大学医学系研究科 循環器内科学 遺伝性心血管疾患の感受性遺伝子解析研究 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2021/07/16-2022/05/31
増子 裕典 筑波大学 呼吸器内科 炎症性肺疾患の遺伝素因に関する研究 JGAD000123 2021/08/11-2023/03/31
河野 隆志 国立研究開発法人国立がん研究センター研究所 ゲノム生物学研究分野 AYA(Adolescence and Young Adult)世代がんの個別化予防に資する遺伝要因の同定を目指す研究 JGAD000209, JGAD000220 2021/09/27-2025/03/31
松田 文彦 国立研究開発法人国立がん研究センター研究所 ゲノム生物学研究分野 オーダーメイド医療開発プロジェクト JGAD000123, JGAD000220 2021/09/27-2025/03/31
松田 喬 アステラス製薬株式会社 アドバンストインフォマティクス&アナリティクス室 肝がん並びにB型肝炎発症と遺伝子多型の相関に関する検討 JGAD000102, JGAD000123 2021/11/05-2022/07/31
野口 恵美子 筑波大学 医学医療系遺伝医学 食物アレルギーの発症要因の解明 JGAD000220 2021/12/03-2025/03/31
河合 洋介 東京大学医科学研究所 人癌病因遺伝子分野 集団遺伝学的解析による日本人集団のなりたちの解析 JGAD000123 2021/12/08-2023/03/31
二宮 利治 九州大学 大学院医学研究院 衛生・公衆衛生学分野 健康長寿社会の実現を目指した大規模認知症コホート研究(JPSC-AD) JGAD000220 2021/12/08-2026/02/28
Joshua Chiou Pfizer Internal Medicine Research Unit Evaluating GWAS associations from Biobank Japan to Support Confidence in Rationale for Therapeutic Targets JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2022/01/27-2022/12/31
Gil McVean Genomics plc イギリス Development of polygenic risk scores in diverse ancestries for diseases, traits and conditions JGAD000101, JGAD000102 2022/07/19-2025/07/01
Gil McVean Genomics plc イギリス Using large-scale reference panels for imputation and ancestry analysis to support target discovery and polygenic risk score models JGAD000220, JGAD000410 2022/08/04-2025/08/01
中岡 博史 公益財団法人佐々木研究所 腫瘍ゲノム研究部 日本 大規模シーケンスデータを用いた乳がん関連遺伝子における活性低下型変異の研究 JGAD000209 2022/08/17-2024/03/31
野口 恵美子 筑波大学 医学医療系遺伝医学 日本 炎症性肺疾患の遺伝素因に関する研究 JGAD000220 2022/09/19-2027/03/31
Nuria Lopez-Bigas Institute for Research in Biomedicine (IRB Barcelona) スペイン Study of the genetic basis of clonal hematopoiesis JGAD000399, JGAD000400 2022/11/06-2025/08/01
山崎 慶子 千葉大学大学院医学研究院 公衆衛生学 日本 炎症性腸疾患における分子標的薬の効果予測システムの構築 JGAD000220 2022/11/09-2025/03/31
鬼頭 良輔 信州大学 医学部 耳鼻咽喉科頭頸部外科 日本 突発性難聴の発症・治療効果に関する遺伝子解析 JGAD000123 2022/12/19-2027/03/31
上辻 茂男 株式会社スタージェン 統計解析事業部 日本 斜視の遺伝的要因の検証のためのゲノムワイド関連研究 JGAD000123 2023/02/13-2027/02/28
由良 敬 お茶の水女子大学 大学院 人間文化創成科学研究科 日本 がん抑制遺伝子BRCA1バリアントの表現型予測に関するデータ解析研究 JGAD000220 2023/03/16-2025/03/31
尾内 善広 千葉大学大学院医学研究院 公衆衛生学 日本 川崎病の関連遺伝子解析に関する多施設共同研究 JGAD000220 2023/03/30-2025/03/31
尾内 善広 千葉大学大学院医学研究院 公衆衛生学 日本 新型コロナワクチンへの抗体応答の個人差の遺伝的背景に関する研究 JGAD000220 2023/04/19-2025/12/31
加藤 正樹 関西医科大学 日本 精神疾患個別化治療アルゴリズムの構築を目的とする生物学的反応因子の探索・検証試験 JGAD000101, JGAD000102,
JGAD000123, JGAD000220
2023/08/25-2028/06/30
木村 大樹 名古屋大学大学院医学系研究科 日本 遺伝子解析による脳とこころの病気に対するかかりやすさ(発症脆弱性)や薬の効きめや副作用(治療反応性)等の解明に関する研究 JGAD000220 2023/11/17-2025/10/28
寺尾 知可史 理化学研究所生命医学研究センター 日本 ゲノミクス情報を基盤とした個別化医療の研究 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2023/11/21-2026/03/31
持田 泰寛 湘南鎌倉総合病院 腎臓病総合医療センター 日本 日本人におけるクローン性造血と慢性腎臓病進展への関連に関する 後ろ向きコホート研究 JGAD000399, JGAD000400 2024/02/07-2027/03/31
三嶋 博之 長崎大学 原爆後障害医療研究所 日本 ヒト全ゲノムシークエンシングにおけるバッチ効果軽減方法の開発 JGAD000220 2024/04/17-2027/03/31
寺尾 知可史 静岡県立総合病院 臨床研究部 日本 ヒト形質関連遺伝因子に関する研究 JGAD000220, JGAD000495,
JGAD000777
2024/04/17-2028/12/03
松田 浩一 東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 日本 疾患コホート研究ネットワークによる疾患マーカー探索研究 JGAD000209, JGAD000220,
JGAD000288, JGAD000438,
JGAD000458-JGAD000461,
JGAD000495, JGAD000531,
JGAD000720, JGAD000721,
JGAD000777,
JGAD000831-JGAD000834
2024/06/17-2029/03/31
長﨑 正朗 九州大学 生体防御医学研究所 高深度オミクスサイエンスセンター バイオメディカル情報解析分野 日本 日本人大規模全ゲノム情報を基盤とした多因子疾患関連遺伝子の同定を加速する情報解析技術の開発と応用(ゲノム情報解析技術開発) JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2024/06/24-2027/03/31
白石 航也 国立がん研究センター研究所 臨床ゲノム解析部門 日本 肺がんの個別化予防に資する遺伝要因の同定を目指す研究 JGAD000123 2024/06/24-2025/12/31
寺尾 知可史 理化学研究所生命医学研究センター 日本 ゲノミクス情報を基盤とした個別化医療の研究 JGAD000836 2024/07/08-2026/03/31
寺尾 知可史 静岡県立総合病院 臨床研究部 日本 ヒト形質関連遺伝因子に関する研究 JGAD000836 2024/07/16-2028/12/03