NBDC Research ID: hum0014.v35

最新版はこちらです

研究内容の概要

目的： 日本人における疾患関連遺伝子の特定、日本人における転移因子挿入多型の網羅的探索、日本人集団に特化したリファレンスパネルの開発

方法： Human610-Quad BeadChip、HumanHap550v3 Genotyping BeadChip、HumanOmniExpress-12 BeadChip、HumanExome BeadChip、 OmniExpressExome Beadchip（Illumina社）、high-density oligonucleotide arrays （Perlegen Sciences社）、もしくはインベーダー法（Hologic Japan社）により遺伝子型を決定し、心筋梗塞、２型糖尿病、アトピー性皮膚炎、心房細動、Body Mass Index（BMI）、開放隅角緑内障、58形質、初潮・閉経年齢、喫煙習慣、身長、42疾患（4疾患は以前のリリースと一部重複あり）、食習慣、および冠動脈疾患のゲノムワイド関連解析（Genome Wide Association Study：GWAS）や２型糖尿病腎症および２型糖尿病発症のGWASメタ解析を実施した。51疾患患者26.9万名のSNPアレイ解析を実施した。また、Illumina社 HiSeq 2500/X Fiveを用いて、BBJ第1コホート1,026＋1,007名、心筋梗塞1,765症例、認知症199症例、胃がん256＋2,067症例、大腸がん617症例、糖尿病2,162症例の全ゲノムシークエンス（Whole Genome Sequencing：WGS）を実施した。乳がん7,104症例と対照者23,731名における遺伝性乳がん原因11遺伝子翻訳領域、遺伝性前立腺がん7,636症例と対照者12,366名における遺伝性前立腺がん原因8遺伝子翻訳領域、バイオバンクジャパン11,234名における23遺伝子、膵がん1,005症例、大腸がん12,503症例および対照者23,705名、腎がん740症例および対照者5,996名、リンパ腫1,982症例、胃がん10,366症例および対照者37,592名の遺伝性腫瘍関連27遺伝子翻訳領域ならびに腎がん740症例および対照者5,996名の腎がん関連13遺伝子翻訳領域のTarget Capture Sequencingを実施した。遺伝性乳がん原因11遺伝子翻訳領域、遺伝性前立腺がん原因8遺伝子翻訳領域、バイオバンクジャパン11,234名における23遺伝子、遺伝性腫瘍関連27遺伝子翻訳領域および腎がん関連13遺伝子翻訳領域のTarget Capture Sequencingを実施した。バイオバンクジャパン7,472名のWGSデータから作成したvcfファイルと1000ゲノムプロジェクト（Phase3v5）2,504名のvcfファイルを統合し、genotype imputation用reference panelを作成した。バイオバンクジャパン137,693名について、男女別にCox回帰分析を実施した。当研究室が開発したソフトウェアを用い、バイオバンクジャパンの第1コホート4,880名のWGSデータから転移因子多型の同定を行った。バイオバンクジャパンの心房細動ケース9,826人とコントロール140,446人で心房細動GWASを実施し、さらに欧米人の心房細動GWAS（http://csg.sph.umich.edu/willer/public/afib2018; 60,620人ケースと970,216人コントロール、FinnGen; https://www.finngen.fi/en; 7,244人ケースと56,378人コントロール）とメタ解析を行った。メタ解析の結果からポリジェニックリスクスコアを構築した。

対象： オーダーメイド医療実現化プロジェクトおよびオーダーメイド医療の実現プログラム参加者

URL： http://www.biobankjp.org/index.html

データID	内容	制限	公開日
hum0014.v1.freq.v1	心筋梗塞1,666症例および対照健常者3,198名のGWAS	非制限公開	2014/09/30
hum0014.v2.jsnp.934ctrl.v1	健常者934名の遺伝子型カウント情報（JSNPのデータ）	非制限公開	2015/12/28
35疾患	35疾患各約190症例における遺伝子型カウント情報（JSNPのデータ）	非制限公開	2015/12/28
hum0014.v2.jsnp.182ec.v1	食道がん182症例の遺伝子型カウント情報（JSNPのデータ）	非制限公開	2015/12/28
hum0014.v2.jsnp.92als.v1	筋萎縮性側索硬化症92症例の遺伝子型カウント情報（JSNPのデータ）	非制限公開	2015/12/28
hum0014.v3.T2DM-1.v1	２型糖尿病9,817症例および対照者6,763名のGWAS	非制限公開	2016/01/28
hum0014.v3.T2DM-2.v1	２型糖尿病5,646症例および対照者19,420名のGWAS	非制限公開	2016/01/28
hum0014.v4.AD.v1	アトピー性皮膚炎患者1,472症例および対照者7,966名のGWAS	非制限公開	2016/02/02
hum0014.v5.AF.v1	心房細動患者8,180症例および対照者28,612名のGWAS	非制限公開	2017/05/18
JGAS000101	心房細動患者8,180症例のPhenotypeデータ、Genotypeデータ	制限公開（Type I）	2017/05/18
hum0014.v6.158k.v1	158,284名のBMIのGWAS	非制限公開	2017/09/08
JGAS000114	158,284名のBMIデータ 182,505名のGenotypeデータ	制限公開（Type I）	2017/09/08
hum0014.v7.POAG.v1	開放隅角緑内障3,980症例および対照者18,815名のGWAS	非制限公開	2018/04/04
hum0014.v8.58qt.v1	162,255名の58臨床検査値のGWAS	非制限公開	2018/05/01
JGAS000114	162,255名の58臨床検査値のPhenotypeデータ	制限公開（Type I）	2018/05/01
hum0014.v9.Men.v1 hum0014.v9.MP.v1	初潮年齢データを有する女性67,029名および閉経年齢データを有する女性43,861名のGWAS	非制限公開	2018/08/07
JGAS000114	BBJ第1コホート1,026名のWGSデータ	制限公開（Type I）	2018/08/13
JGAS000140	乳がん7,104症例と対照者23,731名の遺伝性乳がん原因11遺伝子翻訳領域のTarget Capture Sequencingデータ	制限公開（Type I）	2018/10/16
hum0014.v12.T2DMwN.v1	２型糖尿病腎症2,809症例および２型糖尿病対照5,592症例のGWASメタ解析	非制限公開	2018/12/10
hum0014.v13.T2DMmeta.v1	２型糖尿病36,614症例および対照者155,150名のGWASメタ解析	非制限公開	2019/01/25
hum0014.v14.smok.v1	日本人集団165,436名における喫煙習慣のGWAS	非制限公開	2019/03/26
JGAS000114	バイオバンクジャパン1,037名のWGSデータと1000ゲノムプロジェクト（Phase3v5）2,504名のWGSのvcfファイルを統合したgenotype imputation用のreference panel	制限公開（Type I）	2019/09/27
hum0014.v15.ht.v1	159,095名の身長のGWAS	非制限公開	2019/09/27
JGAS000203	遺伝性前立腺がん7,636症例と対照者12,366名の遺伝性前立腺がん原因8遺伝子翻訳領域のTarget Capture Sequencingデータ	制限公開（Type I）	2019/10/07
hum0014.v17	40疾患のGWAS	非制限公開	2019/10/08
hum0014.v18	乳がんのGWAS	非制限公開	2019/11/26
hum0014.v19	日本人集団165,084名における食習慣のGWAS	非制限公開	2020/04/20
hum0014.v20.cad.v1	冠動脈疾患のGWAS	非制限公開	2020/08/17
hum0014.v21	虚血性心疾患のGWAS	非制限公開	2020/08/25
JGAS000293	2003年から2007年度にバイオバンク・ジャパンに登録されたサンプル（約20万例）から抽出された11,234名の23遺伝子における全てのエクソン領域のTarget Capture Sequencingn解析より得られた体細胞変異データおよびSNPアレイにより得られた染色体変異データ	制限公開（Type I）	2021/05/21
JGAS000114 にデータ追加	JGAD000220のWGSデータのbam/gvcfデータ	制限公開（Type I）	2021/07/13
JGAS000327	膵がん1,005症例の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ	制限公開（Type I）	2021/11/26
JGAS000346	大腸がん12,503症例および対照者23,705名の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ	制限公開（Type I）	2021/11/26
JGAS000381	心筋梗塞1,765症例、認知症199症例のWGSデータ	制限公開（Type I）	2022/01/25
JGAS000414	腎がん740症例および対照者5,996名の遺伝性腫瘍関連27遺伝子および腎がん関連13遺伝子翻訳領域のTarget Capture Sequencingデータ	制限公開（Type I）	2022/04/01
hum0014.v27.surv.v1	BBJ第1コホート137,693名の生存に関するGWAS	非制限公開	2022/12/31
hum0014.v28.MEs.v1	BBJ第1コホート4,880名のmobile element多型頻度情報	非制限公開	2023/04/05
hum0014.v29.AF.v1	心房細動患者9,826症例および対照者140,446名のGWAS（BBJ）心房細動患者77,690症例および対照者1,167,040名のGWASメタ解析（BBJ、欧米人、FinnGen）	非制限公開	2023/04/05
JGAS000347	リンパ腫1,982症例の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ	制限公開（Type I）	2023/04/20
JGAS000592	胃がん10,366症例の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ	制限公開（Type I）	2023/04/20
JGAS000592	対照者37,592名（BBJの非がん対象者）の遺伝性腫瘍関連27遺伝子翻訳領域のTarget Capture Sequencingデータ	制限公開（Type I）	2023/04/20
JGAD000690	JGAD000220（BBJ1,026名のWGS）の加工データ（CRAM、gVCF）	制限公開（Type I）	2023/09/01
JGAD000758	JGAD000220（BBJ1,026名のWGS）の加工データ（joint call）（aggregate VCF）	制限公開（Type I）	2023/09/01
JGAD000679	JGAD000220（reference panel）の加工データ（TogoImputation用reference panelデータ）	制限公開（Type I）	2023/09/01
JGAS000647	BBJ第1コホート1,007名のWGSデータ	制限公開（Type I）	2024/01/11
JGAS000698	胃がん256症例のWGSデータ	制限公開（Type I）	2024/05/27
JGAS000703	BBJ第1コホートおよび第2コホート26.9万名のSNPアレイデータ	制限公開（Type I）	2024/05/27
JGAS000699	大腸がん617症例のWGSデータ	制限公開（Type I）	2024/05/27
JGAS000700	糖尿病2,162症例のWGSデータ（low-depth）	制限公開（Type I）	2024/05/27
JGAS000701	胃がん2,067症例のWGSデータ（low-depth）	制限公開（Type I）	2024/05/27
JGAD000867	JGAD000220（バイオバンクジャパン1,026名のWGSデータ）の加工データ（TogoImputation用reference panelデータ）	制限公開（Type I）	2024/09/19
JGAD000868	JGAD000495（バイオバンクジャパン1,964名のWGSデータ）の加工データ（TogoImputation用reference panelデータ）	制限公開（Type I）	2024/09/19
JGAS000738	バイオバンクジャパン7,472名のWGSデータと1000ゲノムプロジェクト（Phase3v5）2,504名のWGSのvcfファイルを統合したgenotype imputation用のreference panel	制限公開（Type I）	2024/10/25

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら。

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞（Acknowledgement）に記載して下さい。記載例はこちら。

分子データ

hum0014.v1.freq.v1


対象	心筋梗塞：1,666症例、対照健常者：3,198名
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [Human610-Quad BeadChip、HumanHap550v3 Genotyping BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Illumina Human610-Quad Beadchip
遺伝子型決定アルゴリズム（ソフトウェア）	GenCall software（GenomeStudio）
フィルタリング	Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後)	455,781 SNPs （hg18/GRCh36）
NBDC Dataset ID	hum0014.v1.freq.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	71.3 MB（xlsx）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v2.jsnp.934ctrl.v1


対象	健常者：934名（JSNP）
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanHap550v3 Genotyping BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Illumina HumanHap550v3 Genotyping BeadChip
遺伝子型決定アルゴリズム（ソフトウェア）	GenCall software（GenomeStudio）
フィルタリング	Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後)	515,286 SNPs
NBDC Dataset ID	hum0014.v2.jsnp.934ctrl.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	32.2 MB（zip [xls]）
コメント（利用にあたっての制限事項）	NBDC policy

35疾患（JSNP）


対象	悪性腫瘍（肺がん、乳がん、胃がん、大腸・直腸がん、前立腺がん）心血管系疾患（心不全、心筋梗塞，不安定狭心症、安定狭心症、不整脈、閉塞性動脈硬化症）脳血管障害（脳梗塞、脳動脈瘤）呼吸器疾患（間質性肺炎＆肺線維症、肺気腫、気管支喘息）慢性肝疾患（C型慢性肝炎、肝硬変）眼疾患（白内障、緑内障）その他（てんかん、歯周病、尿路結石、ネフローゼ症候群、子宮筋腫、子宮内膜症、骨粗鬆症、関節リウマチ、筋萎縮性側索硬化症、花粉症、アトピー性皮膚炎、過敏性症候群（薬疹）、高脂血症、糖尿病、バセドウ病）各約190症例
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Perlegen Sciences [high-density oligonucleotide arrays]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	-
遺伝子型決定アルゴリズム（ソフトウェア）	-
フィルタリング	-
マーカー数(QC後)	約20万SNPs （b129）
データセット	悪性腫瘍（肺がん、乳がん、胃がん、大腸・直腸がん、前立腺がん）心血管系疾患（心不全、心筋梗塞、不安定狭心症、安定狭心症、不整脈、閉塞性動脈硬化症）脳血管障害（脳梗塞、脳動脈瘤）呼吸器疾患（間質性肺炎＆肺線維症、肺気腫、気管支喘息）慢性肝疾患（C型慢性肝炎、肝硬変）眼疾患（白内障、緑内障）その他（てんかん、歯周病、尿路結石、ネフローゼ症候群、子宮筋腫、子宮内膜症、骨粗鬆症、関節リウマチ、筋萎縮性側索硬化症、花粉症、アトピー性皮膚炎、過敏性症候群（薬疹）、高脂血症、糖尿病、バセドウ病）（データのダウンロードは上記疾患名をクリックしてください） Dictionary file
コメント（利用にあたっての制限事項）	NBDC policy

*各SNVの染色体上のポジションはdbSNP build 129に基づいています。他のbuildに基づいた位置情報を希望される場合はお問い合わせください。

hum0014.v2.jsnp.182ec.v1


対象	食道がん：182症例（JSNP）
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanHap550v3 Genotyping BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Illumina HumanHap550v3 Genotyping BeadChip
遺伝子型決定アルゴリズム（ソフトウェア）	GenCall software（GenomeStudio）
フィルタリング	Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後)	503,734 SNPs
NBDC Dataset ID	hum0014.v2.jsnp.182ec.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	6.6 MB（zip [txt]）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v2.jsnp.92als.v1


対象	筋萎縮性側索硬化症：92症例（JSNP）
規模	large-scale case-control association study
対象領域（Target Captureの場合）	-
Platform	Hologic Japan [Invader]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Invader assay system（Third Wave Technologies）
遺伝子型決定アルゴリズム（ソフトウェア）	ABI PRISM SDS versions 2.0 - 2.2
フィルタリング	SNP call rate ≥ 0.95（疾患群、対照群）, HWE P ≥1.0 x 10^-2（対照群）
マーカー数(QC後)	48,939 SNPs
NBDC Dataset ID	hum0014.v2.jsnp.92als.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	3.2 MB（zip [txt]）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v3.T2DM-1.v1


対象	２型糖尿病：9,817症例、対照者：6,763名（健常者および糖尿病を合併していない脳動脈瘤、食道がん、子宮体がん、肺気腫、緑内障の患者）
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [OmniExpressExome Beadchip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Illumina OmniExpressExome Beadchip kit
遺伝子型決定アルゴリズム（ソフトウェア）	GenCall software（GenomeStudio）
フィルタリング	Sample Call rate < 0.98, SNP call rate < 0.99, MAF < 0.01 HWE P < 1 x 10^-6 in control
マーカー数(QC後)	552,915 SNPs （hg19）
NBDC Dataset ID	hum0014.v3.T2DM-1.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	84.0 MB（xlsx）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v3.T2DM-2.v1


対象	２型糖尿病：5,646症例、対照者：19,420名（糖尿病を合併していない大腸-直腸がん、乳がん、前立腺がん、肺がん、胃がん、閉塞性動脈硬化症、不整脈、脳梗塞、心筋梗塞、胆嚢・胆管がん、膵がん、過敏性症候群（薬疹）、関節リウマチ、筋萎縮性側索硬化症、肝がん、肝硬変、骨粗鬆症、子宮筋腫の患者）
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [Human610-Quad BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Illumina Human610-Quad Beadchip kit
遺伝子型決定アルゴリズム（ソフトウェア）	GenCall software（GenomeStudio）
フィルタリング	Sample Call rate < 0.98, SNP call rate < 0.99, MAF < 0.01 HWE P < 1 x 10^-6 in control
マーカー数(QC後)	479,088 SNPs （hg18）
NBDC Dataset ID	hum0014.v3.T2DM-2.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	72.6 MB（xlsx）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v4.AD.v1


対象	アトピー性皮膚炎：1,472症例、対照者：7,966名（健常者およびアトピー性皮膚炎と気管支喘息のいずれも合併していない脳動脈瘤、食道がん、子宮体がん、肺気腫、緑内障の患者）
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress-12 BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress-12 BeadChip
遺伝子型決定アルゴリズム（ソフトウェア）	minimac [imputation（1000 genomes Phase I v3 ）]
関連解析（ソフトウェア）	mach2dat [GWAS]
フィルタリング	GenotypingのQC：sample call rate < 0.98, SNV call rate < 0.99, 対照者群で HWE P < 1 x 10^-6 ImputationのQC：リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01 　 GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16
マーカー数(QC後)	約770万 SNVs（hg19）
NBDC Dataset ID	hum0014.v4.AD.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	ADGWAS_auto.txt （525 MB） ADGWAS_X_females.txt （17 MB） ADGWAS_X_males.txt （15 MB）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000101 / hum0014.v5.AF.v1


対象	心房細動：8,180症例対照者：28,612名
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	minimac [imputation（1000 genomes Phase I v3 ）] GenCall software（GenomeStudio）
関連解析（ソフトウェア）	mach2dat [GWAS]
フィルタリング	GenotypingのQC：sample call rate < 0.98, SNV call rate < 0.99, 対照者群で HWE P < 1 x 10^-6 ImputationのQC：リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01 　 GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16 R square < 0.9
マーカー数(QC後)	約500万 SNVs（hg19）
Phenotype情報	性別、年齢
NBDC Dataset ID / Japanese Genotype-phenotype Archive Dataset ID	【GWAS集計情報】 hum0014.v5.AF.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file 【個別データ（心房細動群のみ）】 Phenotype：JGAD000101 Genotype：JGAD000102
総データ量	GWAS：485 MB（txt） Phenotype、Genotype：1 GB（txt）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000114 / hum0014.v6.158k.v1


対象	182,505名（内、BMI研究で使用した対象数：158,284名）
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	minimac [imputation（1000 genomes Phase I v3 ）] GenCall software（GenomeStudio）
関連解析（ソフトウェア）	mach2qtl (v1.1.3)
フィルタリング	GenotypingのQC：sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6 Imputation referenceのQC: 　以下の条件に該当するSNVはreferenceから除外: 　1) HWE P < 1 x 10^-6、2) MAF < 0.01 Imputation後のQC: 　Imputation quality (Rsq) < 0.7　を除外。
マーカー数(QC後)	常染色体：約600万 SNVs (hg19) X染色体：約15万 SNVs (hg19)
NBDC Dataset ID / Japanese Genotype-phenotype Archive Dataset ID	【GWAS】 hum0014.v6.158k.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file 【個別データ】 Phenotypeデータ（BMI）：JGAD000124 Genotypeデータ：JGAD000123 遺伝型情報に関する詳細アレイプローブの取り扱いに関する情報
総データ量	GWAS：406 MB（zip） Phenotypeデータ（BMI）：3.32 MB（txt.gz） Genotypeデータ：26.3 GB（csv.gz）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v7.POAG.v1


対象	開放隅角緑内障（ICD10：H401）：3,980症例（男性：1,997、女性：1,983）対照者：18,815名（男性：7,817、女性：10,998）
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	minimac（ver. 0.1.1）[imputation（1000 genomes Phase I v3 ）]
関連解析（ソフトウェア）	mach2dat（ver. 1.0.19）
フィルタリング	GenotypingのQC：sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.5%, 　　　　　　　　対照者群で HWE P < 1 x 10^-6 ImputationのQC：リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01 　　　　　　　　　GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16 Imputation後のQC：Imputation quality (Rsq) < 0.7を除外。　　　　　　　　　さらに、ベータが4未満もしくは4を超えるものは公開用に除外。
マーカー数(QC後)	常染色体：5,961,428 SNPs（hg19）男性X染色体：147,351 SNPs（hg19）女性X染色体：147,353 SNPs（hg19）
NBDC Dataset ID	hum0014.v7.POAG-1.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	113 MB（txt.zip）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000114 / hum0014.v8.58qt.v1


対象	162,255名の58臨床検査値
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	minimac [imputation（1000 genomes Phase I v3 ）] GenCall software（GenomeStudio）
関連解析（ソフトウェア）	mach2qtl（v1.1.3）
フィルタリング	GenotypingのQC：sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6 Imputation referenceのQC: 　以下の条件に該当するSNVはreferenceから除外: 　1) HWE P < 1 x 10^-6、2) MAF < 0.01 Imputation後のQC: 　Imputation quality (Rsq) < 0.7　を除外。
マーカー数(QC後)	常染色体：5,961,600 SNVs（hg19） X染色体：147,353 SNVs（hg19）
NBDC Dataset ID / Japanese Genotype-phenotype Archive Dataset ID	血糖・脂質関連	総コレステロール	JGAD000144
		HDLコレステロール	JGAD000145
		LDLコレステロール	JGAD000146
		中性脂肪	JGAD000147
		血糖	JGAD000148
		ヘモグロビンA1c	JGAD000149
	血清蛋白質	総蛋白	JGAD000150
		アルブミン	JGAD000151
		非アルブミン蛋白	JGAD000152
		アルブミン/グロブリン比	JGAD000153
	腎機能	尿素窒素	JGAD000154
		血清クレアチニン	JGAD000155
		推算糸球体濾過量	JGAD000156
		尿酸	JGAD000157
	電解質	ナトリウム	JGAD000158
		カリウム	JGAD000159
		クロール	JGAD000160
		カルシウム	JGAD000161
		無機リン	JGAD000162
	肝機能	総ビリルビン	JGAD000163
		硫酸亜鉛混濁試験	JGAD000164
		アスパラギン酸アミノ基転移酵素	JGAD000165
		アラニンアミノ基転移酵素	JGAD000166
		アルカリフォスファターゼ	JGAD000167
		ガンマグルタミルトランスフェラーゼ	JGAD000168
	その他の検査値	活性化部分トロンボプラスチン時間	JGAD000169
		プロトロンビン時間	JGAD000170
		フィブリノーゲン	JGAD000171
		クレアチンキナーゼ	JGAD000172
		乳酸脱水素酵素	JGAD000173
		C反応性蛋白	JGAD000174
	血球数	白血球数	JGAD000175
		好中球数	JGAD000176
		好酸球数	JGAD000177
		好塩基球数	JGAD000178
		単球数	JGAD000179
		リンパ球数	JGAD000180
		赤血球数	JGAD000181
		ヘモグロビン濃度	JGAD000182
		ヘマトクリット値	JGAD000183
		平均赤血球容積	JGAD000184
		平均赤血球ヘモグロビン量	JGAD000185
		平均赤血球ヘモグロビン濃度	JGAD000186
		血小板数	JGAD000187
	血圧	収縮期血圧	JGAD000188
		拡張期血圧	JGAD000189
		平均血圧	JGAD000190
		脈圧	JGAD000191
	心エコー	心室中隔壁厚	JGAD000192
		後壁厚	JGAD000193
		左室拡張末期径	JGAD000194
		左室収縮末期径	JGAD000195
		左室心筋重量	JGAD000196
		左室心筋重量係数	JGAD000197
		相対的壁厚	JGAD000198
		左室内径短縮率	JGAD000199
		左室駆出率	JGAD000200
		E/A比	JGAD000201
	（GWAS統計情報のダウンロードは上記形質名をクリックしてください） Dictionary file
総データ量	GWAS：平均 123 MB（zip） Phenotypeデータ（58形質）：平均 2.4 MB（txt.gz）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v9.Men.v1 / hum0014.v9.MP.v1


対象	初潮年齢データを有する女性67,029名閉経年齢データを有する女性43,861名
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	minimac [imputation（1000 genomes Phase I v3 ）] GenCall software（GenomeStudio）
関連解析（ソフトウェア）	mach2qtl (v1.1.3)
フィルタリング	GenotypingのQC：sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.5%, 　　　　　　　　対照者群で HWE P < 1 x 10^-6 ImputationのQC：リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01 　　　　　　　　　GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16 Imputation後のQC：Imputation quality (Rsq) < 0.7を除外。　　　　　　　　　さらに、ベータが4未満もしくは4を超えるものは公開用に除外。
マーカー数(QC後)	9,296,729 SNPs (hg19)
NBDC Dataset ID	初潮：hum0014.v9.Men.v1 閉経：hum0014.v9.MP.v1 （データのダウンロードは上記Dataset IDをクリックしてください）初潮：Dictionary file 閉経：Dictionary file
総データ量	初潮：181 MB（txt.gz）閉経：186 MB（txt.gz）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000114 （JGAD000220 / JGAD000410 / JGAD000690 / JGAD000758）


対象	2003年から2007年度にバイオバンク・ジャパンに登録された47疾患患者：1,026名
規模	WGS
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	TruSeq Nano DNA Library Preparation Kit
断片化の方法	超音波断片化
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	160 bp
クオリティコントロール方法	リードのbase qualityが全体的に悪い検体、リード毎の%GCの結果にて異常を示した検体を除去。 Alignment後、Low mapping rate検体、Insert sizeがおかしい検体、メタデータの性別情報とalingment結果より推定される性別情報が不一致な検体、性染色体異常疑いの検体を除去。 Genotyping時に、VQSR、DP/GP filter (DP < 5, GQ < 20, DP > 60 && GQ < 95を除去）、heterozygosity filter (F>=0.05 を除去)、HWE filter (p < 10-6を除去）、Repeat & Low Complexity filterを実施。 1000 genomes projectと合わせたPCAを実施し、日本人クラスタから大きく外れる検体を除外。その後、Genome-In-A-Bottleプロジェクトから公開されているHighConfidenceRegionリストに記載のある領域のバリアントにフラグを付与。
重複するリードの除去	Picard 2.10.6
リアライメントおよびベースクオリティのキャリブレーション	GATK 3.7
マッピング方法	BWA mem 0.7.12
マッピングクオリティ	GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列	GRCh37/hg19（hs37d5）
平均カバー率（Depth）	31.8x
変異検出方法	GATK 3.7 HaplotypeCaller
SNV数（QC後）	76,768,387（常染色体） 2,898,518（X 染色体）
INDEL数（QC後）	10,202,908（常染色体） 410,435（X 染色体）
Japanese Genotype-phenotype Archive Dataset ID	JGAD000220（fastq） JGAD000410（bam、vcf）：GEnome Medical alliance Japan（GEM Japan, GEM-J）の取り組みとして、GATK Best Practicesに準拠した方法により、GRCh37の参照ゲノム配列へのマッピングおよびバリアント検知を実施した際のデータです。詳しくはこちらをご覧ください。
NBDCおよび生命情報・DDBJ センターによる加工データのID	JGAD000690 JGAD000758（joint call）加工方法はこちら
総データ量	JGAD000220：73 TB（fastq） JGAD000410：49 TB（bam、vcf） JGAD000690：52.1 TB（bam、bai、vcf、document） JGAD000758：203.8 GB（vcf_aggregate、tabix）
コメント（利用にあたっての制限事項）	NBDC policy

※日本人集団ゲノム関連解析情報データベース「Jenger」にて、当該データの概要データ（アリル頻度情報）をダウンロードできます。

JGAS000140


対象	乳がん（ICD10：C509）：7,104症例対照者：23,731名
規模	Target Capture
対象領域（Target Captureの場合）	遺伝性乳がんの原因11遺伝子（ATM, BRCA1, BRCA2, CDH1, CHEK2, NBN, NF1, PALB2, PTEN, STK11, TP53）の翻訳領域
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	2X Platinum Multiplex PCR Master Mix (Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 ^*1
断片化の方法	-
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp x 2
Japanese Genotype-phenotype Archive Dataset ID	JGAD000209
総データ量	1 TB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

※1 Hum Mol Genet. 25,:5027-5034 (2016)

hum0014.v12.T2DMwN.v1


対象	[GWAS-1] 　　２型糖尿病腎症：2,380症例、２型糖尿病対照（腎症非発症群）：5,234症例 [GWAS-2] 　　２型糖尿病腎症：429症例、２型糖尿病対照（腎症非発症群）：358症例
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [OmniExpressExome Beadchip、Human610-Quad BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Illumina OmniExpressExome Beadchip kit　 Illumina Human610-Quad Beadchip kit
遺伝子型決定アルゴリズム（ソフトウェア）	MACH and Minimac（1000 Genomes phased JPT, CHB and Han Chinese South data n = 275, March 2012） GenCall software（GenomeStudio）
関連解析（ソフトウェア）	mach2dat
フィルタリング	sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.1%, 対照者群で HWE P < 1 x 10^-6
マーカー数(QC後)	7,521,072 SNPs（hg19）
NBDC Dataset ID	hum0014.v12.T2DMwN.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	310 MB（csv.zip）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v13.T2DMmeta.v1


対象	[GWAS-1] 　　２型糖尿病（ICD-10：E11）：9,804症例、対照者：6,728名 [GWAS-2] 　　２型糖尿病（ICD-10：E11）：5,639症例、対照者：19,407名 [GWAS-3] 　　２型糖尿病（ICD-10：E11）：18,688症例、対照者：121,950名 [GWAS-4] 　　２型糖尿病（ICD-10：E11）：2,483症例、対照者：7,065名
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome、Human610-Quad BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome、Human610-Quad Beadchip kit
遺伝子型決定アルゴリズム（ソフトウェア）	minimac [imputation(1000 genomes Phase 3)] GenCall software（GenomeStudio）
関連解析（ソフトウェア）	mach2dat (v1.0.24)
フィルタリング	GenotypingのQC： GWAS1, GWAS3, GWAS4除外基準 (i) hetero count < 5 (ii) 各chipでHWE P < 1.0 × 10^-6 (iii) in-house WGSデータとのジェノタイプ一致率 < 0.99 (iv) SNV call rate < 0.99 GWAS2除外基準 (i) SNV call rate < 0.99 (ii) MAF < 0.01 (iii) differential missingness P < 1.0 × 10^-6 (iv) HWE P < 1.0 × 10^-6 ImputationのQC：リファレンスパネルで HWE P < 1 × 10^-6 もしくは MAF < 0.01を除外 3つ以上のGWASでImputation quality (Rsq) < 0.3となったものを除外
マーカー数(QC後)	12,557,761 SNPs（hg19）
NBDC Dataset ID	hum0014.v13.T2DMmeta.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	257 MB（txt）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v14.smok.v1


対象	165,436名の喫煙習慣データ
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	minimac [imputation（1000 genomes Phase I v3 ）] GenCall software（GenomeStudio）
関連解析（ソフトウェア）	BOLT-LMM（v2.2） ProbABEL（v0.4.5; for X chromosome）
フィルタリング	GenotypingのQC：sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6 Imputation referenceのQC: 　以下の条件に該当するSNVはreferenceから除外: 　1) HWE P < 1 x 10^-6、2) MAF < 0.01 Imputation後のQC: 　Imputation quality (Rsq) < 0.7 and MAF < 0.01を除外
マーカー数(QC後)	常染色体：5,961,480 SNVs（hg19）男性X染色体（喫煙開始年齢）：163,412 SNVs（hg19）女性X染色体（喫煙開始年齢）：146,130 SNVs（hg19）男性X染色体（喫煙本数）：166,111 SNVs（hg19）女性X染色体（喫煙本数）：146,114 SNVs（hg19）男性X染色体（喫煙歴）：166,138 SNVs（hg19）女性X染色体（喫煙歴）：146,146 SNVs（hg19）男性X染色体（禁煙歴の有無）：166,142 SNVs（hg19）女性X染色体（禁煙歴の有無）：146,118 SNVs（hg19）
NBDC Dataset ID	hum0014.v14.asi.v1（喫煙開始年齢） hum0014.v14.cpd.v1（喫煙本数） hum0014.v14.ens.v1（喫煙歴） hum0014.v14.fcs.v1（禁煙歴の有無）（データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	1.9 GB（txt.gz）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000114 reference panel


対象	・1,026名のWGSデータ（JGAD000220）を含むバイオバンクジャパン1,037名のWGSデータのvcfファイル（WGSデータの分子データは上記参照のこと）・1000ゲノムプロジェクト（Phase3v5）2,504名のWGSのvcfファイル（ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/）
規模	WGS解析により検出された変異情報の統合（常染色体およびX染色体上のvariants）
対象領域（Target Captureの場合）	-
クオリティコントロール方法※	We set exclusion criteria for genotypes as follows: (1) DP < 5, (2) GQ < 20, or (3) DP > 60 and GQ < 95, and regarded these genotypes as missing. Variants with call rates < 90% were excluded before variant quality score recalibration (VQSR). After VQSR, we excluded variants located in low-complexity regions (LCR), as defined by mdust software were excluded. Finally, we used BEAGLE to impute missing genotypes.
重複するリードの除去※	picard (versions 1.106)
リアライメントおよびベースクオリティのキャリブレーション※	GATK (version 3.2-2)
マッピング方法※	BWA-MEM (version 0.7.5a)
マッピングクオリティ※	MAPQ < 20 を除外（HaplotypeCaller）
マッピングの際のリファレンス配列※	GRCh37/hg19, hs37d5
平均カバー率（Depth）※	aimed at 30x depth
変異検出方法※	GATK HaplotypeCaller (version 3.2-2)
vcfファイルの統合方法	常染色体：Impute2 X染色体：Beagle（男性）、Impute2（女性）
リファレンスパネルに含まれるvariant数	61,608,817 variants（常染色体：59,387,070variants、X染色体：2,221,747variants）
Japanese Genotype-phenotype Archive Dataset ID	JGAD000220
NBDCおよび生命情報・DDBJ センターによる加工データのID	JGAD000679 加工方法はこちら
総データ量	約15 GB（vcf.gz）
コメント（利用にあたっての制限事項）	NBDC policy

※バイオバンクジャパン1037名のデータに対して実施。

hum0014.v15.ht.v1


対象	バイオバンクジャパンに参加した159,095名（男性：86,257名、女性：72,838名）
規模	genome wide variants
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	Minimac3 [imputation reference panel using WGS data of the biobank Japan project (N=1,037) and 1KGP p3v5 ALL (N=2,504)]
関連解析（ソフトウェア）	BOLT-LMM (ver2.2)、mach2qtl
フィルタリング	Sample QCs：1) call rate < 98%、2) closely related samples (PI_HAT > 0.175)、3) outlier from Japanese cluster determined by PCA using GCTA を除外。 Imputation後のQC：Imputation quality (Rsq) < 0.3　を除外。
マーカー数(QC後)	常染色体：27,211,524 variants（hg19）男性X染色体：684,533 variants（hg19）女性X染色体：684,533 variants（hg19）
NBDC Dataset ID	hum0014.v15.ht.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	約663 MB（txt.gz）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000203


対象	遺伝性前立腺がん（ICD10：C61）：7,636症例対照者：12,366名
規模	Target Capture
対象領域（Target Captureの場合）	遺伝性前立腺がんの原因8遺伝子（ATM, BRCA1, BRCA2, BRIP1, CHEK2, HOXB13, NBN, PALB2）の翻訳領域
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	2X Platinum Multiplex PCR Master Mix (Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 ^*1
断片化の方法	-
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp x 2
Japanese Genotype-phenotype Archive Dataset ID	JGAD000288
総データ量	2.2 TB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v17 / hum0014.v18 / hum0014.v21


対象	42疾患（ICD10 code）不整脈（I499）、気管支喘息（J459）、アトピー性皮膚炎（L209）、胆嚢・胆管がん（C23, C240）、白内障（H269）、脳動脈瘤（I671）、子宮頸がん（C539）、B型慢性肝炎（B181）、 C型慢性肝炎（B182）、COPD（J449）、肝硬変（K746）、大腸・直腸がん（C189, C20）、心不全（I509, I500）、薬疹（L270）、子宮体がん（C549）、子宮内膜症（N809）、てんかん（G409）、食道がん（C159）、胃がん（C169）、緑内障（H409）、バセドウ病（E050）、造血器腫瘍（C81-96）、肝がん（C220）、肺線維症（J849, J841）、脳梗塞（I639）、ケロイド（L910）、肺がん（C349）、ネフローゼ症候群（N049）、骨粗鬆症（M8199）、卵巣がん（C56）、膵がん（C259）、歯周病（K054）、ASO（I709）、花粉症（J301）、前立腺がん（C61）、肺結核（A169）、関節リウマチ（M0690）、糖尿病（E14）、尿路結石症（N209）、子宮筋腫（D259）、乳がん（C509）虚血性心疾患（I200、I209、I219）
規模	genome wide variants
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	minimac3 [imputation（1000 genomes Phase 3 v5 ）] GenCall software（GenomeStudio）
関連解析（ソフトウェア）	SAIGE（v0.29.4.2）
フィルタリング	Imputation後のQC: 　Imputation quality (Rsq) < 0.7　を除外
マーカー数(QC後)	常染色体：8,712,794 variants（hg19） X染色体：207,198 variants（hg19）
NBDC Dataset ID	不整脈	hum0014.v17.AR.v1
	気管支喘息	hum0014.v17.BA.v1
	アトピー性皮膚炎＊	hum0014.v17.AD.v1
	胆嚢・胆管がん	hum0014.v17.GCc.v1
	白内障	hum0014.v17.Cat.v1
	脳動脈瘤	hum0014.v17.CA.v1
	子宮頸がん	hum0014.v17.CeC.v1
	B型慢性肝炎	hum0014.v17.CHB.v1
	C型慢性肝炎	hum0014.v17.CHC.v1
	COPD	hum0014.v17.COPD.v1
	肝硬変	hum0014.v17.Cir.v1
	大腸・直腸がん	hum0014.v17.CC.v1
	心不全＊	hum0014.v17.HF.v1
	薬疹	hum0014.v17.DE.v1
	子宮体がん	hum0014.v17.UC.v1
	子宮内膜症	hum0014.v17.EM.v1
	てんかん	hum0014.v17.Ep.v1
	食道がん	hum0014.v17.EC.v1
	胃がん	hum0014.v17.GC.v1
	緑内障＊	hum0014.v17.Gla.v1
	バセドウ病	hum0014.v17.GD.v1
	造血器腫瘍	hum0014.v17.HT.v1
	肝がん	hum0014.v17.LiC.v1
	肺線維症	hum0014.v17.IP.v1
	脳梗塞	hum0014.v17.CI.v1
	ケロイド	hum0014.v17.Kel.v1
	肺がん	hum0014.v17.LuC.v1
	ネフローゼ症候群	hum0014.v17.NS.v1
	骨粗鬆症	hum0014.v17.OP.v1
	卵巣がん	hum0014.v17.OC.v1
	膵がん	hum0014.v17.PaC.v1
	歯周病	hum0014.v17.PD.v1
	ASO	hum0014.v17.PAD.v1
	花粉症	hum0014.v17.Hay.v1
	前立腺がん	hum0014.v17.PrC.v1
	肺結核	hum0014.v17.PT.v1
	関節リウマチ	hum0014.v17.RA.v1
	糖尿病＊	hum0014.v17.DM.v1
	尿路結石症	hum0014.v17.Uro.v1
	子宮筋腫	hum0014.v17.UF.v1
	乳がん	hum0014.v18.BC.v1
	虚血性心疾患	hum0014.v21.CAD.v1
	（データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file Sample size file
総データ量	常染色体：0.9-1.3 GB程度（txt） X染色体：20-30 MB程度（txt）
コメント（利用にあたっての制限事項）	NBDC policy

＊緑内障（hum0014.v7.POAG.v1）、心房細動（hum0014.v5.AF.v1）、アトピー性皮膚炎患（hum0014.v4.AD.v1）、２型糖尿病（hum0014.v3.T2DM-2.v1）と一部重複あり。

hum0014.v19


対象	165,084名の食習慣（13項目）
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	GenCall software（GenomeStudio） MACH minimac (v.0.1.1) [imputation（1000 genomes Phase I v3 ）]
関連解析（ソフトウェア）	BOLT-LMM（v2.2）for autosomes ProbABEL（v0.4.5）for X chromosome
フィルタリング	GenotypingのQC：sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.005 Imputation referenceのQC: 　HWE P < 1 x 10^-6、MAF < 0.01に該当するSNVを除外 Imputation後のQC: 　Imputation quality (Rsq) < 0.7 and MAF < 0.01を除外
マーカー数(QC後)	常染色体：5,961,480 variants（hg19） X染色体：148,568 variants for female、170,117 variants for male（hg19）
NBDC Dataset ID	飲酒歴の有無	hum0014.v19.drink.v1
	1週間あたりの飲酒量	hum0014.v19.dpw.v1
	コーヒー摂取頻度	hum0014.v19.cafe.v1
	緑茶摂取頻度	hum0014.v19.tea.v1
	牛乳摂取頻度	hum0014.v19.milk.v1
	ヨーグルト摂取頻度	hum0014.v19.ygt.v1
	チーズ摂取頻度	hum0014.v19.cheese.v1
	納豆摂取頻度	hum0014.v19.natto.v1
	豆腐摂取頻度	hum0014.v19.tofu.v1
	魚摂取頻度	hum0014.v19.fish.v1
	小魚摂取頻度	hum0014.v19.sfish.v1
	野菜摂取頻度	hum0014.v19.vege.v1
	肉摂取頻度	hum0014.v19.meat.v1
	（データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	各形質：約420 MB（txt.zip）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v20.cad.v1


対象	冠動脈疾患（ICD10：I20-25)：25,892症例対象者：142,336名
規模	genome wide variants
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	GenCall software（GenomeStudio） minimac3（BBJ-CAD reference panel）
関連解析（ソフトウェア）	PLINK2
フィルタリング	Imputation後のQC: Imputation quality (Rsq) < 0.3 または MAF < 0.0002 を除外
マーカー数(QC後)	常染色体：19,707,525 variants（hg19）
NBDC Dataset ID	hum0014.v20.gwas.v1（統計解析データ） hum0014.v20.prs.v1（ポリジェニックリスクスコア）（データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	約413 MB（txt.gz）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000293（Target Capture）


対象	2003年から2007年度にバイオバンク・ジャパンに登録されたサンプル（約20万例）から抽出された11,234名
規模	Target Capture
対象領域（Target Captureの場合）	下記の23遺伝子における全てのエクソン領域 ASXL1, CBL, CEBPA, DDX41, DNMT3A, ETV6, EZH2, GATA2, GNAS, GNB1, IDH1, IDH2, JAK2, KRAS, MYD88, NRAS, PPM1D, RUNX1, SF3B1, SRSF2, TET2, TP53, U2AF1
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	ライブラリ作成は下記の論文に記載された方法で実施した。 Momozawa, Y., et al. Low-frequency coding variants in CETP and CFB are associated with susceptibility of exudative age-related macular degeneration in the Japanese population. Hum Mol Genet 25, 5027-5034 (2016).
断片化の方法	-
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp
クオリティコントロール方法	Depth 20以上の領域が98%以上のサンプルを解析対象とした。
マッピング方法	bwa
マッピングクオリティ	≥40
マッピングの際のリファレンス配列	hg19
平均カバー率	x800
変異検出方法	Genomon pipeline
フィルタリング方法	Genomon pipeline
Japanese Genotype-phenotype Archive Dataset ID	JGAD000399
総データ量	5.3 MB（txt）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000293（SNPアレイ）


対象	2003年から2007年度にバイオバンク・ジャパンに登録されたサンプル（約20万例）から抽出された11,234名
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、OmniExpressExome]
ライブラリソース	末梢血から抽出したDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Illumina Infinium OmniExpress, Infinium OmniExpressExome v.1.0, or v.1.2
遺伝子型決定アルゴリズム（ソフトウェア）	GenCall software（GenomeStudio）
染色体変異検出アルゴリズム（ソフトウェア）	ハプロタイプ情報に基づくアリル不均衡の検出法（下記の論文を参照） Terao, C., et al. Chromosomal alterations among age-related haematopoietic clones in Japan. Nature (2020).
フィルタリング	上記の３バージョンのアレイの全てでカバーされているSNPsを使用した
マーカー数（QC後）	515,355
Japanese Genotype-phenotype Archive Dataset ID	JGAD000400
総データ量	5.3 MB（csv）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000327 / JGAS000346 / JGAS000414 / JGAS000347 / JGAS000592


対象	膵がん（ICD10：C25）：1,005症例大腸がん（ICD10：C18、C19、C20）：12,503症例腎がん（ICD10：C64）：740症例リンパ腫（ICD10：C81、C82、C83、C84、C85、C86、C88、C91）：1,982症例胃がん（ICD10：C16）：10,366症例対照者：23,705名＋5,996名＋37,592名
規模	Target Capture
対象領域（Target Captureの場合）	遺伝性腫瘍関連27遺伝子（APC, ATM, BARD1, BMPR1A, BRCA1, BRCA2, BRIP1, CDK4, CDKN2A, CDH1, CHEK2, EPCAM, HOXB13, NBN, NF1, MLH1, MSH2, MSH6, MUTYH, PALB2, PMS2, PTEN, RAD51C, RAD51D, SMAD4, STK11, TP53）の翻訳領域
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	2X Platinum Multiplex PCR Master Mix（Thermo Fisher Scientific）を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 ^*1
断片化の方法	-
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp x 2
Japanese Genotype-phenotype Archive Dataset ID	膵がん：JGAD000438 大腸がん：JGAD000458 23,705名の対照者：JGAD000459 腎がんと5,996名の対照者：JGAD000531 リンパ腫：JGAD000460 胃がん：JGAD000720 37,592名の対照者：JGAD000721
総データ量	JGAD000438：78 GB（fastq） JGAD000458：956 GB（fastq） JGAD000459：1.9 TB（fastq） JGAD000531：961.8 GB（fastq） JGAD000460：126 GB（fastq） JGAD000720、JGAD000721：3.4 TB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000414


対象	腎がん（ICD10：C64）：740症例対照者：5,996名
規模	Target Capture
対象領域（Target Captureの場合）	腎がん関連13遺伝子（VHL、 BAP1、FH、FLCN、MET、TSC1、TSC2、MITF、SDHA、SDHB、SDHC、SDHD、CDC73）の翻訳領域
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	2X Platinum Multiplex PCR Master Mix (Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 ^*1
断片化の方法	-
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp x 2
Japanese Genotype-phenotype Archive Dataset ID	JGAD000531
総データ量	961.8 GB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000381


対象	2003年から2017年度にバイオバンク・ジャパンに登録された症例：1,964名心筋梗塞（ICD10：I21）：1,765症例認知症（ICD10：F00-03）：199症例
規模	WGS
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq X Five]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	TruSeq DNA PCR-Free Prep kit
断片化の方法	超音波断片化
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	151 bp
クオリティコントロール方法	リードのbase qualityが全体的に悪い検体、リード毎の%GCの結果にて異常を示した検体を除去。 Alignment後、Low mapping rate検体、Insert sizeがおかしい検体、メタデータの性別情報とalingment結果より推定される性別情報が不一致な検体、性染色体異常疑いの検体を除去。 Genotyping時に、VQSR、DP/GP filter (DP < 5, GQ < 20, DP > 60 && GQ < 95を除去）、heterozygosity filter (F>=0.05 を除去)、HWE filter (p < 10-6を除去）、Repeat & Low Complexity filterを実施。 1000 genomes projectと合わせたPCAを実施し、日本人クラスタから大きく外れる検体を除外。その後、Genome-In-A-Bottleプロジェクトから公開されているHighConfidenceRegionリストに記載のある領域のバリアントにフラグを付与。
重複するリードの除去	Picard 2.10.6
リアライメントおよびベースクオリティのキャリブレーション	GATK 3.7
マッピング方法	BWA mem 0.7.12
マッピングクオリティ	GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列	GRCh37/hg19（hs37d5）
平均カバー率（Depth）	心筋梗塞：15.0x、認知症：30.0x
変異検出方法	GATK 3.7 HaplotypeCaller
SNV数（QC後）	76,768,387（常染色体） 2,898,518（X 染色体）
INDEL数（QC後）	10,202,908（常染色体） 410,435（X 染色体）
Japanese Genotype-phenotype Archive Dataset ID	JGAD000495（fastq） JGAD000496（bam、vcf）：GEnome Medical alliance Japan（GEM Japan, GEM-J）の取り組みとして、GATK Best Practicesに準拠した方法により、GRCh37の参照ゲノム配列へのマッピングおよびバリアント検知を実施した際のデータです。詳しくはこちらをご覧ください。
総データ量	188.4 TB（fastq、bam、vcf）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v27.surv.v1


対象	BBJ第1コホート：137,693名
規模	genome wide variants
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	minimac [imputation（1000 genomes Phase I v3 ）] GenCall software（GenomeStudio）
関連解析（ソフトウェア）	mach2qtl（v1.1.3） SPACox
フィルタリング	GenotypingのQC：sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6 Imputation referenceのQC: 　以下の条件に該当するSNVはreferenceから除外: 　1) HWE P < 1 x 10^-6、2) MAF < 0.01 Imputation後のQC: 　Imputation quality (Rsq) < 0.7　を除外。
マーカー数(QC後)	6,108,833 variants（hg19）
NBDC Dataset ID	hum0014.v27.surv.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	789 MB（txt.gz）
コメント（利用にあたっての制限事項）	NBDC policy

hum0014.v28.MEs.v1


対象	BBJ第1コホート4880名のWGSデータ（下記データを含む）・1,026名のWGSデータ（JGAD000220）・心筋梗塞症例1,765名および認知症症例199名のWGSデータ（JGAD000495）・胃がん症例255名のWGSデータ（AGDD_000005）・アジアゲノムプロジェクトの1007名・大腸・直腸がん症例の617名・AGDD_000005のQCで除かれた1名・JGAD000220のQCで除かれた10名
規模	mobile element多型頻度情報
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq X/2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	TruSeq DNA PCR-Free Sample Prep Kit、TruSeq Nano DNA HT Sample Prep Kit
断片化の方法	超音波断片化
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	151 bp（HiSeq X）、126 bp（HiSeq 2500）
クオリティコントロール方法	-
マッピング方法	BWA-MEM
マッピングクオリティ	-
マッピングの際のリファレンス配列	GRCh37（hs37d5）
平均カバー率（Depth）	15×以上（内、1235名：25×以上）
mobile element検出方法	MEGAnE ^*2
mobile element数	24,933（4880名） 10,997（1235名）
NBDC Dataset ID	hum0014.v28.MEs.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	1.1 MB（txt.gz）
コメント（利用にあたっての制限事項）	NBDC policy

※2 doi: 10.1101/2022.03.25.485726

hum0014.v29.AF.v1


対象	心房細動（ICD10：I48）：77,690症例、対照者：1,167,040名 BBJ：心房細動：9,826症例、対照者：140,446名欧米人：心房細動：60,620症例、対照者：970,216名 FinnGen：心房細動：7,244症例、対照者：56,378名
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース	末梢血から抽出したgDNA 欧米GWAS：http://csg.sph.umich.edu/willer/public/afib2018 FinnGen GWAS：https://www.finngen.fi/en
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム（ソフトウェア）	GenCall software（GenomeStudio） minimac [imputation（1000 genomes Phase I v3 ）]
関連解析（ソフトウェア）	PLINK2
フィルタリング	BBJ GWAS：imputation quality（Rsq） < 0.3 または MAF < 0.001 を除外メタ解析GWAS：MAF < 1% を除外
ポリジェニックリスクスコア算出方法	Pruning and thresholding method
メタ解析方法	MANTRA、METAL
マーカー数(QC後)	BBJ GWAS：16,817,144 SNPs メタ解析GWAS：5,158,449 SNPs
NBDC Dataset ID	hum0014.v29.AF.v1 （データのダウンロードは上記Dataset IDをクリックしてください） Dictionary file
総データ量	BBJのGWAS集計情報：424 MB（txt）メタ解析のGWAS集計情報：78 MB（txt）ポリジェニックリスクスコア：59 KB（txt）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000647


対象	2003年から2007年度にバイオバンク・ジャパンに登録された47疾患患者：1,007名
規模	WGS
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq X Five]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	TruSeq Nano DNA Library Preparation Kit
断片化の方法	超音波断片化
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	150 bp
クオリティコントロール方法	・常染色体，X PAR，X NonPAR 女性 DP < 2 または GQ < 20 の genotype を missing に設定，call rate < 90% を除外・X NonPAR 男性，Y DP < 1 または GQ < 20 の genotype を missing に設定，call rate < 90% を除外・X NomPAR 女性の HWE_P
重複するリードの除去	Picard 2.10.10
リアライメントおよびベースクオリティのキャリブレーション	GATK 3.8
マッピング方法	BWA-MEM（version 0.7.13）
マッピングクオリティ	GATK 3.8 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列	hs37d5
平均カバー率（Depth）	19.93455
変異検出方法	GATK Haplotype Caller（version 3.8）
SNV数（QC後）	常染色体：71,643,487 X PAR：82,997 X nonPAR：2,618,495 Y染色体：171,271 ※ AC=0を含むレコード数
Japanese Genotype-phenotype Archive Dataset ID	JGAD000777
総データ量	41.6 TB（fastq、 vcf）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000698


対象	バイオバンク・ジャパン第1コホートに含まれる胃がん（ICD10：C16）：256症例
規模	WGS
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	TruSeq Nano DNA Library Preparation Kit
断片化の方法	超音波断片化
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	2 × 125 bp
Japanese Genotype-phenotype Archive Dataset ID	JGAD000831
総データ量	21.5 TB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000703


対象	バイオバンク・ジャパン第1コホートおよび第２コホートに含まれる51疾患いずれかの患者：26.9万名（重複を含む）
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanHap550、Human610-Quad v1、HumanExome-12 v1、Infinium OmniExpress-24、Infinium HumanOmniExpressExome-8、Infinium HumanOmniExpressExome-8 v1.2、Infinium HumanOmniExpressExome-8 v1.3、Infinium HumanOmniExpressExome-8 v1.4、Infinium HumanOmniExpressExome-8 v1.6]
ライブラリソース	末梢血から抽出したDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanHap550 kit、Human610-Quad kit v1、HumanExome-12 kit v1、Infinium OmniExpress-24 kit、Infinium HumanOmniExpressExome-8 kit、Infinium HumanOmniExpressExome-8 kit v1.2、Infinium HumanOmniExpressExome-8 kit v1.3、Infinium HumanOmniExpressExome-8 kit v1.4、Infinium HumanOmniExpressExome-8 kit v1.6
遺伝子型決定アルゴリズム（ソフトウェア）	-
フィルタリング	-
マーカー数（QC後）	-
Japanese Genotype-phenotype Archive Dataset ID	JGAD000836
総データ量	3.1 TB（idat）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000699


対象	バイオバンク・ジャパン第1コホートおよび第２コホートに含まれる大腸がん（ICD10：C18、C19、C20）：617症例
規模	WGS
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	TruSeq Nano DNA Library Preparation Kit
断片化の方法	超音波断片化
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	2 × 125 bp
Japanese Genotype-phenotype Archive Dataset ID	JGAD000832
総データ量	25.5 TB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000700 / JGAS000701


対象	バイオバンク・ジャパン第1コホートに含まれる糖尿病（ICD10：E11）：2,162症例バイオバンク・ジャパン第1コホートに含まれる胃がん（ICD10：C16）：2,067症例
規模	WGS
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	TruSeq Nano DNA Library Preparation Kit
断片化の方法	超音波断片化
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	2 × 125 bp
Japanese Genotype-phenotype Archive Dataset ID	糖尿病：JGAD000833 胃がん：JGAD000834
総データ量	JGAD000833：20.0 TB（fastq） JGAD000834：18.7 TB（fastq）
コメント（利用にあたっての制限事項）	NBDC policy

TogoImputation reference panel（JGAD000867 / JGAD000868）


対象	【JGAD000867】バイオバンクジャパン1,026名のWGSデータ（JGAD000220）のvcfファイル（WGSデータの分子データは上記参照のこと）【JGAD000868】バイオバンクジャパン1,964名のWGSデータ（JGAD000495）のvcfファイル（WGSデータの分子データは上記参照のこと）
規模	WGS解析により検出された変異情報から遺伝型インピュテーションパネルを作成（常染色体およびX染色体上のvariants）
対象領域（Target Captureの場合）	-
クオリティコントロール方法	生殖系列（germline）の全ゲノムシークエンスデータの加工を行い、aggregate VCFを計算した。その後、下記の条件でvariantsのフィルタリングを行った。 (1) VQSRフィルタを通過しなかったvariantsの除外 (2) Multi-allelic sitesの除外 (3) Call rate が低い（95%未満）variantsの除外 (4) Hardy-Weinberg平衡から逸脱している（P<1e-10）variantsの除外 (5) Minor allele count（MAC）が小さい（< 2）variantsの除外
重複するリードの除去	GATK MarkDuplicates（version 4.1.0.0）
リアライメントおよびベースクオリティのキャリブレーション	-
マッピング方法	bwa mem（version 0.7.15）
マッピングクオリティ	-
マッピングの際のリファレンス配列	GRCh38
平均カバー率（Depth）	Mean ± Standard deviation JGAD000867：28.70 ± 4.16 JGAD000868：19.61 ± 5.41
変異検出方法	GATK HaplotypeCaller -ERC GVCF（version 4.1.0.0）バリアント検出時のパラメータである ploidy は次のように設定した。常染色体および pseudoautosomal region（PAR）領域：ploidy=2 X染色体のnon-PAR領域：ploidy=2（女性）および ploidy=1（男性） Y染色体の non-PAR 領域：ploidy=1（男性）
vcfファイルのphasing方法	クオリティコントロール後、beagle program version 5.2（21Apr21.304）を用いてphasingを行った。
リファレンスパネルに含まれるvariant数	JGAD000867：17,167,510 variants（常染色体：16,677,000 variants、X染色体：490,510 variants） JGAD000868：21,596,248 variants（常染色体：21,157,732 variants、X染色体：438,516 variants）
Japanese Genotype-phenotype Archive Dataset ID	JGAD000220 JGAD000495
NBDCおよび生命情報・DDBJ センターによる加工データのID	JGAD000867 JGAD000868 加工方法はこちら
総データ量	JGAD000867：3.3 GB（vcf.gz） JGAD000868：6.2 GB（vcf.gz）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000738


対象	【WGS】 BBJ第1コホート：7,472名 15-30×深度：3,256名、3×深度：4,216名（下記データを含む）・2003年から2007年度にバイオバンク・ジャパンに登録された47疾患患者 1,026名（JGAD000220）・バイオバンク・ジャパン第1コホートに含まれる胃がん 256名（JGAD000831）・2003年から2017年度にバイオバンク・ジャパンに登録された症例 1,964名（JGAD000495）・バイオバンク・ジャパン第1コホートに含まれる糖尿病のうち 2,157名（JGAD000833）・バイオバンク・ジャパン第1コホートに含まれる胃がんのうち 2,059名（JGAD000834）【reference panel】・BBJ第1コホート7,472名のWGSのvcfファイル・1000ゲノムプロジェクト（Phase3v5）2,504名のWGSのvcfファイル（ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/）
規模	WGS WGS解析により検出された変異情報の統合（常染色体上のvariants）
対象領域（Target Captureの場合）	-
Platform	Illumina [HiSeq 2500/X Five]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	TruSeq Nano DNA Library Preparation Kit
断片化の方法	超音波断片化
ライブラリ構築方法	Paired-end
リード長（除：バーコード、アダプタ、プライマー、リンカー）	125 bp x 2、126 bp x 2、151 bp x 2、161 bp x 2
クオリティコントロール方法	We set exclusion criteria for genotypes sequenced at high depth (30x and 15x) as follows: (1) DP < 5, (2) GQ < 20, or (3) DP > 60 and GQ < 95, and regarded these genotypes as missing. Variants with call rates < 90% were excluded before variant quality score recalibration (VQSR). After VQSR, variants located in low-complexity regions (LCR), as defined by mdust software, were excluded in the high depth (30x) dataset. Finally, we used BEAGLE to impute missing genotypes.
重複するリードの除去	15-30×深度：Picard 2.10.6 3×深度：Picard 1.106、2.5.0
リアライメントおよびベースクオリティのキャリブレーション	GATK v.3.2-2
マッピング方法	15-30×深度：BWA mem 0.7.12 3×深度：BWA mem 0.7.5a
マッピングクオリティ	15-30×深度：GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20 のリードを除外 3×深度：GotCloudで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列	GRCh37
平均カバー率（Depth）	30×、15×、3×
変異検出方法	15-30×深度：GATK 3.7 HaplotypeCaller 3×深度：GotCloud v1.17.5
SNV数（QC後）	80,753,886
INDEL数（QC後）	4,535,276
vcfファイルの統合方法	Impute2
リファレンスパネルに含まれるvariant数	85,328,475 variants
Japanese Genotype-phenotype Archive Dataset ID	JGAD000873
総データ量	40.5 GB（vcf）
コメント（利用にあたっての制限事項）	NBDC policy

提供者情報

研究代表者： 久保充明

所属機関： 理化学研究所統合生命医科学研究センター疾患多様性医科学研究部門

プロジェクト/研究グループ名： オーダーメイド医療の実現プログラム

URL： http://www.biobankjp.org/index.html

科研費/助成金（Research Project Number）：

科研費・助成金名	タイトル	研究課題番号
文部科学省科学技術試験研究委託事業費	オーダーメイド医療の実現プログラム（第3期）	-
日本医療研究開発機構（AMED）オーダーメイド医療の実現プログラム	疾患関連遺伝子等の探索を効率化するための遺伝子多型情報の高度化	JP17km0305002
日本医療研究開発機構（AMED）次世代がん医療創生研究事業（P-CREATE）	大規模シーケンス解析に基づく、造血器腫瘍のゲノム、エピゲノムにおける、空間的・時間的多様性の研究	JP19cm010650
日本医療研究開発機構革新的先端研究開発支援事業（AMED-CREST）	加齢や炎症に伴う組織の再構築と機能低下	JP19gm1110011
科学研究費助成事業基盤研究（S）	先端ゲノミクスを駆使したがんの初期発生とクローン進化に関わる分子基盤の解明	19H05656
日本医療研究開発機構（AMED）疾病克服に向けたゲノム医療実現プロジェクトゲノム創薬基盤推進研究事業	乳がん・大腸がん・膵がんに対する適切な薬剤投与を可能にする大規模データ基盤の構築	JP19kk0305010
科学研究費助成事業若手研究	転移因子の挿入多型と疾患とのゲノムワイド関連解析	22K15385
科学研究費助成事業基盤研究（B）	心不全発症の基盤となる心筋脆弱性を規定する遺伝要因の解明	21H02919
科学研究費助成事業基盤研究（S）	ゲノム免疫：内在性ウイルスの抗ウイルス活性の動作原理解明と機能資源としての確保	20H05682
科学研究費助成事業基盤研究（B）	ヘルペスウイルスのゲノムへの組み込みと再活性化: 大規模解析から探る疾患との関連	21H02972
日本医療研究開発機構（AMED）ゲノム医療実現バイオバンク利活用プログラム（B-Cure）	利活用を目的とした日本疾患バイオバンクの運営・管理	JP19km0605001
日本医療研究開発機構（AMED）循環器疾患・糖尿病等生活習慣病対策実用化研究事業	心房細動・重篤合併症予防を実現する多層的・統合的エビデンス創出研究	JP22ek0210164
日本医療研究開発機構（AMED）ゲノム医療実現バイオバンク利活用プログラム	全ゲノム解析と組織オミックス解析による心房細動の病態解明と精密医療	JP21tm0724601
日本医療研究開発機構（AMED）ゲノム医療実現バイオバンク利活用プログラム	マルチオミックス連関による循環器疾患における次世代型精密医療の実現	JP20km0405209
日本医療研究開発機構（AMED）難治性疾患実用化研究事業	難治性心血管疾患におけるマルチオミックス解析による病態解明と精密医療	JP20ek0109487

	タイトル	DOI	データID
1	A genome-wide association study identifies PLCL2 and AP3D1-DOT1L-SF3A2 as new susceptibility loci for myocardial infarction in Japanese.	doi:10.1038/ejhg.2014.110	hum0014.v1.freq.v1
2	A functional variant in ZNF512B is associated with susceptibility to amyotrophic lateral sclerosis in Japanese.	doi:10.1093/hmg/ddr268	hum0014.v2.jsnp.92als.v1
3	Functional variants in ADH1B and ALDH2 coupled with alcohol and smoking synergistically enhance esophageal cancer risk.	doi: 10.1053/j.gastro.2009.07.070	hum0014.v2.jsnp.182ec.v1
4	SNPs in KCNQ1 are associated with susceptibility to type 2 diabetes in East Asian and European populations.	doi: 10.1038/ng.208	T2DM (JSNP)
5	Common variants in a novel gene, FONG on chromosome 2q33.1 confer risk of osteoporosis in Japanese.	doi: 10.1371/journal.pone.0019641	Osteoporosis (JSNP)
6	Genome-wide association studies in the Japanese population identify seven novel loci for type 2 diabetes.	doi: 10.1038/ncomms10531	hum0014.v3.T2DM-1.v1 hum0014.v3.T2DM-2.v1
7	Multi-ancestry genome-wide association study of 21,000 cases and 95,000 controls identifies new risk loci for atopic dermatitis.	doi: 10.1038/ng.3424	hum0014.v4.AD.v1
8	Genome-wide association study identifies eight new susceptibility loci for atopic dermatitis in the Japanese population.	doi: 10.1038/ng.2438	hum0014.v4.AD.v1
9	Identification of six new genetic loci associated with atrial fibrillation in the Japanese population.	doi: 10.1038/ng.3842	hum0014.v5.AF.v1
10	Genome-wide association study identifies 112 new loci for body mass index in the Japanese population.	doi:10.1038/ng.3951	hum0014.v6.158k.v1 JGAD000123 JGAD000124
11	Genome-wide association study identifies seven novel susceptibility loci for primary open-angle glaucoma.	doi: 10.1093/hmg/ddy053	hum0014.v7.POAG.v1
12	Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases.	doi:10.1038/s41588-018-0047-6	hum0014.v8.58qt.v1 JGAD000144-JGAD000201
13	Elucidating the genetic architecture of reproductive ageing in the Japanese population	doi: 10.1038/s41467-018-04398-z	hum0014.v9.Men.v1 hum0014.v9.MP.v1
14	Deep whole-genome sequencing reveals recent selection signatures linked to evolution and disease risk of Japanese.	doi: 10.1038/s41467-018-03274-0	JGAD000220
15	Germline pathogenic variants of 11 breast cancer genes in 7,051 Japanese patients and 11,241 controls.	doi: 10.1038/s41467-018-06581-8	JGAD000209
16	A Variant within the FTO confers susceptibility to diabetic nephropathy in Japanese patients with type 2 diabetes	doi: 10.1371/journal.pone.0208654	hum0014.v12.T2DMwN.v1
17	Identification of 28 new susceptibility loci for type 2 diabetes in the Japanese population	doi: 10.1038/s41588-018-0332-4	hum0014.v13.T2DMmeta.v1
18	GWAS of smoking behaviour in 165,436 Japanese people reveals seven new loci and shared genetic architecture.	doi: 10.1038/s41562-019-0557-y	hum0014.v14.asi.v1 hum0014.v14.cpd.v1 hum0014.v14.ens.v1 hum0014.v14.fcs.v1
19	Characterizing rare and low-frequency height-asssociated variants in the Japanese population	doi: 10.1038/s41467-019-12276-5	JGAD000220 (fastq) JGAD000220 (reference panel) hum0014.v15.ht.v1
20	Germline pathogenic variants in 7,636 Japanese patients with prostate cancer and 12,366 controls.	doi: 10.1093/jnci/djz124	JGAD000288
21	Large-scale genome-wide association study in a Japanese population identifies novel susceptibility loci across different diseases	doi: 10.1038/s41588-020-0640-3	hum0014.v17 hum0014.v18 hum0014.v21
22	GWAS of 165,084 Japanese individuals identified nine loci associated with dietary habits	doi: 10.1038/s41562-019-0805-1	hum0014.v19
23	Population-specific and transethnic genome-wide analyses identify distinct and shared genetic risk loci for coronary artery disease.	doi: 10.1038/s41588-020-0705-3	hum0014.v20.cad.v1
24	Genetic characterization of pancreatic cancer patients and prediction of carrier status of germline pathogenic variants in cancer-predisposing genes	doi: 10.1016/j.ebiom.2020.103033	JGAD000438
25	Population-based Screening for Hereditary Colorectal Cancer Variants in Japan	doi: 10.1016/j.cgh.2020.12.007	JGAD000458 JGAD000459
26	Genome-wide association study reveals BET1L associated with survival time in the 137,693 Japanese individuals.	doi: 10.1038/s42003-023-04491-0	hum0014.v27.surv.v1
27	Cross-ancestry genome-wide analysis of atrial fibrillation unveils disease biology and enables cardioembolic risk prediction	doi: 10.1038/s41588-022-01284-9	hum0014.v29.AF.v1
28	Association between germline pathogenic variants in cancer-predisposing genes and lymphoma risk	doi: 10.1111/cas.15522	JGAD000460 JGAD000721
29	Helicobacter pylori, Homologous-Recombination Genes, and Gastric Cancer	doi: 10.1056/NEJMoa2211807	JGAD000720 JGAD000721
30	Germ line DDX41 mutations define a unique subtype of myeloid neoplasms	doi: 10.1182/blood.2022018221	JGAD000399 JGAD000400
31	Combined landscape of single-nucleotide variants and copy number alterations in clonal hematopoiesis	doi: 10.1038/s41591-021-01411-9	JGAD000399 JGAD000400
32	Characterizing rare and low-frequency height-associated variants in the Japanese population	doi: 10.1038/s41467-019-12276-5	JGAD000777
33	Chromosomal alterations among age-related haematopoietic clones in Japan	doi: 10.1038/s41586-020-2426-2	JGAD000777 JGAD000836
34	Detection of trait-associated structural variations using short-read sequencing	doi: 10.1016/j.xgen.2023.100328	JGAD000831
35	Population-specific reference panel improves imputation quality for genome-wide association studies conducted on the Japanese population		JGAD000873

制限公開データの利用者一覧

研究代表者	所属機関	国・州名	研究題目	利用データID	利用期間
Mark Daly	Broad Institute of MIT and Harvard			JGAD000101, JGAD000102, JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2018/09/11-2023/07/31
岡田随象	大阪大学大学院医学系研究科・遺伝統計学			JGAD000101, JGAD000102, JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2018/09/20-2021/03/31
上辻茂男	株式会社スタージェン			JGAD000123	2018/10/04-2019/03/31
徳永勝士	東京大学大学院医学系研究科人類遺伝学教室			JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2018/11/13-2026/11/08
角田達彦	東京医科歯科大学・難治疾患研究所・医科学数理分野		オーダーメイド医療のためのビッグデータ解析に関する研究	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2018/12/18-2021/06/19
Liming Liang	Harvard T.H. Chan School of Public Health, Department of Epidemiology			JGAD000123	2019/01/21-2021/12/31
長崎正朗	京都大学大学院医学研究科附属ゲノム医学センター学際融合教育研究推進センター		日本人大規模全ゲノム情報を基盤とした多因子疾患関連遺伝子の同定を加速する情報解析技術の開発と応用（ゲノム情報解析技術開発）	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2019/01/31-2027/03/31
小川誠司	京都大学大学院医学研究科腫瘍生物学講座			JGAD000209	2019/02/04-2021/03/31
上辻茂男	株式会社スタージェン			JGAD000123	2019/03/13-2022/03/31
河野隆志	国立研究開発法人国立がん研究センター			JGAD000123, JGAD000124, JGAD000220	2019/04/15-2019/12/31
堀江重郎	順天堂大学大学院医学研究科・遺伝子疾患先端情報学			JGAD000123, JGAD000220	2019/05/14-2024/03/31
角田達彦	東京医科歯科大学・難治疾患研究所・医科学数理分野		オーダーメイド医療のためのシーケンス、画像データなどの解析に関する研究	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2019/06/06-2023/08/31
木下健吾	東北大学東北メディカル・メガバンク機構		日本人全ゲノムデータベースの構築	JGAD000220	2019/06/24-2022/03/31
白石航也	国立研究開発法人国立がん研究センター研究所ゲノム生物学研究分野		ゲノム解析に基づく宿主並びに腫瘍における免疫応答ネットワーク機構の解明	JGAD000124	2019/08/05-2023/03/31
上辻茂男	株式会社スタージェン　統計解析事業部		尿酸代謝に関連する遺伝子を操作変数としたメンデル無作為化解析	JGAD000123, JGAD000124, JGAD000146, JGAD000148, JGAD000149, JGAD000155, JGAD000156, JGAD000157, JGAD000174, JGAD000188	2019/08/16-2024/03/31
上辻茂男	株式会社スタージェン　統計解析事業部		網羅的な臨床検査値のメンデル無作為解析	JGAD000123, JGAD000124, JGAD000144-JGAD000201	2019/08/22-2024/03/31
小笠原理	国立遺伝学研究所生命情報・DDBJセンター		JGA/AGDゲノムデータを利用したヒトゲノム解析ワークフローの評価	JGAD000123, JGAD000220	2019/10/11-2024/03/31
小川誠司	京都大学医学研究科		造血器腫瘍における遺伝子異常の網羅的解析	JGAD000102, JGAS000123, JGAD000220	2019/11/14-2024/03/31
岡﨑康司	順天堂大学大学院医学研究科難治性疾患診断・治療学		疾患コホート研究ネットワークによる疾患マーカー探索研究	JGAD000123	2020/06/04-2023/03/31
秦千比呂	国立遺伝学研究所生命情報・DDBJセンター		日本人乳癌患者シーケンスデータにおけるhypomorphic変異同定	JGAD000209	2020/06/04-2023/03/31
河合洋介	国立国際医療研究センターゲノム医科学プロジェクト		ヤポネシア人の起源をさぐるための現代人ゲノム塩基配列の大規模解析	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2020/06/19-2022/03/31
岩田仲生	藤田医科大学医学部精神神経科学		遺伝子解析によるこころの健康とこころの病気に対するかかりやすさ（発症脆弱性）や薬の効きめや副作用（治療反応性）等の解明に関する研究	JGAD000123, JGAD000124	2020/08/17-2022/12/31
Atray Dixit	Coral Genomics, Inc.		Derivation and Evaluation of Functional Response Scores	JGAD000101, JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2020/08/24-2021/07/21
Hae Kyung Im	Biological Sciences Division, University of Chicago		Predicted Gene Expression: High Power, Mechanism, and Direction of Effect	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2020/09/15-2023/06/23
Hongyu Zhao	Department of Biostatistics, Yale School of Public Health		Leveraging multi-ethnic data and functional annotations in causal variant identification, genetic correlation estimation, and genetic risk prediction	JGAD000101, JGAD000102, JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2020/09/24-2024/03/01
Charleston Chiang	Center for Genetic Epidemiology, Keck School of Medicine, University of Southern Califolnia		Investigating the evolution of complex genetic architecture in participants of Biobank Japan	JGAD000101, JGAD000102, JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2020/09/28-2025/07/01
上辻茂男	株式会社スタージェン　統計解析事業部		ステント血栓症発症の遺伝的要因の探索のためのゲノムワイド関連研究	JGAD000123, JGAD000124, JGAD000145, JGAD000146, JGAD000149, JGAD000151, JGAD000155, JGAD000156, JGAD000158, JGAD000159, JGAD000163, JGAD000165-JGAD000167, JGAD000170, JGAD000172-JGAD000175, JGAD000182, JGAD000187-JGAD000189, JGAD000192-JGAD000196, JGAD000200, JGAD000201	2020/10/26-2025/03/31
Ali Torkamani	Scripps Research Institute		Genomics Deep Learning	JGAD000101, JGAD000102, JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2020/11/16-2023/07/10
中山一大	東京大学大学院新領域創成科学研究科先端生命科学専攻		褐色脂肪組織活性に寄与するゲノム多型の探索	JGAD000123, JGAD000124	2020/11/26-2023/09/18
藤尾圭志	東京大学大学院医学系研究科アレルギー・リウマチ内科		日本人免疫細胞eQTLデータと日本人大規模GWASデータの統合解析	JGAD000101, JGAD000102, JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2020/12/14-2025/03/31
菊地正隆	東京大学大学院新領域創成科学研究科	日本	日本人リファレンスパネルを用いたゲノムデータ補完	JGAD000220	2020/12/14-2027/06/31
松田文彦	京都大学大学院医学研究科附属ゲノム医学センター		日本人の遺伝的多様性の解明（G751-5）	JGAD000220	2021/01/05-2025/03/31
野口恵美子	筑波大学医学医療系		アレルギー疾患における遺伝要因の探索研究	JGAD000220	2021/03/16-2032/03/31
佐藤憲子	東京医科歯科大学難治疾患研究所分子疫学		地域コホート縦断データに基づく肥満・糖尿病発症・進行の遺伝・環境リスクの解析	JGAD000220	2021/04/09-2023/03/31
河野隆志	国立研究開発法人国立がん研究センター研究所ゲノム生物学研究分野		AYA(Adolescence and Young Adult)世代がんの個別化予防に資する遺伝要因の同定を目指す研究	JGAD000209, JGAD000220	2021/05/20-2025/03/31
永田安伸	日本医科大学血液内科		新たな遺伝学的異常を用いた造血器腫瘍発症メカニズムの探索	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2021/05/26-2026/03/31
川上純	長崎大学病院リウマチ・膠原病内科		免疫チェックポイント阻害薬ニボルマブが誘発する1型糖尿病、間質性肺疾患の発症に関連する原因遺伝子多型・変異の探索的研究	JGAD000220	2021/06/14-2022/03/30
藤本明洋	東京大学大学院医学系研究科人類遺伝学教室		全ゲノムシークエンスデータの解析による突然変異・遺伝的多様性・転写異常の包括的解析	JGAD000220, JGAD000410	2021/09/16-2024/11/30
朝野仁裕	大阪大学医学系研究科循環器内科学		遺伝性心血管疾患の感受性遺伝子解析研究	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2021/07/16-2022/05/31
増子裕典	筑波大学呼吸器内科		炎症性肺疾患の遺伝素因に関する研究	JGAD000123	2021/08/11-2023/03/31
河野隆志	国立研究開発法人国立がん研究センター研究所ゲノム生物学研究分野		AYA（Adolescence and Young Adult）世代がんの個別化予防に資する遺伝要因の同定を目指す研究	JGAD000209, JGAD000220	2021/09/27-2025/03/31
松田文彦	国立研究開発法人国立がん研究センター研究所ゲノム生物学研究分野		オーダーメイド医療開発プロジェクト	JGAD000123, JGAD000220	2021/09/27-2025/03/31
松田喬	アステラス製薬株式会社アドバンストインフォマティクス＆アナリティクス室		肝がん並びにB型肝炎発症と遺伝子多型の相関に関する検討	JGAD000102, JGAD000123	2021/11/05-2022/07/31
野口恵美子	筑波大学医学医療系遺伝医学		食物アレルギーの発症要因の解明	JGAD000220	2021/12/03-2025/03/31
河合洋介	東京大学医科学研究所人癌病因遺伝子分野		集団遺伝学的解析による日本人集団のなりたちの解析	JGAD000123	2021/12/08-2023/03/31
二宮利治	九州大学大学院医学研究院　衛生・公衆衛生学分野		健康長寿社会の実現を目指した大規模認知症コホート研究（JPSC-AD）	JGAD000220	2021/12/08-2026/02/28
Joshua Chiou	Pfizer Internal Medicine Research Unit		Evaluating GWAS associations from Biobank Japan to Support Confidence in Rationale for Therapeutic Targets	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2022/01/27-2022/12/31
Gil McVean	Genomics plc	イギリス	Development of polygenic risk scores in diverse ancestries for diseases, traits and conditions	JGAD000101, JGAD000102	2022/07/19-2025/07/01
Gil McVean	Genomics plc	イギリス	Using large-scale reference panels for imputation and ancestry analysis to support target discovery and polygenic risk score models	JGAD000220, JGAD000410	2022/08/04-2025/08/01
中岡博史	公益財団法人佐々木研究所腫瘍ゲノム研究部	日本	大規模シーケンスデータを用いた乳がん関連遺伝子における活性低下型変異の研究	JGAD000209	2022/08/17-2024/03/31
野口恵美子	筑波大学医学医療系遺伝医学	日本	炎症性肺疾患の遺伝素因に関する研究	JGAD000220	2022/09/19-2027/03/31
Nuria Lopez-Bigas	Institute for Research in Biomedicine (IRB Barcelona)	スペイン	Study of the genetic basis of clonal hematopoiesis	JGAD000399, JGAD000400	2022/11/06-2025/08/01
山崎慶子	千葉大学大学院医学研究院公衆衛生学	日本	炎症性腸疾患における分子標的薬の効果予測システムの構築	JGAD000220	2022/11/09-2025/03/31
鬼頭良輔	信州大学医学部耳鼻咽喉科頭頸部外科	日本	突発性難聴の発症・治療効果に関する遺伝子解析	JGAD000123	2022/12/19-2027/03/31
上辻茂男	株式会社スタージェン統計解析事業部	日本	斜視の遺伝的要因の検証のためのゲノムワイド関連研究	JGAD000123	2023/02/13-2027/02/28
由良敬	お茶の水女子大学大学院人間文化創成科学研究科	日本	がん抑制遺伝子BRCA1バリアントの表現型予測に関するデータ解析研究	JGAD000220	2023/03/16-2025/03/31
尾内善広	千葉大学大学院医学研究院公衆衛生学	日本	川崎病の関連遺伝子解析に関する多施設共同研究	JGAD000220	2023/03/30-2025/03/31
尾内善広	千葉大学大学院医学研究院公衆衛生学	日本	新型コロナワクチンへの抗体応答の個人差の遺伝的背景に関する研究	JGAD000220	2023/04/19-2025/12/31
加藤　正樹	関西医科大学	日本	精神疾患個別化治療アルゴリズムの構築を目的とする生物学的反応因子の探索・検証試験	JGAD000101, JGAD000102, JGAD000123, JGAD000220	2023/08/25-2028/06/30
木村大樹	名古屋大学大学院医学系研究科	日本	遺伝子解析による脳とこころの病気に対するかかりやすさ（発症脆弱性）や薬の効きめや副作用（治療反応性）等の解明に関する研究	JGAD000220	2023/11/17-2025/10/28
寺尾知可史	理化学研究所生命医学研究センター	日本	ゲノミクス情報を基盤とした個別化医療の研究	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2023/11/21-2026/03/31
持田泰寛	湘南鎌倉総合病院腎臓病総合医療センター	日本	日本人におけるクローン性造血と慢性腎臓病進展への関連に関する後ろ向きコホート研究	JGAD000399, JGAD000400	2024/02/07-2027/03/31
三嶋博之	長崎大学原爆後障害医療研究所	日本	ヒト全ゲノムシークエンシングにおけるバッチ効果軽減方法の開発	JGAD000220	2024/04/17-2027/03/31
寺尾知可史	静岡県立総合病院臨床研究部	日本	ヒト形質関連遺伝因子に関する研究	JGAD000220, JGAD000495, JGAD000777	2024/04/17-2028/12/03
松田浩一	東京大学大学院新領域創成科学研究科メディカル情報生命専攻	日本	疾患コホート研究ネットワークによる疾患マーカー探索研究	JGAD000209, JGAD000220, JGAD000288, JGAD000438, JGAD000458-JGAD000460, JGAD000495, JGAD000531, JGAD000720, JGAD000721, JGAD000777, JGAD000831-JGAD000834	2024/06/17-2029/03/31
長﨑正朗	九州大学生体防御医学研究所高深度オミクスサイエンスセンターバイオメディカル情報解析分野	日本	日本人大規模全ゲノム情報を基盤とした多因子疾患関連遺伝子の同定を加速する情報解析技術の開発と応用（ゲノム情報解析技術開発）	JGAD000123, JGAD000124, JGAD000144-JGAD000201, JGAD000220	2024/06/24-2027/03/31
白石航也	国立がん研究センター研究所臨床ゲノム解析部門	日本	肺がんの個別化予防に資する遺伝要因の同定を目指す研究	JGAD000123	2024/06/24-2025/12/31
寺尾知可史	理化学研究所生命医学研究センター	日本	ゲノミクス情報を基盤とした個別化医療の研究	JGAD000836	2024/07/08-2026/03/31
寺尾知可史	静岡県立総合病院臨床研究部	日本	ヒト形質関連遺伝因子に関する研究	JGAD000836	2024/07/16-2028/12/03
莚田泰誠	理化学研究所生命医科学研究センターファーマコゲノミクス研究チーム	日本	薬疹関連遺伝子の探索	JGAD000220	2024/08/01-2028/03/31
中杤昌弘	名古屋大学大学院医学系研究科総合保健学専攻実社会情報健康医療学	日本	筋萎縮性側索硬化症の発症・進行・予後に関与する遺伝因子の探索	JGAD000679	2024/08/27-2030/03/31

研究内容の概要

分子データ

提供者情報

関連論文

制限公開データの利用者一覧