NBDC Research ID: hum0014.v15

最新版はこちらです

研究内容の概要

目的: 日本人における疾患関連遺伝子の特定

方法: Human610-Quad BeadChip、HumanHap550v3 Genotyping BeadChip、HumanOmniExpress-12 BeadChip、HumanExome BeadChip、 OmniExpressExome Beadchip(Illumina社)、high-density oligonucleotide arrays (Perlegen Sciences社)、もしくはインベーダー法(Hologic Japan社)により遺伝子型を決定し、心筋梗塞、2型糖尿病、アトピー性皮膚炎、心房細動、Body Mass Index(BMI)、開放隅角緑内障、58形質、初潮・閉経年齢、喫煙習慣、および身長のゲノムワイド関連解析(Genome Wide Association Study:GWAS)や2型糖尿病腎症および2型糖尿病発症のGWASメタ解析を実施。また、Illumina社 HiSeq2500を用いて、BBJ第1コホート1026名の全ゲノムシークエンス(Whole Genome Sequencing:WGS)および遺伝性乳がん原因11遺伝子翻訳領域のTarget Capture Sequencingを実施した。バイオバンクジャパン1037名のWGSデータから作成したvcfファイルと1000ゲノムプロジェクト(Phase3v5)2504名のvcfファイルを統合し、genotype imputation用reference panelを作成した。

対象: オーダーメイド医療実現化プロジェクトおよびオーダーメイド医療の実現プログラム参加者

URL: http://www.biobankjp.org/index.html

 

データID内容制限公開日
hum0014.v1.freq.v1

心筋梗塞1666症例および

対照健常者3198名のGWAS

非制限公開 2014/09/30
hum0014.v2.jsnp.934ctrl.v1

健常者934名の遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
35疾患

35疾患各約190症例における遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
hum0014.v2.jsnp.182ec.v1

食道がん182症例の遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
hum0014.v2.jsnp.92als.v1

筋萎縮性側索硬化症92症例の遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
hum0014.v3.T2DM-1.v1

2型糖尿病9817症例および

対照者6763名のGWAS

非制限公開 2016/01/28
hum0014.v3.T2DM-2.v1

2型糖尿病5646症例および

対照者19,420名のGWAS

非制限公開 2016/01/28
hum0014.v4.AD.v1

アトピー性皮膚炎患者1472症例および

対照者7966名のGWAS

非制限公開 2016/02/02
hum0014.v5.AF.v1 心房細動患者8180症例および対照者28,612名のGWAS 非制限公開 2017/05/18
JGAS000101 心房細動患者8180症例のPhenotypeデータ、Genotypeデータ 制限公開(Type I) 2017/05/18
hum0014.v6.158k.v1 158,284名のBMIのGWAS 非制限公開 2017/09/08
JGAS000114

158,284名のBMIデータ

182,505名のGenotypeデータ

制限公開(Type I) 2017/09/08
hum0014.v7.POAG.v1

開放隅角緑内障3980症例および

対照者18,815名のGWAS

非制限公開 2018/04/04
hum0014.v8.58qt.v1 162,255名の58臨床検査値のGWAS 非制限公開 2018/05/01
JGAS000114 162,255名の58臨床検査値のPhenotypeデータ 制限公開(Type I) 2018/05/01

hum0014.v9.Men.v1

hum0014.v9.MP.v1

初潮年齢データを有する女性67,029名および閉経年齢データを有する女性43,861名のGWAS 非制限公開 2018/08/07
JGAS000114 BBJ第1コホート1026名のWGSデータ 制限公開(Type I) 2018/08/13
JGAS000140 乳がん7,104症例と対照者23,731名の遺伝性乳がん原因11遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2018/10/16
hum0014.v12.T2DMwN.v1

2型糖尿病腎症2,809症例および

2型糖尿病対照5,592症例のGWASメタ解析

非制限公開 2018/12/10
hum0014.v13.T2DMmeta.v1

2型糖尿病36,614症例および

対照者155,150名のGWASメタ解析

非制限公開 2019/01/25
hum0014.v14.smok.v1 日本人集団165,436名における喫煙習慣のGWAS 非制限公開 2019/03/26
JGAS000114 バイオバンクジャパン1037名のWGSデータと1000ゲノムプロジェクト(Phase3v5)2504名のWGSのvcfファイルを統合したgenotype imputation用のreference panel 制限公開(Type I) 2019/09/27
hum0014.v15.ht.v1 159,095名の身長のGWAS 非制限公開 2019/09/27

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら

 

分子データ

hum0014.v1.freq.v1

対象 心筋梗塞:1666症例、対照健常者:3198名
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [Human610-Quad BeadChip, HumanHap550v3 Genotyping BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina Human610-Quad Beadchip
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後) 455,781 SNPs (hg18/GRCh36)
NBDC Data Set ID

hum0014.v1.freq.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 71.3 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v2.jsnp.934ctrl.v1

対象 健常者:934名(JSNP)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanHap550v3 Genotyping BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina HumanHap550v3 Genotyping BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後) 515,286 SNPs
NBDC Data Set ID

hum0014.v2.jsnp.934ctrl.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 32.2 MB(zip [xls])
コメント(利用にあたっての制限事項) NBDC policy

 

35疾患(JSNP)

対象

悪性腫瘍 (肺がん、乳がん、胃がん、大腸・直腸がん、前立腺がん)

心血管系疾患 (心不全、心筋梗塞,不安定狭心症、安定狭心症、不整脈、閉塞性動脈硬化症)

脳血管障害 (脳梗塞、脳動脈瘤)

呼吸器疾患 (間質性肺炎&肺線維症、肺気腫、気管支喘息)

慢性肝疾患 (C型慢性肝炎、肝硬変)

眼疾患 (白内障、緑内障)

その他 (てんかん、歯周病、尿路結石、ネフローゼ症候群、子宮筋腫、子宮内膜症、

骨粗鬆症、関節リウマチ、筋萎縮性側索硬化症、花粉症、アトピー性皮膚炎、

過敏性症候群(薬疹)、高脂血症、糖尿病、バセドウ病)

各約190症例

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Perlegen Sciences [high-density oligonucleotide arrays]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) -
遺伝子型決定アルゴリズム(ソフトウェア) -
フィルタリング -
マーカー数(QC後) 約20万SNPs (b129)
データセット

悪性腫瘍 (肺がん乳がん胃がん大腸・直腸がん前立腺がん

心血管系疾患 (心不全心筋梗塞不安定狭心症安定狭心症不整脈閉塞性動脈硬化症

脳血管障害 (脳梗塞脳動脈瘤

呼吸器疾患 (間質性肺炎&肺線維症肺気腫気管支喘息

慢性肝疾患 (C型慢性肝炎肝硬変

眼疾患 (白内障緑内障

その他 (てんかん歯周病尿路結石ネフローゼ症候群子宮筋腫子宮内膜症

骨粗鬆症関節リウマチ筋萎縮性側索硬化症花粉症アトピー性皮膚炎

過敏性症候群(薬疹)高脂血症糖尿病バセドウ病

(データのダウンロードは上記疾患名をクリックしてください)

Dictionary file

コメント(利用にあたっての制限事項) NBDC policy

*各SNVの染色体上のポジションはdbSNP build 129に基づいています。他のbuildに基づいた位置情報を希望される場合はお問い合わせください。

 

hum0014.v2.jsnp.182ec.v1

対象 食道がん:182症例(JSNP)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanHap550v3 Genotyping BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina HumanHap550v3 Genotyping BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後) 503,734 SNPs
NBDC Data Set ID

hum0014.v2.jsnp.182ec.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 6.6 MB(zip [txt])
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v2.jsnp.92als.v1

対象 筋萎縮性側索硬化症:92症例(JSNP)
規模 large-scale case-control association study
対象領域(Target Captureの場合) -
Platform Hologic Japan [Invader]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Invader assay system(Third Wave Technologies)
遺伝子型決定アルゴリズム(ソフトウェア) ABI PRISM SDS versions 2.0 - 2.2
フィルタリング SNP call rate ≥ 0.95(疾患群、対照群), HWE P ≥1.0 x 10^-2(対照群)
マーカー数(QC後) 48,939 SNPs
NBDC Data Set ID

hum0014.v2.jsnp.92als.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 3.2 MB(zip [txt])
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v3.T2DM-1.v1

対象

2型糖尿病:9817症例、

対照者:6763名(健常者および糖尿病を合併していない脳動脈瘤、食道がん、子宮体がん、肺気腫、緑内障の患者)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [OmniExpressExome Beadchip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina OmniExpressExome Beadchip kit
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, MAF < 0.01 HWE P < 1 x 10^-6 in control
マーカー数(QC後) 552,915 SNPs (hg19)
NBDC Data Set ID

hum0014.v3.T2DM-1.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 84.0 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v3.T2DM-2.v1

対象

2型糖尿病:5646症例、

対照者:19,420名 (糖尿病を合併していない大腸-直腸がん、乳がん、前立腺がん、肺がん、胃がん、

閉塞性動脈硬化症、不整脈、脳梗塞、心筋梗塞、胆嚢・胆管がん、膵がん、過敏性症候群(薬疹)、

関節リウマチ、筋萎縮性側索硬化症、肝がん、肝硬変、骨粗鬆症、子宮筋腫の患者)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [Human610-Quad BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina Human610-Quad Beadchip kit
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, MAF < 0.01 HWE P < 1 x 10^-6 in control
マーカー数(QC後) 479,088 SNPs (hg18)
NBDC Data Set ID

hum0014.v3.T2DM-2.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 72.6 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v4.AD.v1

対象

アトピー性皮膚炎:1472症例、

対照者:7966名(健常者およびアトピー性皮膚炎と気管支喘息のいずれも合併していない脳動脈瘤、食道がん、子宮体がん、肺気腫、緑内障の患者)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress-12 BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress-12 BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) minimac [imputation(1000 genomes Phase I v3 )]
関連解析(ソフトウェア) mach2dat [GWAS]
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, 対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01

                           GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

マーカー数(QC後) 約770万 SNVs(hg19)
NBDC Data Set ID

hum0014.v4.AD.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量

ADGWAS_auto.txt (525 MB)

ADGWAS_X_females.txt (17 MB)

ADGWAS_X_males.txt (15 MB)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000101 / hum0014.v5.AF.v1

対象

心房細動:8180症例

対照者:28,612名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress / HumanExome / OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress / HumanExome / OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2dat [GWAS]
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, 対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01

                           GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

                              R square < 0.9

マーカー数(QC後) 約500万 SNVs(hg19)
Phenotype情報 性別、年齢

NBDC Data Set ID /

Japanese Genotype-phenotype

Archive Data set ID

【GWAS集計情報】

hum0014.v5.AF.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

【個別データ(心房細動群のみ

Phenotype:JGAD000101

Genotype:JGAD000102

総データ量

GWAS:485 MB(txt)

Phenotype、Genotype:1 GB(txt)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 / hum0014.v6.158k.v1

対象 182,505名(内、BMI研究で使用した対象数:158,284名)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress / HumanExome / OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress / HumanExome / OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2qtl (v1.1.3)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 を除外。

マーカー数(QC後)

常染色体:約600万 SNVs (hg19)

X染色体:約15万 SNVs (hg19)

NBDC Data Set ID /

Japanese Genotype-phenotype

Archive Data set ID

【GWAS】

hum0014.v6.158k.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

【個別データ】

Phenotypeデータ(BMI):JGAD000124

Genotypeデータ:JGAD000123

遺伝型情報に関する詳細

アレイプローブの取り扱いに関する情報

総データ量

GWAS:406 MB(zip)

Phenotypeデータ(BMI):3.32 MB(txt.gz)

Genotypeデータ:26.3 GB(csv.gz)

コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v7.POAG.v1

対象

開放隅角緑内障(ICD10:H401):3980症例(男性:1,997、女性:1,983)

対照者:18,815名(男性:7,817、女性:10,998)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress / HumanExome / OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress / HumanExome / OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア) minimac(ver. 0.1.1)[imputation(1000 genomes Phase I v3 )]
関連解析(ソフトウェア) mach2dat(ver. 1.0.19)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.5%,

          対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01  

        GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

Imputation後のQC:Imputation quality (Rsq) < 0.7を除外。

         さらに、ベータが4未満もしくは4を超えるものは公開用に除外。

マーカー数(QC後)

常染色体:5,961,428 SNPs(hg19)

男性X染色体:147,351 SNPs(hg19)

女性X染色体:147,353 SNPs(hg19)

NBDC Data Set ID

hum0014.v7.POAG-1.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 113 MB(txt.zip)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 / hum0014.v8.58qt.v1

対象 162,255名の58臨床検査値
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress / HumanExome / OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress / HumanExome / OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2qtl(v1.1.3)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 を除外。

マーカー数(QC後)

常染色体:5,961,600 SNVs(hg19)

X染色体:147,353 SNVs(hg19)

NBDC Data Set ID /

Japanese Genotype-phenotype

Archive Data set ID

血糖・脂質関連 総コレステロール JGAD000144
HDLコレステロール JGAD000145
LDLコレステロール JGAD000146
中性脂肪 JGAD000147
血糖 JGAD000148
ヘモグロビンA1c JGAD000149
血清蛋白質 総蛋白 JGAD000150
アルブミン JGAD000151
非アルブミン蛋白 JGAD000152
アルブミン/グロブリン比 JGAD000153
腎機能 尿素窒素 JGAD000154
血清クレアチニン JGAD000155
推算糸球体濾過量 JGAD000156
尿酸 JGAD000157
電解質 ナトリウム JGAD000158
カリウム JGAD000159
クロール JGAD000160
カルシウム JGAD000161
無機リン JGAD000162
肝機能 総ビリルビン JGAD000163
硫酸亜鉛混濁試験 JGAD000164
アスパラギン酸アミノ基転移酵素 JGAD000165
アラニンアミノ基転移酵素 JGAD000166
アルカリフォスファターゼ JGAD000167
ガンマグルタミルトランスフェラーゼ JGAD000168
その他の検査値 活性化部分トロンボプラスチン時間 JGAD000169
プロトロンビン時間 JGAD000170
フィブリノーゲン JGAD000171
クレアチンキナーゼ JGAD000172
乳酸脱水素酵素 JGAD000173
C反応性蛋白 JGAD000174
血球数 白血球数 JGAD000175
好中球数 JGAD000176
好酸球数 JGAD000177
好塩基球数 JGAD000178
単球数 JGAD000179
リンパ球数 JGAD000180
赤血球数 JGAD000181
ヘモグロビン濃度 JGAD000182
ヘマトクリット値 JGAD000183
平均赤血球容積 JGAD000184
平均赤血球ヘモグロビン量 JGAD000185
平均赤血球ヘモグロビン濃度 JGAD000186
血小板数 JGAD000187
血圧 収縮期血圧 JGAD000188
拡張期血圧 JGAD000189
平均血圧 JGAD000190
脈圧 JGAD000191
心エコー 心室中隔壁厚 JGAD000192
後壁厚 JGAD000193
左室拡張末期径 JGAD000194
左室収縮末期径 JGAD000195
左室心筋重量 JGAD000196
左室心筋重量係数 JGAD000197
相対的壁厚 JGAD000198
左室内径短縮率 JGAD000199
左室駆出率 JGAD000200
E/A比 JGAD000201

(GWAS統計情報のダウンロードは上記形質名をクリックしてください)

Dictionary file

総データ量

GWAS:平均 123 MB(zip)

Phenotypeデータ(58形質):平均 2.4 MB(txt.gz)

コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v9.Men.v1 / hum0014.v9.MP.v1

対象

初潮年齢データを有する女性67,029名

閉経年齢データを有する女性43,861名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress / HumanExome / OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress / HumanExome / OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2qtl (v1.1.3)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.5%,

          対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01  

        GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

Imputation後のQC:Imputation quality (Rsq) < 0.7を除外。

         さらに、ベータが4未満もしくは4を超えるものは公開用に除外。

マーカー数(QC後) 9,296,729 SNPs (hg19)
NBDC Data Set ID

初潮:hum0014.v9.Men.v1

閉経:hum0014.v9.MP.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

初潮:Dictionary file

閉経:Dictionary file

総データ量

初潮:181 MB(txt.gz)

閉経:186 MB(txt.gz)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 / JGAD000220

対象 2003年から2007年度にバイオバンク・ジャパンに登録された47疾患患者:1,026名
規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq Nano DNA Library Preparation Kit
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 160 bp
Japanese Genotype-phenotype Archive Data set ID JGAD000220
総データ量 73 TB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

日本人集団ゲノム関連解析情報データベース「Jenger」にて、当該データの概要データ(アリル頻度情報)をダウンロードできます。

 

JGAS000140

対象

乳がん(ICD10:C509):7,104症例

対照者:23,731名

規模 Target Capture
対象領域(Target Captureの場合) 遺伝性乳がんの原因11遺伝子(ATM, BRCA1, BRCA2, CDH1, CHEK2, NBN, NF1, PALB2, PTEN, STK11, TP53)の翻訳領域
Platform Illumina [HiSeq2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) 2X Platinum Multiplex PCR Master Mix (Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 *1
断片化の方法 -
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp x 2
Japanese Genotype-phenotype Archive Data set ID JGAD000209
総データ量 1 TB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

※1 Hum Mol Genet. 25,:5027-5034 (2016)

 

hum0014.v12.T2DMwN.v1

対象

[GWAS-1]

  2型糖尿病腎症:2,380症例、2型糖尿病対照(腎症非発症群):5,234症例

[GWAS-2]

  2型糖尿病腎症:429症例、2型糖尿病対照(腎症非発症群):358症例

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [OmniExpressExome Beadchip / Human610-Quad BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン)

Illumina OmniExpressExome Beadchip kit 

Illumina Human610-Quad Beadchip kit

遺伝子型決定アルゴリズム(ソフトウェア)

MACH and Minimac(1000 Genomes phased JPT, CHB and Han Chinese South data n = 275, March 2012)

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2dat
フィルタリング

sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.1%,

対照者群で HWE P < 1 x 10-6

マーカー数(QC後) 7,521,072 SNPs(hg19)
NBDC Data Set ID

hum0014.v12.T2DMwN.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 310 MB(csv.zip)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v13.T2DMmeta.v1

対象

[GWAS-1]

  2型糖尿病(ICD-10:E11):9,804症例、対照者:6,728名

[GWAS-2]

  2型糖尿病(ICD-10:E11):5,639症例、対照者:19,407名

[GWAS-3]

  2型糖尿病(ICD-10:E11):18,688症例、対照者:121,950名

[GWAS-4]

  2型糖尿病(ICD-10:E11):2,483症例、対照者:7,065名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress / HumanExome / OmniExpressExome / Human610-Quad BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress / HumanExome / OmniExpressExome / Human610-Quad Beadchip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase 3)]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2dat (v1.0.24)
フィルタリング

GenotypingのQC:

GWAS1, GWAS3, GWAS4除外基準

(i) hetero count < 5

(ii) 各chipでHWE P < 1.0 × 10^-6

(iii) in-house WGSデータとのジェノタイプ一致率 < 0.99

(iv) SNV call rate < 0.99

GWAS2除外基準

(i) SNV call rate < 0.99

(ii) MAF < 0.01

(iii) differential missingness P < 1.0 × 10^-6

(iv) HWE P < 1.0 × 10^-6

ImputationのQC:

リファレンスパネルで HWE P < 1 × 10^-6 もしくは MAF < 0.01を除外

3つ以上のGWASでImputation quality (Rsq) < 0.3となったものを除外

マーカー数(QC後) 12,557,761 SNPs(hg19)
NBDC Data Set ID

hum0014.v13.T2DMmeta.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 257 MB(txt)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v14.smok.v1

対象 165,436名の喫煙習慣データ
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress / HumanExome / OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress / HumanExome / OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア)

BOLT-LMM(v2.2)

ProbABEL(v0.4.5; for X chromosome)

フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 and MAF < 0.01を除外

マーカー数(QC後)

常染色体:5,961,480 SNVs(hg19)

男性X染色体(喫煙開始年齢):163,412 SNVs(hg19)

女性X染色体(喫煙開始年齢):146,130 SNVs(hg19)

男性X染色体(喫煙本数):166,111 SNVs(hg19)

女性X染色体(喫煙本数):146,114 SNVs(hg19)

男性X染色体(喫煙歴):166,138 SNVs(hg19)

女性X染色体(喫煙歴):146,146 SNVs(hg19)

男性X染色体(禁煙歴の有無):166,142 SNVs(hg19)

女性X染色体(禁煙歴の有無):146,118 SNVs(hg19)

NBDC Data Set ID

hum0014.v14.asi.v1(喫煙開始年齢)

hum0014.v14.cpd.v1(喫煙本数)

hum0014.v14.ens.v1(喫煙歴)

hum0014.v14.fcs.v1(禁煙歴の有無)

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 1.9 GB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 reference panel

対象

・1026名のWGSデータ(JGAD000220)を含むバイオバンクジャパン1037名のWGSデータのvcfファイル(WGSデータの分子データは上記参照のこと)

・1000ゲノムプロジェクト(Phase3v5)2504名のWGSのvcfファイル(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/

規模 WGS解析により検出された変異情報の統合(常染色体およびX染色体上のvariants)
対象領域(Target Captureの場合) -
クオリティコントロール方法

We set exclusion criteria for genotypes as follows:

(1) DP < 5, (2) GQ < 20, or (3) DP > 60 and GQ < 95, and regarded these genotypes as missing.

Variants with call rates < 90% were excluded before variant quality score recalibration (VQSR).

After VQSR, we excluded variants located in low-complexity regions (LCR), as defined by mdust software were excluded.

Finally, we used BEAGLE to impute missing genotypes.

重複するリードの除去 picard (versions 1.106)
リアライメントおよびベースクオリティのキャリブレーション GATK (version 3.2-2)
マッピング方法 BWA-MEM (version 0.7.5a)
マッピングクオリティ MAPQ < 20 を除外(HaplotypeCaller)
マッピングの際のリファレンス配列 GRCh37/hg19, hs37d5
平均カバー率(Depth) aimed at 30x depth
変異検出方法 GATK HaplotypeCaller (version 3.2-2)
vcfファイルの統合方法

常染色体:Impute2

X染色体:Beagle(男性)、Impute2(女性)

リファレンスパネルに含まれるvariant数 61,608,817 variants(常染色体:59,387,070variants、X染色体:2,221,747variants)
Japanese Genotype-phenotype Archive Data set ID JGAD000220
総データ量 約15 GB(vcf.gz)
コメント(利用にあたっての制限事項) NBDC policy

バイオバンクジャパン1037名のデータに対して実施。

 

hum0014.v15.ht.v1

対象

バイオバンクジャパンに参加した159,095名

(男性:86,257名、女性:72,838名)

規模 genome wide variants
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress / HumanExome / OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress / HumanExome / OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア) Minimac3 [imputation reference panel using WGS data of the biobank Japan project (N=1,037) and 1KGP p3v5 ALL (N=2,504)]
関連解析(ソフトウェア) BOLT-LMM (ver2.2)、mach2qtl
フィルタリング

Sample QCs:1) call rate < 98%、2) closely related samples (PI_HAT > 0.175)、3) outlier from Japanese cluster determined by PCA using GCTA を除外。

Imputation後のQC:Imputation quality (Rsq) < 0.3 を除外。

マーカー数(QC後)

常染色体:27,211,524 variants(hg19)

男性X染色体:684,533 variants(hg19)

女性X染色体:684,533 variants(hg19)

NBDC Data Set ID

hum0014.v15.ht.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 約663 MB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 久保 充明

所 属 機 関: 理化学研究所 統合生命医科学研究センター 疾患多様性医科学研究部門

プロジェクト/研究グループ名: オーダーメイド医療の実現プログラム

URL: http://www.biobankjp.org/index.html

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
文部科学省 科学技術試験研究委託事業費 オーダーメイド医療の実現プログラム(第3期) -

 

関連論文

タイトルDOIデータID
1 A genome-wide association study identifies PLCL2 and AP3D1-DOT1L-SF3A2 as new susceptibility loci for myocardial infarction in Japanese. doi:10.1038/ejhg.2014.110 hum0014.v1.freq.v1
2 A functional variant in ZNF512B is associated with susceptibility to amyotrophic lateral sclerosis in Japanese. doi:10.1093/hmg/ddr268 hum0014.v2.jsnp.92als.v1
3 Functional variants in ADH1B and ALDH2 coupled with alcohol and smoking synergistically enhance esophageal cancer risk. doi: 10.1053/j.gastro.2009.07.070 hum0014.v2.jsnp.182ec.v1
4 SNPs in KCNQ1 are associated with susceptibility to type 2 diabetes in East Asian and European populations. doi: 10.1038/ng.208 T2DM (JSNP)
5 Common variants in a novel gene, FONG on chromosome 2q33.1 confer risk of osteoporosis in Japanese. doi: 10.1371/journal.pone.0019641 Osteoporosis (JSNP)
6 Genome-wide association studies in the Japanese population identify seven novel loci for type 2 diabetes. doi: 10.1038/ncomms10531

hum0014.v3.T2DM-1.v1

hum0014.v3.T2DM-2.v1

7 Multi-ancestry genome-wide association study of 21,000 cases and 95,000 controls identifies new risk loci for atopic dermatitis. doi: 10.1038/ng.3424 hum0014.v4.AD.v1
8 Genome-wide association study identifies eight new susceptibility loci for atopic dermatitis in the Japanese population. doi: 10.1038/ng.2438 hum0014.v4.AD.v1
9 Identification of six new genetic loci associated with atrial fibrillation in the Japanese population. doi: 10.1038/ng.3842 hum0014.v5.AF.v1
10 Genome-wide association study identifies 112 new loci for body mass index in the Japanese population. doi:10.1038/ng.3951

hum0014.v6.158k.v1

JGAD000123

JGAD000124

11 Genome-wide association study identifies seven novel susceptibility loci for primary open-angle glaucoma. doi: 10.1093/hmg/ddy053 hum0014.v7.POAG.v1
12 Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. doi:10.1038/s41588-018-0047-6

hum0014.v8.58qt.v1

JGAD000144-JGAD000201

13 Elucidating the genetic architecture of reproductive ageing in the Japanese population doi: 10.1038/s41467-018-04398-z

hum0014.v9.Men.v1

hum0014.v9.MP.v1

14 Deep whole-genome sequencing reveals recent selection signatures linked to evolution and disease risk of Japanese. doi: 10.1038/s41467-018-03274-0 JGAD000220
15 Germline pathogenic variants of 11 breast cancer genes in 7,051 Japanese patients and 11,241 controls. doi: 10.1038/s41467-018-06581-8 JGAD000209
16 A Variant within the FTO confers susceptibility to diabetic nephropathy in Japanese patients with type 2 diabetes doi: 10.1371/journal.pone.0208654 hum0014.v12.T2DMwN.v1
17 Identification of 28 new susceptibility loci for type 2 diabetes in the Japanese population doi: 10.1038/s41588-018-0332-4 hum0014.v13.T2DMmeta.v1
18 GWAS of smoking behaviour in 165,436 Japanese people reveals seven new loci and shared genetic architecture. doi: 10.1038/s41562-019-0557-y

hum0014.v14.asi.v1

hum0014.v14.cpd.v1

hum0014.v14.ens.v1

hum0014.v14.fcs.v1

19 Characterizing rare and low-frequency height-asssociated variants in the Japanese population doi: 10.1038/s41467-019-12276-5

JGAD000220 (fastq)

JGAD000220 (reference panel)

hum0014.v15.ht.v1

 

制限公開データの利用者一覧

研究代表者所属機関利用データID利用期間
Mark Daly Broad Institute of MIT and Harvard JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/09/11-2023/07/31
岡田 随象 大阪大学大学院医学系研究科・遺伝統計学 JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/09/20-2021/03/31
上辻 茂男 株式会社スタージェン JGAD000123 2018/10/04-2019/03/31
徳永 勝士 東京大学大学院医学系研究科人類遺伝学教室 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/11/13-2026/11/08
角田 達彦 東京医科歯科大学・難治疾患研究所・医科学数理分野 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/12/18-2020/03/31
Liming Liang Harvard T.H. Chan School of Public Health, Department of Epidemiology JGAD000123 2019/01/21-2021/12/31
小川 誠司 京都大学大学院医学研究科 腫瘍生物学講座 JGAD000209 2019/02/04-2021/03/31
上辻 茂男 株式会社スタージェン JGAD000123 2019/03/13-2022/03/31
河野 隆志 国立研究開発法人国立がん研究センター JGAD000123, JGAD000124, JGAD000220 2019/04/15-2019/12/31
堀江 重郎 順天堂大学大学院医学研究科・遺伝子疾患先端情報学 JGAD000123, JGAD000220 2019/05/14-2024/03/31
木下 健吾 東北大学 東北メディカル・メガバンク機構 JGAD000220 2019/06/24-2022/03/31
白石 航也 国立研究開発法人国立がん研究センター研究所 ゲノム生物学研究分野 JGAD000124 2019/08/05-2023/03/31
上辻 茂男 株式会社スタージェン 統計解析事業部 JGAD000123, JGAD000124,
JGAD000146, JGAD000148,
JGAD000149, JGAD000155,
JGAD000156, JGAD000157,
JGAD000174, JGAD000188
2019/08/16-2024/03/31
上辻 茂男 株式会社スタージェン 統計解析事業部 JGAD000123, JGAD000124,
JGAD000144-JGAD000201
2019/08/22-2024/03/31