NBDC Research ID: hum0014.v23

最新版はこちらです

研究内容の概要

目的: 日本人における疾患関連遺伝子の特定

方法: Human610-Quad BeadChip、HumanHap550v3 Genotyping BeadChip、HumanOmniExpress-12 BeadChip、HumanExome BeadChip、 OmniExpressExome Beadchip(Illumina社)、high-density oligonucleotide arrays (Perlegen Sciences社)、もしくはインベーダー法(Hologic Japan社)により遺伝子型を決定し、心筋梗塞、2型糖尿病、アトピー性皮膚炎、心房細動、Body Mass Index(BMI)、開放隅角緑内障、58形質、初潮・閉経年齢、喫煙習慣、身長、42疾患(4疾患は以前のリリースと一部重複あり)、食習慣、および冠動脈疾患のゲノムワイド関連解析(Genome Wide Association Study:GWAS)や2型糖尿病腎症および2型糖尿病発症のGWASメタ解析を実施。また、Illumina社 HiSeq 2500を用いて、BBJ第1コホート1026名の全ゲノムシークエンス(Whole Genome Sequencing:WGS)、遺伝性乳がん原因11遺伝子翻訳領域、遺伝性前立腺がん原因8遺伝子翻訳領域、およびバイオバンクジャパン11,234名における23遺伝子のTarget Capture Sequencingを実施した。バイオバンクジャパン1037名のWGSデータから作成したvcfファイルと1000ゲノムプロジェクト(Phase3v5)2504名のvcfファイルを統合し、genotype imputation用reference panelを作成した。

対象: オーダーメイド医療実現化プロジェクトおよびオーダーメイド医療の実現プログラム参加者

URL: http://www.biobankjp.org/index.html

 

データID内容制限公開日
hum0014.v1.freq.v1

心筋梗塞1666症例および

対照健常者3198名のGWAS

非制限公開 2014/09/30
hum0014.v2.jsnp.934ctrl.v1

健常者934名の遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
35疾患

35疾患各約190症例における遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
hum0014.v2.jsnp.182ec.v1

食道がん182症例の遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
hum0014.v2.jsnp.92als.v1

筋萎縮性側索硬化症92症例の遺伝子型カウント情報

(JSNPのデータ)

非制限公開 2015/12/28
hum0014.v3.T2DM-1.v1

2型糖尿病9817症例および

対照者6763名のGWAS

非制限公開 2016/01/28
hum0014.v3.T2DM-2.v1

2型糖尿病5646症例および

対照者19,420名のGWAS

非制限公開 2016/01/28
hum0014.v4.AD.v1

アトピー性皮膚炎患者1472症例および

対照者7966名のGWAS

非制限公開 2016/02/02
hum0014.v5.AF.v1 心房細動患者8180症例および対照者28,612名のGWAS 非制限公開 2017/05/18
JGAS000101 心房細動患者8180症例のPhenotypeデータ、Genotypeデータ 制限公開(Type I) 2017/05/18
hum0014.v6.158k.v1 158,284名のBMIのGWAS 非制限公開 2017/09/08
JGAS000114

158,284名のBMIデータ

182,505名のGenotypeデータ

制限公開(Type I) 2017/09/08
hum0014.v7.POAG.v1

開放隅角緑内障3980症例および

対照者18,815名のGWAS

非制限公開 2018/04/04
hum0014.v8.58qt.v1 162,255名の58臨床検査値のGWAS 非制限公開 2018/05/01
JGAS000114 162,255名の58臨床検査値のPhenotypeデータ 制限公開(Type I) 2018/05/01

hum0014.v9.Men.v1

hum0014.v9.MP.v1

初潮年齢データを有する女性67,029名および閉経年齢データを有する女性43,861名のGWAS 非制限公開 2018/08/07
JGAS000114 BBJ第1コホート1026名のWGSデータ 制限公開(Type I) 2018/08/13
JGAS000140 乳がん7,104症例と対照者23,731名の遺伝性乳がん原因11遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2018/10/16
hum0014.v12.T2DMwN.v1

2型糖尿病腎症2,809症例および

2型糖尿病対照5,592症例のGWASメタ解析

非制限公開 2018/12/10
hum0014.v13.T2DMmeta.v1

2型糖尿病36,614症例および

対照者155,150名のGWASメタ解析

非制限公開 2019/01/25
hum0014.v14.smok.v1 日本人集団165,436名における喫煙習慣のGWAS 非制限公開 2019/03/26
JGAS000114 バイオバンクジャパン1037名のWGSデータと1000ゲノムプロジェクト(Phase3v5)2504名のWGSのvcfファイルを統合したgenotype imputation用のreference panel 制限公開(Type I) 2019/09/27
hum0014.v15.ht.v1 159,095名の身長のGWAS 非制限公開 2019/09/27
JGAS000203 遺伝性前立腺がん7,636症例と対照者12,366名の遺伝性前立腺がん原因8遺伝子翻訳領域のTarget Capture Sequencingデータ 制限公開(Type I) 2019/10/07
hum0014.v17 40疾患のGWAS 非制限公開 2019/10/08
hum0014.v18 乳がんのGWAS 非制限公開 2019/11/26
hum0014.v19 日本人集団165,084名における食習慣のGWAS 非制限公開 2020/04/20
hum0014.v20.cad.v1 冠動脈疾患のGWAS 非制限公開 2020/08/17
hum0014.v21 虚血性心疾患のGWAS 非制限公開 2020/08/25
JGAS000293 2003年から2007年度にバイオバンク・ジャパンに登録されたサンプル(約20万例)から抽出された11,234名の23遺伝子における全てのエクソン領域のTarget Capture Sequencingn解析より得られた体細胞変異データおよびSNPアレイにより得られた染色体変異データ 制限公開(Type I) 2021/05/21
JGAS000114 にデータ追加 JGAD000220のWGSデータのbam/gvcfデータ 制限公開(Type I) 2021/07/13

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら

 

分子データ

hum0014.v1.freq.v1

対象 心筋梗塞:1666症例、対照健常者:3198名
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [Human610-Quad BeadChip、HumanHap550v3 Genotyping BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina Human610-Quad Beadchip
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後) 455,781 SNPs (hg18/GRCh36)
NBDC Data Set ID

hum0014.v1.freq.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 71.3 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v2.jsnp.934ctrl.v1

対象 健常者:934名(JSNP)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanHap550v3 Genotyping BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina HumanHap550v3 Genotyping BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後) 515,286 SNPs
NBDC Data Set ID

hum0014.v2.jsnp.934ctrl.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 32.2 MB(zip [xls])
コメント(利用にあたっての制限事項) NBDC policy

 

35疾患(JSNP)

対象

悪性腫瘍 (肺がん、乳がん、胃がん、大腸・直腸がん、前立腺がん)

心血管系疾患 (心不全、心筋梗塞,不安定狭心症、安定狭心症、不整脈、閉塞性動脈硬化症)

脳血管障害 (脳梗塞、脳動脈瘤)

呼吸器疾患 (間質性肺炎&肺線維症、肺気腫、気管支喘息)

慢性肝疾患 (C型慢性肝炎、肝硬変)

眼疾患 (白内障、緑内障)

その他 (てんかん、歯周病、尿路結石、ネフローゼ症候群、子宮筋腫、子宮内膜症、

骨粗鬆症、関節リウマチ、筋萎縮性側索硬化症、花粉症、アトピー性皮膚炎、

過敏性症候群(薬疹)、高脂血症、糖尿病、バセドウ病)

各約190症例

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Perlegen Sciences [high-density oligonucleotide arrays]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) -
遺伝子型決定アルゴリズム(ソフトウェア) -
フィルタリング -
マーカー数(QC後) 約20万SNPs (b129)
データセット

悪性腫瘍 (肺がん乳がん胃がん大腸・直腸がん前立腺がん

心血管系疾患 (心不全心筋梗塞不安定狭心症安定狭心症不整脈閉塞性動脈硬化症

脳血管障害 (脳梗塞脳動脈瘤

呼吸器疾患 (間質性肺炎&肺線維症肺気腫気管支喘息

慢性肝疾患 (C型慢性肝炎肝硬変

眼疾患 (白内障緑内障

その他 (てんかん歯周病尿路結石ネフローゼ症候群子宮筋腫子宮内膜症

骨粗鬆症関節リウマチ筋萎縮性側索硬化症花粉症アトピー性皮膚炎

過敏性症候群(薬疹)高脂血症糖尿病バセドウ病

(データのダウンロードは上記疾患名をクリックしてください)

Dictionary file

コメント(利用にあたっての制限事項) NBDC policy

*各SNVの染色体上のポジションはdbSNP build 129に基づいています。他のbuildに基づいた位置情報を希望される場合はお問い合わせください。

 

hum0014.v2.jsnp.182ec.v1

対象 食道がん:182症例(JSNP)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanHap550v3 Genotyping BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina HumanHap550v3 Genotyping BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, HWE P < 1 x 10^-6
マーカー数(QC後) 503,734 SNPs
NBDC Data Set ID

hum0014.v2.jsnp.182ec.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 6.6 MB(zip [txt])
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v2.jsnp.92als.v1

対象 筋萎縮性側索硬化症:92症例(JSNP)
規模 large-scale case-control association study
対象領域(Target Captureの場合) -
Platform Hologic Japan [Invader]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Invader assay system(Third Wave Technologies)
遺伝子型決定アルゴリズム(ソフトウェア) ABI PRISM SDS versions 2.0 - 2.2
フィルタリング SNP call rate ≥ 0.95(疾患群、対照群), HWE P ≥1.0 x 10^-2(対照群)
マーカー数(QC後) 48,939 SNPs
NBDC Data Set ID

hum0014.v2.jsnp.92als.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 3.2 MB(zip [txt])
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v3.T2DM-1.v1

対象

2型糖尿病:9817症例、

対照者:6763名(健常者および糖尿病を合併していない脳動脈瘤、食道がん、子宮体がん、肺気腫、緑内障の患者)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [OmniExpressExome Beadchip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina OmniExpressExome Beadchip kit
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, MAF < 0.01 HWE P < 1 x 10^-6 in control
マーカー数(QC後) 552,915 SNPs (hg19)
NBDC Data Set ID

hum0014.v3.T2DM-1.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 84.0 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v3.T2DM-2.v1

対象

2型糖尿病:5646症例、

対照者:19,420名 (糖尿病を合併していない大腸-直腸がん、乳がん、前立腺がん、肺がん、胃がん、

閉塞性動脈硬化症、不整脈、脳梗塞、心筋梗塞、胆嚢・胆管がん、膵がん、過敏性症候群(薬疹)、

関節リウマチ、筋萎縮性側索硬化症、肝がん、肝硬変、骨粗鬆症、子宮筋腫の患者)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [Human610-Quad BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina Human610-Quad Beadchip kit
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
フィルタリング Sample Call rate < 0.98, SNP call rate < 0.99, MAF < 0.01 HWE P < 1 x 10^-6 in control
マーカー数(QC後) 479,088 SNPs (hg18)
NBDC Data Set ID

hum0014.v3.T2DM-2.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 72.6 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v4.AD.v1

対象

アトピー性皮膚炎:1472症例、

対照者:7966名(健常者およびアトピー性皮膚炎と気管支喘息のいずれも合併していない脳動脈瘤、食道がん、子宮体がん、肺気腫、緑内障の患者)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress-12 BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress-12 BeadChip
遺伝子型決定アルゴリズム(ソフトウェア) minimac [imputation(1000 genomes Phase I v3 )]
関連解析(ソフトウェア) mach2dat [GWAS]
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, 対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01

                           GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

マーカー数(QC後) 約770万 SNVs(hg19)
NBDC Data Set ID

hum0014.v4.AD.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量

ADGWAS_auto.txt (525 MB)

ADGWAS_X_females.txt (17 MB)

ADGWAS_X_males.txt (15 MB)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000101 / hum0014.v5.AF.v1

対象

心房細動:8180症例

対照者:28,612名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2dat [GWAS]
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, 対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01

                           GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

                              R square < 0.9

マーカー数(QC後) 約500万 SNVs(hg19)
Phenotype情報 性別、年齢

NBDC Data Set ID /

Japanese Genotype-phenotype

Archive Data set ID

【GWAS集計情報】

hum0014.v5.AF.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

【個別データ(心房細動群のみ

Phenotype:JGAD000101

Genotype:JGAD000102

総データ量

GWAS:485 MB(txt)

Phenotype、Genotype:1 GB(txt)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 / hum0014.v6.158k.v1

対象 182,505名(内、BMI研究で使用した対象数:158,284名)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2qtl (v1.1.3)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 を除外。

マーカー数(QC後)

常染色体:約600万 SNVs (hg19)

X染色体:約15万 SNVs (hg19)

NBDC Data Set ID /

Japanese Genotype-phenotype

Archive Data set ID

【GWAS】

hum0014.v6.158k.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

【個別データ】

Phenotypeデータ(BMI):JGAD000124

Genotypeデータ:JGAD000123

遺伝型情報に関する詳細

アレイプローブの取り扱いに関する情報

総データ量

GWAS:406 MB(zip)

Phenotypeデータ(BMI):3.32 MB(txt.gz)

Genotypeデータ:26.3 GB(csv.gz)

コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v7.POAG.v1

対象

開放隅角緑内障(ICD10:H401):3980症例(男性:1,997、女性:1,983)

対照者:18,815名(男性:7,817、女性:10,998)

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア) minimac(ver. 0.1.1)[imputation(1000 genomes Phase I v3 )]
関連解析(ソフトウェア) mach2dat(ver. 1.0.19)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.5%,

          対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01  

        GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

Imputation後のQC:Imputation quality (Rsq) < 0.7を除外。

         さらに、ベータが4未満もしくは4を超えるものは公開用に除外。

マーカー数(QC後)

常染色体:5,961,428 SNPs(hg19)

男性X染色体:147,351 SNPs(hg19)

女性X染色体:147,353 SNPs(hg19)

NBDC Data Set ID

hum0014.v7.POAG-1.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 113 MB(txt.zip)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 / hum0014.v8.58qt.v1

対象 162,255名の58臨床検査値
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2qtl(v1.1.3)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 を除外。

マーカー数(QC後)

常染色体:5,961,600 SNVs(hg19)

X染色体:147,353 SNVs(hg19)

NBDC Data Set ID /

Japanese Genotype-phenotype

Archive Data set ID

血糖・脂質関連 総コレステロール JGAD000144
HDLコレステロール JGAD000145
LDLコレステロール JGAD000146
中性脂肪 JGAD000147
血糖 JGAD000148
ヘモグロビンA1c JGAD000149
血清蛋白質 総蛋白 JGAD000150
アルブミン JGAD000151
非アルブミン蛋白 JGAD000152
アルブミン/グロブリン比 JGAD000153
腎機能 尿素窒素 JGAD000154
血清クレアチニン JGAD000155
推算糸球体濾過量 JGAD000156
尿酸 JGAD000157
電解質 ナトリウム JGAD000158
カリウム JGAD000159
クロール JGAD000160
カルシウム JGAD000161
無機リン JGAD000162
肝機能 総ビリルビン JGAD000163
硫酸亜鉛混濁試験 JGAD000164
アスパラギン酸アミノ基転移酵素 JGAD000165
アラニンアミノ基転移酵素 JGAD000166
アルカリフォスファターゼ JGAD000167
ガンマグルタミルトランスフェラーゼ JGAD000168
その他の検査値 活性化部分トロンボプラスチン時間 JGAD000169
プロトロンビン時間 JGAD000170
フィブリノーゲン JGAD000171
クレアチンキナーゼ JGAD000172
乳酸脱水素酵素 JGAD000173
C反応性蛋白 JGAD000174
血球数 白血球数 JGAD000175
好中球数 JGAD000176
好酸球数 JGAD000177
好塩基球数 JGAD000178
単球数 JGAD000179
リンパ球数 JGAD000180
赤血球数 JGAD000181
ヘモグロビン濃度 JGAD000182
ヘマトクリット値 JGAD000183
平均赤血球容積 JGAD000184
平均赤血球ヘモグロビン量 JGAD000185
平均赤血球ヘモグロビン濃度 JGAD000186
血小板数 JGAD000187
血圧 収縮期血圧 JGAD000188
拡張期血圧 JGAD000189
平均血圧 JGAD000190
脈圧 JGAD000191
心エコー 心室中隔壁厚 JGAD000192
後壁厚 JGAD000193
左室拡張末期径 JGAD000194
左室収縮末期径 JGAD000195
左室心筋重量 JGAD000196
左室心筋重量係数 JGAD000197
相対的壁厚 JGAD000198
左室内径短縮率 JGAD000199
左室駆出率 JGAD000200
E/A比 JGAD000201

(GWAS統計情報のダウンロードは上記形質名をクリックしてください)

Dictionary file

総データ量

GWAS:平均 123 MB(zip)

Phenotypeデータ(58形質):平均 2.4 MB(txt.gz)

コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v9.Men.v1 / hum0014.v9.MP.v1

対象

初潮年齢データを有する女性67,029名

閉経年齢データを有する女性43,861名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2qtl (v1.1.3)
フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.5%,

          対照者群で HWE P < 1 x 10^-6

ImputationのQC:リファレンスパネルで HWE P < 1 x 10^-6 もしくは MAF < 0.01  

        GWASデータセットとリファレンスパネルのアレル頻度差 > 0.16

Imputation後のQC:Imputation quality (Rsq) < 0.7を除外。

         さらに、ベータが4未満もしくは4を超えるものは公開用に除外。

マーカー数(QC後) 9,296,729 SNPs (hg19)
NBDC Data Set ID

初潮:hum0014.v9.Men.v1

閉経:hum0014.v9.MP.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

初潮:Dictionary file

閉経:Dictionary file

総データ量

初潮:181 MB(txt.gz)

閉経:186 MB(txt.gz)

コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 / JGAD000220 / JGAD000410

対象 2003年から2007年度にバイオバンク・ジャパンに登録された47疾患患者:1,026名
規模 WGS
対象領域(Target Captureの場合) -
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) TruSeq Nano DNA Library Preparation Kit
断片化の方法 超音波断片化
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 160 bp
クオリティコントロール方法

リードのbase qualityが全体的に悪い検体、リード毎の%GCの結果にて異常を示した検体を除去。

Alignment後、Low mapping rate検体、Insert sizeがおかしい検体、メタデータの性別情報とalingment結果より推定される性別情報が不一致な検体、性染色体異常疑いの検体を除去。

Genotyping時に、VQSR、DP/GP filter (DP < 5, GQ < 20, DP > 60 && GQ < 95を除去)、heterozygosity filter (F>=0.05 を除去)、HWE filter (p < 10-6を除去)、Repeat & Low Complexity filterを実施。

1000 genomes projectと合わせたPCAを実施し、日本人クラスタから大きく外れる検体を除外。

その後、Genome-In-A-Bottleプロジェクトから公開されているHighConfidenceRegionリストに記載のある領域のバリアントにフラグを付与。

重複するリードの除去 Picard 2.10.6
リアライメントおよびベースクオリティのキャリブレーション GATK 3.7
マッピング方法 BWA mem 0.7.12
マッピングクオリティ GATK 3.7 HaplotypeCallerで変異コール時にMAPQ<20のリードを除外
マッピングの際のリファレンス配列 GRCh37/hg19(hs37d5)
平均カバー率(Depth) HiSeq 2000/2500:31.8x、NovaSeq 6000:28.0x
変異検出方法 GATK 3.7 HaplotypeCaller
SNV数(QC後)

76,768,387(常染色体)

2,898,518(X 染色体)

INDEL数(QC後)

10,202,908(常染色体)

410,435(X 染色体)

Japanese Genotype-phenotype Archive Data set ID

JGAD000220(fastq)

JGAD000410(bam、vcf):GEnome Medical alliance Japan(GEM Japan, GEM-J)の取り組みとして、GATK Best Practicesに準拠した方法により、GRCh37の参照ゲノム配列へのマッピングおよびバリアント検知を実施した際のデータです。詳しくはこちらをご覧ください。

総データ量 73 TB(fastq)+49 TB(bam、vcf)
コメント(利用にあたっての制限事項) NBDC policy

日本人集団ゲノム関連解析情報データベース「Jenger」にて、当該データの概要データ(アリル頻度情報)をダウンロードできます。

 

JGAS000140

対象

乳がん(ICD10:C509):7,104症例

対照者:23,731名

規模 Target Capture
対象領域(Target Captureの場合) 遺伝性乳がんの原因11遺伝子(ATM, BRCA1, BRCA2, CDH1, CHEK2, NBN, NF1, PALB2, PTEN, STK11, TP53)の翻訳領域
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) 2X Platinum Multiplex PCR Master Mix (Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 *1
断片化の方法 -
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp x 2
Japanese Genotype-phenotype Archive Data set ID JGAD000209
総データ量 1 TB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

※1 Hum Mol Genet. 25,:5027-5034 (2016)

 

hum0014.v12.T2DMwN.v1

対象

[GWAS-1]

  2型糖尿病腎症:2,380症例、2型糖尿病対照(腎症非発症群):5,234症例

[GWAS-2]

  2型糖尿病腎症:429症例、2型糖尿病対照(腎症非発症群):358症例

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [OmniExpressExome Beadchip、Human610-Quad BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン)

Illumina OmniExpressExome Beadchip kit 

Illumina Human610-Quad Beadchip kit

遺伝子型決定アルゴリズム(ソフトウェア)

MACH and Minimac(1000 Genomes phased JPT, CHB and Han Chinese South data n = 275, March 2012)

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2dat
フィルタリング

sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.1%,

対照者群で HWE P < 1 x 10-6

マーカー数(QC後) 7,521,072 SNPs(hg19)
NBDC Data Set ID

hum0014.v12.T2DMwN.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 310 MB(csv.zip)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v13.T2DMmeta.v1

対象

[GWAS-1]

  2型糖尿病(ICD-10:E11):9,804症例、対照者:6,728名

[GWAS-2]

  2型糖尿病(ICD-10:E11):5,639症例、対照者:19,407名

[GWAS-3]

  2型糖尿病(ICD-10:E11):18,688症例、対照者:121,950名

[GWAS-4]

  2型糖尿病(ICD-10:E11):2,483症例、対照者:7,065名

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome、Human610-Quad BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome、Human610-Quad Beadchip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase 3)]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) mach2dat (v1.0.24)
フィルタリング

GenotypingのQC:

GWAS1, GWAS3, GWAS4除外基準

(i) hetero count < 5

(ii) 各chipでHWE P < 1.0 × 10^-6

(iii) in-house WGSデータとのジェノタイプ一致率 < 0.99

(iv) SNV call rate < 0.99

GWAS2除外基準

(i) SNV call rate < 0.99

(ii) MAF < 0.01

(iii) differential missingness P < 1.0 × 10^-6

(iv) HWE P < 1.0 × 10^-6

ImputationのQC:

リファレンスパネルで HWE P < 1 × 10^-6 もしくは MAF < 0.01を除外

3つ以上のGWASでImputation quality (Rsq) < 0.3となったものを除外

マーカー数(QC後) 12,557,761 SNPs(hg19)
NBDC Data Set ID

hum0014.v13.T2DMmeta.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 257 MB(txt)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v14.smok.v1

対象 165,436名の喫煙習慣データ
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac [imputation(1000 genomes Phase I v3 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア)

BOLT-LMM(v2.2)

ProbABEL(v0.4.5; for X chromosome)

フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, HWE P < 1 x 10^-6

Imputation referenceのQC:

 以下の条件に該当するSNVはreferenceから除外:

 1) HWE P < 1 x 10^-6、2) MAF < 0.01

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 and MAF < 0.01を除外

マーカー数(QC後)

常染色体:5,961,480 SNVs(hg19)

男性X染色体(喫煙開始年齢):163,412 SNVs(hg19)

女性X染色体(喫煙開始年齢):146,130 SNVs(hg19)

男性X染色体(喫煙本数):166,111 SNVs(hg19)

女性X染色体(喫煙本数):146,114 SNVs(hg19)

男性X染色体(喫煙歴):166,138 SNVs(hg19)

女性X染色体(喫煙歴):146,146 SNVs(hg19)

男性X染色体(禁煙歴の有無):166,142 SNVs(hg19)

女性X染色体(禁煙歴の有無):146,118 SNVs(hg19)

NBDC Data Set ID

hum0014.v14.asi.v1(喫煙開始年齢)

hum0014.v14.cpd.v1(喫煙本数)

hum0014.v14.ens.v1(喫煙歴)

hum0014.v14.fcs.v1(禁煙歴の有無)

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 1.9 GB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000114 reference panel

対象

・1026名のWGSデータ(JGAD000220)を含むバイオバンクジャパン1037名のWGSデータのvcfファイル(WGSデータの分子データは上記参照のこと)

・1000ゲノムプロジェクト(Phase3v5)2504名のWGSのvcfファイル(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/

規模 WGS解析により検出された変異情報の統合(常染色体およびX染色体上のvariants)
対象領域(Target Captureの場合) -
クオリティコントロール方法

We set exclusion criteria for genotypes as follows:

(1) DP < 5, (2) GQ < 20, or (3) DP > 60 and GQ < 95, and regarded these genotypes as missing.

Variants with call rates < 90% were excluded before variant quality score recalibration (VQSR).

After VQSR, we excluded variants located in low-complexity regions (LCR), as defined by mdust software were excluded.

Finally, we used BEAGLE to impute missing genotypes.

重複するリードの除去 picard (versions 1.106)
リアライメントおよびベースクオリティのキャリブレーション GATK (version 3.2-2)
マッピング方法 BWA-MEM (version 0.7.5a)
マッピングクオリティ MAPQ < 20 を除外(HaplotypeCaller)
マッピングの際のリファレンス配列 GRCh37/hg19, hs37d5
平均カバー率(Depth) aimed at 30x depth
変異検出方法 GATK HaplotypeCaller (version 3.2-2)
vcfファイルの統合方法

常染色体:Impute2

X染色体:Beagle(男性)、Impute2(女性)

リファレンスパネルに含まれるvariant数 61,608,817 variants(常染色体:59,387,070variants、X染色体:2,221,747variants)
Japanese Genotype-phenotype Archive Data set ID JGAD000220
総データ量 約15 GB(vcf.gz)
コメント(利用にあたっての制限事項) NBDC policy

バイオバンクジャパン1037名のデータに対して実施。

 

hum0014.v15.ht.v1

対象

バイオバンクジャパンに参加した159,095名

(男性:86,257名、女性:72,838名)

規模 genome wide variants
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア) Minimac3 [imputation reference panel using WGS data of the biobank Japan project (N=1,037) and 1KGP p3v5 ALL (N=2,504)]
関連解析(ソフトウェア) BOLT-LMM (ver2.2)、mach2qtl
フィルタリング

Sample QCs:1) call rate < 98%、2) closely related samples (PI_HAT > 0.175)、3) outlier from Japanese cluster determined by PCA using GCTA を除外。

Imputation後のQC:Imputation quality (Rsq) < 0.3 を除外。

マーカー数(QC後)

常染色体:27,211,524 variants(hg19)

男性X染色体:684,533 variants(hg19)

女性X染色体:684,533 variants(hg19)

NBDC Data Set ID

hum0014.v15.ht.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 約663 MB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000203

対象

遺伝性前立腺がん(ICD10:C61):7,636症例

対照者:12,366名

規模 Target Capture
対象領域(Target Captureの場合) 遺伝性前立腺がんの原因8遺伝子(ATM, BRCA1, BRCA2, BRIP1, CHEK2, HOXB13, NBN, PALB2)の翻訳領域
Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) 2X Platinum Multiplex PCR Master Mix (Thermo Fisher Scientific)を用いたmultiplex PCRで対象遺伝子領域を抽出し、2nd PCRにより、KAPA HiFi DNA Polymeraseを用いてHiSeqに必要なバーコード配列およびアダプター配列を付加 *1
断片化の方法 -
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp x 2
Japanese Genotype-phenotype Archive Data set ID JGAD000288
総データ量 2.2 TB(fastq)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v17 / hum0014.v18 / hum0014.v21

対象

42疾患(ICD10 code)

不整脈(I499)、気管支喘息(J459)、アトピー性皮膚炎(L209)、

胆嚢・胆管がん(C23, C240)、白内障(H269)、

脳動脈瘤(I671)、子宮頸がん(C539)、B型慢性肝炎(B181)、

C型慢性肝炎(B182)、COPD(J449)、肝硬変(K746)、

大腸・直腸がん(C189, C20)、心不全(I509, I500)、薬疹(L270)、

子宮体がん(C549)、子宮内膜症(N809)、てんかん(G409)、

食道がん(C159)、胃がん(C169)、緑内障(H409)、バセドウ病(E050)、

造血器腫瘍(C81-96)、肝がん(C220)、肺線維症(J849, J841)、

脳梗塞(I639)、ケロイド(L910)、肺がん(C349)、

ネフローゼ症候群(N049)、骨粗鬆症(M8199)、卵巣がん(C56)、

膵がん(C259)、歯周病(K054)、ASO(I709)、花粉症(J301)、

前立腺がん(C61)、肺結核(A169)、関節リウマチ(M0690)、

糖尿病(E14)、尿路結石症(N209)、子宮筋腫(D259)、乳がん(C509)

虚血性心疾患(I200、I209、I219)

規模 genome wide variants
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

minimac3 [imputation(1000 genomes Phase 3 v5 )]

GenCall software(GenomeStudio)

関連解析(ソフトウェア) SAIGE(v0.29.4.2)
フィルタリング

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 を除外

マーカー数(QC後)

常染色体:8,712,794 variants(hg19)

X染色体:207,198 variants(hg19)

NBDC Data Set ID 不整脈 hum0014.v17.AR.v1
気管支喘息 hum0014.v17.BA.v1
アトピー性皮膚炎 hum0014.v17.AD.v1
胆嚢・胆管がん hum0014.v17.GCc.v1
白内障 hum0014.v17.Cat.v1
脳動脈瘤 hum0014.v17.CA.v1
子宮頸がん hum0014.v17.CeC.v1
B型慢性肝炎 hum0014.v17.CHB.v1
C型慢性肝炎 hum0014.v17.CHC.v1
COPD hum0014.v17.COPD.v1
肝硬変 hum0014.v17.Cir.v1
大腸・直腸がん hum0014.v17.CC.v1
心不全 hum0014.v17.HF.v1
薬疹 hum0014.v17.DE.v1
子宮体がん hum0014.v17.UC.v1
子宮内膜症 hum0014.v17.EM.v1
てんかん hum0014.v17.Ep.v1
食道がん hum0014.v17.EC.v1
胃がん hum0014.v17.GC.v1
緑内障 hum0014.v17.Gla.v1
バセドウ病 hum0014.v17.GD.v1
造血器腫瘍 hum0014.v17.HT.v1
肝がん hum0014.v17.LiC.v1
肺線維症 hum0014.v17.IP.v1
脳梗塞 hum0014.v17.CI.v1
ケロイド hum0014.v17.Kel.v1
肺がん hum0014.v17.LuC.v1
ネフローゼ症候群 hum0014.v17.NS.v1
骨粗鬆症 hum0014.v17.OP.v1
卵巣がん hum0014.v17.OC.v1
膵がん hum0014.v17.PaC.v1
歯周病 hum0014.v17.PD.v1
ASO hum0014.v17.PAD.v1
花粉症 hum0014.v17.Hay.v1
前立腺がん hum0014.v17.PrC.v1
肺結核 hum0014.v17.PT.v1
関節リウマチ hum0014.v17.RA.v1
糖尿病 hum0014.v17.DM.v1
尿路結石症 hum0014.v17.Uro.v1
子宮筋腫 hum0014.v17.UF.v1
乳がん hum0014.v18.BC.v1
虚血性心疾患 hum0014.v21.CAD.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

Sample size file

総データ量

常染色体:0.9-1.3 GB程度(txt)

X染色体:20-30 MB程度(txt)

コメント(利用にあたっての制限事項) NBDC policy

緑内障(hum0014.v7.POAG.v1)、心房細動(hum0014.v5.AF.v1)、アトピー性皮膚炎患(hum0014.v4.AD.v1)、2型糖尿病(hum0014.v3.T2DM-2.v1)と一部重複あり。

 

hum0014.v19

対象 165,084名の食習慣(13項目)
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

GenCall software(GenomeStudio)

MACH

minimac (v.0.1.1) [imputation(1000 genomes Phase I v3 )]

関連解析(ソフトウェア)

BOLT-LMM(v2.2)for autosomes

ProbABEL(v0.4.5)for X chromosome

フィルタリング

GenotypingのQC:sample call rate < 0.98, SNV call rate < 0.99, MAF < 0.005

Imputation referenceのQC:

 HWE P < 1 x 10^-6、MAF < 0.01に該当するSNVを除外

Imputation後のQC:

 Imputation quality (Rsq) < 0.7 and MAF < 0.01を除外

マーカー数(QC後)

常染色体:5,961,480 variants(hg19)

X染色体:148,568 variants for female、170,117 variants for male(hg19)

NBDC Data Set ID 飲酒歴の有無 hum0014.v19.drink.v1
1週間あたりの飲酒量 hum0014.v19.dpw.v1
コーヒー摂取頻度 hum0014.v19.cafe.v1
緑茶摂取頻度 hum0014.v19.tea.v1
牛乳摂取頻度 hum0014.v19.milk.v1
ヨーグルト摂取頻度 hum0014.v19.ygt.v1
チーズ摂取頻度 hum0014.v19.cheese.v1
納豆摂取頻度 hum0014.v19.natto.v1
豆腐摂取頻度 hum0014.v19.tofu.v1
魚摂取頻度 hum0014.v19.fish.v1
小魚摂取頻度 hum0014.v19.sfish.v1
野菜摂取頻度 hum0014.v19.vege.v1
肉摂取頻度 hum0014.v19.meat.v1

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 各形質:約420 MB(txt.zip)
コメント(利用にあたっての制限事項) NBDC policy

 

hum0014.v20.cad.v1

対象

冠動脈疾患(ICD10:I20-25):25,892症例

対象者:142,336名

規模 genome wide variants
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、HumanExome、OmniExpressExome BeadChip]
ソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpress、HumanExome、OmniExpressExome BeadChip kit
遺伝子型決定アルゴリズム(ソフトウェア)

GenCall software(GenomeStudio)

minimac3(BBJ-CAD reference panel)

関連解析(ソフトウェア) PLINK2
フィルタリング Imputation後のQC: Imputation quality (Rsq) < 0.3 または MAF < 0.0002 を除外
マーカー数(QC後) 常染色体:19,707,525 variants(hg19)
NBDC Data Set ID

hum0014.v20.gwas.v1(統計解析データ)

hum0014.v20.prs.v1(ポリジェニックリスクスコア)

(データのダウンロードは上記Data Set IDをクリックしてください)

Dictionary file

総データ量 約413 MB(txt.gz)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000293(Target Capture)

対象 2003年から2007年度にバイオバンク・ジャパンに登録されたサンプル(約20万例)から抽出された11,234名
規模 Target Capture
対象領域(Target Captureの場合)

下記の23遺伝子における全てのエクソン領域

ASXL1, CBL, CEBPA, DDX41, DNMT3A, ETV6, EZH2, GATA2, GNAS, GNB1, IDH1, IDH2, JAK2, KRAS, MYD88, NRAS, PPM1D, RUNX1, SF3B1, SRSF2, TET2, TP53, U2AF1

Platform Illumina [HiSeq 2500]
ライブラリソース 末梢血から抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名)

ライブラリ作成は下記の論文に記載された方法で実施した。

Momozawa, Y., et al. Low-frequency coding variants in CETP and CFB are associated with susceptibility of exudative age-related macular degeneration in the Japanese population. Hum Mol Genet 25, 5027-5034 (2016).

断片化の方法 -
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp
クオリティコントロール方法 Depth 20以上の領域が98%以上のサンプルを解析対象とした。
マッピング方法 bwa
マッピングクオリティ ≥40
マッピングの際のリファレンス配列 hg19
平均カバー率 x800
変異検出方法 Genomon pipeline
フィルタリング方法 Genomon pipeline
Japanese Genotype-phenotype Archive Data set ID JGAD000399
総データ量 5.3 MB(txt)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000293(SNPアレイ)

対象 2003年から2007年度にバイオバンク・ジャパンに登録されたサンプル(約20万例)から抽出された11,234名
規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpress、OmniExpressExome]
ライブラリソース 末梢血から抽出したDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Illumina Infinium OmniExpress, Infinium OmniExpressExome v.1.0, or v.1.2
遺伝子型決定アルゴリズム(ソフトウェア) GenCall software(GenomeStudio)
染色体変異検出アルゴリズム(ソフトウェア)

ハプロタイプ情報に基づくアリル不均衡の検出法(下記の論文を参照)

Terao, C., et al. Chromosomal alterations among age-related haematopoietic clones in Japan. Nature (2020).

フィルタリング 上記の3バージョンのアレイの全てでカバーされているSNPsを使用した
マーカー数(QC後) 515,355
Japanese Genotype-phenotype Archive Data set ID JGAD000400
総データ量 5.3 MB(csv)
コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 久保 充明

所 属 機 関: 理化学研究所 統合生命医科学研究センター 疾患多様性医科学研究部門

プロジェクト/研究グループ名: オーダーメイド医療の実現プログラム

URL: http://www.biobankjp.org/index.html

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
文部科学省 科学技術試験研究委託事業費 オーダーメイド医療の実現プログラム(第3期) -
日本医療研究開発機構(AMED) オーダーメイド医療の実現プログラム 疾患関連遺伝子等の探索を効率化するための遺伝子多型情報の高度化 17km0305002h0005
日本医療研究開発機構(AMED) 次世代がん医療創生研究事業(P-CREATE) 大規模シーケンス解析に基づく、造血器腫瘍のゲノム、エピゲノムにおける、空間的・時間的多様性の研究 JP19cm010650
日本医療研究開発機構 革新的先端研究開発支援事業(AMED-CREST) 加齢や炎症に伴う組織の再構築と機能低下 JP19gm1110011
科学研究費助成事業 基盤研究(S) 先端ゲノミクスを駆使したがんの初期発生とクローン進化に関わる分子基盤の解明 19H05656

 

関連論文

タイトルDOIデータID
1 A genome-wide association study identifies PLCL2 and AP3D1-DOT1L-SF3A2 as new susceptibility loci for myocardial infarction in Japanese. doi:10.1038/ejhg.2014.110 hum0014.v1.freq.v1
2 A functional variant in ZNF512B is associated with susceptibility to amyotrophic lateral sclerosis in Japanese. doi:10.1093/hmg/ddr268 hum0014.v2.jsnp.92als.v1
3 Functional variants in ADH1B and ALDH2 coupled with alcohol and smoking synergistically enhance esophageal cancer risk. doi: 10.1053/j.gastro.2009.07.070 hum0014.v2.jsnp.182ec.v1
4 SNPs in KCNQ1 are associated with susceptibility to type 2 diabetes in East Asian and European populations. doi: 10.1038/ng.208 T2DM (JSNP)
5 Common variants in a novel gene, FONG on chromosome 2q33.1 confer risk of osteoporosis in Japanese. doi: 10.1371/journal.pone.0019641 Osteoporosis (JSNP)
6 Genome-wide association studies in the Japanese population identify seven novel loci for type 2 diabetes. doi: 10.1038/ncomms10531

hum0014.v3.T2DM-1.v1

hum0014.v3.T2DM-2.v1

7 Multi-ancestry genome-wide association study of 21,000 cases and 95,000 controls identifies new risk loci for atopic dermatitis. doi: 10.1038/ng.3424 hum0014.v4.AD.v1
8 Genome-wide association study identifies eight new susceptibility loci for atopic dermatitis in the Japanese population. doi: 10.1038/ng.2438 hum0014.v4.AD.v1
9 Identification of six new genetic loci associated with atrial fibrillation in the Japanese population. doi: 10.1038/ng.3842 hum0014.v5.AF.v1
10 Genome-wide association study identifies 112 new loci for body mass index in the Japanese population. doi:10.1038/ng.3951

hum0014.v6.158k.v1

JGAD000123

JGAD000124

11 Genome-wide association study identifies seven novel susceptibility loci for primary open-angle glaucoma. doi: 10.1093/hmg/ddy053 hum0014.v7.POAG.v1
12 Genetic analysis of quantitative traits in the Japanese population links cell types to complex human diseases. doi:10.1038/s41588-018-0047-6

hum0014.v8.58qt.v1

JGAD000144-JGAD000201

13 Elucidating the genetic architecture of reproductive ageing in the Japanese population doi: 10.1038/s41467-018-04398-z

hum0014.v9.Men.v1

hum0014.v9.MP.v1

14 Deep whole-genome sequencing reveals recent selection signatures linked to evolution and disease risk of Japanese. doi: 10.1038/s41467-018-03274-0 JGAD000220
15 Germline pathogenic variants of 11 breast cancer genes in 7,051 Japanese patients and 11,241 controls. doi: 10.1038/s41467-018-06581-8 JGAD000209
16 A Variant within the FTO confers susceptibility to diabetic nephropathy in Japanese patients with type 2 diabetes doi: 10.1371/journal.pone.0208654 hum0014.v12.T2DMwN.v1
17 Identification of 28 new susceptibility loci for type 2 diabetes in the Japanese population doi: 10.1038/s41588-018-0332-4 hum0014.v13.T2DMmeta.v1
18 GWAS of smoking behaviour in 165,436 Japanese people reveals seven new loci and shared genetic architecture. doi: 10.1038/s41562-019-0557-y

hum0014.v14.asi.v1

hum0014.v14.cpd.v1

hum0014.v14.ens.v1

hum0014.v14.fcs.v1

19 Characterizing rare and low-frequency height-asssociated variants in the Japanese population doi: 10.1038/s41467-019-12276-5

JGAD000220 (fastq)

JGAD000220 (reference panel)

hum0014.v15.ht.v1

20 Germline pathogenic variants in 7,636 Japanese patients with prostate cancer and 12,366 controls. doi: 10.1093/jnci/djz124 JGAD000288
21 Large-scale genome-wide association study in a Japanese population identifies novel susceptibility loci across different diseases doi: 10.1038/s41588-020-0640-3

hum0014.v17

hum0014.v18

hum0014.v21

22 GWAS of 165,084 Japanese individuals identified nine loci associated with dietary habits doi: 10.1038/s41562-019-0805-1 hum0014.v19
23 Population-specific and transethnic genome-wide analyses identify distinct and shared genetic risk loci for coronary artery disease. doi: 10.1038/s41588-020-0705-3 hum0014.v20.cad.v1
24

 

制限公開データの利用者一覧

研究代表者所属機関研究題目利用データID利用期間
Mark Daly Broad Institute of MIT and Harvard JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/09/11-2023/07/31
岡田 随象 大阪大学大学院医学系研究科・遺伝統計学 JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/09/20-2021/03/31
上辻 茂男 株式会社スタージェン JGAD000123 2018/10/04-2019/03/31
徳永 勝士 東京大学大学院医学系研究科人類遺伝学教室 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/11/13-2026/11/08
角田 達彦 東京医科歯科大学・難治疾患研究所・医科学数理分野 オーダーメイド医療のためのビッグデータ解析に関する研究 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2018/12/18-2021/06/19
Liming Liang Harvard T.H. Chan School of Public Health, Department of Epidemiology JGAD000123 2019/01/21-2021/12/31
長崎 正朗 東北大学 東北メディカル・メガバンク機構 ゲノム解析部門 バイオメディカル情報解析分野 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2019/01/31-2021/03/16
小川 誠司 京都大学大学院医学研究科 腫瘍生物学講座 JGAD000209 2019/02/04-2021/03/31
上辻 茂男 株式会社スタージェン JGAD000123 2019/03/13-2022/03/31
河野 隆志 国立研究開発法人国立がん研究センター JGAD000123, JGAD000124, JGAD000220 2019/04/15-2019/12/31
堀江 重郎 順天堂大学大学院医学研究科・遺伝子疾患先端情報学 JGAD000123, JGAD000220 2019/05/14-2024/03/31
角田 達彦 東京医科歯科大学・難治疾患研究所・医科学数理分野 オーダーメイド医療のためのシーケンス、画像データなどの解析に関する研究 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2019/06/06-2023/08/31
木下 健吾 東北大学 東北メディカル・メガバンク機構 日本人全ゲノムデータベースの構築 JGAD000220 2019/06/24-2022/03/31
白石 航也 国立研究開発法人国立がん研究センター研究所 ゲノム生物学研究分野 ゲノム解析に基づく宿主並びに腫瘍における免疫応答ネットワーク機構の解明 JGAD000124 2019/08/05-2023/03/31
上辻 茂男 株式会社スタージェン 統計解析事業部 尿酸代謝に関連する遺伝子を操作変数としたメンデル無作為化解析 JGAD000123, JGAD000124,
JGAD000146, JGAD000148,
JGAD000149, JGAD000155,
JGAD000156, JGAD000157,
JGAD000174, JGAD000188
2019/08/16-2024/03/31
上辻 茂男 株式会社スタージェン 統計解析事業部 網羅的な臨床検査値のメンデル無作為解析 JGAD000123, JGAD000124,
JGAD000144-JGAD000201
2019/08/22-2024/03/31
小笠原 理 国立遺伝学研究所 生命情報・DDBJセンター JGA/AGDゲノムデータを利用したヒトゲノム解析ワークフローの評価 JGAD000123, JGAD000220 2019/10/11-2024/03/31
小川 誠司 京都大学 医学研究科 造血器腫瘍における遺伝子異常の網羅的解析 JGAD000102, JGAS000123,
JGAD000220
2019/11/14-2024/03/31
岡﨑 康司 順天堂大学 大学院医学研究科 難治性疾患診断・治療学 疾患コホート研究ネットワークによる疾患マーカー探索研究 JGAD000123 2020/06/04-2023/03/31
秦 千比呂 国立遺伝学研究所 生命情報・DDBJセンター 日本人乳癌患者シーケンスデータにおけるhypomorphic変異同定 JGAD000209 2020/06/04-2023/03/31
河合 洋介 国立国際医療研究センター ゲノム医科学プロジェクト ヤポネシア人の起源をさぐるための現代人ゲノム塩基配列の大規模解析 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/06/19-2022/03/31
岩田 仲生 藤田医科大学 医学部 精神神経科学 遺伝子解析によるこころの健康とこころの病気に対するかかりやすさ(発症脆弱性)や薬の効きめや副作用(治療反応性)等の解明に関する研究 JGAD000123, JGAD000124 2020/08/17-2022/12/31
Atray Dixit Coral Genomics, Inc. Derivation and Evaluation of Functional Response Scores JGAD000101, JGAD000123,
JGAD000124, JGAD000144-JGAD000201, JGAD000220
2020/08/24-2021/07/21
Hae Kyung Im Biological Sciences Division, University of Chicago Predicted Gene Expression: High Power, Mechanism, and Direction of Effect JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/09/15-2023/06/23
Hongyu Zhao Department of Biostatistics, Yale School of Public Health Leveraging multi-ethnic data and functional annotations in causal variant identification, genetic correlation estimation, and genetic risk prediction JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/09/24-2024/03/01
Charleston Chiang Center for Genetic Epidemiology, Keck School of Medicine, University of Southern Califolnia Investigating the evolution of complex genetic architecture in participants of Biobank Japan JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/09/28-2025/07/01
上辻 茂男 式会社スタージェン 統計解析事業部 ステント血栓症発症の遺伝的要因の探索のためのゲノムワイド関連研究 JGAD000123, JGAD000124,
JGAD000145, JGAD000146,
JGAD000149, JGAD000151,
JGAD000155, JGAD000156,
JGAD000158, JGAD000159,
JGAD000163,
JGAD000165-JGAD000167,
JGAD000170,
JGAD000172-JGAD000175,
JGAD000182,
JGAD000187-JGAD000189,
JGAD000192-JGAD000196,
JGAD000200, JGAD000201
2020/10/26-2025/03/31
Ali Torkamani Scripps Research Institute Genomics Deep Learning JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/11/16-2023/07/10
中山 一大 東京大学大学院 新領域創成科学研究科 先端生命科学専攻 褐色脂肪組織活性に寄与するゲノム多型の探索 JGAD000123, JGAD000124 2020/11/26-2023/09/18
藤尾 圭志 東京大学大学院医学系研究科 アレルギー・リウマチ内科 日本人免疫細胞eQTLデータと日本人大規模GWASデータの統合解析 JGAD000101, JGAD000102,
JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2020/12/14-2025/03/31
菊地 正隆 大阪大学 大学院医学系研究科 日本人リファレンスパネルを用いたゲノムデータ補完 JGAD000220 2020/12/14-2023/03/31
松田 文彦 京都大学大学院医学研究科 附属ゲノム医学センター 日本人の遺伝的多様性の解明(G751-5) JGAD000220 2021/01/05-2025/03/31
野口 恵美子 筑波大学 医学医療系 アレルギー疾患における遺伝要因の探索研究 JGAD000220 2021/03/16-2032/03/31
佐藤 憲子 東京医科歯科大学 難治疾患研究所 分子疫学 地域コホート縦断データに基づく肥満・糖尿病発症・進行の遺伝・環境リスクの解析 JGAD000220 2021/04/09-2023/03/31
河野 隆志 国立研究開発法人国立がん研究センター研究所 ゲノム生物学研究分野 AYA(Adolescence and Young Adult)世代がんの個別化予防に資する遺伝要因の同定を目指す研究 JGAD000209, JGAD000220 2021/05/20-2025/03/31
永田 安伸 日本医科大学 血液内科 新たな遺伝学的異常を用いた造血器腫瘍発症メカニズムの探索 JGAD000123, JGAD000124,
JGAD000144-JGAD000201,
JGAD000220
2021/05/26-2026/03/31
川上 純 長崎大学病院 リウマチ・膠原病内科 免疫チェックポイント阻害薬ニボルマブが誘発する1型糖尿病、間質性肺疾患の発症に関連する原因遺伝子多型・変異の探索的研究 JGAD000220 2021/06/14-2022/03/30