NBDC Research ID: hum0311.v4

最新版はこちらです

研究内容の概要

目的: バイオバンク・ジャパン(BBJ)は、東京大学医科学研究所内に設置された臨床情報と生体試料(DNA・血清)のバイオバンクで、平成15(2003)年に委託事業として出発した「オーダーメイド医療実現化プロジェクト」により国内12協力医療機関と協力して収集された47疾患・約20万人(第一コホート)、並びに平成25(2013)年度に開始した「オーダーメイド医療の実現プログラム」により同様の方法で収集された38疾患・約6.7万人(第二コホート)からなる我が国の重要な研究基盤である。 本研究ではBBJが管理する試料・臨床情報及びゲノム情報のさらなる利活用を目指して、試料・情報の保管、管理、提供を継続して実施するとともに、生体試料やゲノム情報、臨床情報を用いて疾患のリスクや予後、薬剤感受性に関わるバイオマーカーを同定し、個別化医療に貢献する。

方法: Asian Screening Array (ASA-24v1-0_A2)による塩基配列決定

            TOPMed r2を用いたimputationデータ(GRCh38)

            血清サンプルについてNMR装置により取得したスペクトラムの250代謝物の定量データ

対象: BBJ第一コホート 11,716人+180,882人+1,285人+2,570人、BBJ第二コホート 42,689人

URL: https://biobankjp.org/

 

データID内容制限公開日
JGAS000412 BBJ第一コホート11,716名、BBJ第二コホート42,689名のGenotypeデータ 制限公開(Type I) 2021/11/30
JGAS000541 BBJ第一コホート180,882名を男女別に7つのバッチに分けて実施したImputationデータならびにindexデータ 制限公開(Type I) 2022/07/28
JGAS000561 BBJ第一コホート1,285名の血清サンプルを対象としたNMRによるメタボロームデータ 制限公開(Type I) 2022/09/08
JGAS000561(データ追加) BBJ第一コホート2,570名の血清サンプルを対象としたNMRによるメタボロームデータ 制限公開(Type I) 2023/04/24

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

 

分子データ

JGAS000412

対象

BBJ第一コホート(47疾患):11,716名

BBJ第二コホート(38疾患):42,689名

ICD10:C34, C15, C16, C18-C21, C22, C25, C23, C24, C61, C50, C53, C54, C56, C81-C86, C90-C93, I63, G45.9, I67.1, G40, J45, A15-A19, J44.9, J84.1-9, I21.0-9, I20.0, I20.1, I20.8, I20.9, R00, I44.0-3, I45.5-6, I47-I49, I50, I70.9, B18.1, B18.2, K74.6, N04, N20-N23, M80-M81, E10, E11, E88.8, E78.0-5, E78.8-9, E05.0, M05-M06, J30.1, L91.0, L20, L51.1-2, L27.0, D25, N80, R56.0, H40, H25-H26, K05, G12.2, I61, C64

規模 genome wide SNPs
対象領域(Target Captureの場合) -
Platform Illumina [Asian Screening Array (ASA-24v1-0_A2)]
ソース 末梢血(一部唾液)から抽出したDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Infinium Asian Screening Array-24 v1.0 BeadChip Kit
遺伝子型決定アルゴリズム(ソフトウェア) GenomeStudio
マーカー数(QC後) 657,060 SNVs(GRCh38)
Japanese Genotype-phenotype Archive Dataset ID JGAD000529
総データ量 1,020 GB(idat、csv、plink binary)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000541

対象

BBJ第一コホート(47疾患):180,882名

ICD10:A15-A16、B16-B17.0、B18.0-B18.1、B17.1、B18.2、C15、C16、C18、C22、C23-C24、C25、C33-C34、C50、C53、C54、C56、C61、C81、D25、E05、E10、E78.0-E78.5、G12、G40-G41、H25-H26、H40-H42、I20、I21-I22、I44-I49、I50、I60、I69.0、I63、I69.3、I70、J30、J41-J44、J45-J46、J80-J84、K05、K74.3-K74.6、L00-L99、L20、M05-M06、M80-M82、N04、N20-N23、N80、R00-R9

規模 genome wide SNVs
対象領域(Target Captureの場合) -
Platform Illumina [HumanOmniExpressExome、HumanOmniExpress、HumanExome]
ソース 末梢血(一部唾液)から抽出したDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) HumanOmniExpressExome-8、HumanOmniExpress-12、HumanExome-12 kit
遺伝子型決定アルゴリズム(ソフトウェア)

GenomeStudio Software

Eagle software (v2.4.1) without a reference panel

Minimac4 software (v1.0.2) 

リファレンス配列 TOPMed reference panel (Version R2 on GRC38)
フィルタリング

imputation前のQC:

Before imputation, we excluded SNPs using the following criteria:

    - Heterozygosity count for each chip < 5

    - P-value for Hardy–Weinberg equilibrium (HWE) for each chip < 1.0 x 10^-6 *

    - Genotype concordance rate with whole-genome sequencing (WGS) for 939 samples < 99.5% and its non-reference discordance rate >= 0.5%

    - Lower call rate SNPs if the position was the same when merging datasets

    - Call rate < 99%

   * P-values for chrX SNPs were calculated by using female samples

We also excluded samples using the following criteria :

    - Call Rate < 98%

    - Samples whose inferred sex was not matched with the clinical information

    - Lower call rate samples for duplicated or monozygotic twin in the dataset

    - Outliers from East Asian clusters from principal component analysis with 1KGp3v5 samples.

マーカー数(QC後)

常染色体:515,587 SNVs(GRCh38)

X染色体:11,140 SNVs(GRCh38)

Japanese Genotype-phenotype Archive Dataset ID JGAD000660
総データ量 11.1 TB (vcf、tbi)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000561

対象

BBJ第一コホート(47疾患):1,285名 (1,286検体)+2,570名(2,573検体)  累計:3,841名 (3,859検体)

ICD10:R00、I44.0-3、I45.5-6、I47-I49、I70.9、L20、J45、I67.1、I63、G45.9、C50、I50、I21.0-9、H25-H26、C53、B18.1、B18.2、C18-C21、J44.9、L51.1-2、L27.0、E10、E11、E88.8、N80、G40、C15、D25、C23、C24、H40、E05.0、K05、R56.0、C81-C86、C90-C93、C22、J30.1、E78.0-5、E78.8-9、J84.1-9、L91.0、K74.6、C34、N04、M80-M81、C56、C25、A15-A19、C61、M05-M06、I20.1、I20.8、I20.9、C16、N20-N23、I20.0、C54

規模 メタボローム(NMR)
対象領域(Target Captureの場合) -
Platform Bruker [AVANCE III HD]
ソース 血清サンプル
検体情報(購入の場合) -
測定パラメータ Nightingale Healthの内製ソフトウェア(quantification library 2020)
ノイズの低減方法・補正方法 Nightingale Healthの内製ソフトウェア(quantification library 2020)
アノテーション方法 Nightingale Healthの内製ソフトウェア(quantification library 2020)
定量アルゴリズム(ソフトウェア) Nightingale Healthの内製ソフトウェア(quantification library 2020)
定量対象領域 250代謝物 (代謝物リスト
Japanese Genotype-phenotype Archive Dataset ID JGAD000683
総データ量 7.1+15.3 MB(xlsx)
コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 松田 浩一

所 属 機 関: 東京大学大学院 新領域創成科学研究科

プロジェクト/研究グループ名:利活用を目的とした日本疾患バイオバンクの運営・管理

URL: https://biobankjp.org/

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
日本医療研究開発機構(AMED) ゲノム医療実現バイオバンク利活用プログラム(B-Cure) 利活用を目的とした日本疾患バイオバンクの運営・管理

JP20km0605001

JP23tm0624002

日本医療研究開発機構(AMED) ゲノム医療実現推進プラットフォーム事業 TOPMED panelを用いた高密度Imputationによる、バイオバンクジャパン18万症例のphenotype横断的解析 JP21km0405215

 

関連論文

タイトルDOIデータID
1
2

 

制限公開データの利用者一覧

研究代表者所属機関国・州名研究題目利用データID利用期間
小川 誠司 京都大学大学院医学研究科 腫瘍生物学講座 日本 クローン性造血と新型コロナウイルス感染症の関連性についての解析 JGAD000529 2022/08/15-2026/03/31
岡田 随象 大阪大学大学院医学系研究科 遺伝統計学 日本 日本人由来B細胞株DNAのゲノムデータを用いた遺伝統計解析手法の研究 JGAD000529, JGAD000660 2022/09/12-2025/03/31