研究内容の概要

目的： バイオバンク・ジャパン（BBJ）は、東京大学医科学研究所内に設置された臨床情報と生体試料（DNA・血清）のバイオバンクで、平成15（2003）年に委託事業として出発した「オーダーメイド医療実現化プロジェクト」により国内12協力医療機関と協力して収集された47疾患・約20万人（第一コホート）、並びに平成25（2013）年度に開始した「オーダーメイド医療の実現プログラム」により同様の方法で収集された38疾患・約6.7万人（第二コホート）からなる我が国の重要な研究基盤である。本研究ではBBJが管理する試料・臨床情報及びゲノム情報のさらなる利活用を目指して、試料・情報の保管、管理、提供を継続して実施するとともに、生体試料やゲノム情報、臨床情報を用いて疾患のリスクや予後、薬剤感受性に関わるバイオマーカーを同定し、個別化医療に貢献する。

方法： Asian Screening Array （ASA-24v1-0_A2）による塩基配列決定

TOPMed r2を用いたimputationデータ（GRCh38）

血清サンプルについてNMR装置により取得したスペクトラムの250代謝物の定量データ

対象： BBJ第一コホート　11,716人＋180,882人＋1,285人＋2,570人、BBJ第二コホート　42,689人

URL： https://biobankjp.org/

データID	内容	制限	公開日
JGAS000412	BBJ第一コホート11,716名、BBJ第二コホート42,689名のGenotypeデータ	制限公開（Type I）	2021/11/30
JGAS000541	BBJ第一コホート180,882名を男女別に7つのバッチに分けて実施したImputationデータならびにindexデータ	制限公開（Type I）	2022/07/28
JGAS000561	BBJ第一コホート1,285名の血清サンプルを対象としたNMRによるメタボロームデータ	制限公開（Type I）	2022/09/08
JGAS000561（データ追加）	BBJ第一コホート2,570名の血清サンプルを対象としたNMRによるメタボロームデータ	制限公開（Type I）	2023/04/24

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら。

分子データ

JGAS000412


対象	BBJ第一コホート（47疾患）：11,716名 BBJ第二コホート（38疾患）：42,689名 ICD10：C34, C15, C16, C18-C21, C22, C25, C23, C24, C61, C50, C53, C54, C56, C81-C86, C90-C93, I63, G45.9, I67.1, G40, J45, A15-A19, J44.9, J84.1-9, I21.0-9, I20.0, I20.1, I20.8, I20.9, R00, I44.0-3, I45.5-6, I47-I49, I50, I70.9, B18.1, B18.2, K74.6, N04, N20-N23, M80-M81, E10, E11, E88.8, E78.0-5, E78.8-9, E05.0, M05-M06, J30.1, L91.0, L20, L51.1-2, L27.0, D25, N80, R56.0, H40, H25-H26, K05, G12.2, I61, C64
規模	genome wide SNPs
対象領域（Target Captureの場合）	-
Platform	Illumina [Asian Screening Array (ASA-24v1-0_A2)]
ソース	末梢血（一部唾液）から抽出したDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	Infinium Asian Screening Array-24 v1.0 BeadChip Kit
遺伝子型決定アルゴリズム（ソフトウェア）	GenomeStudio
マーカー数（QC後）	657,060 SNVs（GRCh38）
Japanese Genotype-phenotype Archive Dataset ID	JGAD000529
総データ量	1,020 GB（idat、csv、plink binary）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000541


対象	BBJ第一コホート（47疾患）：180,882名 ICD10：A15-A16、B16-B17.0、B18.0-B18.1、B17.1、B18.2、C15、C16、C18、C22、C23-C24、C25、C33-C34、C50、C53、C54、C56、C61、C81、D25、E05、E10、E78.0-E78.5、G12、G40-G41、H25-H26、H40-H42、I20、I21-I22、I44-I49、I50、I60、I69.0、I63、I69.3、I70、J30、J41-J44、J45-J46、J80-J84、K05、K74.3-K74.6、L00-L99、L20、M05-M06、M80-M82、N04、N20-N23、N80、R00-R9
規模	genome wide SNVs
対象領域（Target Captureの場合）	-
Platform	Illumina [HumanOmniExpressExome、HumanOmniExpress、HumanExome]
ソース	末梢血（一部唾液）から抽出したDNA
検体情報（購入の場合）	-
調整試薬（キット名、バージョン）	HumanOmniExpressExome-8、HumanOmniExpress-12、HumanExome-12 kit
遺伝子型決定アルゴリズム（ソフトウェア）	GenomeStudio Software Eagle software （v2.4.1） without a reference panel Minimac4 software (v1.0.2)
リファレンス配列	TOPMed reference panel (Version R2 on GRC38)
フィルタリング	imputation前のQC： Before imputation, we excluded SNPs using the following criteria: - Heterozygosity count for each chip < 5 - P-value for Hardy–Weinberg equilibrium (HWE) for each chip < 1.0 x 10^-6 * - Genotype concordance rate with whole-genome sequencing (WGS) for 939 samples < 99.5% and its non-reference discordance rate >= 0.5% - Lower call rate SNPs if the position was the same when merging datasets - Call rate < 99% * P-values for chrX SNPs were calculated by using female samples We also excluded samples using the following criteria ： - Call Rate < 98% - Samples whose inferred sex was not matched with the clinical information - Lower call rate samples for duplicated or monozygotic twin in the dataset - Outliers from East Asian clusters from principal component analysis with 1KGp3v5 samples.
マーカー数(QC後)	常染色体：515,587 SNVs（GRCh38） X染色体：11,140 SNVs（GRCh38）
Japanese Genotype-phenotype Archive Dataset ID	JGAD000660
総データ量	11.1 TB （vcf、tbi）
コメント（利用にあたっての制限事項）	NBDC policy

JGAS000561


対象	BBJ第一コホート（47疾患）：1,285名（1,286検体）＋2,570名（2,573検体）累計：3,841名（3,859検体） ICD10：R00、I44.0-3、I45.5-6、I47-I49、I70.9、L20、J45、I67.1、I63、G45.9、C50、I50、I21.0-9、H25-H26、C53、B18.1、B18.2、C18-C21、J44.9、L51.1-2、L27.0、E10、E11、E88.8、N80、G40、C15、D25、C23、C24、H40、E05.0、K05、R56.0、C81-C86、C90-C93、C22、J30.1、E78.0-5、E78.8-9、J84.1-9、L91.0、K74.6、C34、N04、M80-M81、C56、C25、A15-A19、C61、M05-M06、I20.1、I20.8、I20.9、C16、N20-N23、I20.0、C54
規模	メタボローム（NMR）
対象領域（Target Captureの場合）	-
Platform	Bruker [AVANCE III HD]
ソース	血清サンプル
検体情報（購入の場合）	-
測定パラメータ	Nightingale Healthの内製ソフトウェア（quantification library 2020）
ノイズの低減方法・補正方法	Nightingale Healthの内製ソフトウェア（quantification library 2020）
アノテーション方法	Nightingale Healthの内製ソフトウェア（quantification library 2020）
定量アルゴリズム（ソフトウェア）	Nightingale Healthの内製ソフトウェア（quantification library 2020）
定量対象領域	250代謝物（代謝物リスト）
Japanese Genotype-phenotype Archive Dataset ID	JGAD000683
総データ量	7.1＋15.3 MB（xlsx）
コメント（利用にあたっての制限事項）	NBDC policy

提供者情報

研究代表者： 松田浩一

所属機関： 東京大学大学院新領域創成科学研究科

プロジェクト/研究グループ名：利活用を目的とした日本疾患バイオバンクの運営・管理

URL： https://biobankjp.org/

科研費/助成金（Research Project Number）：

科研費・助成金名	タイトル	研究課題番号
日本医療研究開発機構（AMED）ゲノム医療実現バイオバンク利活用プログラム（B-Cure）	利活用を目的とした日本疾患バイオバンクの運営・管理	JP20km0605001 JP23tm0624002
日本医療研究開発機構（AMED）ゲノム医療実現推進プラットフォーム事業	TOPMED panelを用いた高密度Imputationによる、バイオバンクジャパン18万症例のphenotype横断的解析	JP21km0405215

科研費・助成金名

タイトル

研究課題番号

日本医療研究開発機構（AMED）ゲノム医療実現バイオバンク利活用プログラム（B-Cure）

利活用を目的とした日本疾患バイオバンクの運営・管理

JP20km0605001

JP23tm0624002

日本医療研究開発機構（AMED）ゲノム医療実現推進プラットフォーム事業

TOPMED panelを用いた高密度Imputationによる、バイオバンクジャパン18万症例のphenotype横断的解析

JP21km0405215

制限公開データの利用者一覧

研究代表者	所属機関	国・州名	研究題目	利用データID	利用期間
小川誠司	京都大学大学院医学研究科腫瘍生物学講座	日本	クローン性造血と新型コロナウイルス感染症の関連性についての解析	JGAD000529	2022/08/15-2026/03/31
岡田随象	大阪大学大学院医学系研究科　遺伝統計学	日本	日本人由来B細胞株DNAのゲノムデータを用いた遺伝統計解析手法の研究	JGAD000529, JGAD000660	2022/09/12-2025/03/31

研究内容の概要

分子データ

提供者情報

関連論文

制限公開データの利用者一覧