NBDC Research ID: hum0495.v2

 

研究内容の概要

目的:心房細動は高齢者に多く、脳梗塞合併はQOL低下や寝たきりにつながる。本研究は、心房細動患者および健常者を対象に、遺伝子情報・臨床情報・生体情報・心電図情報等の多階層データを収集し、AI解析により心房細動の発症および脳梗塞リスクを層別化するアルゴリズムを開発することで、健診・IoTによる一次スクリーニング、個別化先制医療、創薬・新薬開発などに応用可能な基盤を確立することを目的とする。

方法:【hum0495.v1.gwas.v1】全エクソームシークエンシングを実施し、Genome Analysis Toolkit(GATK)ベストプラクティスに従ってシーケンスデータを処理後、検出されたバリアントを対象とした関連解析(Burdenテスト、SKAT、SKAT-O)を実施した。

         【JGAS000866】SNPアレイでジェノタイピングし、1000 Genomesでimputation後、共変量調整ロジスティック回帰でGWASを実施した。

対象: PAF患者1,176症例、非PAF(対照)1,172症例

 

データID内容制限公開日
hum0495.v1.gwas.v1 発作性心房細動のExomeデータを元にしたGWAS統計情報 非制限公開 2025/02/13
JGAS000866 発作性心房細動のGWAS統計情報 制限公開(Type I) 2026/02/27

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。記載例はこちら

 

分子データ

hum0495.v1.gwas.v1

対象

PAF(ICD10:I48.0):1,176症例

非PAF(対照):1,172名

規模 Exome / genome wide SNPs
対象領域(Target Captureの場合) -
Platform Illumina [NovaSeq 6000]
ライブラリソース 末梢血から抽出したDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名) SureSelectXT Kit
断片化の方法 超音波断片化(Covaris)
ライブラリ構築方法 Paired-end
リード長(除:バーコード、アダプタ、プライマー、リンカー) 150 bp
遺伝子型決定アルゴリズム(ソフトウェア) GATK HaplotypeCaller
関連解析(ソフトウェア) Burden、SKAT、SKATO(R:package SKAT)
フィルタリング

Sample QC:

(1) Sample call rate < 0.97

(2) 性別の一致

(3) 血縁関係者(親族係数0.088を超える二親等以上のサンプルを除外)

(4) 挿入/欠失比、データ量、ヘテロ接合性/ホモ接合性比に基づく外れ値のサンプルを除外

Variant QC:

(1) genotype quality >= 20

(2) depth >=10

(3) Allele balance

(4) variant call rate >= 0.97

(5) Hardy‒Weinberg equilibrium P-values >1 × 10−8

(6) PCA

Imputation QC:-

マーカー数(QC後) 518,621
NBDC Dataset ID

hum0495.v1.gwas.v1

(データのダウンロードは上記Dataset IDをクリックしてください)

Dictionary file

総データ量 822 KB(tsv)
コメント(利用にあたっての制限事項) NBDC policy

 

JGAS000866

対象

PAF(ICD10:I48.0):1,038症例

非PAF(対照):744名

規模 genome wide SNPs
対象領域(Target Captureの場合) -
Platform Illumina [Infinium Asian Screening Array]
ソース 末梢血から抽出したDNA
検体情報(購入の場合) -
調整試薬(キット名、バージョン) Infinium Asian Screening Array-24 v1.0 BeadChip
遺伝子型決定アルゴリズム(ソフトウェア)

genotyping:GenomeStudio

haplotype phasing:SHAPEIT2

imputation:Minimac3

Imputation reference:1000 Genomes panel

関連解析(ソフトウェア) PLINK v1.9
フィルタリング

Sample QC:以下のサンプルを除外

(1) Sample call rate < 0.97

(2) 性別の不一致

(3) 血縁関係者(PI_HAT が 0.185を超えるサンプル)

(4) 挿入/欠失比、データ量、ヘテロ接合性/ホモ接合性比に基づき外れた値( > mean ± 3SD)のサンプル

(5) 1000ゲノムプロジェクトのサンプルを用いた主要コンポーネント分析における東アジアクラスターから外れたサンプル

Variant QC:以下のバリアントを除外

(1) variant call rate < 0.95

(2) Hardy‒Weinberg equilibrium P >1.0 × 10−6

(3) minor allele frequency < 0.01

(4) 常染色体以外のバリアント

Post-imputation QC:

(1) minor allele frequency < 0.01

(2) imputation score (Rsq) < 0.3

マーカー数(QC後) 8,094,202 SNVs
Japanese Genotype-phenotype Archive Dataset ID JGAD001009
総データ量 971.9 MB(csv)
コメント(利用にあたっての制限事項) NBDC policy

 

提供者情報

研究代表者: 田中 敏博

所 属 機 関: 東京科学大学 疾患多様性遺伝学

プロジェクト/研究グループ名:-

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
日本医療研究開発機構(AMED) 医療機器・ヘルスケアプロジェクト インテリジェント心房細動予防・検出インフラの構築 JP21he2102002

 

関連論文

タイトルDOIデータID
1 Rare genetic variants involved in increased risk of paroxysmal atrial fibrillation in a Japanese population doi: 10.1038/s41598-025-97794-7 hum0495.v1.gwas.v1
2

 

制限公開データの利用者一覧

研究代表者所属機関国・州名研究題目利用データID利用期間