NBDC Research ID: hum0248.v2

 

研究内容の概要

目的: 日本人基準ゲノム配列の構築

方法: 日本人健常男性3名それぞれから、PacBio、Bionano、Illumina HiSeq法にて配列を取得し、デノボアセンブリを実施後メタアセンブリにより三者の配列を統合した。さらに三者間において塩基が異なる部位では多数派アレルを採用した。遺伝地図・放射線ハイブリッド地図のマーカーによりアンカリングし、擬似染色体配列セットとして統合した。

対象: 日本人健常男性3名

URL: https://www.megabank.tohoku.ac.jp/news/32217

 

データID内容制限公開日
AP023461-AP024084 日本人基準ゲノム配列 非制限公開 2020/10/30
JGAS000259 日本人基準ゲノム配列 制限公開(Type II) 2020/11/06

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞(Acknowledgement)に記載して下さい。詳しくはこちら

 

分子データ

AP023461-AP024084 / JGAS000259

対象 日本人健常男性:3名
規模 WGS
対象領域(Target Captureの場合) -
Platform

PacBio [RS II]

Bionano [Irys、Saphyr]

Illumina [HiSeq 2500]

ライブラリソース 末梢血から抽出したgDNA
検体情報(購入の場合) -
ライブラリ作製方法(キット名)

PacBio:DNA template prep kit 2.0

Bionano:ゲルプラグによるDNA単離、Proteinase KとRNase処理、GELaseによるプラグの可溶化を行なった。jg1aについてはNt.BspQIとNb.BssSIによるニックラベル修復法、またはjg1bとjg1cについては直接標識、により蛍光ラベル付加を行った。

Illumina:TruSeq DNA PCR-Free HT sample prep kit

断片化方法

Illumina:超音波断片化(Covaris)

ライブラリ構築方法

Illumina:Paired-end、Mate pair

リード長(除:バーコード、アダプター、プライマー、リンカー)

PacBio:10 kb

    - jg1a:10,589 bp(mean)

    - jg1b:10,066 bp(mean)

    - jg1c:9,226 bp(mean)

Bionano:>146 kb

    - jg1a.BspQI:318,216 bp(mean)

    - jg1a.BssSI:228,101 bp(mean)

    - jg1b.DLS:169,138 bp(mean)

    - jg1c.DLS:146,026 bp(mean)

Illumina:162 or 259 bp

クオリティコントロール方法

PacBio:Falconソフトウェア内でのQC(length_cutoff = 9000, length_cutoff_pr = 15000)

Bionano:BionanoSolveソフトウェア内でのQC (default config)

Illumina:特になし

ゲノム配列構築方法

① デノボアセンブリ(リードによる全ゲノム塩基配列の決定)

 ①-1 長鎖リード解読技術によるコンティグ作成:Pacific Bioscience社の一分子リアルタイムシークエンシング技術(SMRTシークエンシング技術)と、Falconソフトウェアによるデノボアセンブリ。

 ①ー2 解読したゲノム配列間の結合:Bionano Genomics社のオプティカルマッピング技術とBionanoSolveソフトウェアによるデノボアセンブリ

② ①-1と①ー2を用いてハイブリッドスキャフォールドの作成(BionanoSolveソフトウェアによる)

③ エラー除去:IlluminaのPair-end配列情報を用いたエラー修正(Pilonソフトウェア)

④ 位置・配向情報の取得:Illuminaリードによるメイトペアライブラリー技術(Bowtie2ソフトウェア)

⑤ ②に③と④の情報を加えることで、1名ずつのドラフト配列の決定、ならびに、3者間で解読できなかった領域の補完(Metassembler)

⑥ 配列スキャフォールドと染色体との対応付け(アンカリング):観測された組み換えの頻度から遺伝子やマーカーの並び順と距離を示す遺伝地図(連鎖地図)、放射線ハイブリッド地図、(gPCRソフトウェアによる)

平均カバー率(Depth)

PacBio:>122×

    - jg1a:122×

    - jg1b:123×

    - jg1c:128×

Bionano:>123×

    - jg1a.BspQI:123×

    - jg1a.BssSI:140×

    - jg1b:160×

    - jg1c:175×

Illumina paired end:>26×

    - jg1a.162PE:29×

    - jg1a.259PE:26×

    - jg1b.162PE:31×

    - jg1b.259PE:28×

    - jg1c.162PE:31×

    - jg1c.259PE:26×

Illumina mate-pair:>12×

    - jg1a:13×

    - jg1b:12×

    - jg1c:12×

変異決定方法 hs37d5とJG1の常染色体およびX染色体における比較;minimap2, paftools
一塩基変異数 2,501,575 SNVs
構造変異検出方法 GRCh38 and JG1間の比較; minimap2, paftools
構造多型数 8,697 insertions and 6,190 deletions >50 bp in length
Mass Submission System ID AP023461-AP024084
Japanese Genotype-phenotype Archive Dataset ID JGAD000362
総データ量

AP023461-AP024084:821 MB(fasta)

JGAD000362:2.4 TB(fasta、fastq、bnx)

コメント(利用にあたっての制限事項)

AP023461-AP024084:NBDC policy

JGAD000362:NBDC policy および hum0184 policy

東北メディカル・メガバンク機構のスパコンに関するお問い合わせ先:

 

提供者情報

研究代表者: 山本 雅之

所 属 機 関: 東北大学大学院 医学系研究科 兼)東北メディカル・メガバンク機構

プロジェクト/研究グループ名: JRGA (Japanese Reference Genome Assembly)

URL: jMorp: https://jmorp.megabank.tohoku.ac.jp/

科研費/助成金(Research Project Number):

科研費・助成金名タイトル研究課題番号
日本医療研究開発機構 医療研究開発推進事業費補助金 東北メディカル・メガバンク計画(東北大学)東日本大震災復興特別会計分 JP20km0105001
日本医療研究開発機構 医療研究開発推進事業費補助金 東北メディカル・メガバンク計画(東北大学)一般会計分 JP20km0105002
日本医療研究開発機構 ゲノム医療実現推進プラットフォーム事業 AMEDが行うゲノム医療研究支援サービスを支える研究開発基盤の整備 JP20km0405001
科学研究費助成事業 新学術領域研究(研究領域提案型) マルチスケール精神病データの疎性モデリング解析 JP19H05200
科学研究費助成事業 基盤研究(C) 深層学習による大規模ゲノムコホートの次世代シークエンス解析 JP19K06625

 

関連論文

タイトルDOIデータID
1 Construction and Integration of Three De Novo Japanese Human Genome Assemblies toward a Population-Specific Reference doi:10.1101/861658

AP023461-AP024084

JGAD000362

2

 

制限公開データの利用者一覧

研究代表者所属機関国・州名研究題目利用データID利用期間