NBDC Research ID: hum0248.v2

研究内容の概要

目的： 日本人基準ゲノム配列の構築

方法： 日本人健常男性3名それぞれから、PacBio、Bionano、Illumina HiSeq法にて配列を取得し、デノボアセンブリを実施後メタアセンブリにより三者の配列を統合した。さらに三者間において塩基が異なる部位では多数派アレルを採用した。遺伝地図・放射線ハイブリッド地図のマーカーによりアンカリングし、擬似染色体配列セットとして統合した。

対象： 日本人健常男性3名

URL： https://www.megabank.tohoku.ac.jp/news/32217

データID	内容	制限	公開日
AP023461-AP024084	日本人基準ゲノム配列	非制限公開	2020/10/30
JGAS000259	日本人基準ゲノム配列	制限公開（Type II）	2020/11/06

※リリース情報はこちら

※制限公開データの利用にあたっては、利用申請が必要です。申請方法はこちら。

※論文等でデータベースからダウンロードしたデータを含む結果を公表する際には、下記文献を引用いただくか、NBDCヒトデータベースに登録されたデータを利用した旨について謝辞（Acknowledgement）に記載して下さい。詳しくはこちら。

分子データ

AP023461-AP024084 / JGAS000259


対象	日本人健常男性：3名
規模	WGS
対象領域（Target Captureの場合）	-
Platform	PacBio [RS II] Bionano [Irys、Saphyr] Illumina [HiSeq 2500]
ライブラリソース	末梢血から抽出したgDNA
検体情報（購入の場合）	-
ライブラリ作製方法（キット名）	PacBio：DNA template prep kit 2.0 Bionano：ゲルプラグによるDNA単離、Proteinase KとRNase処理、GELaseによるプラグの可溶化を行なった。jg1aについてはNt.BspQIとNb.BssSIによるニックラベル修復法、またはjg1bとjg1cについては直接標識、により蛍光ラベル付加を行った。 Illumina：TruSeq DNA PCR-Free HT sample prep kit
断片化方法	Illumina：超音波断片化（Covaris）
ライブラリ構築方法	Illumina：Paired-end、Mate pair
リード長（除：バーコード、アダプター、プライマー、リンカー）	PacBio：10 kb - jg1a：10,589 bp（mean） - jg1b：10,066 bp（mean） - jg1c：9,226 bp（mean） Bionano：>146 kb - jg1a.BspQI：318,216 bp（mean） - jg1a.BssSI：228,101 bp（mean） - jg1b.DLS：169,138 bp（mean） - jg1c.DLS：146,026 bp（mean） Illumina：162 or 259 bp
クオリティコントロール方法	PacBio：Falconソフトウェア内でのQC（length_cutoff = 9000, length_cutoff_pr = 15000） Bionano：BionanoSolveソフトウェア内でのQC (default config) Illumina：特になし
ゲノム配列構築方法	① デノボアセンブリ（リードによる全ゲノム塩基配列の決定）　①－１長鎖リード解読技術によるコンティグ作成：Pacific Bioscience社の一分子リアルタイムシークエンシング技術（SMRTシークエンシング技術）と、Falconソフトウェアによるデノボアセンブリ。　①ー２解読したゲノム配列間の結合：Bionano Genomics社のオプティカルマッピング技術とBionanoSolveソフトウェアによるデノボアセンブリ ② ①－１と①ー２を用いてハイブリッドスキャフォールドの作成（BionanoSolveソフトウェアによる） ③ エラー除去：IlluminaのPair-end配列情報を用いたエラー修正（Pilonソフトウェア） ④ 位置・配向情報の取得：Illuminaリードによるメイトペアライブラリー技術（Bowtie2ソフトウェア） ⑤ ②に③と④の情報を加えることで、１名ずつのドラフト配列の決定、ならびに、３者間で解読できなかった領域の補完（Metassembler） ⑥ 配列スキャフォールドと染色体との対応付け（アンカリング）：観測された組み換えの頻度から遺伝子やマーカーの並び順と距離を示す遺伝地図（連鎖地図）、放射線ハイブリッド地図、（gPCRソフトウェアによる）
平均カバー率（Depth）	PacBio：>122× - jg1a：122× - jg1b：123× - jg1c：128× Bionano：>123× - jg1a.BspQI：123× - jg1a.BssSI：140× - jg1b：160× - jg1c：175× Illumina paired end：>26× - jg1a.162PE：29× - jg1a.259PE：26× - jg1b.162PE：31× - jg1b.259PE：28× - jg1c.162PE：31× - jg1c.259PE：26× Illumina mate-pair：>12× - jg1a：13× - jg1b：12× - jg1c：12×
変異決定方法	hs37d5とJG1の常染色体およびX染色体における比較；minimap2, paftools
一塩基変異数	2,501,575 SNVs
構造変異検出方法	GRCh38 and JG1間の比較; minimap2, paftools
構造多型数	8,697 insertions and 6,190 deletions >50 bp in length
Mass Submission System ID	AP023461-AP024084
Japanese Genotype-phenotype Archive Dataset ID	JGAD000362
総データ量	AP023461-AP024084：821 MB（fasta） JGAD000362：2.4 TB（fasta、fastq、bnx）
コメント（利用にあたっての制限事項）	AP023461-AP024084：NBDC policy JGAD000362：NBDC policy および hum0184 policy 東北メディカル・メガバンク機構のスパコンに関するお問い合わせ先：

提供者情報

研究代表者： 山本雅之

所属機関： 東北大学大学院医学系研究科兼）東北メディカル・メガバンク機構

プロジェクト/研究グループ名： JRGA (Japanese Reference Genome Assembly)

URL： jMorp: https://jmorp.megabank.tohoku.ac.jp/

科研費/助成金（Research Project Number）：

科研費・助成金名	タイトル	研究課題番号
日本医療研究開発機構医療研究開発推進事業費補助金	東北メディカル・メガバンク計画（東北大学）東日本大震災復興特別会計分	JP20km0105001
日本医療研究開発機構医療研究開発推進事業費補助金	東北メディカル・メガバンク計画（東北大学）一般会計分	JP20km0105002
日本医療研究開発機構ゲノム医療実現推進プラットフォーム事業	AMEDが行うゲノム医療研究支援サービスを支える研究開発基盤の整備	JP20km0405001
科学研究費助成事業新学術領域研究（研究領域提案型）	マルチスケール精神病データの疎性モデリング解析	JP19H05200
科学研究費助成事業基盤研究（C）	深層学習による大規模ゲノムコホートの次世代シークエンス解析	JP19K06625

	タイトル	DOI	データID
1	Construction and Integration of Three De Novo Japanese Human Genome Assemblies toward a Population-Specific Reference	doi:10.1101/861658	AP023461-AP024084 JGAD000362
2

制限公開データの利用者一覧

研究代表者	所属機関	国・州名	研究題目	利用データID	利用期間

研究内容の概要

分子データ

提供者情報

関連論文

制限公開データの利用者一覧