TogoVar収録データセット一覧

NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ

データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。

頻度データセット名解析手法対象集団健常者罹患者サンプル数バリアント数
(座位数)
含まれる制限公開データセット
GEM Japan Whole Genome Aggregation (GEM-J WGA) PanelWGS日本人7,60995,863,463
(90,280,248)
6データセット
JGA-NGSWES日本人1254,679,0257データセット
JGA-SNPSNP-Chip日本人183,8841,249,7243データセット

∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など

その他のバリアントデータ

データベース名解析手法対象集団健常者罹患者サンプル数バリアント数
(座位数)
作成者バージョン/
最終更新日
ClinVar複数674,792NCBI2020/06/04
Exome Aggregation Consortium (ExAC)WES複数60,70610,195,872
(9,362,319)
Broad InstituteRelease 1 (2017/02/27)
Human Genetic Variation Database (HGVD)WES日本人1,208554,461
(501,556)
京都大学Version 2.30
(2017/08/02)
ToMMo 4.7KJPN Allele Frequency Panel(4.7KJPN)WGS日本人4,77374,494,394
(70,101,710)
東北メディカル・メガバンク機構v20190826

注1:ClinVarはVCFファイルに含まれるGRCh37上の位置が決定しているバリアントのみを掲載しています。
注2:4.7KJPNの内訳は、SNV (Autosome、chrX(PAR1+PAR2+XTR)、chrMT)とINDEL (Autosome、chrX(PAR1+PAR2+XTR))です。 詳細はSummary of ToMMo 4.7KJPNをご覧ください。

バリアント以外のデータ

データベース名バージョン/最終更新日内容作成者
Colil2019/01/25生命科学分野の文献間の引用関係の情報DBCLS
GRCh37.p132013/06/28ヒトゲノムリファレンス配列GRC
HGNC symbol report2020/03/30遺伝子シンボルや関連リソースの情報HGNC
LitVarAPIで取得バリアント名が出現する文献情報NCBI
PubTatorCentral2020/05/09バリアント名が出現する文献情報NCBI
TogoGenomeゲノムに関する包括的な情報DBCLS

データ加工に利用したツール

ツール名バージョン内容作成者
bcftoolsIndelの正規化とmultiallelicバリアントのbiallelicバリアントへの分割Genome Research Ltd.
BioReTNGSデータからバリアントを特定するツール群を一括実行アメリエフ
Variant Effect Predictor (VEP)Ensembl rel. 100バリアントにアノテーション(遺伝子名、Consequence等)を付加EMBL-EBI