Help

TogoVar全般

Q. TogoVarの目的や有用性は何でしょうか。

A. ゲノムの解読はNGSにより低頻度の変異を取得することが可能となりました。しかし、欧米の既存データベースには、十分なサンプル数の日本人集団における頻度データはありません。この問題を解決するため、公開されている日本人のゲノム変異情報やNBDCに寄託されたヒトデータベースからの情報を集積し、より信頼性の高い頻度情報を提供することを目指します。

また、ヒトゲノムの参照配列は常に一定ではなく更新される情報であるため、同じバリアントであっても参照配列が異なるとゲノム上の位置が異なリます。そこで、当データベースでは同じバリアントにはユニークなIDを付与することで、研究者が行っているバリアントの位置情報を参照配列間で変換する作業を省力化します。

Q. インハウスでTogoVarを利用できますか。

A. dockerイメージを公開する予定です。しばらくお待ちください。

利用条件に関して

Q. TogoVarデータベースの利用は無償でしょうか。

A. すべて無償での利用が可能です。データベースの利用については、Termsのページを参照してください。

Q. TogoVarデータベースを論文で引用するにはどうすれば良いでしょうか。

A. Termsのクレジットの表示例を参考にしてください。

Q. 商用利用は可能でしょうか。

A. TogoVarのwebサイトの閲覧や公開予定のdockerイメージは商用利用可能です。TogoVarが取り込んでいる第三者作成データに関してはそれそれの利用条件に従ってください。詳しくはTermsをご覧ください。

TogoVar収録データに関して

Q. 個人レベルの表現型情報の取得は可能でしょうか。

A. 当データベースは個人情報を保持しておらず、また、個人ごとの表現型情報は現在のところ提供はしておりません。表現型情報の詳細については、JGA-NGSデータセット及びJGA-SNPデータセットに記載されている研究グループに直接お問い合わせ下さい。

Q. 遺伝子発現やタンパク質の情報とは結び付かないのでしょうか。

A. 当データベースはヒトゲノムの遺伝子変異について、日本人の公開情報を中心として統合したものです。当データベースはRDFの技術をベースとして利用している為、遺伝子発現やタンパク質の情報がRDFを利用しているデータベースである場合は、容易に拡張が可能と考えております。遺伝子発現やタンパク質の情報への拡張は順次実施する予定です。

Q. バリアントの検出の際に使用したソフトウェアおよび品質管理の方法を教えてください。

A. TogoVarデータセット作成方法を参照ください。

Q. TogoVarで対象としているバリアントの種類は何ですか。

A. SNV、Insertion、Deletion、Indel、Substitutionの5種類です。HGVSがType of variantsに列挙した5種類のうち、DuplicationはInsertionに、DeletionとInsertionの長さが同じIndelはSubstitionに分類されています。なお、バリアントの種類の特定には、Variant Effect Predictor (VEP)を利用しています。

Q. Consequenceの値はどのように計算していますか。

A. Variant Effect Predictor (VEP)のvariant consequenceの値を表示しています。1バリアントに対応するトランスクリプトが複数ある場合は、一番重大なconsequenceのみを表示している場合があります。

Q. SIFTとPolyPhenとは何ですか。

A. バリアントによってアミノ酸配列が変化する場合、それがタンパク質の機能に与える影響を予測したものです。Variant Effect Predictor (VEP)で計算した値を表示しています。アイコンの意味は以下の通りです。

  • SIFT
    • Deleterious
    • Tolerated
  • PolyPhen
    • Probably Damaging
    • Possibly Damaging
    • Benign
    • Unknown

Q. Clinical Significanceの値はどのように計算していますか。

A. ClinVarのclinical significanceの値を表示しています。

TogoVarの検索システムに関して

Q. 検索結果のFrequency列に表示される頻度メーターは何を表現していますか。

A. 各データセットにおけるAlternative allele頻度を表現しています。頻度メータの色はデータセットに割り当てられた色に対応しています。データの有無や頻度の値を9段階で表現しています。

  • JGA-NGS
  • JGA-SNP
  • 3.5KJPN
  • HGVD
  • ExAC
  • ClinVar

Q. バリアントタイプごとにPosition、Ref、Altはそれぞれどのように記述されますか。

A. 以下に、各バリアントタイプ毎の例を示します。染色体の最初の塩基の位置は1です。

Variant Type ID Position Ref Alt 説明
SNV tgv41 1:13116 T G 1番染色体13116番目の塩基TがGに置換された
Ins tgv1019 1:138646 A 1番染色体138646番目と138647番目の塩基の間に塩基Aが挿入された
Del tgv63 1:13486 GC 1番染色体13486番目と13487番目の塩基GCが欠失した
Indel tgv1537710 1:53676691 C TA 1番染色体53676691番目の塩基Cが欠失して、その場所にTAが挿入された
Substitution tgv675673 1:21889705 AC CA 1番染色体21889705番目の塩基ACが欠失して、その場所にCAが挿入された

Q. TogoVarでは、どのようにバリアントを表記していますか。

A. TogoVarでは、ゲノム上の位置及びreference allele、alternative allele、ヒトゲノム標準配列のビルド番号の組み合わせでバリアントを一意に識別します。TogoVar及びdbSNP、VCFHGVSでの表記例を下の表に示しています。

Variant Type TogoVar dbSNP VCF HGVS
ID Position Ref Alt ID Position(GRCh37) Alleles Position Ref Alt
SNV tgv30913364 7:127254587 G A rs114202595 chr7:127254587 G>A / G>T 7:127254587 G A 7:g.127254587:G>A
tgv30913365 7:127254587 G T 7:127254587 G T 7:g.127254587:G>T
Ins tgv1019 1:138646 A rs761725800 chr1:138646 dupA 1:138646 C CA 1:g.138646_138647insA
Del tgv63 1:13486 GC rs780379327 chr1:13486-13487 delGC 1:13485 AGC A 1:g.13486_13487del
Indel tgv1537710 1:53676691 C TA rs1057517525 chr1:53676691 delCinsTA 1:53676691 C TA 1:g.53676691delinsTA
Substitution tgv675673 1:21889705 AC CA rs786204530 chr1:21889705-21889706 AC>CA 1:21889705 AC CA 1:g.21889705_21889706delinsCA