臨床バイオインフォマティシャンのブログ

臨床に近いバイオインフォマティクス初学者です。NGSによる変異解析を紹介します。

MutalyzerのPosition Converterを使ってバリアントの染色体上のポジションを確認しよう

Mutalyzerの「Position Converter」の使い方を解説します。

「Position Converter」を利用することで転写物表記 (NM_XXXXXX)のバリアント情報から染色体上のポジション情報を得ることができます。
染色体上のポジション情報としてバリアントを表記することで、健常人多型データベースであるgnomADなどでバリアントを検索することが可能になります。遺伝子解析結果などで染色体上のポジション情報が記載されていない場合に「Position Converter」が重宝します。
なお、MutalyzerはLUMC (Department of Human Genetics, Leiden University Medical Center)が運営しており、Web上に無料で公開されています(文献リンク)。使い方をみていきましょう。

対象者

  • NM番号から始まるバリアント情報から染色体上におけるポジション情報を取得したい方
  • Mutalyzerを使ってみたい方

目次

  1. Potistion Converterの使い方
  2. 最後に

Position Converterの使い方

まずは、Mutalyzer(https://mutalyzer.nl/)へアクセスしましょう。
「Position Converter」以外にも、バリアント表記をHGVS表記に則ってチェックしてくれる「Name Checker」などがあります。
「Position Converter」をクリックします。

20210802170638

「Build」のプルダウンからリファレンス配列を選択します (デフォルトはhg19)。
「Variant description」の部分にバリアントを入力します。HGVS表記に準拠して、NM番号:c.XXXA>Gのように入力します。
試しに、MYH7遺伝子のバリアント (NM_000257.3:c.2146G>A)を検索してみます。バリアントを入力したら、「Convert variant description」をクリックします。

20210802175219

バリアントの表記が正しければ、「Chromosomal variant」の部分に染色体上のポジション情報が確認できます。
入力エラーでは、打ち間違い (NM→MN)やコロン「:」忘れ、NM番号の「.」以下のバージョンが登録されていない場合など経験しています。NM番号の古いバージョンなどで試してください。
20210802180652

例では、バリアント (NM_000257.3:c.2146G>A)は「NC_000014.8:g.23895189C>T」であることが分かります。
「NC_」はRefSeqのアクセッション番号の接頭辞の一つで、完全長のゲノムを表します。「NC_000014.8」は14番染色体のバージョン8を意味しています。「g.23895189C>T」はポジションとリファレンス塩基CがTへ変化していることを意味しています。
なお、例のMYH7遺伝子の場合、ゲノム表記 (NC_)だと、塩基がC>Tとなっていますが、転写物表記 (NM_)ではG>Aとなっております。これは、ゲノム表記は染色体の短腕から長腕に向かって表記しているのに対して、転写物表記は遺伝子の向きに合わせて表記している違いに由来するものです (MYH7遺伝子は長腕から短腕向きの遺伝子です)。

最後に

「Position Converter」により染色体上での変異のポジション情報を得ることができました。
これにより、健常人多型データベースgnomADなどでバリアントを検索することができるようになります (gnomAD検索方法は次回まとめます)。
また、他の機能「Name Checker」ではバリアントの表記が正しいかどうかなどの判定が行えます (いつか記事にしたいです)。
どなたかの役に立ちましたら幸いです。ありがとうございました。