公開日:2009/08/15
【第119号】ちんぷんかんぷん次世代シーケンサ
今年の2月に取り上げた次世代シーケンサについて今回もっと詳しく説明しようと思って資料を集めたのですが、言葉がわからなくてちんぷんかんぷん。旧世代のシーケンサの原理は非常に明解で、ATGCの塩基配列を各4つの塩基でぶった切った時の長さを電気泳動で調べて短い順に並び変えると塩基配列が分かるというものです。
ところが次世代シーケンサになると、どうも塩基配列を読み取る原理自体が各メーカーで違っているようです。例えばPyrosequencing法というものでは相補鎖合成というものを使います。ある解説によると「反応の副産物であるピロリン酸(PPi)をATP sulfurylaseによってATPに変え、ルシフェラーゼ存在下でルシフェリンと反応させ、化学発光を観測・定量する」ということだそうです。途中の単語の意味は私には理解不能ですが、要は各ATGCに反応する物質を入れてやって、マッチすると光がピカッと光るそうです。それを測定して塩基配列を読んでいくらしいです。速度は1塩基で読むのに1分弱かかります。次世代シーケンサでは、CCD等の高解像カメラ等を使って1度に大量のDNA断片を解析できるので高速にできます。速いものでは約7時間くらいで1つのDNAの解析ができるそうです(遅い機械は1週間くらいかかる)。
また2010年以降には、1時間で1,000億塩基(人のDNAは30億塩基)読めるシーケンサが登場してくるそうです。すると数分で人間のDNA解析が終了します。ただ一番問題なのは、シーケンサで読めるのはDNAの断片の情報です。1個の断片は50塩基とか100塩基とかいう非常に小さい単位です。この断片の情報を基にDNA全体の塩基配列を計算で求めます。ですが、ここが肝心要なのに、まだまだ高速化の研究はできていないようです。やはりここでHPCが必要になってくるんですね。
ところが次世代シーケンサになると、どうも塩基配列を読み取る原理自体が各メーカーで違っているようです。例えばPyrosequencing法というものでは相補鎖合成というものを使います。ある解説によると「反応の副産物であるピロリン酸(PPi)をATP sulfurylaseによってATPに変え、ルシフェラーゼ存在下でルシフェリンと反応させ、化学発光を観測・定量する」ということだそうです。途中の単語の意味は私には理解不能ですが、要は各ATGCに反応する物質を入れてやって、マッチすると光がピカッと光るそうです。それを測定して塩基配列を読んでいくらしいです。速度は1塩基で読むのに1分弱かかります。次世代シーケンサでは、CCD等の高解像カメラ等を使って1度に大量のDNA断片を解析できるので高速にできます。速いものでは約7時間くらいで1つのDNAの解析ができるそうです(遅い機械は1週間くらいかかる)。
また2010年以降には、1時間で1,000億塩基(人のDNAは30億塩基)読めるシーケンサが登場してくるそうです。すると数分で人間のDNA解析が終了します。ただ一番問題なのは、シーケンサで読めるのはDNAの断片の情報です。1個の断片は50塩基とか100塩基とかいう非常に小さい単位です。この断片の情報を基にDNA全体の塩基配列を計算で求めます。ですが、ここが肝心要なのに、まだまだ高速化の研究はできていないようです。やはりここでHPCが必要になってくるんですね。
![]() |
【第118号】Condorを使ったCloud | 【第120号】くらうど 独り言 | ![]() |





