遺伝子センターとゲマトリアンクォーツ
通路の突き当たりでジュールと別れると、アドナはいったん農業研究所に戻りかけたが、エレベーターホールの手前で踵を返すと、折り返し階段で4階に上がり、北翼の遺伝子センターに足を向けた。
遺伝子センターは4階の北翼から東翼にかけて作られた、遺伝子研究および生命情報データ管理の中枢だ。GEN MATRIXのノードでもある『ゲノム解析コンピューティングシステム』を中心に、研究室、処置室、バイオバンク等が設置されている。
バイオバンクは圏内でも特に空調管理と空気洗浄が行き届いたクリーンルームで、冷蔵・冷凍装置の他、生物学や生化学の研究に必要な無菌作業を行うクリーンベンチも完備している。また隣接する標本室には、僅かではあるが、学術的に価値のある動植物の液浸標本(ホルマリン漬け)や剥製も保管されている。
凍結保存された種子や生体細胞の中には絶滅した動植物も多数含まれ、人類が地上に帰還したら、ゲマトリアンクォーツに刻まれたゲノム情報を参考に順次再生される予定だった。だが、そうはならなかった。《隔壁》を締め切ってから、一番肝腎な塩基配列データが読み取れなくなってしまったからである。
アドナは、遺伝子センターの奥深くにあるデータ室に足を運ぶと、楕円形の黒曜石(オプシディアン)の台座に、ロゼッタストーンのように置かれたゲマトリアンクォーツを見上げた。
高さ240センチ、横幅144センチ、厚さ48センチ。玄関ドアほどの大きさの石英ガラスに400ゼタバイトを超えるゲノムデータが刻まれている。ゼタバイトといえば、宇宙に存在する恒星の数が20ゼタバイトと言われているから、その20倍の分量だ。
ゲマトリアンクォーツは、喩えるなら、バイナリコード化された生物の博物館だ。GEN MATRIXのコンピューティングシステムの対となるもので、『記録』の為だけに開発された電子媒体である。本質的には光ディスクやフラッシュメモリと同様の位置付けだが、従来の記憶媒体と大きく異なるのは、純度の高い石英ガラス*6で作られ、耐熱性や耐薬品性に優れている点だ。金属やプラスチックのように数年で劣化することなく、適切に保管すれば数億年に及ぶデータ保存が可能である。
EN MATRIXによって蓄積された生命情報データは、『0』と『1』からなる二進数のバイナリコードに変換され、超短パルスレーザーによって、屈折率の異なるドットとしてゲマトリアンクォーツに刻まれる。『0』がドット無し、『1』がドット有りだ。
たとえば、アデニンの『A』は『01000001』。グアニンの『G』は『01000111』。アミノ酸の一つ、『アスパラギン(asparagine)』なら、『01100001 01110011 01110000 01100001 01110010 01100001 01100111 01101001 01101110 01100101』。
ゲマトリアンクォーツに刻み込まれたドットデータを再生するには、《ゲマトリア》と呼ばれる特殊な読み取り装置を使う。まず光学顕微鏡を使ってドットの配置を読み取り、ドットの配置=バイナリコードを英数字(ラテン文字)に変換する。それ自体はさほど難しくなく、ゲマトリアがあれば、誰でも手軽にゲマトリアンクォーツの生命情報データを読み取ることができる。
ところが、《隔壁》を締め切った後、通常の手順で塩基配列データを読み取ろうとすると、めちゃくちゃな文字列を吐き出すようになった。たとえば、『GATTGGCAA』が『a&wtSh%k+66PQopN>qt』のように。何をどのようにエンコードしても、『AGTC(U)』の正しい文字列に変換されない為、まるでデータの役に立たない。
ただでさえ生命情報を収録したデータベースは恐ろしく膨大だ。
数十万から数十億に及ぶ塩基配列の、どこからどこまでが遺伝子で、どの遺伝子がどのような形質を発現するのか。どの遺伝子とどの遺伝子がどのような機序で働き、どのようなタンパク質を作り出すのか。遺伝子の位置と役割を正確に把握する必要がある。
また塩基配列だけ分かっても、生命情報の役には立たない。
まずDNA解析によって得られた塩基配列データを参照しやすい形に整理し(アセンブリやマッピング)、遺伝コードの位置、遺伝子の機能と構造、近縁生物との比較など、ゲノムに関する情報を『注釈(アノテーション)』として付与する必要がある。
アノテーションの中には、解析対象となった生物に関するプロフィールや学術的知見をはじめ、研究に携わった施設や経歴、関連文献やデータ登録者などのメタデータも含まれ、どれを欠いても、研究成果物としての価値を損なう。
また一口に『生命情報データベース』といっても、遺伝子の位置情報と機能を示したカタログ、遺伝子やタンパク質の相互作用を経路図として示したパスウェイ、生体内における化学反応や代謝物質、酵素などに関するケミカル情報、疾患や医薬品に関するメディカル情報、またこれらをグラフィック化した画像ライブラリなど、非常に多岐にわたり、ファイル形式も多種多様だ。
生物種にもよるが、一つの解析対象につき、平均的なデータサイズは数ギガバイトから数十ギガバイト、その大半がハッシュインデックスやツリー型インデックスによって塩基配列データに紐付けられ、巨大な図書検索システムを形成している
GEN MATRIXでは、これらの膨大なデータを一冊の本のようにフラットファイル化し、『GENBOOK』というエントリー単位で分類・演算処理する。
例えば『ショウジョウバエのGENBOOK』といえば、解析対象となったショウジョウバエの塩基配列、そこに含まれる遺伝コードの位置と種類、機能に関する注釈(アノテーション)、研究者のプロフィールや研究手法、参考文献、ショウジョウバエの生物史や生物学的知見(メタデータ)を一纏めにして収録したものである。
さらには、同じハエ目、昆虫網、節足動物門に共通するGENBOOKを編纂した上位カテゴリーも存在し、これらは生物界の系統樹のようにインデックス化されている。
いわばGEN MATRIXは、DNA解析のみならず、生命情報データの図書館を天文学的な演算処理能力で分類・整理し、膨大なアノテーションやメタデータの中から求める情報を瞬時に検索して、研究プロセスを簡素化するシステムだ。
最盛期には、タンパク質の構造予測や機能特性の予測を立体CGにグラフィック化し、ゲノム編集や遺伝子治療の効果を仮想空間でシミュレーションするほどの機能を誇り、理論的には新生物の創造も不可能ではないと言われた所以である。
これほどのシステムが機能不能に陥り、生物学の集大成ともいうべきゲマトリアンクォーツの塩基配列データが読み取れなくなるなど、誰が想像し得ただろう?
《隔壁》を締め切ってから七十年。いまだ誰一人として解決することはできず、ゲマトリアンクォーツは、生命の樹に手を伸ばそうとする人類を嘲笑うかのように冷たい光を放っていた。
Kindleストア