![]() 分子動力学を使用してタンパク質またはその他のバイオポリマー中の相関残基を決定するための方法
专利摘要:
バイオポリマー中の相関残基を決定するための方法を提供する。本発明は、分子が利用可能な配座空間のサンプリングに基づいて、バイオポリマープロファイルとバイオポリマーの構造単位(残基)同士の相関とを決定する方法およびシステムを提供する。これら構造単位同士の相関は、タンパク質の結合残基ネットワークなど、バイオポリマー内のネットワークを見出すのにさらに使用することができる。本発明は、配座クラスタ化および本明細書に記載の方法から得られた情報を使用した、ポリペプチド、核酸、および炭水化物を含めたバイオポリマーの設計および設計操作も提供する。 公开号:JP2011514509A 申请号:JP2010545577 申请日:2009-02-05 公开日:2011-05-06 发明作者:タン,パウウェル,パトリック,チェン;ディキシット,サージット,ビー.;ムレゲール,ヨハネス;ラリオ,ポーラ,アイ.;ロディンガー,トーマス 申请人:ザイムワークス,インコーポレイテッド; IPC主号:G01N33-48
专利说明:
[0001] 関連出願の相互参照 本出願は、米国特許法第119条(e)項の下、全ての目的でその全体が参照により全て組み込まれている2008年2月5日出願の米国仮出願第61/026,435号および2008年11月19日出願の第61/116,267号の利益を主張するものである。] 背景技術 [0002] 酵素工学で最も難しい態様の1つは、タンパク質の残基同士の相関を推定することである。残基同士の相関を見出すための以前の方法は、タンパク質残基の集団運動を調査し、基本的な成分分析に依拠しており、それによって共分散行列を評価する。そのような方法は、同じ(平行)かまたは反対(逆平行)の方向でしか相関残基の動きを特定しないので、有用性が限られている。これらの以前の方法は、相関残基ネットワークを特定するのに低い感度を有することによっても阻まれている(Harte,W.E., et.al., 1990, PNAS, 85, 4686; Ichiye,T. and Karplus,M., 1991, Protein Struct. Funct. Genet. 11:205)。] [0003] タンパク質中の残基同士の相関を見出すその他の方法は、バイオインフォマティクスをベースにした手法を使用する(例えば、Fodor et.al., 2004, Proteins, 56, 211およびその中の引用例)。これらの方法は、大きな配列アライメントの分析および相関変異の統計分析に依拠する。しかし、配列アライメントに基づくタンパク質中の2つの位置同士の統計カップリングは、二重変異体サイクルを使用して実験的に決定されたように、実際の熱力学的カップリングに必ずしも反映されていないことが示されている(Chi et.al., 2008, PNAS, 105, 12)。] [0004] 本明細書には、タンパク質内で関連した動きを示す残基のネットワーク、またはバイオポリマー内の成分構造単位のネットワークを推定する独自の方法が示されている。相関運動を有する残基ネットワークを特定するための本発明の方法は、僅かなオフ−ロータマー(off-rotamer)配座でさえ検出するのに十分高い感度を有する。これらのオフ−ロータマー配座は、アポおよび複合タンパク質の配座異性体にしばしば見出される。] [0005] 分子動力学またはモンテカルロシミュレーションでは、様々なメトリックを使用して、局所タンパク質またはバイオポリマーの幾何形状を分析する。次いでシミュレーションの結果を使用して、サンプリングされた時間枠内のバイオポリマー中の残基の様々な交互配座を特定する。これら交互配座の相互関係性を使用して、相関運動のネットワークを確立する。本発明の分析は、大部分の場合、利用可能な交互残基配座がほとんどない点を利用する。] [0006] 提示される方法の高い感度により、この方法は、広く様々な適用例で構造/活性関係を推定するのに適切なものになる。例えば、この分析結果を使用して、飽和突然変異誘発技法で使用されるポリペプチドの重要な残基を理知的に選択することができる。さらに、タンパク質における動的ネットワークの深い理解は、ホモロジーモデリング、ドッキング研究、および量子力学/分子力学的シミュレーションなど、予測的なインシリコ(in silico)実験の精度に不可欠である。より可能性ある配座状態およびそのような配座同士の一時的な関係を特定することにより、バイオポリマーの安定性および機能において重要な役割を演ずる傾向があるより強固な構造配座を特定することが可能になる。本明細書に示される方法は、バイオポリマーに関する様々なタイプの情報を提供するのに使用することができる。そのような情報には、例えば、本明細書で論じられるように、バイオポリマープロファイル、バイオポリマーの構造単位のプロファイル、バイオポリマーまたはバイオポリマーの構造サブユニットの配座状態、および様々な構造サブユニット同士の相関が含まれる。様々な例示的な実施形態では、バイオポリマーがポリペプチドであり、構造サブユニットがアミノ酸である。] 図面の簡単な説明 [0007] 3つの原子配置によりそれぞれ画定された2つの平面の間で計算された、仰角およびアジマス角を示す図である。 分子動力学シミュレーションからの幾何学的メトリックデータを示す分布図である。データポイントは、軌道内の特定の構造のスナップショットまたはフレームを表し、このデータポイントの位置は、互いに対してプロットされた3つの角度により拘束される。この場合、データは2つの全く異なるクラスタに分かれる。クラスタ化は、全ての利用可能な角度で、またはそのサブセットで行うが、三次元のみでいくらか明瞭に、視覚的に示すことができる(本明細書に示されるように)。 分子動力学シミュレーションから得られた幾何学的メトリックデータを示すヒストグラムである。このヒストグラムのピークおよび谷は、3つの極大値を有する多峰形分布を示唆する。 クチナーゼに関して本発明が定めた残基配座を示すカラムスタックヒストグラムプロットである。これらのプロットは、タンパク質の独自のサインを表示し、単一残基配座を有する残基、交互配座を有する残基、および高度に集中した離散的配座を有する残基を、素早く視覚化するのに使用される。具体的な詳細は、実施例のセクションに示す。 鋳型骨格構造上にマッピングされた、定義された残基配座のそれぞれに関する、三次元の代表的な残基構造を示す図である。詳細を、実施例のセクションに示す。 タンパク質プロファイリングデータをどのように使用できるかを示す例である。詳細を、実施例のセクションに示す。 溶媒が接触可能な残基の表面積と、タンパク質プロファイルで定義されたその移動度と、変異に対するその感受性との相関を示す図である。詳細を、実施例のセクションに示す。 残基ネットワークのデータをどのように使用できるかを示す例である。詳細を、実施例のセクションに示す。] [0008] 定義:幾何学的メトリックという用語は、バイオポリマー、タンパク質の場合はアミノ酸の、構造単位または残基(本明細書では同義に使用する。)の複数の測定可能な物理的属性を示す。幾何学的メトリックは、1)二面、平面、またはそれぞれの残基の原子によって定義されたその他の測定可能な角度、2)同じ残基の原子間または別の残基の原子までの距離、および/または3)同じ残基の原子間および構造内の参照原子または位置の距離によって定義することができる。残基集団は、単一残基に関して得られた全てのスナップショットまたはサンプルの合計である。集団は、通常、分子動力学シミュレーションで獲得されたフレームの数またはモンテカルロシミュレーションから得られたサンプルの数に等しいと考えられる。残基配座は、特定の残基構造に起因する、観察された幾何学的メトリックの組合せに関して定義される。残基クラスタは、定義された幾何学的メトリックの全てまたは一部のクラスタ化に基づいた、同じ配座が割り当てられた複数のスナップショットを指す。配座頻度(conformational frequency)は、同じ残基配座が割り当てられたフレームの数を指す。シミュレーションは、分子動力学またはモンテカルロをベースにしたサンプリング手法によって行われた、配座サンプリングのプロセスを指す。軌道は、シミュレーションによって生成された配座フレームを含有する。グラフ理論は、数学およびコンピュータサイエンスで使用されるような用語を指す(例えば、Reinhard Diestel, Graph Theory; Edition 3, Springer 2005参照)。クラスタ化ツールという用語は、データ集合から同様のデータポイントのクラスタを特定するのに使用することができる、複数の数学的方法およびアルゴリズムおよびこれらを実行するプログラムを指す。動的相互相関法という用語は、分子動力学軌道における分子構造の原子転位の相互相関行列を、その構造の別の配座状態を基準にして示したグラフ表示を指す。通常モード分析は、局所エネルギーが最小限の分子系に関する特性調和振動および頻度の研究である。弾性ネットワークモデルは、残基対同士の相互作用に近い調和スプリングのネットワークを含むようなタンパク質構造の表示を指す。] [0009] タンパク質内のアミノ酸は、タンパク質構造内の立体および二面障害により、一般に限られた配座空間に接触できる。これは特に、埋没した残基、ならびに活性部位が存在可能なタンパク質表面の凹部領域に存在するものに関して、あてはまる。このように、限られた数のおそらくは交互残基配座が、タンパク質構造で利用可能である。タンパク質構造のライブラリーで観察されるアミノ酸ロータマー配座の程度および性質は、文献で研究されてきた(Dunbrakライブラリーなど: http://dunbrack.fccc.edu/bbdep/index.php,またはその他の公開されたライブラリー:例えば、Lovel et al., 2000, Proteins: Structure Function and Genetics 40, 389; Dunbrack & Cohen, 1997, Protein Science, 6, 1661; DeMaeyer et al., 1997, Folding and Design, 2, 53; Tuffery et al., 1991, Journal of Biomolecular Structure and Dynamics, 8, 1267;およびPonder & Richards, 1987, Journal of Molecular Biology, 193, 775参照)。本発明の研究では、タンパク質構造のライブラリーで観察された多数の潜在的ロータマーについて考慮する代わりに、研究中のタンパク質のシミュレーションで観察されたロータマーまたはオフ−ロータマー配座のみが相互相関分析に含まれることになる。事実、タンパク質中の残基コンジット/ネットワークにおいて重要なのは、通常オフ−ロータマー配座の変化である。本発明の技法により、相互作用と酵素メカニズムとを結び付ける際の極めて重要な役割にしばしば関連付けられた、僅かなオフ−ロータマー配座の特定が可能になる。オフ−ロータマー配座には、例えば歪みラック配座、即ち残基のロッキング運動を通してサンプリングされた配座異性体が含まれる(Davis et al., 2006, Structure 14, 265)。オフ−ロータマー配座を含むことにより、相関残基ネットワークを精密に定めるのに必要な感度レベルが実現される。] [0010] 本明細書で使用される「ポリペプチド」は、ペプチド結合によって結合した2つ以上のアミノ酸または残基を意味する。「ポリペプチド」および「タンパク質」は、同義であり、オリゴペプチドおよびペプチドが含まれる。] [0011] 単一のアミノ酸の場合、「オフ−ロータマー」または「非ロータマー」の側鎖位置は、一部の「オン−ロータマー」または「ロータマー」の位置の場合よりも高い内部エネルギーを有する。側鎖ヘテロ原子の立体構造は、側鎖二面角χを、位相空間内のある領域に限定する傾向がある。四面体炭素に関わる結合に関するχは、例えば−60°、180°、および60°で最小限のエネルギーになる傾向がある(Petrella & Karplus, 2001, Journal of Molecular Biology, 312,1161)。非限定的な例として、統計的変動を認めると、オン−ロータマーの位置は範囲{30〜90°、150〜210°、270〜330°}内に包含されると考えられる。この場合、オフ−ロータマーの位置は、範囲{90〜150°、210〜270°、330〜30°}内に見出されるものと見なすことができる。このように、オフ−ロータマーの位置は、オン−ロータマーまたはロータマーの位置に対するもので、統計的に適切な範囲を、位相空間内で若干最小限のエネルギーに設定することにより決定される。有用な範囲には、±10°、±20°、および±30°が含まれる。オン−ロータマーおよびオフ−ロータマーに関する範囲は、古典的に定義されたχ角に加え、その他の残基メトリックに関して相応に見出すことができる。これらは、オン−ロータマーに対し、典型的にはそれほどエネルギー的に好ましくないので、オフ−ロータマーは、タンパク質構造内でそれほど見出し易くはない。それにも関わらず、周囲のポリペプチド環境に起因して、ポリペプチド中のアミノ酸のエネルギー的景観は個々の残基の場合とは異なる。ポリペプチド中のアミノ酸の独自の局所環境は、最小限の局所エネルギーを示す「オフ−ロータマー」の位置をもたらす可能性がある。物理的に全く異なり集中させた、側鎖の幾何形状、「オフ−ロータマー」または「オン−ロータマー」の両方の構造的特徴付けは、正確な結果を保証するために考慮にいれなければならない。] [0012] 一般に、本発明の方法は、バイオポリマーの残基に関する適切なデータを獲得し、そのデータを分析して、これらの間の相関運動を決定する手段を提供する。] [0013] バイオポリマーの残基配座に関する幾何学データは、分子動力学(MD)シミュレーションを行うことによって生成することができる。MDシミュレーションでは、エネルギーポテンシャルに曝された分子が、ニュートンの運動方程式の解法により経時的に発生する。分子のポテンシャルエネルギーは、タンパク質の部分同士の様々な関係に関する項を含む関数を使用して計算される。このように、項は、例えば結合長、結合角、および二面角、ならびにクーロンおよびレナードジョーンズの相互作用などの非結合相互作用エネルギーについて説明するために使用してもよい。交差またはその他のより高次な項も役立てることができる。そのようなポテンシャルエネルギーは、タンパク質、核酸、脂質、および炭水化物のモデル化に有用であるが、小有機分子などのその他のタイプの分子に同様の関数を選択することができる。] [0014] 原子の位置に対してポテンシャルエネルギー関数の勾配をとることにより、原子に対する力の方程式が得られる。原子に関するニュートンの運動方程式は、計算された力を使用して解かれ、その結果を使用して、原子を空間内で移動させる。運動方程式を解くための方法は、ベレのアルゴリズムなどの任意の有用な数値アルゴリズムを含む。] [0015] このように、MD軌道に沿って生体分子を発生させることが可能な任意のMDシミュレーションを、本発明で使用してもよい。例えば、MD軌道は、CHARMM、AMBER、GROMACS、およびNAMDソフトウェアパッケージを使用して計算することができる。一般に、Adcock & McCammon,2006,Chemical Reviews,106,1589を参照されたい。] [0016] 一実施形態では、ポリペプチド残基メトリックに関するデータは、タンパク質側鎖配座のモンテカルロサンプリングを行うことによって生成することもできる。この手法では、アミノ酸側鎖でのランダムに選択されるねじれ(二面)角が、ランダムに摂動を引き起こす。この動きは、摂動前の角度の値よりもエネルギー的により好ましい場合に許容される。この動きがエネルギー的に好ましくない場合は、ボルツマンの統計で定められた確率で許容され、その他全ての場合は拒否される。アルゴリズムを繰り返し継続して、配座のアンサンブルを生成する。] [0017] 一実施形態では、ポリペプチド残基メトリックに関するデータを、タンパク質の側鎖および主鎖の両方の配座のモンテカルロサンプリングを行うことによって、生成することができる。] [0018] 原則として、問題のタンパク質に接触可能な配座空間を表す十分大きいサンプルを生成することが可能な、任意のその他の方法を使用することができ、例えば、NMR法または高速大量処理の高分解能法であって、ラウエX線結晶構造解析が含まれる。] [0019] 一実施形態では、シミュレーションデータの分析で、それぞれ個別の残基メトリックごとに残基クラスタを定義し、各クラスタのクラスタ頻度を計算し、次いでさらにクラスタ頻度を分析する。別の実施形態では、シミュレーションデータの分析で、複数の残基メトリックを基に残基クラスタを定義し、各残基クラスタのクラスタ頻度を計算し、次いでさらにクラスタ頻度を分析する。] [0020] 交互残基配座をスクリーニングする簡単で強固な方法は、各残基Xiのフレームワークに対する位置的相違をサンプリングするために、残基メトリックnを使用することである。有用な残基メトリックには、残基の標準結合ねじれ角、末端原子位置、およびサンプリングの感度を上昇させるよう定められた角の独自の組が含まれる。] [0021] 一態様では、本発明は、角メトリックを定義する方法を提供する。各残基タイプごとに一意的に定義することができる、1つのそのような角メトリックを、本明細書では「平面角メトリック」と呼び、グリシンおよびアラニンを含む残基で生じ得る、明瞭に異なる歪みまたは傾斜交互幾何形状の高感度検出に役立てることができる。そのようなメトリックを提供する1つの利点は、シミュレーション中のサンプリング感度を上昇させることである。言い換えれば、これらの平面角は、エネルギー的にはそれほど好ましくない障壁によって分離される、2つの緊密なしかし構造的に全く異なる交互配座の分割を可能にする。一組の平面角メトリックは、原子の2つの異なる組によって定義される2つの異なる平面を定義し、次いでこれら平面間の仰角およびアジマス角を共に計算することによって、決定することができる(例として図1を参照)。例えばアラニンでは、仰平面角は、残基主鎖の原子Cα、Co、およびNにより定義された第1の平面と、主鎖および末端原子の両方を含むCβ、Co、およびNにより定義された第2の平面との間の角度によって、定義することができる。このように、平面角の一部で定義するのに使用される平面は、任意の組合せの、主鎖および末端原子から独立して選択される3個の原子を使用して、定義することができる。] 図1 [0022] そのように定義された2つの平面により、仰平面角メトリックは、各平面の法線ベクトルを使用して計算することができる。図1を参照すると、N1およびN2は2つの異なる平面角の法線ベクトルであり、この平面角メトリックは、方程式N1・N2=|N1||N2|cosθにより決定することができる。] 図1 [0023] そのように定義された2つの平面により、アジマス平面角メトリックは、第1の平面上に投影された第2の平面の法線ベクトルを使用して、そのベクトルと、第1の平面内の第1の2個の原子によって定義されたベクトルとの角を計算することによって、計算することができる(図1参照)。N2が第2の平面の法線ベクトルである場合、ABは、第1の平面内の原子AとBとの間のベクトルである。] 図1 [0024] 表1は、様々なアミノ酸に関する平面角メトリックを定義するのに使用することができる、原子の例を示す。] [0025] ] [0026] 表1からわかるように、第1の平面は、例えば主鎖原子のみ含んでいてもよい。第2の平面は、例えば、主鎖および側鎖から選択される原子、または側鎖からのみ選択される原子の組合せを含んでいてもよい。側鎖または末端原子は、固有のものであり得る。] [0027] 平面は、例えば芳香環系の6個の炭素原子であり得る一組の原子に当てはめることにより、定義することもできる。3個以上の原子の任意の組合せおよび数を使用して、平面を定義し当てはめることができる。原子は、同じかまたは異なる残基の一部であることができる。] [0028] 本明細書の平面角を定義する方法は、当業者により認められるような、いくつかのその他の適用例での使用を見出すことができる。] [0029] 表2からわかるように、何組かの平面角メトリックは、ヌクレオチドの交互配座を獲得するように、核酸に関して定義することができる。] [0030] ] [0031] 表3のβ−D−マンノースの例からわかるように、何組かの平面角メトリックは、多糖内で観察された配座を獲得するように、炭水化物に関して定義することができる。] [0032] ] [0033] 計算される残基メトリックの組は、上述の平面角、ならびに主鎖二面角φおよびψ、側鎖二面角χn(nは、例えばアミノ酸のタイプに応じて選択される。)、およびポリペプチドの2点間の距離ベクトルrを含むことができる。例えばrは、残基のCαからその残基の末端原子を指すベクトルであることができる。] [0034] 次いで残基メトリックXnij(但し、nはメトリックを指し、iは残基の数を指し、jは軌道スナップショット/フレームまたはその他の配座サンプルを指す。)を計算し、データベースに保存する。残基に関して定義されたメトリックの全てまたはその内部のサブセットを使用して、軌道全体を通して残基によりサンプリングされた高度集中残基配座サブ状態を特定する。以下の記述は、分子動力学がサンプリング法として使用されるが、データは前述の種々の手段によって得ることができ、本発明の方法により処理することができるという仮定に基づく。] [0035] 残基の局所環境に応じて、この残基は、複数の配座状態で存在してもよい。例えば、図2に示すように、三次元プロットを使用して単一残基に関する3つの角メトリックをプロットする場合、2つの全く異なるクラスタが現れる。これら2つのクラスタは、2つの分離可能な集団があるので、その残基に関する交互残基配座として定義することができる。多次元クラスタ化は、軌道全体にわたり生じる任意の高度に集中した分離可能な残基配座を特定するのに使用される。多次元クラスタ化法は、このデータに適用することができる。] 図2 [0036] 各残基ごとに独立して、クラスタ化アルゴリズムが高度集中クラスタを特定する場合、これらのクラスタには、0、1、...、mからの公称記述子が割り当てられる。残基がこれら高度集中クラスタの1つに属する軌道フレームには、適切なクラスタ記述子が割り当てられる。特に、残基メトリックまたは残基に関する時間軌道データには、そのクラスタメンバーシップXmnijに基づくこの記述子が割り当てられる。軌道データポイントのいくつかは、有意に集中したクラスタに属さないことになり;これらは、その性質を示す−1という公称記述子で標識される。] [0037] 多数の残基メトリックは、データ内の分割可能な交互残基配座の全てが一意的に定義されるように(例えば、標準平面角および/または二面角の全てが使用される場合)、組み合わせることができる。これらの使用の場合、残基記述子は、固有の残基配座を定義する。] [0038] 単一残基メトリック軌道Xnijは、残基の構造サブ状態を特徴付けるのに使用することができる。本明細書では、本発明者らは、より位置的な重なりを本質的に示すが依然としてピーク差を含有する単一メトリックデータを特徴付けるため、任意の標準クラスタ化法とは対照的に、区分法(binning method)について記述する。残基メトリックの値は、メトリックタイプに適切な、選択される区分幅に応じて、一緒に区分される。例えば、二面角メトリックの分析では、選択される区分幅4°で、10°異なる配座異性体を分離するのに十分な分解能をもたらし、同時に統計的ノイズを制限するのに十分な平滑化をもたらすと考えられる。図2に示されるように、3つのクラスタが極大付近に分布し、そこでは角メトリックが「区分(bin)」28〜32、48〜52、および84〜88であるが、クラスタを割り当てる基準に応じて、より多くのまたはより少ないクラスタを見分けることができる。その他の区分幅は、所望の平滑化および分割を行うのに選択することができる。自動化一および多次元区分プログラムは、区分を決定するのに役立てることができる。次いで区分の集団が決定され、これをプロットすることにより、残基メトリックの分布を示すヒストグラムが得られ、その例を図3に示す。] 図2 図3 [0039] 次いでこれらの平滑化ヒストグラムを使用して、最も可能性ある残基メトリックを定義することができる。ヒストグラム内のピーク間の境界(図3参照)は、分割可能な残基メトリック最小値の構造範囲を定義するのに使用されるが、それはピークが、特定の角度または距離で観察された有意なデータポイント頻度から得られるからである。] 図3 [0040] 次いで軌道データに、これら定義された集中区分の1つでのメトリック占有を基にして、公称記述子を割り当てることができる。本明細書で使用される残基「サブ状態」は、範囲が定められた値の組を指す。次いでサブ状態Xは、一組の基準を残基メトリックの集団分布に当てはめることによって、特定することができる。これらのクラスタは、クラスタXに関する残基メトリックの、可能性ある残基配座状態を特定する働きをする。例えば、図3のヒストグラムは、分布のピークおよび谷によって特定できる3つのクラスタを示し、図2は、データを予め区分することなく、3つの二面角を分離することによって特定される2つのクラスタを示す。所与の分布におけるクラスタの数は、当業者がデータの処理および解釈で適用する種々の閾値および制約に応じて変化することになる。例えば、区分幅の縮小または拡張は、相応に集団プロファイルを変化させることになり、したがって、ピークおよび谷の数が変化することになる。クラスタを特定する工程は、自動化することができる。Bravi et al.,1997,Journal of Computational Chemistry,18,1295は、クラスタを特定するための自動定量法の例について記述している。] 図2 図3 [0041] 本明細書で使用される、例えば「交互クラスタ」または「交互配座状態」における「交互」は、高度に集中しているが必ずしも最大限に集中しているわけではないことを意味する。何をもって高度に集中していると見なすのか決定する基準が、本明細書で論じられる。] [0042] (残基プロファイリング) 残基プロファイルは、以下の段落でより詳細に記述されるように、1個当たりの残基ベースで行われた分析の要約である。移動度指数は、クラスタ頻度およびクラスタ化に使用される幾何形状データの分散から得られる。] [0043] クラスタ化または代替区分法によって割り当てられた公称記述子は、残基の配座サブ状態を定義することに留意されたい。軌道の過程で残基によりサンプリングされた配座状態の出現/集団および数の両方は、円グラフやヒストグラムなどの標準的なグラフ表示法を使用して、分析することができる。この情報により、当業者は、それぞれの残基の構造および機能の重要性について結論を導くことが可能になる。] [0044] 残基の配座は、ロータマーライブラリー(Dunbrack)に記述される配座と同一であることができるが、上述のようなオフ−ロータマー配座であることもできる。交互残基配座は、それぞれのクラスタ化アルゴリズムにより定義されたパラメータと共に、同様の配座をグループ化/クラスタ化することによって特定される。配座のクラスタを定義するのにハードカットオフ値は使用せず、したがって、例えば配座は、分布が角度に沿って連続する場合には、大きな標準偏差を有する測定された二面角の1つに関して広い角度に及ぶ。] [0045] これらの残基配座(またはサブ状態)は、残基の運動特性を定義するのを助ける。これらの残基配座は、例えば、残基の運動中の構造的移動度および/または方向性を特定するのに使用することができる。例えば、これら定義されたサブ状態の角度分散は、サブ原子分解能結晶構造における原子に関する異方性原子温度因子の厳密な検査により得られたものと同様の機能情報を得るために、当業者により同様の手法で使用することができる。定性的手法によるこのデータは、その構造的配座を移動させ変化させる残基の位置的自由度を定義する、ポテンシャルエネルギーランドスケープを定義する。] [0046] 分布の特徴を分析することにより、移動性の残基と強固な残基のメトリックを区別することができる。移動性残基メトリックは、広範な、特徴のない分布によって特徴付けられる。強固なまたはほぼ強固な残基のメトリックは、残基メトリックのある値付近に集団のクラスタ化を有する、比較的狭いピークによって特徴付けられる。分布は、少なくとも1つの狭いピークに欠けている場合、広くかつ特徴がないと見なされる。] [0047] 残基は、そのそれぞれ定義された(1つまたは複数の)交互配座性質に基づいて、強固な、半強固な、柔軟な、また移動性のグループにグループ化することができる。「移動性グループ」への指定は、一連の測定およびカットオフ値に基づいて行うことができる。この分類および対応するカットオフ値を調節して、分析された系を最良に当てはめることができる。残基の分類は、種々の配座の集団と、これらの配座におけるそれぞれの分散に基づいて行われる。] [0048] 上記残基プロファイルから、タンパク質プロファイルを得ることができ、このプロファイルを、その他のタンパク質または同じタンパク質の変異型との比較に使用することができる。この情報は、タンパク質工学で成果を得るために、当業者が使用することができる。] [0049] 好ましい実施形態では、残基プロファイル法を使用して非常に強固であると定義された全ての残基を、定義によりタンパク質構造の完全性に欠かせずしたがってタンパク質を変異させようとするときに特に注意を払って処理しなければならないフレームワークに、割り当てることができる。このフレームワークは、残基ネットワークの特殊なケースと見なすことができる。] [0050] (残基ネットワーク) 残基ネットワークは、以下により詳細に記述するように、残基配座の統計分析に基づき高い相互関係性を示す、一組の残基と言える。] [0051] 上記にて論じたように、公称残基配座記述子は、クラスタ化/区分プロセスで使用されるメトリックの数に応じて、その残基に関して定義された単一残基メトリックまたはサブセットまたは全ての残基メトリックに基づき割り当てることができる。残基に関する全ての構造的自由度をサンプリングする残基メトリックのサブセットを有する多次元クラスタ化は、本質的に、軌道データ内でサンプリングされた特定の残基に利用可能な、分解可能な残基配座またはサブ状態または「交互配座」の全てを定義する。] [0052] タンパク質中のほとんどの残基は、典型的には全く動かず、それらの関連あるメトリックの分析によって、ほんの僅かな交互配座が得られる。各残基ごとに、これらの交互残基配座(サブ状態)を定義した後、軌道全体にわたるそれぞれ定義された残基配座サブ状態の集団を、計算することができる。] [0053] 残基配座の周辺確率は、残基配座集団をフレームの総数で割った商として計算することができる。例えば、残基配座「A」の場合: P(A)=n(A)/N であり、上式でP(A)は、周辺確率であり、n(A)はAの集団であり、Nはフレームの総数である。] [0054] 交互配座は、固有の残基配座サブ状態と見なされ、サブセットが中心極限定理を満足させかつ分布が収束した場合に、確率をその状態に割り当てることができる。残基P(A)の状態Aの確率が1に等しい(または近い)場合を、強固でありかつ上述のフレームワークの一部であると見なす。] [0055] 次いでこれらの残基配座集団をさらに分析して、クラスタ同士の相関を決定する。] [0056] それぞれ配座状態AおよびBにあり、但しP(A)およびP(B)が1に等しくない2つの残基では、即ちこれらの残基がフレームワークの一部でない場合には、条件付き確率を、下式を使用して配座のそれぞれの対ごとに計算し、 P(A|B)=P(A,B)/P(B) 上式でP(A|B)は、Bが与えられたときのAの条件付き確率であり、P(A,B)は、AおよびBの論理積(または結合確率)であり、P(B)は、Bに関する周辺確立である。] [0057] この確率比の正規化は、P(A|B)/P(A)の形で、即ちP(A,B)/P(A)P(B)で実施される。この正規化された確率比を使用して、統計的独立の程度または依存性の程度と、2つの残基配座状態AおよびBの間の相関を検証する。この比が1の値である場合、AおよびBは統計的に独立していることを示唆する。同様に1からの偏差は、AおよびBが相関していることを示唆する。] [0058] 「エネルギー」などの用語は、下記の自然対数をとることによって記述することができ、 G=−ln(P(A|B)/P(A)) この自由エネルギーの推定値が0の場合、2つの配座は統計的に独立していることが示唆される。Eが正の値の場合は、2つの配座の相互排除が示され、負の値は共存を示唆する。] [0059] まとめると、非相関メトリック対の場合、比の対数は0に向かう傾向になるのに対し、相関残基は、0から著しく逸脱した比をもたらすことになる。メトリック同士の時間相関の根底にある原因は、じつに複雑である可能性があり、それぞれのタンパク質残基の直接的または間接的な相互作用から生じる可能性がある。] [0060] あるいは、周辺確率と条件付き確率との差を使用して、2つの残基配座同士の相関の量を示すことができる。] [0061] 事実、集団同士の統計的有意性を導く様々な統計的方法を適用して、相関残基配座を特定することができる。そのような方法の一例は、分割表の使用と考えられる。] [0062] 相関残基配座対の縮小サブセットは、残基配座対の全てに関する確率比の値のヒストグラム分布に基づき、カットオフを適用することによって生成することができる。例えば、データのランダム誤差は、比のデータのバルク分布により明白であるが、それはデータの大部分が有意に相関しておらず、したがって、ほぼ1つのまたは1つの比を有するからである。データのこのバルクを除去するカットオフは、残基配座の集団における弱い相関またはランダムノイズに起因して、その比が一般的なバックグラウンド変量とは著しく異なっている、これらの相関残基対のみ残す。] [0063] 有意に相関している残基配座は、軌道全体を通して共存していてもよく、または相互に排除的であってもよい。両方のタイプの相関は、タンパク質中に存在する残基相互作用ネットワークを定義するのに極めて重要である。例えば、残基同士の立体相互作用は、相互排除的な相互作用として主に特定される。共存または相互排除は、Gのサインで明らかであり、負の相関値を有する残基対は、一緒に存在する傾向が高いのに対し、Gが正の値の場合には、相互排除が示唆される。] [0064] 残基相互作用ネットワークは、強度相関ペアワイズ残基間相互作用の相互依存性によって定義することができる。例えば、残基の1つの配座状態Aの位置が、第2の残基の配座Bおよび第3の残基配座Cの集団に影響を及ぼす場合、3つの残基全ては、ネットワークに属することを明らかにすることができる。] [0065] 多くの場合、ある配座状態Aの位置は、残基配座Bの集団に劇的な影響を及ぼさない。即ち、残基Xiが所定位置Aにある場合、残基配座Bにある残基Yjの傾向に変化がある。これは、ポテンシャルエネルギーランドスケープの変化の間接的尺度である。これらのそれほど明らかではない残基間相関対も、相関残基ネットワークに潜在的に関与する。] [0066] 定義により相関残基ネットワークに関与する残基は、このそれぞれの残基配座間に、高いペアワイズ相互接続性を必要とする。例えば、4つの残基配座A、B、C、およびDのネットワークにおいて、これが「相関残基ネットワーク」である場合には、そのネットワークを定義する、3つを超えるペアワイズ相関があることが予測される。理想的には、4つの残基配座に関わる相関ネットワークに関して、6つのペアワイズ相関を観察することが予測される。まとめると、ネットワーク内の高度相互接続残基配座は、相関残基ネットワークを定義する。] [0067] 様々なフィルタリング法を使用して、観察される相関残基ネットワークに関与する(1つまたは複数の)同様のメカニズムを解明することができる。例えば、距離的制約を使用して、スルースペース相互作用ネットワークを特定することができる。2つの残基配座(または残基)AおよびBが、軌道全体を通してどの時点でもファンデルワールス距離内(例えば、4.5Å以内)にある場合、これらの配座は、互いに物理的に接触するように位置決めされる。] [0068] 残基メトリッククラスタ情報(Xijmn)は、時系列分析で使用することができる。シミュレートされた軌道の過程での、時系列の残基メトリックは、これら固有のクラスタへの割当てに基づいて得られる。残基幾何学メトリックの時間依存性共分散分析は、当技術分野により行われた方法で、時間の関数としてのこの系の結合残基幾何学変化に関する情報を提供することになる。] [0069] 主成分分析(PCA)または対応分析を含むデータマイニング法を用いて、共分散行列を分析することができる。] [0070] 時間ドメイン内の幾何学共分散データを頻度ドメインに変換して、データ分析で伝統的なシグナル処理手順を適用することができる。] [0071] 本発明の別の実施形態では、相関は、複数対の配座に関して計算せずに、下式を用いて相互情報I(A;B)を計算することにより残基−残基対に関して計算し、 I(A;B)=ΣAΣBP(A,B)×log(P(A,B)/P(A)×P(B)) 上式で、P(A,B)は、Bが与えられたときのAの条件付き確率であり、P(A)およびP(B)は、それぞれAおよびBの周辺確率であり、残基AおよびBの関連ある相関配座サブ状態全てにわたり合計される。Zスコア計算(オブザーブドマイナスエクスペクテッドスクエアド(OMES)共分散アルゴリズムとしても公知である。)などのその他の方法を利用して、残基対同士のこの関係を分析することができる。] [0072] (適用例) タンパク質からの「タンパク質プロファイル」データを使用して、タンパク質を区別することができ、したがってタンパク質を種々のグループに分類することができる。そのような新しい分類スキームは、構造および配列の類似性などの現在使用されているパラメータを利用せず、残基配座の相対数およびこのそれぞれの柔軟性を使用して、タンパク質同士を区別する。そのようなグループは、例えば、タンパク質の全体的な柔軟性を記述するのに使用することができ、安定性などの物理的性質に相関させることができる。] [0073] 全てのタンパク質に関し、一組の残基には柔軟性がほとんどなく;これらの残基はそれぞれの構造に関してフレームワークを構成する。どの残基がフレームワークに属するかに関する情報は、そのフレームワークの完全性を妨害すべきではない場合、突然変異を回避するのに使用することができ、またはこの完全性の崩壊が望まれる場合には、特に突然変異の標的にすることができる。タンパク質プロファイルは、変異に対してタンパク質が一般にどのように修正可能か推定するのに使用することができ、また変異が許容される位置を当業者が特定するのを助けるのに使用することができる。] [0074] それらの定義された(1つまたは複数の)残基配座における小さな位置分散による残基のクラスタ化は、タンパク質中の重要な結合部位を特定する追加の方法として使用することができる。これらの部位を、当業者はしばしば「ホットスポット」と呼ぶ。] [0075] それらの定義された(1つまたは複数の)残基配座でより大きな位置分散を有する残基は、タンパク質の安定性を改善することを目的とした、標的とされた変異誘発適用例のために選択することができる。タンパク質の安定性は、タンパク質のコンパクト度合にしばしば関連する(Matthews, B., 1996,FASEB J., 10(1), 35; Stawiski, E. W., et.al., 2000, PNAS, 97(8), 3954)。] [0076] この方法によって定義された、観察された残基配座は、変異体を設計するための方法のようなデッドエンド排除を使用して、制約された残基タイプの組を優先順位付けする加重スキームを開発するのに使用することができる(Desmet et al., 1992, Nature, 356, 539)。主鎖の幾何学要件が残基のロータマー配座と一致していない位置で置換されることは、いくつかの残基タイプにとってエネルギー的にそれほど好ましくないので、より可能性ある配座空間の動的範囲を定義することにより、代替残基タイプを特定し重み付けするために、公知のロータマーライブラリーをスクリーニングすることができる。] [0077] 2個の残基同士の相関は、関与しているネットワークをさらに分析することなく、協同的変異を設計するのに使用することができる。2個の残基は、それらが互いの隣に位置付けられており、したがってファンデルワールス接触を有する場合、またはそれらが静電相互作用を通して離れて位置付けられている場合、互いの位置に影響を及ぼす可能性があり、したがって相関している隣接部分全てに対する作用を考慮する必要がある。強力に相関している残基は、同時変異誘発に向いていると考えられる。] [0078] タンパク質内の残基の相関ネットワークの決定は、リガンド結合で重要な役割を演ずるタンパク質の柔軟性を予測するのに役立てることができる。酵素触媒作用などのプロセスでは、反応を受ける分子の遷移状態の選択的結合がしばしば行われる。酵素が反応を触媒する能力は、遷移状態を安定化させるという酵素の能力と結び付いている。自由エネルギー関数に関して、酵素は、反応座標に沿って生成物状態を実現する前に、反応物によって克服しなければならないエネルギー障壁を低下させると考えられる。] [0079] より一般的には、分子内の相関運動のネットワークを理解することにより、研究者は、2個の結合パートナーが、特にそれら結合パートナーの一方がタンパク質である場合、互いに相互に作用しまたは結合する能力を微調整することが可能になる。このように、結合パートナーの一部の間で相関運動を確立することは、シグナル伝達事象または結合が重要な任意のその他の生物学的プロセスの制御において、重要な示唆をもたらす可能性がある。] [0080] 一態様では、本発明を、タンパク質と、別のタンパク質やリガンドなどの別の分子との複合体の構造を決定するのに使用される計算手法である、タンパク質ドッキング法に役立てることができる。初期の方法では、様々なタンパク質残基の結合角、結合長、およびねじれ角を、シミュレーション中は固定したままにした。最終的には、シミュレーション中に、特に側鎖の配座変化を可能にする、柔軟なドッキング法を開発した。本発明の方法による相関残基ネットワークの特徴付けおよび特定は、そのような柔軟なドッキング法に含まれるよう、残基の重要な柔軟なサブセットの定義を可能にする。本発明の方法の1つの利点は、タンパク質ドッキングシミュレーションにおいて、タンパク質活性部位の第1の「シェル」の外側にいくつかの残基を特定し含むことが可能になることである。このように、その運動が結合相互作用に関わっている離れた残基を含むことは、現行のドッキング法を改善するのに使用することができる。] [0081] 活性部位での可能性ある残基配座の特徴付けは、制限されたタンパク質配座の組を剛体ドッキング法に提供するのに使用することもでき、それによって、強固なタンパク質モデルを生成する場合に組合せ的爆発特性が実質的に低下する。] [0082] タンパク質残基およびそのそれぞれの(1つまたは複数の)配座がどのように相関しているか理解することにより、以前から公知の結合対と比べて触媒効率が改善されまたは低下するように、酵素触媒または基質を設計操作する(engineer)ことが可能になる。残基相関の知識は、以前から公知の結合パートナーに比べて異なる特異性を有する、新規な結合パートナーの設計操作も助けることができる。] [0083] したがって、別の態様では、本発明は、タンパク質用のリガンドの設計操作を提供する。タンパク質残基同士の相互作用を決定することにより、また相関残基のネットワークをマッピングするのに空間的または距離上の制約を使用することにより、タンパク質の配座状態を特徴付けることも可能になる。新しい結合部位は、酵素触媒またはタンパク質−タンパク質もしくはタンパク質−基質結合などのタンパク質の機能が、新しい結合部位とリガンド結合することによって修正され得るように、決定することができる。このように、本発明は、アロステリック部位を特定するのに使用することができる。ネットワークは、結合、エナンチオ選択性、または基質特異性が最適化されるよう、リガンドを設計しまたは修正するのに使用することができる。] [0084] 特定されたタンパク質配座状態は、酵素に対する結合または活性を維持するのに必要とされ得る、柔軟な構築物を設計操作するのに使用することもできる。このように本発明の方法は、リガンドに固有の柔軟性の要件を特定するのに役立てることができる。これは、抗生物質の設計に特に重要と考えられる。] [0085] 別の態様では、本発明は、活性部位で幾何形状に著しく寄与するタンパク質の離れた領域を特定することによって、最適な球面境界条件を特徴付けるための、分子動力学/量子力学シミュレーションに用途を見出している。] [0086] 一態様では、本発明は、野生型タンパク質またはその他のタンパク質変異体に比べて変化した機能的特徴を有する、タンパク質変異体を設計する方法を提供する。「タンパク質変異体」は、野生型タンパク質とは少なくとも1個の残基が異なるタンパク質を意味する。タンパク質変異体と野生型タンパク質との相違は、任意の選択される変異位置でのアミノ酸の付加、欠失、または置換に起因すると考えられる。野生型タンパク質は、天然に生ずるポリペプチド、または天然に生ずるポリペプチドの変異体もしくは設計操作された種類であってもよい。親ポリペプチドは、野生型タンパク質または変異体、または親ポリペプチドを含む組成物を指してもよい。] [0087] 残基の相関付けおよび相関残基のネットワークの決定は、どの残基およびその運動がリガンド結合に最も重要かを明らかにする。これらの残基の修正は、エナンチオ選択性、基質特異性、酵素活性およびメカニズム、ならびに生成物プロファイルを変化させるのに使用してもよい。ポリペプチドの機能の修正は、変化したポリペプチドの安定性を引き起こす可能性がある。このように本発明は、ポリペプチドの安定性を変化させる方法も提供する。一実施形態では、熱安定性またはpH安定性は、ポリペプチドの配列を修正することによって変化する。一実施形態では、アロステリックネットワークの特定によって、選択されるリガンドと相互に作用することができるタンパク質変異体の設計が可能になる。] [0088] 設計したら、タンパク質は、公知の方法で容易に製造することができる。例えば、宿主細胞への外因性核酸を使用したタンパク質発現方法は、当技術分野で周知であり、使用される宿主細胞に応じて変わることになる。外因性核酸の導入技法には、デキストラン媒介性トランスフェクション、リン酸カルシウム沈殿、塩化カルシウム処理、ポリブレン媒介性トランスフェクション、プロトプラスト融合、エレクトロポレーション、ウイルスまたはファージ感染、リポソーム内への(1種または複数の)ポリヌクレオチドの被包化、および核へのDNAの直接的マイクロインジェクションが含まれるが、これらに限定するものではない。哺乳動物細胞の場合、トランスフェクションは、一時的でも安定していてもよい。] [0089] 一実施形態では、タンパク質を、発現後に精製しまたは単離する。タンパク質は、当業者に公知の様々な方法で単離しまたは精製してもよい。標準的な精製方法には、FPLCやHPLCなどのシステムを使用して大気圧または高圧で実施される、イオン交換、疎水性相互作用、親和性、サイジングまたはゲル濾過、および逆相を含むクロマトグラフィ技法が含まれる。精製方法には、電気泳動、免疫、沈殿、透析、およびクロマト分画技法も含まれる。タンパク質濃縮法と併せた限外濾過およびダイアフィルトレーション技法も有用である。適切な精製技法の一般的指針に関しては、Protein Purification:Principles and Practice(3rd ed.,1994)を参照されたい。] [0090] 一実施形態では、本発明の分子の機能的および/または生物物理学的性質を、in vitroアッセイでスクリーニングする。in vitroアッセイは、問題の性質をスクリーニングするための広範なダイナミックレンジを可能にすることができる。スクリーニングすることができる分子の性質には、安定性および溶解度が含まれるが、これらに限定するものではない。さらに、ポリペプチドを、リガンドに対する親和性、酵素活性、または生物活性に関してin vitroでスクリーニングしてもよい。多数の性質を、同時にまたは個々にスクリーニングすることができる。分子は、アッセイの要件に応じて精製しても精製しなくてもよい。結合アッセイは、FRET(蛍光共鳴エネルギー伝達)およびBRET(生物ルミネセンス共鳴エネルギー伝達)ベースのアッセイ、AlphaScreen(商標)(増幅ルミネセンスプロキシミティホモジニアスアッセイ)、シンチレーションプロキシミティアッセイ、ELISA(酵素結合免疫吸着アッセイ)、SPR(BIACORE(登録商標)としても公知の表面プラスモン共鳴)、等温滴定熱量測定、示差走査熱力測定、ゲル電気泳動、およびゲル濾過を含むクロマトグラフィを含むがこれらに限定するものではない、当技術分野で公知の様々な方法を使用して実施することができる。アッセイは、色素産生、蛍光、ルミネセンス、または同位体性標識を含むがこれらに限定されない様々な検出法を用いてもよい。] [0091] タンパク質の安定性は、折畳み状態と非折畳み状態との間の熱力学的平衡を測定することによって、決定してもよい。例えば、本発明を使用して設計され引き続き設計操作されたポリペプチドは、化学変性、熱、またはpHを使用して折り畳まなくてもよく、この変化は、円偏光二色性分光法、蛍光分光法、吸光分光法、NMR分光法、熱量測定、およびタンパク質分解を含むがこれらに限定されない方法を使用してモニタしてもよい。当業者に理解されるように、ポリペプチドの折畳みおよび非折畳み遷移の動力学的パラメータは、これらおよびその他の技法を使用してモニタしてもよい。分子の溶解度および全体的な構造の完全性は、当技術分野で公知の広範にわたる方法を使用して、定量的にまたは定性的に決定してもよい。生物物理学的性質を特徴付けるために本発明での用途を見出すことができる方法には、ゲル電気泳動、サイズ排除クロマトグラフィや逆相高性能液体クロマトグラフィなどのクロマトグラフィ、質量分光法、紫外線吸光分光法、蛍光分光法、円偏光二色性分光法、等温滴定熱量測定、示差走査熱量測定、分析用超遠心分離、動的光散乱、タンパク質分解、および架橋、濁度測定、フィルタ遅延アッセイ、免疫アッセイ、蛍光色素結合アッセイ、タンパク質染色アッセイ、顕微鏡法、およびELISAまたはその他の結合アッセイを介した凝集体の検出が含まれる。X線結晶構造解析技法およびNMR分光法を用いる構造分析も、用途を見出すことができる。一実施形態では、安定性および/または溶解度は、定義されたある一定期間後に、標準状態でまたは極限状態で、溶液中の分子の量を決定することにより測定してもよい。] [0092] 好ましい実施形態では、分子活性は、細胞ベースのまたはin vivoアッセイを使用して決定する。そのようなアッセイでは、分子が成長培地に典型的には添加されて、細胞を分子に曝す。分子に対する細胞の応答は、例えば細胞生存、細胞死、細胞形態の変化、または転写的変化、および天然の遺伝子またはレポーター遺伝子の発現に対するこれらの作用である。細胞死または生存度をモニタする方法は、当技術分野で周知であり、色素、免疫化学的、細胞化学的、および放射性試薬の使用を含む。そのようなアッセイの細胞型は、原核性または真核性であってもよく、当技術分野で公知の様々な細胞系を用いてもよい。] [0093] あるいは、細胞ベースのスクリーニングを、本発明のポリペプチドをコードする核酸で形質転換されまたはトランスフェクトされた細胞を使用して行う。] [0094] 本発明の分子の生物学的性質は、細胞、組織、および生物そのものの実験で特徴付けることができる。当技術分野で公知のように、薬物は、疾患または疾患モデルに対する治療での薬物の効力を測定するために、または薬物の薬物動態、毒性、およびその他の性質を測定するために、マウス、ラット、ウサギ、イヌ、ネコ、ブタ、およびサルを含むがこれらに限定されない動物でしばしば試験される。] [0095] したがって本明細書に記述される方法は、問題の任意のバイオポリマーまたは生体分子に適用することができまたは役立てることができる。一実施形態では、バイオポリマーは、上記にて定義されたタンパク質またはポリペプチドである。特定用途のタンパク質には、酵素、抗体(例えば、抗フルオレセイン)、オキシダーゼ、ヒドロラーゼ、リパーゼ、アルドラーゼ、およびペプチド類似体が含まれる。一実施形態では、オキシダーゼがコレステロールオキシダーゼである。一実施形態では、バイオポリマーが糖(多糖を含む。)、核酸、および核酸−糖結合体(例えば、UDP−ガラクトピラノース)である。別の実施形態では、生体分子は、治療用小分子を含んでいてもよい。一実施形態では、生体分子は、例えば、上述の分子と本明細書に記述されるその他の分子との複合体を含む。複合体の例には、抗体−糖、抗体−ペプチド、および抗体−ペプチド類似体の複合体が含まれる。これら分子のいずれかを、設計操作してもよい。] [0096] 記述される方法およびプロセスは、少なくとも1つのプロセッサおよび少なくとも1つのデータ記憶システムを含むプログラマブルコンピュータで実行される、コンピュータプログラムとして実現してもよい。コンピュータプログラムは、ある活動を行うためにまたはある結果をもたらすために、コンピュータで直接または間接的に使用することができる一組の命令である。コンピュータプログラムは、コンパイルされまたは翻訳された言語を含めたプログラミング言語の任意の形で書くことができ、スタンドアロンプログラムとして、またはモジュール、コンポーネント、サブルーチン、関数、プロシージャ、もしくはコンピュータ環境での使用に適したその他のユニットとして含めた、任意の形で導入することができる。] [0097] コンピュータプログラムは、コンピュータ可読記憶媒体またはデバイスに記憶させることができる。記憶媒体の例には、CD、DVD、およびブルーレイディスク(BD)などの光ディスク;光磁気ディスク;磁気テープおよび内蔵ハードディスクおよびリムーバブルディスクなどの磁気媒体;EPROM、EEPROM、およびフラッシュメモリなどの半導体メモリデバイス;およびRAMが含まれるが、これらに限定するものではない。プロセッサおよびメモリは、特定用途向け集積回路(ASIC)によって補完されまたはこの回路に組み込むことができる。コンピュータのプロセッサに読み込み、実行しまたはさらに処理した後に実行する場合、プログラムの命令によって、プログラマブルコンピュータは上述の様々な演算を実行する。] [0098] ユーザとの相互作用をもたらすために、本発明は、ユーザに情報を表示する目的で、例えば陰極線管(CRT)や液晶ディスプレイ(LCD)モニタなどのディスプレイデバイスを有するコンピュータで実施することができる。ユーザは、例えばキーボード、およびマウスなどのポインティングデバイスを介して、入力を行うことができる。残基相関およびネットワークデータは、分子モデリングおよびグラフィックソフトウェアを使用して、グラフィック表示することができる。] [0099] 本発明の異なる態様は、データサーバなどのバックエンドコンポーネント、アプリケーションサーバやインターネットサーバなどのミドルウェアコンポーネント、またはユーザインターフェース、インターネットブラウザ、もしくはこれらの組合せを有するクライアントコンピュータなどのフロントエンドコンポーネントを含む、コンピュータシステムで実現することができる。] [0100] システムのコンポーネントは、任意の形または媒体のデジタルデータ通信によって接続することができる。] [0101] したがって、様々な実施形態では、本発明は、個々のコンポーネント構造単位の動的挙動(dynamic behavior)に基づきバイオポリマープロファイルを決定する方法であって、平面もしくは二面角メトリックまたは距離メトリックを含む複数の幾何学的メトリックに対して少なくとも1つの軌道を計算するシミュレーションを行う工程、構造単位のそれぞれに関する幾何学的メトリックのサブセットまたは複数の幾何学的メトリックに基づいて、クラスタに対して少なくとも1つの配座頻度を決定する工程、および配座頻度および移動度に基づいて、全ての構造単位に移動度指数を割り当てる工程を含む方法を提供する。] [0102] 様々な実施形態において、本発明は、個々の残基の動的挙動に基づきポリペプチドプロファイルを決定する方法であって、平面もしくは二面角メトリックまたは距離メトリックを含む複数の残基メトリックに対して少なくとも1つの軌道を計算するシミュレーションを行う工程、残基のそれぞれに関する残基メトリックのサブセットまたは複数の残基メトリックに基づいて、クラスタに対して少なくとも1つの配座頻度を決定する工程、および配座頻度および移動度に基づいて、全ての残基に移動度指数を割り当てる工程を含む方法を提供する。] [0103] 様々な実施形態において、本発明は、ポリペプチドの残基同士の相関を決定する方法であって、平面もしくは二面角メトリックまたは距離メトリックを含む複数の残基メトリックに対して少なくとも1つの軌道を計算するシミュレーションを行う工程、残基のそれぞれに関する残基メトリックのサブセットまたは複数の残基メトリックに基づいて、クラスタに対して少なくとも1つの配座頻度を決定する工程、および残基クラスタの配座頻度を相関させ、それによってポリペプチドの残基同士の相関を決定する工程を含む方法を提供する。] [0104] 様々な実施形態において、本発明は、ポリペプチドの残基同士の相関を決定する方法であって、平面もしくは二面角メトリックまたは距離メトリックを含む複数の残基メトリックに対して少なくとも1つの軌道を計算するシミュレーションを行う工程、残基のそれぞれに関する残基メトリックのサブセットまたは複数の残基メトリックに基づいて、クラスタに対して少なくとも1つの配座頻度を決定する工程、およびクラスタの配座頻度を相関させ、但し残基配座の少なくとも1つが残基のオフ−ロータマー配座に対応するものであり、それによってポリペプチドの残基同士の相関を決定する工程を含む方法を提供する。] [0105] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、残基配座の少なくとも2つが独立して、残基のロータマーまたはオフ−ロータマー配座に対応する方法を提供する。] [0106] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、決定される場合には、相関の少なくとも1つが、残基の交互配座状態同士のものである方法を提供する。] [0107] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、複数の残基メトリックが、二面角、位置ベクトル、および平面角メトリックもしくは距離メトリックからなる群から選択される残基メトリックを含んでいる方法を提供する。] [0108] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、平面角メトリックが残基の第1および第2の平面を使用して計算され、第1の平面が、残基の主鎖原子を含む第1の組の原子によって定義され、第2の平面が、残基の主鎖原子および末端原子からなる群から選択される原子を含む第2の組の原子によって定義されている方法を提供する。] [0109] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、第1の組の原子が(Cα、C°、N)および(Cα、C°、O)からなる群から選択される方法を提供する。] [0110] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、決定する工程が、多次元クラスタ化法を使用する工程を含む方法を提供する。] [0111] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、決定する工程が、自動区分プログラムを実行する工程を含む方法を提供する。] [0112] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、存在する場合には、相関させる工程が、クラスタ頻度分析を行う工程を含む方法を提供する。] [0113] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、クラスタ頻度分析が、複数の軌道フレームを使用して第1の残基の第1の配座に関する頻度を計算する工程、複数の軌道フレームを使用して第2の残基の第2の配座に関する頻度を計算する工程、軌道フレームのサブセットを使用して第2の配座に関する頻度を計算する工程、および第1の配座および第2の配座の配座頻度が統計的依存性を示すか否かを決定する工程を含む方法を提供する。] [0114] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、冗長データ(redundant data)をフィルタリングする工程をさらに含む方法を提供する。] [0115] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、ポリペプチドが、構造タンパク質、抗体、酵素、およびシグナル伝達タンパク質からなる群から選択される方法を提供する。] [0116] 様々な実施形態において、本発明は、ポリペプチドの相関残基のネットワークを決定する方法であって、前述の段落のいずれかによる方法を行うことによりポリペプチドプロファイルまたはポリペプチドの相関残基を決定する工程、および空間または距離の制約を使用することにより相関残基のネットワークをマッピングし、それによってポリペプチドの相関残基のネットワークを決定し、またはグラフ理論分析および/またはクラスタ化ツールを使用することにより相関残基のネットワークをマッピングする工程を含む方法を提供する。] [0117] 様々な実施形態において、本発明は、ポリペプチドの残基および残基ネットワーク間の相関をポリペプチドの機能的メカニズムに関係付ける方法であって、(a)前述の段落のいずれかによる方法を行うことによって、ポリペプチドの相関残基を決定する工程、(b)空間または距離の制約を使用することによって、相関残基のネットワークをマッピングする工程、または(c)グラフ理論分析および/またはクラスタ化ツールを使用することによって、相関残基のネットワークをマッピングする工程、(d)ポリペプチド内のドメインの運動に起因する相関ネットワークを特定するために、弾性ネットワークモデルの動的相互相関法または通常モード分析を行う工程、(e)工程(b、c)で明らかにされたが工程(d)には含まれない相関残基のネットワークを特徴付ける工程、および(f)工程(d)および(e)のネットワークを機能的メカニズムに関する実験データと比較し、それによって、ポリペプチドの残基同士の相関をポリペプチドの機能的メカニズムに関係付ける工程を含む方法を提供する。] [0118] 様々な実施形態において、本発明は、ポリペプチドの相関残基のネットワークを決定する方法であって、前述の段落のいずれかによる方法を行うことにより、ポリペプチドの残基プロファイルまたは相関残基を決定する工程、および空間または距離の制約を使用することにより、相関残基のネットワークをマッピングし、それによってポリペプチドの相関残基のネットワークを決定する工程、またはグラフ理論分析および/またはクラスタ化ツールを使用することにより相関残基のネットワークをマッピングする工程を含む方法を提供する。] [0119] 様々な実施形態において、本発明は、ポリペプチドの残基および残基ネットワーク間の相関をポリペプチドの機能的メカニズムに関係付ける方法であって、(a)前述の段落のいずれかによる方法を行うことによって、ポリペプチドの相関残基を決定する工程、(b)空間または距離の制約を使用することによって、相関残基のネットワークをマッピングする工程、または(c)グラフ理論分析およびクラスタ化ツールを使用することによって、相関残基のネットワークをマッピングする工程、および(d)ポリペプチド内のドメインの運動に起因する相関ネットワークを特定するために、弾性ネットワークモデルの動的相互相関法または通常モード分析を行う工程、(e)工程(b、c)で明らかにされたが工程(d)には含まれない相関残基のネットワークを特徴付ける工程、および(f)工程(d)および(e)のネットワークを機能的メカニズムに関する実験データと比較し、それによって、ポリペプチドの残基間の相関をポリペプチドの機能的メカニズムに関連付ける工程を含む方法を提供する。] [0120] 様々な実施形態において、本発明は、ポリペプチド変異体を設計操作する方法であって、任意の前述の段落による方法を行うことにより、第1のポリペプチドの残基同士の相関を決定する工程、第1のポリペプチドの残基同士の相関に基づき、第1のポリペプチドの変異残基位置を選択する工程、および第1のポリペプチドの変異位置に変異を含む第1のポリペプチドの配列を含むポリペプチド変異体を作製し、それによってポリペプチド変異体を設計操作する工程を含む方法を提供する。] [0121] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、ポリペプチド変異体を翻訳後修飾する工程をさらに含む方法を提供する。] [0122] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、ポリペプチド変異体が非天然アミノ酸を含む方法を提供する。] [0123] 様々な実施形態において、本発明は、任意の前述の段落による方法であって、ポリペプチド変異体が、親ポリペプチドに比べて変化した性質を有し、その性質は、エナンチオ選択性、基質特異性、酵素活性、熱安定性、pH安定性、酵素メカニズム、および生成物プロファイルからなる群から選択されるものである方法を提供する。] [0124] 様々な実施形態において、本発明は、ポリペプチド変異体をコードする核酸を設計操作する方法であって、任意の前述の段落による方法を行うことにより、ポリペプチドプロファイルまたは第1のポリペプチドの残基同士の相関を決定する工程、第1のポリペプチドの残基同士の相関に基づき、第1のポリペプチドの変異残基位置を選択する工程、および第1のポリペプチドの変異位置に変異を含む第1のポリペプチドの配列を含むポリペプチド変異体をコードする核酸を合成し、それによってポリペプチド変異体をコードする核酸を設計操作する工程を含む方法を提供する。] [0125] 様々な実施形態において、本発明は、ポリペプチドリガンドを設計操作する方法であって、任意の前述の段落による方法を行うことにより、ポリペプチドプロファイルまたはポリペプチドの残基同士の相関を決定する工程、空間または距離の制約を使用して、相関残基のネットワークをマッピングする工程、ネットワークに基づきアロステリック部位を特定する工程、アロステリック部位に結合する分子を設計する工程、および分子を合成し、それによってポリペプチドリガンドを設計操作する工程を含む方法を提供する。] [0126] 様々な実施形態において、本発明は、ポリペプチドリガンドを設計操作する方法であって、任意の前述の段落による方法を行うことにより、ポリペプチドの残基同士の相関を決定する工程、空間または距離の制約を使用して、相関残基のネットワークをマッピングする工程、およびリガンドを合成し、酵素に対する結合または活性が維持されるように柔軟な構築物が設計操作され、それによってポリペプチドリガンドを設計操作する工程を含む方法を提供する。] [0127] 様々な実施形態において、本発明は、ポリペプチドの機能をアロステリックに調節する方法であって、任意の前述の段落による方法を行うことにより、ポリペプチドプロファイルまたはポリペプチドの残基同士の相関を決定する工程、相関に基づきアロステリック部位を特定する工程、アロステリック部位に結合するリガンドを設計する工程、リガンドを合成する工程、およびリガンドにポリペプチドを接触させ、それによってポリペプチドの機能を調節する工程を含む方法を提供する。] [0128] 様々な実施形態において、本発明は、リガンドとポリペプチドとのコンピュータによるドッキングを改善する方法であって、任意の前述の段落による方法を行うことにより、ポリペプチドプロファイルまたはポリペプチドの残基同士の相関を決定する工程、相関を使用して柔軟な残基を特定する工程、およびポリペプチドのコンピュータによるドッキングで、入力として柔軟な残基を使用し、それによって、リガンドとポリペプチドとのコンピュータによるドッキングを改善する工程を含む方法を提供する。] [0129] 様々な実施形態において、本発明は、ポリペプチドに配座状態をインプリントする方法であって、任意の前述の段落による方法を行うことにより、ポリペプチドプロファイル、配座状態、またはポリペプチドの残基同士の相関を決定する工程、相関および/またはタンパク質プロファイルを使用して、柔軟なフレームワーク残基を特定する工程、配座のシフト分布を有するポリペプチド変異体を設計するために、入力として配座状態を使用し、それによって、機能性が変化したポリペプチドに配座状態をインプリントする工程を含む方法を提供する。] [0130] 様々な実施形態において、本発明は、バイオポリマーもしくはポリペプチドのプロファイルまたはポリペプチドの残基同士の相関を決定するための、または、ポリペプチドの残基および残基ネットワーク間の相関をポリペプチドの機能的メカニズムに関係付けるためのシステムであって、データ記憶デバイスと、メモリと、バイオポリマーもしくはポリペプチドのプロファイルまたはポリペプチドの残基同士の相関を決定し、または、ポリペプチドの残基および残基ネットワーク間の相関をポリペプチドの機能的メカニズムに関係付ける、任意の前述の段落による方法を含む方法を行うための命令を含むプロセッサとを含むシステムを提供する。] [0131] 様々な実施形態において、本発明は、バイオポリマーもしくはポリペプチドのプロファイルまたはポリペプチドの残基同士の相関を決定し、または、ポリペプチドの残基および残基ネットワーク間の相関をポリペプチドの機能的メカニズムに関係付ける、任意の前述の段落による方法を含む方法を行うためのコンピュータ実行可能命令を含む、コンピュータ可読媒体を提供する。] [0132] 様々な実施形態において、本発明は、任意の前述の段落による方法によって生成された、ポリペプチド変異体を提供する。] [0133] 様々な実施形態において、本発明は、任意の前述の段落のポリペプチドをコードする核酸を提供する。] [0134] 様々な実施形態において、本発明は、任意の前述の段落の核酸を含む発現ベクターを提供する。] [0135] 様々な実施形態において、本発明は、任意の前述の段落の核酸を含む宿主細胞を提供する。] [0136] 様々な実施形態において、本発明は、任意の前述の段落の発現ベクターを含む宿主細胞を提供する。] [0137] 様々な実施形態において、本発明は、残基の第1の組の原子によって定義された第1の平面と、第2の組の原子によって定義された第2の平面との間の角度を測定する工程を含む、残基から得られた平面角メトリックを測定するとして幾何学的メトリックを定義する方法を提供する。] [0138] 様々な実施形態において、本発明は、1つまたは2つの平面を一組の原子に当てはめる工程を含む、平面角を定義する方法を提供する。] [0139] 様々な実施形態において、本発明は、同じまたは異なる残基に属する任意の2個の原子同士の距離を測定する工程を含む、幾何学的メトリックを定義する方法を提供する。] [0140] 様々な実施形態において、本発明は、モンテカルロサンプリング技法を用いた計算法または実験的方法から得られた構造データスナップショットを使用する工程をさらに含む、任意の前述の段落による方法を提供する。] [0141] 様々な実施形態において、本発明は、実験的方法がNMR分光法またはX線結晶構造解析からなる群から選択される、任意の前述の段落による方法を提供する。] [0142] 本明細書で引用された全ての参考文献、刊行物、特許出願、発行特許、受入れ簿、データベース、およびデータファイルは、全ての目的でその全体が参照により明らかに組み込まれ、かつ個々の刊行物または参考文献のそれぞれが参照により組み込まれることが具体的にかつ個別に示されるかのような程度まで組み込まれる。本明細書で示される冠詞「a」、「an」、および「the」は、他に文脈に明示されない限り、「少なくとも1つ」を意味する。接続詞「または」、「もしくは」は、他に文脈に明示されない限り、互いを排除するものではない。] [0143] 10nsの分子動的シミュレーションを、フサリウムソラニ(Fusarium solani pis)からのクチナーゼで実施した。出発構造を、高分解結晶構造(pdb code: 1CEX.pdb)から得た。この酵素で利用可能な飽和変異誘発データ(Brissos et.al., 2008; PEDS, 21(6):387)は、上述の方法およびアプリケーションによって提供されたデータを強調する良好な例となった。] [0144] クチナーゼ中の各残基は、このキラルバイオポリマーの三次元構造で独自の環境にある。この環境は、残基に利用可能な可能性ある配座空間を定義する。図4のパネルA〜Dのカラムスタックヒストグラムプロットは、全ての残基に関するクラスタ化分析の結果を示す。残基に関する残基配座の数は、その残基に関して様々に着色されたセクションの数によって示される。各残基配座のそれぞれの集団は、カラムの高さによって示される。これらのプロットから、どの残基が個別の交互残基配座を有するのか迅速に特定することができる。この情報は、当業者にとって非常に有用である。例えば、174〜184の間の残基の多くは、残基当たり、平均してより多くの個別の配座を示す。これらの残基は、活性部位のエッジを形成するループ上にあり、これは、図4のパネルEのクチナーゼを絵で示した触媒アスパラギン酸(残基175)を含むものである(残基174〜184はマゼンタで着色され、3個の触媒残基全てはスティックで示される。)。この分析の結果は、その領域内の残基が必ずしも当初から柔軟である必要はなく、おそらくは結合および触媒作用に重要な、好ましい配座サブ状態を示すことを明らかにする。さらに、カラムスタックプロットは、軌道全体を通して好ましい配座を全く示さない残基を特定する。これらの残基は、通常は溶媒に接触可能であるが、移動性残基が埋め込まれた場合には、しばしば重要な動的位置になる。] 図4 [0145] 各残基配座ごとの代表的な構造が、利用可能であり、タンパク質の配座可塑性を迅速に視覚化するために、鋳型主鎖の軌跡上に重ねることができる。このデータの例示を、図5に示す。パネルAは、クチナーゼのリボンを絵で表したものであり、触媒三連構造の側鎖がマゼンタスティックで示されている。パネルBには、パネルAに示される構造に重ねられたクチナーゼに関して特定された代表的な残基配座が示されている。第1の特定された残基配座は、青で着色され、次いで緑、黄、橙、および赤で着色されている。予測されるように、このヒドロラーゼの場合、パネルBの図は、このタンパク質のコアの残基の大部分が単一配座にあることを示している。この図は、この方法によって定義された交互残基配座を有する残基も示す。表面のおよび活性部位キャビティを取り囲む高い可塑性は、容易に視覚化することができ、したがって、価値ある構造情報を当業者に提供する。] [0146] その定義された配座内の残基の位置分散の測定値と、残基がこれらの配座のいずれかにあるフレームの総数とに基づいて、プロファイル記述子を割り当てることができる。図6のパネルAに示すように、このデータを構造上にマッピングして、分子の残基プロファイルに関する記述全体の簡単な要約を提供することができる。クチナーゼの各CA原子は、位置的に強固な部分(青)から配座的に多様な部分(赤)に及ぶ4区分のみ使用してプロファイリング法により着色される。この情報により、その定義された配座異性体の位置で限られた移動度を有する、交互配座を持つ残基を容易に特定することができる。] [0147] 残基プロファイリング情報をどのように使用するかという1つの具体的な例は、大きな側鎖を有する極性残基に焦点が当たるよう選択する工程を使用することによって、示すことができる(アミノ酸タイプ:N、Q、D、E、R、およびK)。一般に、これらのアミノ酸タイプは、表面が露出しており、完全に移動性であり、したがって変異に対して耐性がある。本発明者らが、位置的により強固になるようにプロファイリングされ(パネルAに示されるように青および緑)かつ交互配座で観察される、これらの残基のサブセットを選択するのに自らのプロファイリング方法を使用する場合、本発明者らは、パネルBのシアン染色スティックとして示されるように、以下の残基、即ち、R20、D21、E44、Q71、N152、およびR208を得る。これらの自動的にフィルタリングされた残基の7個全ては、溶媒と接触可能であり、酵素の表面全体にわたって分布する。7個の残基のうち3個は、活性部位に非常に近接していることに留意されたい。パネルCの表面の表示は、パネルBの場合と同一の向きにあるタンパク質を示す。複数の定義された残基配座を有するこれらの残基にも関わらず、これらの残基は、プロファイリング法によって、その配座内で位置的に強固であり、したがって、より関心が持たれ易くなることが明らかにされる。飽和変異誘発(Brissos et.al., 2008; PEDS, 21(6):387)データは、7個の残基のうち5個が、変異に対して非常に耐性がないことを示す(残基当たりをベースにした変異体の耐性は、同等の野生型またはより大きな活性を有する19個のアミノ酸クローンのパーセンテージとして測定した。)。さらに、7個の残基(R20、D21、E44、Q71、N152、およびR208)全ての平均変異体耐性は35%であり、タンパク質に関する全耐性平均(45%)よりも低い。これは、埋め込まれた残基の割合およびそれらの変異に対する固有の感受性を考慮すると有意である。さらに、大きな極性残基タイプ(N、Q、D、E、R、およびK)の全てに関する平均変異体耐性は、それらの静電表面特性の公知である重要性にも関わらず、49%である。まとめると、これらの結果は、プロファイリングデータを使用して、酵素機能にとってより重要となり得る離れた残基を自動的に特定できることを示している。] [0148] タンパク質プロファイルの一部として、各残基の移動度を前述のように決定し、全ての残基の溶媒接触表面領域(SASA)に相関させる。図7のパネルAでは、各ドットが、クチナーゼの特定の残基に関するSASAおよび移動度を示す。黒で描かれるデータポイントは、野生型残基を置換するのに実験的に使用されてきた19個のアミノ酸のうち、60%以上が完全酵素活性を有することが示される(Brissos et.al., 2008; PEDS, 21(6):387)。緑で示されるポイントは、この位置で、変異体の35〜60%が完全活性であることを示し、赤で示されるポイントは、活性変異体が0〜35%であることを示す。カットオフ値は、ほぼ等量の残基が各グループ内に包含されるように選択した。それぞれの色の四角形は、3つのデータ集合に関する平均位置を示す。上方および左の誤差棒は標準偏差を示すが、下方および右の誤差棒は、標準誤差を示す。青のトレンドラインは、全てのデータポイントに関する線形回帰分析を基にし、SASAと移動度との間の相関係数は0.54であり、これは、中程度の正相関と見なすことができる。パネルBは、合わせた全てのデータポイントの平均SASAおよび移動度の値に基づいて、4つの象限に分割された同じ範囲のデータを示す。各象限には、EXP(露出され、平均表面積よりも大きい)、BUR(埋め込まれ、平均表面積よりも低い)、RIG(強固、平均移動度よりも低い)、およびMOB(移動性、平均移動度よりも大きい)として示される、SASAおよび移動度に基づいた状態を割り当てることができる。着色された(上記のスキーム)数は、4つの象限のそれぞれで見出されたデータポイントのパーセンテージを示す。] 図7 [0149] 図7に示されるデータは、予測される通り、酵素クチナーゼの各残基のSASAと移動度との間に明らかな相関が確立できたことを示す。このデータ集合を、アミノ酸ベースでさらに分解し(データは図示せず)、それによって、異なるタイプのアミノ酸では異なる挙動となることが明らかに示された。このことは、タンパク質中の特定の位置で変異体を設計する場合に、明らかに考慮しなければならない。さらに、変異の影響をより受け易い残基がプロットの左下の象限(BUR/RIG)に位置付けられており、一方、より容易に変異に耐え得る残基が右上の象限(EXP/MOB)に位置付けられているという、非常に明らかな証拠が示される。図示される例では、変異の35%未満が活性である残基の45%がBUR/RIG象限内に位置付けられ、一方、変異の60%超が活性である残基の21%のみが、この領域に見出される。これとは対照的に、EXP/MOB象限は、耐性残基41%と、影響を受け易い残基の21%のみを含む。残基をプロットすることにより、図7に示される方法は、理に適ったタンパク質の設計操作の決定を明らかに可能にし、タンパク質中の領域および残基を特定するのを助け、潜在的により感受性のあるものからの変異に対してより耐性を有するようになる。最後に、残基の位置的移動度は、構造内の残基が利用可能な空間に関する洞察も提供する。より多くの位置分散が残基に観察されるほど、位置は、より大きな側鎖に適合し易くなる。] 図7 実施例 [0150] クチナーゼで観察される相関残基ネットワークを、グラフ化技法およびペアワイズ残基相関データの高い相互接続性という性質を使用して特定した。本発明者らが、距離カットオフ4.5Å(ファンデルワールス距離内)でこのグラフをフィルタした場合、本発明者らは、図8のパネルBに示されるグラフを得る。各ノード(円)は残基配座を表し、各エッジは、2つのノード間の有意なペアワイズ相関を表す。残基は、図示されるようにネットワークに関与する複数の交互配座を有していてもよい。この定義されたスルースペースネットワークを残基レベルにまで低下させた場合、パネルBに示されるように、CA原子間の結合を生成することによって、このネットワークを構造上にマッピングすることができる。これらのネットワークは、この酵素の結合および/または活性に影響を及ぼし易い活性部位から離れた残基を特定するのに使用することができる。パネルAのノードは、それらの変異感受性に応じて着色されており、黄色に着色されたノードは、(Brissos et.al., 2008; PEDS, 21(6):387)に示される飽和変異誘発データから決定されるように、変異に対して非常に感受性がある。これらの感受性のある残基の7個全ては、その位置では変異体の70%に関して活性がないことを示す。パネルCでは、これらの残基が互いにどのように接触するかを知ることができる。位置的に感受性のある残基(黄色に着色)は、側鎖の相互作用を通して主に相互に作用するが、ピンクに着色されたものは、主鎖の相互作用を通して相互に作用する。その後者は、ある範囲の種々の側鎖に適合した空間がタンパク質内にあるならば、変異誘発に対して比較的感受性は高くないと考えられる。感受性のある残基(黄色)の活性クローンの平均パーセンテージは24%であり、それに対して位置的に耐性ある残基の平均は65%である。この例は、活性部位残基を含む動的相関残基ネットワークを特定することによって、離れた残基のアロステリック効果に関する洞察を得ることができることを示す。]
权利要求:
請求項1 個々のコンポーネント構造単位の動的挙動に基づきバイオポリマープロファイルを決定する方法であって、a)平面もしくは二面角メトリックまたは距離メトリックを含む複数の幾何学的メトリックに対して少なくとも1つの軌道を計算するシミュレーションを行う工程、b)構造単位のそれぞれに関する幾何学的メトリックのサブセットまたは複数の幾何学的メトリックに基づいて、クラスタに対して少なくとも1つの配座頻度を決定する工程、およびc)配座頻度および移動度に基づいて、全ての構造単位に移動度指数を割り当てる工程を含む方法。 請求項2 個々の残基の動的挙動に基づきポリペプチドプロファイルを決定する方法であって、a)平面もしくは二面角メトリックまたは距離メトリックを含む複数の残基メトリックに対して少なくとも1つの軌道を計算するシミュレーションを行う工程、b)残基のそれぞれに関する残基メトリックのサブセットまたは複数の残基メトリックに基づいて、クラスタに対して少なくとも1つの配座頻度を決定する工程、およびc)配座頻度および移動度に基づいて、全ての残基に移動度指数を割り当てる工程を含む方法。 請求項3 ポリペプチドの残基同士の相関を決定する方法であって、a)平面もしくは二面角メトリックまたは距離メトリックを含む複数の残基メトリックに対して少なくとも1つの軌道を計算するシミュレーションを行う工程、b)残基のそれぞれに関する残基メトリックのサブセットまたは複数の残基メトリックに基づいて、クラスタに対して少なくとも1つの配座頻度を決定する工程、およびc)残基クラスタの配座頻度を相関させ、それによってポリペプチドの残基同士の相関を決定する工程を含む方法。 請求項4 ポリペプチドの残基同士の相関を決定する方法であって、a)平面もしくは二面角メトリックまたは距離メトリックを含む複数の残基メトリックに対して少なくとも1つの軌道を計算するシミュレーションを行う工程、b)残基のそれぞれに関する残基メトリックのサブセットまたは複数の残基メトリックに基づいて、クラスタに対して少なくとも1つの配座頻度を決定する工程、およびc)クラスタの配座頻度を相関させ、ここで残基配座の少なくとも1つが残基のオフ−ロータマー配座に対応するものであり、それによってポリペプチドの残基同士の相関を決定する工程を含む方法。 請求項5 残基配座の少なくとも2つが独立して、残基のロータマーまたはオフ−ロータマー配座に対応する、請求項2〜4のいずれかに1項記載の方法。 請求項6 決定される場合には、相関の少なくとも1つが残基の交互配座状態同士のものである、請求項3〜5のいずれか1項に記載の方法。 請求項7 複数の残基メトリックが、二面角、位置ベクトル、および平面角メトリックもしくは距離メトリックからなる群から選択される残基メトリックを含む、請求項2〜6のいずれか1項に記載の方法。 請求項8 平面角メトリックが残基の第1および第2の平面を使用して計算され、第1の平面が、残基の主鎖原子を含む第1の組の原子によって定義され、第2の平面が、残基の主鎖原子および末端原子からなる群から選択される原子を含む第2の組の原子によって定義される、請求項7に記載の方法。 請求項9 第1の組の原子が(Cα、C°、N)および(Cα、C°、O)からなる群から選択される、請求項8に記載の方法。 請求項10 前記決定する工程が、多次元クラスタ化法を使用する工程を含む、請求項1〜9のいずれか1項に記載の方法。 請求項11 前記決定する工程が、自動区分プログラムを実行する工程を含む、請求項1〜9のいずれか1項に記載の方法。 請求項12 存在する場合には、前記相関させる工程が、クラスタ頻度分析を行う工程を含む、請求項3〜11のいずれか1項に記載の方法。 請求項13 クラスタ頻度分析が、a)複数の軌道フレームを使用して第1の残基の第1の配座に関する頻度を計算する工程、b)複数の軌道フレームを使用して第2の残基の第2の配座に関する頻度を計算する工程、c)軌道フレームのサブセットを使用して第2の配座に関する頻度を計算する工程、およびd)第1の配座および第2の配座の配座頻度が統計的依存性を示すか否かを決定する工程を含む、請求項12に記載の方法。 請求項14 冗長データをフィルタリングする工程をさらに含む、請求項13に記載の方法。 請求項15 ポリペプチドが、構造タンパク質、抗体、酵素、およびシグナル伝達タンパク質からなる群から選択される、請求項2〜14のいずれか1項に記載の方法。 請求項16 ポリペプチドの相関残基のネットワークを決定する方法であって、a)請求項2〜15のいずれか1項に記載の方法を行うことによりポリペプチドプロファイルまたはポリペプチドの相関残基を決定する工程、b)空間または距離の制約を使用することにより相関残基のネットワークをマッピングし、それによってポリペプチドの相関残基のネットワークを決定する工程、またはc)グラフ理論分析および/またはクラスタ化ツールを使用することにより相関残基のネットワークをマッピングする工程を含む方法。 請求項17 ポリペプチドの残基および残基ネットワーク間の相関をポリペプチドの機能的メカニズムに関係付ける方法であって、a)請求項3〜16のいずれか1項に記載の方法を行うことによって、ポリペプチドの相関残基を決定する工程、b)空間または距離の制約を使用することによって、相関残基のネットワークをマッピングする工程、またはc)グラフ理論分析および/またはクラスタ化ツールを使用することによって、相関残基のネットワークをマッピングする工程、およびd)ポリペプチド内のドメインの運動に起因する相関ネットワークを特定するために、弾性ネットワークモデルの動的相互相関法または通常モード分析を行う工程、e)工程(b、c)で明らかにされたが工程(d)には含まれない相関残基のネットワークを特徴付ける工程、およびf)工程(d)および(e)のネットワークを機能的メカニズムに関する実験データと比較し、それによって、ポリペプチドの残基同士の相関をポリペプチドの機能的メカニズムに関係付ける工程を含む方法。 請求項18 ポリペプチド変異体を設計操作する方法であって、a)請求項3〜16のいずれか1項に記載の方法を行うことにより、第1のポリペプチドの残基同士の相関を決定する工程、b)第1のポリペプチドの残基同士の相関に基づき、第1のポリペプチドの変異残基位置を選択する工程、およびc)第1のポリペプチドの変異位置に変異を含む第1のポリペプチドの配列を含むポリペプチド変異体を作製し、それによってポリペプチド変異体を設計操作する工程を含む方法。 請求項19 ポリペプチド変異体を翻訳後修飾する工程をさらに含む、請求項18に記載の方法。 請求項20 ポリペプチド変異体が非天然アミノ酸を含む、請求項18または19に記載の方法。 請求項21 ポリペプチド変異体が、親ポリペプチドに比べて変化した性質を有し、前記性質は、エナンチオ選択性、基質特異性、酵素活性、熱安定性、pH安定性、酵素メカニズム、および生成物プロファイルからなる群から選択される、請求項18〜20のいずれか1項に記載の方法。 請求項22 ポリペプチド変異体をコードする核酸を設計操作する方法であって、a)請求項2〜16のいずれか1項に記載の方法を行うことにより、ポリペプチドプロファイルまたは第1のポリペプチドの残基同士の相関を決定する工程、b)第1のポリペプチドの残基同士の相関に基づき、第1のポリペプチドの変異残基位置を選択する工程、およびc)第1のポリペプチドの変異位置に変異を含む第1のポリペプチドの配列を含むポリペプチド変異体をコードする核酸を合成し、それによってポリペプチド変異体をコードする核酸を設計操作する工程を含む方法。 請求項23 ポリペプチドリガンドを設計操作する方法であって、a)請求項2〜16のいずれか1項に記載の方法を行うことにより、ポリペプチドプロファイルまたはポリペプチドの残基同士の相関を決定する工程、b)空間または距離の制約を使用して、相関残基のネットワークをマッピングする工程、c)ネットワークに基づきアロステリック部位を特定する工程、d)アロステリック部位に結合する分子を設計する工程、およびe)分子を合成し、それによってポリペプチドリガンドを設計操作する工程を含む方法。 請求項24 ポリペプチドリガンドを設計操作する方法であって、a)請求項2〜16のいずれか1項に記載の方法を行うことにより、ポリペプチドの残基同士の相関を決定する工程、b)空間または距離の制約を使用して、相関残基のネットワークをマッピングする工程、およびc)リガンドを合成し、但し酵素に対する結合または活性が維持されるように柔軟な特徴が設計操作され、それによってポリペプチドリガンドを設計操作する工程を含む方法。 請求項25 ポリペプチドの機能をアロステリックに調節する方法であって、a)請求項2〜16のいずれか1項に記載の方法を行うことにより、ポリペプチドプロファイルまたはポリペプチドの残基同士の相関を決定する工程、b)相関に基づきアロステリック部位を特定する工程、c)アロステリック部位に結合するリガンドを設計する工程、d)リガンドを合成する工程、およびe)リガンドにポリペプチドを接触させ、それによってポリペプチドの機能を調節する工程を含む方法。 請求項26 リガンドからポリペプチドへのコンピュータによるドッキングを改善する方法であって、a)請求項2〜16のいずれか1項に記載の方法を行うことにより、ポリペプチドプロファイルまたはポリペプチドの残基同士の相関を決定する工程、b)相関を使用して柔軟な残基を特定する工程、およびc)ポリペプチドのコンピュータによるドッキングにおいて、入力として柔軟な残基を使用し、それによって、リガンドからポリペプチドへのコンピュータによるドッキングを改善する工程を含む方法。 請求項27 ポリペプチド上に配座状態をインプリントする方法であって、a)請求項2〜16のいずれか1項に記載の方法を行うことにより、ポリペプチドプロファイル、配座状態、またはポリペプチドの残基同士の相関を決定する工程、b)相関および/またはポリペプチドプロファイルを使用して、柔軟なフレームワーク残基を特定する工程、およびc)配座のシフト分布を有するポリペプチド変異体を設計するために、入力として配座状態を使用し、それによって、機能性が変化したポリペプチド上に配座状態をインプリントする工程を含む方法。 請求項28 バイオポリマーもしくはポリペプチドのプロファイルまたはポリペプチドの残基同士の相関を決定するための、または、ポリペプチドの残基および残基ネットワーク間の相関をポリペプチドの機能的メカニズムに関係付けるためのシステムであって、a)データ記憶デバイスと、b)メモリと、c)バイオポリマーもしくはポリペプチドのプロファイルまたはポリペプチドの残基同士の相関を決定するか、または、ポリペプチドの残基および残基ネットワーク間の相関をポリペプチドの機能的メカニズムに関係付ける方法であって、請求項1〜17のいずれか1項に記載の方法を含む方法を行うための命令を含むプロセッサとを含むシステム。 請求項29 バイオポリマーもしくはポリペプチドのプロファイルまたはポリペプチドの残基同士の相関を決定するか、または、ポリペプチドの残基および残基ネットワーク間の相関をポリペプチドの機能的メカニズムに関係付けるための方法であって、請求項1〜17のいずれか1項に記載の方法を含む方法を行うためのコンピュータ実行可能命令を含む、コンピュータ可読媒体。 請求項30 請求項18〜21のいずれか1項に記載の方法により生成された、ポリペプチド変異体。 請求項31 請求項30に記載のポリペプチドをコードする核酸。 請求項32 請求項31に記載の核酸を含む、発現ベクター。 請求項33 請求項31に記載の核酸を含む、宿主細胞。 請求項34 請求項32に記載の発現ベクターを含む、宿主細胞。 請求項35 残基の第1の組の原子によって定義された第1の平面と、第2の組の原子によって定義された第2の平面との間の角度を測定する工程を含む、残基から得られた平面角メトリックの測定として幾何学的メトリックを定義する方法。 請求項36 1つまたは2つの平面を一組の原子に当てはめる工程を含む、平面角を定義する方法。 請求項37 同じまたは異なる残基に属する任意の2個の原子同士の距離を測定する工程を含む、幾何学的メトリックを定義する方法。 請求項38 モンテカルロサンプリング技法を用いた計算法または実験的方法から得られた構造データスナップショットを使用する工程をさらに含む、請求項1〜17のいずれか1項に記載の方法。 請求項39 実験的方法が、NMR分光法またはX線結晶構造解析からなる群から選択される、請求項38に記載の方法。
类似技术:
公开号 | 公开日 | 专利标题 De Vivo et al.2016|Role of molecular dynamics and related methods in drug discovery Bender et al.2016|Protocols for molecular modeling with Rosetta3 and RosettaScripts Kastritis et al.2013|On the binding affinity of macromolecular interactions: daring to ask why proteins interact Khan et al.2016|Current updates on computer aided protein modeling and designing Fowler et al.2014|Deep mutational scanning: a new style of protein science Craig et al.2010|Ensemble docking into multiple crystallographically derived protein structures: an evaluation based on the statistical analysis of enrichments Gervasio et al.2005|Flexible docking in solution using metadynamics Wass et al.2011|Challenges for the prediction of macromolecular interactions Shoemaker et al.2007|Deciphering protein–protein interactions. Part I. Experimental techniques and databases Sandak et al.1998|Flexible docking allowing induced fit in proteins: insights from an open to closed conformational isomers Jambon et al.2003|A new bioinformatic approach to detect common 3D sites in protein structures Lauck et al.2010|RosettaBackrub—a web server for flexible backbone protein structure modeling and design Lexa et al.2012|Protein flexibility in docking and surface mapping Liang et al.2006|Protein binding site prediction using an empirical scoring function Subramanian et al.2016|Computational modeling of β-secretase 1 | inhibitors using ligand based approaches Verma et al.2010|3D-QSAR in drug design-a review Norel et al.2001|Electrostatic contributions to protein–protein interactions: fast energetic filters for docking and their physical basis Schenone et al.2013|Target identification and mechanism of action in chemical biology and drug discovery Redfern et al.2008|Exploring the structure and function paradigm Laurie et al.2005|Q-SiteFinder: an energy-based method for the prediction of protein–ligand binding sites Chen2009|Intrinsically disordered p53 extreme C-terminus binds to S100B | through “fly-casting” Hall et al.2007|Protein microarray technology Mariani et al.2013|lDDT: a local superposition-free score for comparing protein structures and models using distance difference tests Kuzmanic et al.2014|X-ray refinement significantly underestimates the level of microscopic heterogeneity in biomolecular crystals DK2381382T3|2018-03-05|Method and apparatus for analyzing molecular configurations and combinations
同族专利:
公开号 | 公开日 EP2245571A2|2010-11-03| AU2009211148A1|2009-08-13| EP2245571A4|2015-03-18| EP2245571B1|2019-04-10| JP5530367B2|2014-06-25| US20110053261A1|2011-03-03| CA2715043A1|2009-08-13| AU2009211148B2|2014-08-28| WO2009098596A3|2009-10-01| WO2009098596A2|2009-08-13| US9404928B2|2016-08-02| AU2009211148A8|2010-10-28|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2012-01-24| A621| Written request for application examination|Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120123 | 2012-10-11| A977| Report on retrieval|Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121011 | 2013-08-19| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130816 | 2013-11-19| A521| Written amendment|Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131118 | 2013-12-05| A521| Written amendment|Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20131118 | 2014-03-25| TRDD| Decision of grant or rejection written| 2014-04-01| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140331 | 2014-04-24| A61| First payment of annual fees (during grant procedure)|Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140418 | 2014-04-25| R150| Certificate of patent or registration of utility model|Ref document number: 5530367 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 | 2017-04-11| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 | 2018-04-17| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 | 2019-04-16| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 | 2020-04-08| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 | 2021-04-07| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
优先权:
[返回顶部]
申请号 | 申请日 | 专利标题 相关专利
Sulfonates, polymers, resist compositions and patterning process
Washing machine
Washing machine
Device for fixture finishing and tension adjusting of membrane
Structure for Equipping Band in a Plane Cathode Ray Tube
Process for preparation of 7 alpha-carboxyl 9, 11-epoxy steroids and intermediates useful therein an
国家/地区
|