タンパク質設計のソースを表示

{{about|合理的タンパク質設計|タンパク質の広範な工学|[[タンパク質工学]]}}
'''タンパク質設計'''（たんぱくしつせっけい、{{Lang-en-short|protein design}}）とは、新規の活性、動作、または目的を設計し、タンパク質機能の基礎的な理解を深めるための、新しい[[タンパク質]]分子の[[合理的設計 (生物工学)|合理的な設計]]である<ref>{{cite news|last1=Korendovych|first1=Ivan|title=Minimalist design of peptide and protein catalysts|url=https://plan.core-apps.com/acsnola2018/abstract/3b00ff75f22454219cca274e14edadf8|access-date=22 March 2018|publisher=American Chemical Society|date=19 March 2018}}</ref>。タンパク質設計には、ゼロから設計する方法（'''''de novo''設計'''、デノボせっけい、''de novo'' design）と、既知のタンパク質構造とその配列を数理モデルで作る方法（'''タンパク質再設計'''、''protein redesign''）がある。'''合理的タンパク質設計'''（{{Lang-en-short|rational protein design}}）のアプローチでは、特定の構造に折りたたまれるようにタンパク質の配列を予測する。次に、これらの予測された配列は、[[ペプチド合成]]、{{仮リンク|部位特異的変異誘発|en|Site-directed mutagenesis}}、または[[人工遺伝子合成]]などの方法で実験的に検証される。

合理的タンパク質設計の歴史は1970年代半ばにまでさかのぼる<ref name="richardson1989">{{cite journal|last=Richardson|first=JS|author2=Richardson, DC |title=The de novo design of protein structures.|journal=Trends in Biochemical Sciences|date=July 1989|volume=14|issue=7|pages=304–9|pmid=2672455|doi=10.1016/0968-0004(89)90070-4}}</ref>。しかし最近では、[[タンパク質フォールディング|タンパク質の構造安定性]]に寄与するさまざまな要因の理解が深まり、より優れた計算手法が開発されたこともあって、水溶性および膜貫通型のペプチドやタンパク質の合理的設計に成功した例が数多く見られるようになった。

== 概要と歴史 ==

合理的タンパク質設計の目標は、特定のタンパク質構造に[[タンパク質フォールディング|折りたたまれ]]る[[アミノ酸]][[一次構造|配列]]を予測することである。可能なタンパク質配列の数は膨大で、タンパク質鎖の大きさとともに指数関数的に増加してゆくが、その一部の集まりだけが確実かつ迅速に1つの[[天然状態]]に折りたたまれる。タンパク質設計は、この部分集合の中から新規配列を見つけ出すことである。タンパク質の天然状態とは、その鎖の[[立体配座|配座]][[自由エネルギー]]の最小値である。したがって、タンパク質設計とは、選択された構造を自由エネルギーの最小値とする配列を探索することである。ある意味では、[[タンパク質構造予測]]の逆を行くものである。設計では、[[三次構造]]が指定され、それに折りたたまれる配列が特定される。そのため、逆フォールディング（''inverse folding''）とも呼ばれている。つまり、タンパク質の設計は最適化問題であり、いくつかのスコアリング基準を用いて、目的の構造に折りたたまれる最適な配列を選択するものである。

1970年代から1980年代にかけて、最初のタンパク質が合理的に設計されたとき、これらの配列は、他の既知のタンパク質の分析、配列構成、アミノ酸電荷、および目的とする構造の幾何学性に基づいて、手作業で最適化された<ref name="richardson1989" />。最初に設計されたタンパク質は、Bernd Gutteが、既知の触媒であるウシリボヌクレアーゼを還元したものと、[[DDT]]の結合体を含むβシートとαヘリックスからなる三次構造を設計したことによる。Urryらはその後、配列組成のルールに基づいて[[エラスチン]]様[[線維状タンパク質|繊維状ペプチド]]を設計した。Richardsonらは、既知のタンパク質とは配列相同性のない79残基のタンパク質を設計した<ref name="richardson1989" />。1990年代に入り、強力なコンピューター、{{仮リンク|アミノ酸立体構造ライブラリ|en|Conformational isomerism#Protein rotamer libraries|label=アミノ酸立体構造のライブラリ}}<!-- ←リンク切れ -->、そして主に[[分子動力学法|分子動力学]]シミュレーションのために開発された力場の出現により、構造ベースの計算機タンパク質設計ツールの開発が可能になった。このような計算ツールの開発を受けて、過去30年間でタンパク質設計は大きな成功を収めてきた。完全に新規に設計することに成功した最初のタンパク質は、1997年に[[:en:Stephen Mayo|Stephen Mayo]]らによって作られたもので<ref name="dahiyat1997" />、その直後の1999年には[[:en:Peter S. Kim|Peter S. Kim]]らによって、非天然の右巻き[[コイルドコイル]]の二量体、三量体、四量体が設計された<ref name="gordon99review">{{cite journal|last=Gordon|first=DB|author2=Marshall, SA |author3=Mayo, SL |title=Energy functions for protein design.|journal=Current Opinion in Structural Biology|date=August 1999|volume=9|issue=4|pages=509–13|pmid=10449371|doi=10.1016/s0959-440x(99)80072-4}}</ref><ref name="harbury99">{{cite journal|last=Harbury|first=PB|author2=Plecs, JJ |author3=Tidor, B |author4=Alber, T |author5= Kim, PS |title=High-resolution protein design with backbone freedom.|journal=Science|date=November 20, 1998|volume=282|issue=5393|pages=1462–7|pmid=9822371|doi=10.1126/science.282.5393.1462}}</ref>。2003年、[[:en:David Baker (biochemist)|David Baker]]の研究室は、自然界ではこれまでに見たことのない折りたたみ方をした完全なタンパク質を設計した<ref name="kuhlman03" />。その後、2008年に、Bakerのグループは、2つの異なる反応のために酵素を計算で設計した<ref>{{cite journal|last=Sterner|first=R|author2=Merkl, R |author3=Raushel, FM |title=Computational design of enzymes.|journal=Chemistry & Biology|date=May 2008|volume=15|issue=5|pages=421–3|pmid=18482694|doi=10.1016/j.chembiol.2008.04.007|doi-access=free}}</ref>。2010年には、計算機で設計されたタンパク質プローブを用いて、患者の血清から最も強力な広域中和抗体の1つが分離された<ref name="wu2010a">{{cite journal|last=Wu|first=X|author2=Yang, ZY; Li, Y; Hogerkorp, CM; Schief, WR; Seaman, MS; Zhou, T; Schmidt, SD; Wu, L; Xu, L; Longo, NS; McKee, K; O'Dell, S; Louder, MK; Wycuff, DL; Feng, Y; Nason, M; Doria-Rose, N; Connors, M; Kwong, PD; Roederer, M; Wyatt, RT; Nabel, GJ; Mascola, JR|title=Rational design of envelope identifies broadly neutralizing human monoclonal antibodies to HIV-1.|journal=Science|date=August 13, 2010|volume=329|issue=5993|pages=856–61|pmid=20616233|bibcode= 2010Sci...329..856W |doi= 10.1126/science.1187659|pmc=2965066}}</ref>。これらの成功やその他の成功により（例えば、[[タンパク質設計#タンパク質設計の応用と事例|以下の例]]を参照）、タンパク質設計は、[[タンパク質工学]]で利用できる最も重要なツールの一つとなっている。大小さまざまな新しいタンパク質設計が、[[バイオ医薬品|生物医学]]や[[生物工学]]に役立つことが期待されている。<!--[[Prion]] diseases like [[:en:bovine spongiform encephalopathy|bovine spongiform encephalopathy]] (mad-cow disease) illustrate how important it is that designer proteins possess only one stable conformation. In mad-cow disease, there exists a healthy protein with a fatal weakness: There is another conformation that it can "comfortably" take; the abnormally folded shape has very little free energy and is thus very stable. For reasons that are not yet fully understood, this [[:en:Protein misfolding|mis-folded]] prion protein can [[:en:Catalysis|catalyze]] other proteins of its type to also adopt the mis-folded shape, causing a disease-generating cascade of formerly functional proteins to quickly mis-fold. They lose the ability to perform their intended function in the new conformation, and have a tendency to form aggregates called [[:en:senile plaques|senile plaques]]. The buildup of these aggregates in the brain leads to progressive neuronal death, and eventually death of the entire organism. Thus, it is easy to see the importance both that a designer protein have only one possible stable tertiary structure and that researchers exercise extreme diligence to ensure that this remain the case in all environments, especially ''[[in vivo]]''.-->

== タンパク質の構造と機能の基礎となるモデル ==

タンパク質設計プログラムは、''[[in vivo]]（''生体内）環境でタンパク質を動かす分子間力の[[バイオインフォマティクス|コンピュータモデル]]を使用する。問題を扱いやすくするために、これらの力はタンパク質設計モデルによって単純化されている。タンパク質設計プログラムはさまざまであるが、4つの主要なモデル化の問題に対処しなければならない。設計のターゲット構造、ターゲット構造に持たせる柔軟性、探索に含める配列、および配列や構造のスコアリングに使用する力場である。

===ターゲット構造===

[[File:Top7.png|thumb|left|{{仮リンク|Top7 (タンパク質)|en|Top7|label=Top7}}タンパク質は、これまで自然界では見られなかった折りたたみ方に設計された最初のタンパク質の一つである<ref name="kuhlman03">{{cite journal|last=Kuhlman|first=B|author2=Dantas, G |author3=Ireton, GC |author4=Varani, G |author5=Stoddard, BL |author6= Baker, D |title=Design of a novel globular protein fold with atomic-level accuracy.|journal=Science|date=November 21, 2003|volume=302|issue=5649|pages=1364–8|pmid=14631033|bibcode= 2003Sci...302.1364K |doi= 10.1126/science.1089427|s2cid=1939390}}</ref>

]]

タンパク質の機能は、タンパク質の構造に大きく依存しており、合理的タンパク質設計では、この関係を利用して、ターゲット構造や折りたたみを持つタンパク質を設計することにで機能を設計する。したがって、定義上、合理的タンパク質設計では、ターゲット構造や構造のアンサンブルを事前に知っておく必要がある。これは、さまざまな方法で特定の機能を果たすタンパク質を見つける[[定向進化説|定向進化]]や、配列はわかっているが構造が不明な[[タンパク質構造予測]]など、他のタンパク質工学とは対照的である。

多くの場合、ターゲット構造は、他のタンパク質の既知の構造に基づいている。しかし、自然界では見られない新規折りたたみ方がますます可能になっている。Peter S. Kimらは、これまで自然界では見られなかった、非天然のコイルドコイルの三量体や四量体を設計した<ref name="gordon99review" /><ref name="harbury99" />。[[:en:David Baker (biochemist)|David Baker]]研究室で開発されたタンパク質Top7は、タンパク質設計アルゴリズムを用いて完全な新規折りたたみが設計されている<ref name="kuhlman03" />。最近では、Bakerらが、二次構造予測と三次構造の橋渡しをするタンパク質{{仮リンク|フォールディングファンネル|en|Folding funnel}}に基づいて、理想的な[[球状タンパク質]]構造を設計するための一連の原理を開発した。これらの原理は、タンパク質構造予測とタンパク質設計の両方に基づいており、5種類の新規タンパク質トポロジーを設計するために使用された<ref>{{cite journal|last=Höcker|first=B|title=Structural biology: A toolbox for protein design.|journal=Nature|date=November 8, 2012|volume=491|issue=7423|pages=204–5|pmid=23135466|bibcode= 2012Natur.491..204H |doi= 10.1038/491204a|s2cid=4426247}}</ref>。

=== 配列空間 ===
[[File:1FSVblue-1ZAAred.png|thumb|FSD-1（青、PDB ID: 1FSV）は、世界初の完全なタンパク質の''de novo''計算設計である<ref name="dahiyat1997">{{cite journal|last=Dahiyat|first=BI|author2=Mayo, SL |title=De novo protein design: fully automated sequence selection.|journal=Science|date=October 3, 1997|volume=278|issue=5335|pages=82–7|pmid=9311930|doi=10.1126/science.278.5335.82|citeseerx=10.1.1.72.7304}}</ref>。ターゲットフォールドは、Zif268（赤、PDB ID: 1ZAA）の構造のうち、33-60残基のジンクフィンガーである。設計された配列は、既知のタンパク質配列とほとんど配列相同性がなかった。]]

合理的タンパク質設計では、既知のタンパク質の配列や構造からタンパク質を再設計することも、''de novo''タンパク質設計で完全にゼロから設計することもできる。タンパク質再設計では、配列中のほとんどの残基は野生型アミノ酸として維持されるが、いくつかの残基には変異が許される。''de novo''設計では、過去の配列を基にして、配列全体が新たに設計される。

''de novo''設計でもタンパク質再設計でも、{{仮リンク|配列空間 (進化)|en|Sequence space (evolution)|label=配列空間}}にルールを設けることができ、それは、それぞれの変異可能な残基位置で許容される特定のアミノ酸の決定である。たとえば、HIV広域中和抗体を選択するための[[タンパク質設計#タンパク質リサーフェシング|RSC3プローブ]]の表面の組成は、進化的データと電荷平衡に基づいて制限されていた。初期のタンパク質設計の試みの多くは、配列空間上の経験則に大きく基づいていた<ref name="richardson1989" />。さらに、繊維状タンパク質の設計は、通常、配列空間の厳格なルールに従う。例えば、[[コラーゲン]]ベースで設計されたタンパク質は、Gly-Pro-Xの繰り返しパターンで構成されていることが多い<ref name="richardson1989" />。計算技術の登場により、配列選択に人間が介在しなくてもタンパク質を設計できるようになった<ref name="dahiyat1997" />。

=== 構造の柔軟性 ===

[[File:ileRotamers.gif|thumb|left|200px|一般的なタンパク質設計プログラムでは、回転異性体ライブラリを使用して、タンパク質側鎖の立体配座空間を単純化する。このアニメーションは、Penultimate Rotamer Library<ref name="lovell2000" />に基づいて、イソロイシンアミノ酸のすべての回転異性体を繰り返す。

]]

タンパク質設計では、タンパク質のターゲット構造（または複数の構造）がわかっている。しかし、合理的タンパク質設計アプローチでは、その構造に合わせて設計できる配列の数を増やし、配列が別の構造に折りたたまれる可能性を最小限に抑えるために、ターゲット構造がある程度の柔軟性を持つようモデル化する必要がある。たとえば、タンパク質再設計において、密に詰まったコア内にある1つの小さなアミノ酸（アラニンなど）を再設計する場合、周囲の側鎖が再パッキングを許さなければ、合理的設計手法によってターゲット構造に折りたたまれると予測される変異体は非常に少ない。

このように、設計プロセスの重要なパラメータは、側鎖と主鎖の両方にどれだけの柔軟性を持たせるかということである。最も単純なモデルでは、タンパク質の主鎖は剛体のまま保たれ、タンパク質の側鎖の一部が立体配座を変更できる。ただし、側鎖は、結合長、結合角、およびχ[[二面角]]に多くの自由度を持つことができる。この空間を単純化するために、タンパク質設計法では、結合長と結合角に理想的な値を想定する回転異性体ライブラリを使用し、χ二面角を'''[[回転異性体]]'''（rotamer、ロータマー）と呼ばれるいくつかの繁盛に観察される低エネルギー配座に限定する。

回転異性体ライブラリは、多くのタンパク質構造の分析に基づいて回転異性体を記述する。主鎖非依存の回転異性体ライブラリは、すべての回転異性体を記述する<ref name="lovell2000">{{cite journal|last=Lovell|first=SC|author2=Word, JM |author3=Richardson, JS |author4= Richardson, DC |title=The penultimate rotamer library.|journal=Proteins|date=August 15, 2000|volume=40|issue=3|pages=389–408|pmid=10861930|doi=10.1002/1097-0134(20000815)40:3<389::AID-PROT50>3.0.CO;2-2|citeseerx=10.1.1.555.4071}}</ref>。一方、主鎖依存型回転異性体ライブラリでは、側鎖周辺のタンパク質主鎖の配置に応じて、回転異性体がどの程度出現する可能性があるかを記述する。回転異性体ライブラリで記述される回転異性体は、通常、空間上の領域である<ref>{{cite journal|last=Shapovalov|first=MV|author2=Dunbrack RL, Jr|title=A smoothed backbone-dependent rotamer library for proteins derived from adaptive kernel density estimates and regressions.|journal=Structure|date=June 8, 2011|volume=19|issue=6|pages=844–58|pmid=21645855|doi=10.1016/j.str.2011.03.019|pmc=3118414}}</ref>。ほとんどのタンパク質設計プログラムでは、1つの立体配座（例えば、空間内の回転異性体二面角の再頻値）または回転異性体によって記述される領域内の複数の点を使用する。対照的に、[[タンパク質設計#アルゴリズム|OSPREY]]タンパク質設計プログラムは、連続領域全体をモデル化する<ref name="samish11" />。

合理的タンパク質設計では、タンパク質の一般的な骨格を維持する必要があるが、骨格の柔軟性をある程度確保することで、タンパク質の一般的な折りたたみを維持しながらその構造に折りたたまれる配列の数を大幅に増やすことができる<ref name="kortemme09">{{cite journal|last=Mandell|first=DJ|author2=Kortemme, T |author-link2=Tanja Kortemme |title=Backbone flexibility in computational protein design.|journal=Current Opinion in Biotechnology|date=August 2009|volume=20|issue=4|pages=420–8|pmid=19709874|doi=10.1016/j.copbio.2009.07.006|url=https://escholarship.org/content/qt89b8n09b/qt89b8n09b.pdf?t=pqrxq4}}</ref>。タンパク質再設計においては、配列変異は骨格構造に小さな変化をもたらすことが多いため、骨格の柔軟性は特に重要である。さらに、主鎖の柔軟性は、結合予測や酵素設計など、タンパク質設計のより高度な応用に不可欠である。タンパク質設計の主鎖の柔軟性のモデルには、小さくて連続的な大域的主鎖の動き、ターゲットフォールドの周りの離散的な主鎖サンプル、バックラブ（backrub）の動き、およびタンパク質ループの柔軟性などがある<ref name="kortemme09" /><ref name="donald10" />。

=== エネルギー関数 ===

[[File:PEF comparison.png|thumb|400px|right|さまざまな位置エネルギー関数の比較。最も正確なエネルギーは、量子力学的計算を用いたものであるが(左端)、これらはタンパク質の設計には遅すぎる。一方で、極端なヒューリスティックなエネルギー関数は、統計項に基づいており、非常に高速である(右端)。その中間に位置するのが、物理的な根拠を持ちながら、量子力学シミュレーションほどの計算量を必要としない分子力学エネルギー関数である<ref name="Boas" />。

]]

合理的タンパク質設計のためには、ターゲットフォールドの下で安定する配列を、他の低エネルギーの競合状態を好む配列から区別しなければならない。そのため、タンパク質設計には、ターゲット構造にどれだけうまく折りたためるかによって配列をランク付けし、スコアリングできる正確な[[力場 (化学)|エネルギー関数]]が必要である。しかし同時に、これらのエネルギー関数は、タンパク質設計における計算上の[[タンパク質設計#最適化問題として|課題]]を考慮しなければならない。設計を成功させるための最も困難な要件の1つは、計算機計算上の正確さと単純さを兼ね備えたエネルギー関数である。

最も正確なエネルギー関数は、量子力学的シミュレーションに基づくものである。しかし、このようなシミュレーションは時間がかかりすぎるため、通常、タンパク質設計には実用的ではない。その代わりに、多くのタンパク質設計アルゴリズムでは、[[分子力学法|分子力学]]シミュレーションプログラムを改造した物理ベースのエネルギー関数、{{仮リンク|統計的ポテンシャル|en|Statistical potential|label=知識ベースのエネルギー関数}}、またはその両方を組み合わせたハイブリッドのいずれかを使用している。最近の傾向としては、より多くの物理ベースの位置エネルギー関数を使うようになってきている<ref name="Boas">{{cite journal |last1=Boas |first1=F. E. |last2=Harbury |first2=P. B. |name-list-style=amp |year=2007 |title=Potential energy functions for protein design |journal=Current Opinion in Structural Biology |volume=17 |issue=2 |pages=199–204 |doi=10.1016/j.sbi.2007.03.006 |pmid=17387014}}</ref>。

[[AMBER (分子動力学)|AMBER]]や[[CHARMM]]のような物理ベースのエネルギー関数は、通常、量子力学シミュレーションや、熱力学、結晶学、分光学などの実験データから導出される<ref name="boas2007">{{cite journal|last=Boas|first=FE|author2=Harbury, PB |title=Potential energy functions for protein design.|journal=Current Opinion in Structural Biology|date=April 2007|volume=17|issue=2|pages=199–204|pmid=17387014|doi=10.1016/j.sbi.2007.03.006}}</ref>。これらのエネルギー関数は通常、物理エネルギー関数を単純化し、ペアワイズ分解可能にしている。つまり、タンパク質の立体配座の総エネルギーは、各原子ペア間のペアエネルギーを加算することで計算できるため、最適化アルゴリズムにとって魅力的なものとなっている。物理ベースのエネルギー関数は、一般的に、原子間の引力-反発[[レナード-ジョーンズ・ポテンシャル|レナード-ジョーンズ]]項と、非結合原子間のペアワイズ[[静電気学|静電]]クーロン項<ref>{{cite journal|last=Vizcarra|first=CL|author2=Mayo, SL |title=Electrostatics in computational protein design.|journal=Current Opinion in Chemical Biology|date=December 2005|volume=9|issue=6|pages=622–6|pmid=16257567|doi=10.1016/j.cbpa.2005.10.014}}</ref>をモデル化する。
[[File:Water-hbond-vrc01-gp120.png|thumb|left|水を介した水素結合は、タンパク質-タンパク質結合において重要な役割を果たしている。このような相互作用の1つは、HIV広域中和抗体VRC01（緑）の重鎖の残基D457、S365と、HIVエンベロープタンパク質GP120（紫）の残基N58およびY59の間に見られる<ref name="wu2010">{{cite journal|last=Zhou|first=T|author2=Georgiev, I; Wu, X; Yang, ZY; Dai, K; Finzi, A; Kwon, YD; Scheid, JF; Shi, W; Xu, L; Yang, Y; Zhu, J; Nussenzweig, MC; Sodroski, J; Shapiro, L; Nabel, GJ; Mascola, JR; Kwong, PD|title=Structural basis for broad and potent neutralization of HIV-1 by antibody VRC01.|journal=Science|date=August 13, 2010|volume=329|issue=5993|pages=811–7|pmid=20616231|bibcode= 2010Sci...329..811Z |doi= 10.1126/science.1192819|pmc=2981354}}</ref>。]]

統計的ポテンシャルは、物理ベースのポテンシャルとは対照的に、計算速度が速く、複雑な効果を暗黙的に説明することができ、タンパク質構造の小さな変化にも影響されにくいという利点がある<ref>{{cite journal|last=Mendes|first=J|author2=Guerois, R |author3=Serrano, L |title=Energy estimation in protein design.|journal=Current Opinion in Structural Biology|date=August 2002|volume=12|issue=4|pages=441–6|pmid=12163065|doi=10.1016/s0959-440x(02)00345-7}}</ref>。これらのエネルギー関数は、構造データベース上の出現頻度から[[:ファイル:Knowledge based potential.png|エネルギー値を導き出した]]ものである。

ただし、タンパク質の設計には、分子力学的な力場では制限されるような要件がある。分子動力学シミュレーションで主に使われてきた分子力学力場は、単一配列のシミュレーションに最適化されているが、タンパク質設計では多くの配列の多くの立体配座を探索する。そのため、分子力学力場は、タンパク質設計に合わせて調整する必要がある。実際には、タンパク質設計のエネルギー関数には、統計項と物理ベース項の両方が含まれていることが多くある。たとえば、最も使われているエネルギー関数の一つであるRosettaエネルギー関数には、CHARMMエネルギー関数に由来する物理ベースエネルギー項と、回転異性体確率<!-- rotamer probability -->や知識ベースの静電気<!-- knowledge-based electrostatics -->などの統計エネルギー項が組み込まれている。一般的に、エネルギー関数は研究所間で高度にカスタマイズされており、すべての設計に合わせて特別に調整されている<ref name="boas2007" />。

==== 効果的なエネルギー関数の設計課題 ====

水は、タンパク質を取り巻く分子のほとんどを構成しており、タンパク質の構造を決める推進力となっている。したがって、水とタンパク質の間の相互作用をモデル化することは、タンパク質設計において極めて重要である。ある時点でタンパク質と相互作用する水分子の数は膨大であり、それぞれの水分子は多数の自由度と相互作用パートナーを持っている。その代わり、タンパク質設計プログラムでは、そのような水分子のほとんどを連続体としてモデル化し、疎水性効果と溶媒和分極の両方をモデル化している<ref name="boas2007" />。

個々の水分子は、時に、タンパク質コアや、タンパク質-タンパク質またはタンパク質-リガンドの相互作用において、重要な構造的役割を果たすことがある。このような水のモデル化に欠点があると、タンパク質-タンパク質間の界面の最適配列を誤って予測する可能性がある。別の方法として、水分子を回転異性体に加えることができる<ref name="boas2007" />。
<!--
====Lennard-Jones potentials====

====Electrostatics====

====Entropy====

To be done.

====Non-pairwise terms====

Polarizability ... to be done.

====Knowledge-based energy functions====
-->

<!--
====Lennard-Jones potentials====

====Electrostatics====

====Entropy====

To be done.

====Non-pairwise terms====

Polarizability ... to be done.

====Knowledge-based energy functions====
-->
== 最適化問題として ==

[[File:ProteinDesignSearch.gif|200px|thumb|このアニメーションは、タンパク質設計探索の複雑さを示している。この探索は通常、すべての残基で考えられるすべての可能な変異から得られるすべての回転異性体の立体配座を比較する、この例では、残基Phe36およびHis106は、それぞれアミノ酸TyrおよびAsnに変異することができる。PheとTyrは、回転異性体ライブラリにそれぞれ4つの回転異性体を持ち、AsnとHisはそれぞれ7つと8つの回転異性体を持つ（Richardson's penultimate rotamer libraryより<ref name="lovell2000" />）。アニメーションは、すべての（4＋4）×（7＋8）＝120の可能性を繰り返す。表示されている構造はミオグロビンである（PDB ID: 1mbn）。]]

タンパク質設計の目的は、ターゲット構造に折りたたまれるタンパク質の配列を見つけることである。したがって、タンパク質設計アルゴリズムは、ターゲットフォールドに対する各配列のすべての立体配座を探索し、タンパク質設計エネルギー関数によって決定される各配列の最低エネルギー立体配座に応じて配列をランク付けする必要がある。このように、タンパク質設計アルゴリズムへの典型的な入力は、ターゲットフォールド、配列空間、構造の柔軟性、およびエネルギー関数であり、出力はターゲット構造に安定して折りたまれると予測される1つ（または複数の）配列である。

しかし、候補タンパク質配列の数は、タンパク質残基の数とともに指数関数的に増加する。たとえば、長さ100のタンパク質配列が20<sup>100</sup>個あるとする。さらに、アミノ酸側鎖の立体配座が少数の回転異性体に限定されるとしても（「[[タンパク質設計#構造の柔軟性|構造の柔軟性]]」参照）、これにより、各配列の立体配座数は指数関数的に増加する。したがって、100残基のタンパク質において、各アミノ酸がちょうど10個の回転異性体を持つと仮定すると、この空間を探索する探索アルゴリズムは、200<sup>100</sup>以上のタンパク質の立体配座を探索しなければならない。

最も一般的なエネルギー関数は、回転異性体とアミノ酸タイプの間のペアワイズ項に分解できるため、問題を組み合わせ問題として計算し、強力な最適化アルゴリズムを用いて解決することができる。このような場合、各配列に属する各立体配座の総エネルギーは、残基位置間の個別項とペアワイズ項の和として定式化できる。設計者が最良の配列のみに関心がある場合、タンパク質設計アルゴリズムは、最低エネルギー配列の最低エネルギー配座のみを必要とする。このような場合には、各回転異性体のアミノ酸の同一性を無視し、異なるアミノ酸に属するすべての回転異性体を同じように扱うことができる。タンパク質鎖の残基位置 <var>i</var> にある回転異性体を <var>r</var><sub><var>i</var></sub> とし、回転異性体の内部原子間の位置エネルギーを <var>E(<var>r</var><sub><var>i</var></sub>)</var> とする。<var>E</var>(<var>r</var><sub><var>i</var></sub>, <var>r</var><sub><var>j</var></sub>) を、残基位置 <var>j</var> における <var>r</var><sub><var>i</var></sub> と回転異性体 <var>r</var><sub><var>j</var></sub> の間の位置エネルギーとする。そして、最適化問題を最小エネルギー (<var>E</var><sub><var>T</var></sub><!--さらに、ターゲット構造は、多くの配列にとって非常に高いエネルギー状態である可能性があり、他の配列は代替の競合状態に優先的に折りたたまれる可能性がある。 -->) の立体配座を見つけることの1つと定義する。{{NumBlk|:|<math>\min E_{T} = \sum_{i}\Big[ E_i(r_i) + \sum_{i\ne j} E_{ij}(r_i, r_j)\Big] \, </math>|{{EquationRef|1}}}}

<var>E<sub>T</sub></var> を最小化する問題は、[[NP困難]]な問題である<ref name="donald10">{{cite book |last1=Donald |first1=Bruce R. |author-link1=Bruce Donald |title=Algorithms in Structural Molecular Biology| year=2011|publisher=MIT Press |location=Cambridge, MA}}</ref><ref>{{cite journal|last=Pierce|first=NA|author2=Winfree, E |title=Protein design is NP-hard.|journal=Protein Engineering|date=October 2002|volume=15|issue=10|pages=779–82|pmid=12468711|doi=10.1093/protein/15.10.779|doi-access=free}}</ref><ref name="voigt00">{{cite journal|last=Voigt|first=CA|author2=Gordon, DB |author3=Mayo, SL |title=Trading accuracy for speed: A quantitative comparison of search algorithms in protein sequence design.|journal=Journal of Molecular Biology|date=June 9, 2000|volume=299|issue=3|pages=789–803|pmid=10835284|doi=10.1006/jmbi.2000.3758|citeseerx=10.1.1.138.2023}}</ref>。問題のクラスがNP困難であるにもかかわらず、実際には、タンパク質設計の多くの事例は、ヒューリスティックな方法によって正確に解決したり、十分に最適化することができる。

== アルゴリズム ==

タンパク質設計問題に特化したいくつかのアルゴリズムが開発されている。これらのアルゴリズムは、大きく2つのクラスに分類でき、[[ランタイム (プログラムライフサイクルフェーズ)|実行時間]]の保証はないが解の質を保証するデッドエンド削除などの厳密アルゴリズムと、厳密アルゴリズムよりも高速だが結果の最適性が保証されていないモンテカルロ法などの[[ヒューリスティック]]なアルゴリズムがある。厳密アルゴリズムは、最適化プロセスがタンパク質設計モデルに従って最適解を生成することを保証する。したがって、これらが実験的に検証されたときに厳密アルゴリズムの予測が失敗した場合、エラーの原因は、エネルギー関数、許容される柔軟性、配列空間、またはターゲット構造（たとえば、設計できない場合）に起因すると考えられる<ref>{{cite journal|last=Hong|first=EJ|author2=Lippow, SM |author3=Tidor, B |author4= Lozano-Pérez, T |title=Rotamer optimization for protein design through MAP estimation and problem-size reduction.|journal=Journal of Computational Chemistry|date=September 2009|volume=30|issue=12|pages=1923–45|pmid=19123203|doi=10.1002/jcc.21188 |pmc=3495010}}</ref>。

いくつかのタンパク質設計アルゴリズムを以下に示す。これらのアルゴリズムは、タンパク質設計問題の最も基本的な定式化である式（{{EquationNote|1}}）のみに対応しているが、設計者がタンパク質設計モデルに改良や拡張を導入することで最適化の目標が変化した場合、例えば、許容される構造的な柔軟性（タンパク質の主鎖の柔軟性など）の改善や、洗練されたエネルギー項の追加などを含め、モデリングを改善するタンパク質設計の拡張機能の多くは、これらのアルゴリズムの上に構築されている。例えば、Rosetta Designでは、洗練されたエネルギー項や、最適化アルゴリズムとしてモンテカルロ法を用いた主鎖の柔軟性などが組み込まれている。OSPREYのアルゴリズムは、デッドエンド削除アルゴリズムとA*探索アルゴリズムをベースに、主鎖と側鎖の連続的な動きを取り入れている。このように、各アルゴリズムは、タンパク質設計に利用できるさまざまな種類のアルゴリズムについて、優れた展望を提供している。

2020年7月、科学者たちは、新規タンパク質の[[進化的アルゴリズム|進化的設計]]の開発のために、{{仮リンク|生物学的データベースの一覧|en|List of biological databases|label=ゲノムデータベース}}を利用した[[人工知能]]（AI）ベースのプロセスを報告した。彼らは[[ディープラーニング]]を用いて設計ルールを特定した<ref>{{cite news |title=Machine learning reveals recipe for building artificial proteins |url=https://phys.org/news/2020-07-machine-reveals-recipe-artificial-proteins.html |access-date=17 August 2020 |work=phys.org |language=en}}</ref><ref>{{cite journal |title=An evolution-based model for designing chorismatemutase enzymes |journal=Science |doi=10.1126/science.aba3304 |doi-broken-date=January 16, 2021 |bibcode=2020Sci...369..440R |last1=Russ |first1=William P. |last2=Figliuzzi |first2=Matteo |last3=Stocker |first3=Christian |last4=Barrat-Charlaix |first4=Pierre |last5=Socolich |first5=Michael |last6=Kast |first6=Peter |last7=Hilvert |first7=Donald |last8=Monasson |first8=Remi |last9=Cocco |first9=Simona |last10=Weigt |first10=Martin |last11=Ranganathan |first11=Rama |year=2020 |volume=369 |issue=6502 |pages=440–445 |pmid=32703877 }}</ref>。
=== 数学的な保証付き最適化アルゴリズム ===

==== デッドエンド削除 ====
{{main|en:Dead-end elimination}}

デッドエンド削除 (dead-end elimination、DEE) アルゴリズムは、大域的最低エネルギー配座（global lowest energy conformation、GMEC）の一部ではないことが証明できる回転異性体を削除することにより、問題の探索空間を反復的に縮小する。各反復において、デッドエンド削除アルゴリズムは、各残基位置で可能なすべての回転異性体のペアを比較し、別の回転異性体 <var>r<sub>i</sub></var> よりも常に高いエネルギーを持つことが示すことができ、したがってGMECの一部ではない各回転異性体 <var>r&prime;<sub>i</sub></var> を除去する。

<math> E(r^\prime_i) + \sum_{j\ne i} \min_{r_j} E(r^\prime_i,r_j) > E(r_i) + \sum_{j\ne i} \max_{r_j} E(r_i,r_j) </math>

また、デッドエンド削除アルゴリズムに対する他の強力な拡張として、{{仮リンク|デッドエンド削除#ペア削除基準|en|Dead-end elimination#Pairs elimination criterion|label=ペア削除基準}}や{{仮リンク|デッドエンド削除#一般化|en|Dead-end elimination#Pairs elimination criterion|label=一般化デッドエンド削除基準}}がある。このアルゴリズムはまた、証明可能な保証付きで連続的な回転異性体を扱えるようにも拡張されている。

デッドエンド削除アルゴリズムは、各反復において多項式時間で実行されるが、収束を保証するものではない。ある一定の反復回数の後、デッドエンド削除アルゴリズムがそれ以上の回転異性体を刈り込まない場合、回転異性体を合併するか、別の探索アルゴリズムを使用して残りの探索空間を探索する必要がある。このような場合、デッドエンド削除は、探索空間を縮小するための事前フィルタリング・アルゴリズムとして機能し、A*、モンテカルロ、線形計画法、FASTERなどの他のアルゴリズムを使用して残りの探索空間を探索する<ref name="donald10" />。

==== 分枝限定法 ====
{{main|分枝限定法}}

タンパク質設計の立体配座空間は、タンパク質残基を任意の順序で並べ、残基内の各回転異性体で木が分岐するような[[木構造 (データ構造)|木構造]]で表現することができる。[[分枝限定法|分枝限定]]アルゴリズム（branch and bound algorithms）は、この表現を用いて立体配座木を効率的に探索する。各分岐で、分枝限定アルゴリズムは、立体配座空間を結合し、有望な分岐のみを探索する<ref name="donald10" /><ref name="gordon99">{{cite journal|last=Gordon|first=DB|author2=Mayo, SL |title=Branch-and-terminate: a combinatorial optimization algorithm for protein design.|journal=Structure|date=September 15, 1999|volume=7|issue=9|pages=1089–98|pmid=10508778|doi=10.1016/s0969-2126(99)80176-2}}</ref><ref name="leach98">{{cite journal|last=Leach|first=AR|author2=Lemon, AP |title=Exploring the conformational space of protein side chains using dead-end elimination and the A* algorithm.|journal=Proteins|date=November 1, 1998|volume=33|issue=2|pages=227–39|pmid=9779790|doi=10.1002/(sici)1097-0134(19981101)33:2<227::aid-prot7>3.0.co;2-f|citeseerx=10.1.1.133.7986}}</ref>。

タンパク質設計のための一般的な探索アルゴリズムは、[[A*アルゴリズム|A*探索アルゴリズム]]（A* search algorithm）である<ref name="donald10" /><ref name="leach98" />。A*は、各部分木のパスに対して、展開された各回転異性体のエネルギーを（保証付きで）下限とする下限スコアを計算する。おのおのの部分立体配座は優先キューに追加され、各反復において、最も低い下限値を持つ部分的パスがキューから取り出されて展開される。このアルゴリズムは、完全な立体配座が列挙されると停止し、その立体配座が最適であることを保証する。

タンパク質設計のA*スコア  <var>f</var> は、 <var>f=g+h</var> の2つの部分から構成される。<var>g</var> は、部分立体配座ですでに割り当てられている回転異性体の正確なエネルギーである。<var>h</var> は、まだ割り当てられていない回転異性体のエネルギーの下限値である。それぞれは、以下のように設計されている。ここで、<var>d</var> は部分立体配座の最後に割り当てられた残基のインデックスである。

<math>g=\sum_{i=1}^d (E(r_i ) + \sum_{j=i+1}^d E(r_i,r_j) )</math>

<math>h = \sum_{j=d+1}^n [\min_{r_j}(E(r_j) + \sum_{i=1}^d E(r_i,r_j) + \sum_{k=j+1}^n \min_{r_k} E(r_j,r_k))]</math>

==== 整数線形計画法 ====
{{Further|線型計画法#線型計画法|整数計画問題}}

<var>E<sub>T</sub></var> を最適化する問題（式（{{EquationNote|1}}））は、[[整数計画問題|整数線形計画]]（integer linear program、ILP）として簡単に定式化できる<ref name="kingsford05" />。最も強力な定式化の一つは、最終解における回転異性体とエッジの存在を表すために二値変数を使用し、各残基に対して回転異性体を正確に1つ、各残基のペアに対して1つのペアワイズ相互作用を持つように解を制約するものである。

<math>\ \min \sum_{i}\sum_{r_i} E_i(r_i)q_{i}(r_i) + \sum_{j\ne i}\sum_{r_j} E_{ij}(r_i, r_j)q_{ij}(r_i, r_j) \, </math>

ここに次を仮定する。

<math>\sum_{r_i} q_{i}(r_i) = 1, \ \forall i</math>

<math>\sum_{r_j} q_{ij}(r_i,r_j) = q_{i}(r_i), \forall i, r_i, j </math>

<math>q_i, q_{ij} \in \{0,1\}</math>

{{仮リンク|CPLEX|en|CPLEX}}に代表されるILPソルバーは、タンパク質設計問題の大規模な事例に対して、正確な最適解を計算することができる。これらのソルバーは、問題の{{仮リンク|線形計画緩和|en|Linear programming relaxation}}（linear programming relaxation）を使用し、<var>q<sub>i</sub></var> と <var>q<sub>ij</sub></var> が連続した値をとることができ、{{仮リンク|ブランチ・アンド・カット|en|Branch and cut}}アルゴリズム（branch and cut）を組み合わせて、最適な解を求めて立体配座空間のごく一部を探索するものである。ILPソルバーは、側鎖配置問題の多くの事例を解決することが示されている<ref name="kingsford05">{{cite journal|last=Kingsford|first=CL|author2=Chazelle, B |author3=Singh, M |title=Solving and analyzing side-chain positioning problems using linear and integer programming.|journal=Bioinformatics|date=April 1, 2005|volume=21|issue=7|pages=1028–36|pmid=15546935|doi=10.1093/bioinformatics/bti144|doi-access=free}}</ref>。

==== 線形計画法双対問題に対するメッセージ伝搬法に基づく近似法 ====

ILPソルバーは、[[シンプレックス法]]や[[バリア関数|バリア]]ベース法などの線形計画法（LP）アルゴリズムに依存して、各分岐でLP緩和を実行する。これらのLPアルゴリズムは、汎用の最適化手法として開発されたものであり、タンパク質設計問題（式（{{EquationNote|1}}））に最適化されたものではない。そのため、問題のサイズが大きくなると、LP緩和がILPソルバーのボトルネックになる<ref name="yanover06">{{cite journal|last=Yanover|first=Chen|author2=Talya Meltzer |author3=Yair Weiss |title=Linear Programming Relaxations and Belief Propagation – An Empirical Study|journal=Journal of Machine Learning Research|year=2006|volume=7|pages=1887–1907}}</ref>。最近では、タンパク質設計問題のLP緩和の最適化のために、[[確率伝搬法|メッセージ伝搬]]アルゴリズム（message-passing）に基づくいくつかの代替案が設計された。これらのアルゴリズムは、整数計画の[[双対問題]]または[[双対問題|主問題]]の両方を近似することができるが、最適性の保証を維持するためには、タンパク質設計問題の双対を近似するために使用するのが最も有効である。なぜなら、双対を近似することで、解を見逃さないことを保証するからである。メッセージ伝搬法に基づく近似法には、ツリー再重み付け最大積メッセージ伝搬アルゴリズム（''tree reweighted max-product message passing''）<ref>{{cite journal|last=Wainwright|first=Martin J |author2=Tommi S. Jaakkola |author3=Alan S. Willsky|title=MAP estimation via agreement on trees: message-passing and linear programming.|journal=IEEE Transactions on Information Theory|year=2005|pages=3697–3717|doi=10.1109/tit.2005.856938|volume=51|issue=11 |citeseerx=10.1.1.71.9565 |s2cid=10007532 }}</ref><ref>{{cite journal|last=Kolmogorov|first=Vladimir|title=Convergent tree-reweighted message passing for energy minimization.|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|date=October 28, 2006|volume=28|issue=10|pages=1568–1583|doi=10.1109/TPAMI.2006.200|pmid=16986540|s2cid=8616813}}</ref>や、メッセージ伝搬線形計画アルゴリズム（''message passing linear programming''）<ref>{{cite journal|last=Globerson|first=Amir|author2=Tommi S. Jaakkola |title=Fixing max-product: Convergent message passing algorithms for MAP LP-relaxations.|journal=Advances in Neural Information Processing Systems|year=2007}}</ref>などがある。

=== 保証のない最適化アルゴリズム ===

==== モンテカルロ法とシミュレーテッドアニーリング法 ====

[[モンテカルロ法]]は、タンパク質設計に最も広く用いられているアルゴリズムの一つである。もっとも単純な形式では、モンテカルロアルゴリズム（Monte Carlo）がランダムに残基を選択し、その残基でランダムに選択された（任意のアミノ酸の）回転異性体が評価される<ref name="voigt00" />。タンパク質の新しいエネルギー <var>E</var><sub>new</sub> は、古いエネルギー <var>E</var><sub>old</sub> と比較され、新しい回転異性体が次のとおり確率的に受け入れられる。

<math> p=e^{-\beta(E_{\text{new}}-E_{\text{old}}))},</math>

ここに、 <var>&beta;</var> は[[ボルツマン定数]]であり、温度 <var>T</var> は、初期ラウンドでは高く、局所的な最小値を乗り越えるためにゆっくり[[焼きなまし法|アニーリング]]（annealing）されるように選択できる<ref name="samish11">{{cite journal|last=Samish|first=I|author2=MacDermaid, CM |author3=Perez-Aguilar, JM |author4= Saven, JG |title=Theoretical and computational protein design.|journal=Annual Review of Physical Chemistry|year=2011|volume=62|pages=129–49|pmid=21128762|bibcode= 2011ARPC...62..129S |doi= 10.1146/annurev-physchem-032210-103509}}</ref>。

====FASTER====

FASTERアルゴリズムは、決定論的基準と確率論的基準を組み合わせて、アミノ酸配列を最適化する。FASTERは、最初にDEEを使って、最適解に含まれない回転異性体を排除する。次に、一連の反復ステップにより、回転異性体の割り当てを最適化する<ref>{{cite journal|last=Allen|first=BD|author2=Mayo, SL |title=Dramatic performance enhancements for the FASTER optimization algorithm.|journal=Journal of Computational Chemistry|date=July 30, 2006|volume=27|issue=10|pages=1071–5|pmid=16685715|doi=10.1002/jcc.20420|citeseerx=10.1.1.425.5418|s2cid=769053}}</ref><ref>{{cite journal|last=Desmet|first=J|author2=Spriet, J |author3=Lasters, I |title=Fast and accurate side-chain topology and energy refinement (FASTER) as a new method for protein structure optimization.|journal=Proteins|date=July 1, 2002|volume=48|issue=1|pages=31–43|pmid=12012335|doi=10.1002/prot.10131|s2cid=21524437}}</ref>。

==== 確率伝播法 ====

タンパク質設計のための[[確率伝搬法|確率伝播法]]（belief propagation）では、アルゴリズムは、各残基が近隣する残基の各回転異性体の確率について持っている確率を記述したメッセージを交換する。このアルゴリズムは、反復ごとにメッセージを更新し、収束するまで、または一定の反復回数まで反復する。タンパク質設計において収束は保証されていない。ある残基 <var>i</var> が隣接残基 <var>j</var> のすべての回転異性体 <var>(r<sub>j</sub></var> に送るメッセージ <var>m</var><sub><var>i&rarr; j</var></sub><var>(r<sub>j</sub></var> は次のように定義される。

<math>m_{i\to j}(r_j) = \max_{r_i} \Big(e^{\frac{-E_i(r_i)-E_{ij}(r_i,r_j)}{T}}\Big) \prod_{k \in N(i)\backslash j} m_{k\to i (r_i)}</math>

max-productとsum-productの両方の確率伝播が、タンパク質設計の最適化に使用されている。

== タンパク質設計の応用と事例 ==

=== 酵素の設計 ===

新規[[酵素]]の設計は、計り知れない[[生物工学]]や[[医用生体工学]]への応用が期待されるタンパク質設計の一つである。一般に、タンパク質構造の設計と酵素の設計は異なり、これは、酵素の設計では[[酵素反応|触媒機構]]に関わる多くの状態を考慮する必要があることによる。しかし、タンパク質の設計は、''de novo''酵素設計の前提条件であり、それは少なくとも触媒の設計には、触媒機構を挿入できる足場が必要というためである<ref name="baker10">{{cite journal|last=Baker|first=D|title=An exciting but challenging road ahead for computational enzyme design.|journal=Protein Science|date=October 2010|volume=19|issue=10|pages=1817–9|pmid=20717908|doi=10.1002/pro.481|pmc=2998717}}</ref>。

21世紀の最初の10年間で、''de novo''酵素設計と再設計は大きく進展した。David Bakerらは、3つの主要な研究で、逆[[アルドール反応]]<ref name="jiang08">{{cite journal |doi=10.1126/science.1152692 |title=De Novo Computational Design of Retro-Aldol Enzymes |year=2008 |last1=Jiang |first1=Lin |last2=Althoff |first2=Eric A. |last3=Clemente |first3=Fernando R. |last4=Doyle |first4=Lindsey |last5=Rothlisberger |first5=Daniela |last6=Zanghellini |first6=Alexandre |last7=Gallaher |first7=Jasmine L. |last8=Betker |first8=Jamie L. |last9=Tanaka |first9=Fujie |journal=Science |volume=319 |pages=1387–91 |pmid=18323453 |issue=5868|bibcode= 2008Sci...319.1387J |pmc=3431203}}</ref>、ケンプ離脱反応<ref name="roth08">{{cite journal |doi=10.1038/nature06879 |title=Kemp elimination catalysts by computational enzyme design |year=2008 |last1=Röthlisberger |first1=Daniela |last2=Khersonsky |first2=Olga |last3=Wollacott |first3=Andrew M. |last4=Jiang |first4=Lin |last5=Dechancie |first5=Jason |last6=Betker |first6=Jamie |last7=Gallaher |first7=Jasmine L. |last8=Althoff |first8=Eric A. |last9=Zanghellini |first9=Alexandre |journal=Nature |volume=453 |pages=190–5 |pmid=18354394 |issue=7192|bibcode= 2008Natur.453..190R|doi-access=free }}</ref>、および[[ディールス・アルダー反応]]<ref>{{cite journal|last=Siegel|first=JB|author2=Zanghellini, A; Lovick, HM; Kiss, G; Lambert, AR; St Clair, JL; Gallaher, JL; Hilvert, D; Gelb, MH; Stoddard, BL; Houk, KN; Michael, FE; Baker, D|title=Computational design of an enzyme catalyst for a stereoselective bimolecular Diels-Alder reaction.|journal=Science|date=July 16, 2010|volume=329|issue=5989|pages=309–13|pmid=20647463|bibcode= 2010Sci...329..309S |doi= 10.1126/science.1190239|pmc=3241958}}</ref>のための酵素を''de novo''設計した。さらに、Stephen Mayoらは、ケンプ離脱反応において最も効率的な既知の酵素を設計するための反復法を開発した<ref>{{cite journal|last=Privett|first=HK|author2=Kiss, G |author3=Lee, TM |author4=Blomberg, R |author5=Chica, RA |author6=Thomas, LM |author7=Hilvert, D |author8=Houk, KN |author9= Mayo, SL |title=Iterative approach to computational enzyme design.|journal=Proceedings of the National Academy of Sciences of the United States of America|date=March 6, 2012|volume=109|issue=10|pages=3790–5|pmid=22357762|bibcode= 2012PNAS..109.3790P |doi= 10.1073/pnas.1118082108 |pmc=3309769}}</ref>。また、[[:en:Bruce Donald|Bruce Donald]]の研究室では、計算機的タンパク質設計を使用して、{{仮リンク|グラミシジンS|en|Gramicidin S}}を生成する[[非リボソームペプチド|非リボソームペプチド合成酵素]]の[[タンパク質ドメイン]]の1つの特異性を、その天然基質[[フェニルアラニン]]から荷電アミノ酸を含む他の非同族基質に切り替えることに成功し、再設計された酵素は野生型に近い活性を持っていた<ref name="chen09">{{cite journal|last=Chen|first=CY|author2=Georgiev, I |author3=Anderson, AC |author4= Donald, BR |title=Computational structure-based redesign of enzyme activity.|journal=Proceedings of the National Academy of Sciences of the United States of America|date=March 10, 2009|volume=106|issue=10|pages=3764–9|pmid=19228942|bibcode= 2009PNAS..106.3764C |doi= 10.1073/pnas.0900266106 |pmc=2645347}}</ref>。

=== 親和性のための設計 ===

[[タンパク質間相互作用]]は、ほとんどの生物学的プロセスに関与している。[[アルツハイマー病]]、多くの[[がん]]（[[P53遺伝子|TP53]]など）、ヒト免疫不全ウイルス（[[HIV]]）感染症など、治療が最も困難な疾患の多くは、タンパク質間相互作用が関係している。したがって、このような疾患を治療するためには、相互作用のパートナーの1つに結合し、その結果、疾患の原因となる相互作用を破壊するタンパク質またはタンパク質様治療薬を設計することが望ましい。そのためには、パートナーとの親和性を持つタンパク質治療薬を設計する必要がある。

タンパク質の安定性を支配する原理は、タンパク質間の結合を支配するため、タンパク質間相互作用は、タンパク質設計アルゴリズムを用いて設計することができる。しかし、タンパク質間相互作用設計では、一般的なタンパク質設計にはない課題がある。最も重要な課題の1つは、一般に、タンパク質間の界面はタンパク質コアよりも極性が高く、結合には脱溶媒和と水素結合形成のトレードオフが伴うことである<ref name="kuhlman2009">{{cite journal|last=Karanicolas|first=J|author2=Kuhlman, B |title=Computational design of affinity and specificity at protein–protein interfaces.|journal=Current Opinion in Structural Biology|date=August 2009|volume=19|issue=4|pages=458–63|pmid=19646858|doi=10.1016/j.sbi.2009.07.005|pmc=2882636}}</ref>。この課題を克服するために、Bruce Tidorらは、静電的寄与に着目して抗体の親和性を改善させる方法を開発した。その結果、研究で設計された抗体の場合、界面の残基の脱溶媒和コストを下げることで、結合ペアの親和性が高まることを発見した<ref name="kuhlman2009" /><ref>{{cite journal|last=Shoichet|first=BK|title=No free energy lunch.|journal=Nature Biotechnology|date=October 2007|volume=25|issue=10|pages=1109–10|pmid=17921992|doi=10.1038/nbt1007-1109|s2cid=5527226}}</ref><ref>{{cite journal|last=Lippow|first=SM|author2=Wittrup, KD |author3=Tidor, B |title=Computational design of antibody-affinity improvement beyond in vivo maturation.|journal=Nature Biotechnology|date=October 2007|volume=25|issue=10|pages=1171–6|pmid=17891135|doi=10.1038/nbt1336|pmc=2803018}}</ref>。

==== 結合予測のスコアリング ====

結合は、遊離タンパク質の最低[[自由エネルギー|エネルギー]]立体配座（<var>E<sub>P</sub></var> および <var>E<sub>L</sub></var>）と、結合した複合体の最低エネルギー立体配座（<var>E<sub>PL</sub></var>）との間のトレードオフを伴うため、タンパク質設計エネルギー関数を結合予測スコアリングに適用する必要がある。

<math>\Delta_G = E_{PL} - E_P - E_L </math>.

K*アルゴリズムでは、自由エネルギー計算に配座エントロピーを含めることで、アルゴリズムの結合定数を近似する。K*アルゴリズムでは、遊離および結合複合体の最低エネルギー配座（<var>P、</var><var>L</var><var>、</var><var>PL</var>の集合で示される）のみを考慮して、各複合体の分配関数を近似する<ref name="donald10" />。

<math>K^* = \frac{\sum\limits_{x\in PL} e^{-E(x)/RT}}{\sum\limits_{x\in P} e^{-E(x)/RT}\sum\limits_{x\in L} e^{-E(x)/RT}}</math>

=== 特異性のための設計 ===

タンパク質は多数のタンパク質と相互作用する可能性があるため、タンパク質間相互作用の設計には高い特異性が求められる。設計を成功させるには選択的結合剤（selective binder）が必要である。したがって、タンパク質設計アルゴリズムは、オンターゲット結合（またはポジティブデザイン）とオフターゲット結合（またはネガティブデザイン）を区別できなければならない<ref name="richardson1989" /><ref name="kuhlman2009" />。特異性のための設計の最も顕著な例の一つは、Amy Keatingらによる、20の{{仮リンク|bZIPドメイン|en|bZIP domain|label=bZIP}}ファミリーのうち19のbZIPに特異的な結合ペプチドの設計である。これらのペプチドのうち8つは、競合するペプチドよりも意図したパートナーに特異的であった<ref name="kuhlman2009" /><ref name="schreiber11">{{cite journal|last=Schreiber|first=G|author2=Keating, AE |title=Protein binding specificity versus promiscuity.|journal=Current Opinion in Structural Biology|date=February 2011|volume=21|issue=1|pages=50–61|pmid=21071205|doi=10.1016/j.sbi.2010.10.002|pmc=3053118}}</ref><ref>{{cite journal|last=Grigoryan|first=G|author2=Reinke, AW |author3=Keating, AE |title=Design of protein-interaction specificity gives selective bZIP-binding peptides.|journal=Nature|date=April 16, 2009|volume=458|issue=7240|pages=859–64|pmid=19370028|bibcode= 2009Natur.458..859G |doi= 10.1038/nature07885 |pmc=2748673}}</ref>。さらに、ポジティブデザインとネガティブデザインは、Andersonらが新薬に抵抗性を示す薬物標的の活性部位の変異を予測するためにも用いられた。ポジティブデザインは野生型の活性を維持するために、ネガティブデザインは薬物の結合を阻害するために使用された<ref name="frey10">{{cite journal|last=Frey|first=KM|author2=Georgiev, I |author3=Donald, BR |author4= Anderson, AC |title=Predicting resistance mutations using protein design algorithms.|journal=Proceedings of the National Academy of Sciences of the United States of America|date=August 3, 2010|volume=107|issue=31|pages=13707–12|pmid=20643959|bibcode= 2010PNAS..10713707F |doi= 10.1073/pnas.1002162107 |pmc=2922245}}</ref>。また、Costas Maranasらが最近行った計算的再設計では、''Candida boidinii'' 由来のキシロースレダクターゼの[[補因子]]特異性を[[NADPH]]から[[NADH]]に実験的に切り替えることが可能であった<ref name="khoury">{{cite journal |title=Computational design of Candida boidinii xylose reductase for altered cofactor specificity |journal=Protein Science |volume=18 |issue=10 |pages=2125–38 |date=October 2009 |doi=10.1002/pro.227 |pmc=2786976 |pmid=19693930 |last1=Khoury |first1=GA |last2=Fazelinia |first2=H |last3=Chin |first3=JW |last4=Pantazes |first4=RJ |last5=Cirino |first5=PC |last6=Maranas |first6=CD}}</ref>。

=== タンパク質リサーフェシング ===

タンパク質リサーフェシング（protein resurfacing）は、タンパク質の全体的な折りたたみ、コア、および境界領域をそのまま維持しながら、タンパク質の表面を設計することである。タンパク質リサーフェシングは、タンパク質と他のタンパク質との結合を変更するのに特に役立つ。タンパク質リサーフェシングの最も重要な応用例の一つは、NIHワクチン研究センターでの広域中和HIV抗体を選択するためのRSC3プローブの設計である。最初に、gp120 HIVエンベロープタンパク質と、以前に発見されたb12抗体との結合界面の外側にある残基が設計のために選択された。次に、進化的情報、溶解性、野生型との類似性、およびその他の考慮事項に基づいて、間隔を空けた配列を選択した。次に、Rosetta Designソフトウェアを使用して、選択した配列空間で最適な配列を発見した。その後、RSC3を用いて、長期に渡ってHIVに感染している非進行者の血清中から広域中和抗体VRC01を発見した<ref>{{cite journal|last=Burton|first=DR|author2=Weiss, RA |title=AIDS/HIV. A boost for HIV vaccine design.|journal=Science|date=August 13, 2010|volume=329|issue=5993|pages=770–3|pmid=20705840|bibcode= 2010Sci...329..770B |doi= 10.1126/science.1194693|s2cid=206528638}}</ref>。

=== 球状タンパク質の設計 ===

[[球状タンパク質]]は、疎水性のコアと親水性の表面を持つタンパク質である。球状タンパク質は、複数の立体配座を持つ[[線維状タンパク質|繊維状タンパク質]]とは異なり、安定した構造をとることが多くある。球状タンパク質の三次元構造は、繊維状タンパク質や[[膜タンパク質]]に比べて、[[X線結晶構造解析]]や[[核磁気共鳴分光法]]によって容易に決定することができる。そのため、球状タンパク質は他の種類のタンパク質よりも、タンパク質設計において魅力的である。成功したタンパク質設計の多くは、球状タンパク質を用いている。[[タンパク質設計#配列空間|RSD-1]]も[[タンパク質設計#ターゲット構造|Top7]]も、球状タンパク質の''de novo''設計である。2012年には、さらに5つのタンパク質構造がBakerグループによって設計、合成、検証された。これらの新しいタンパク質は、生物学的な機能を果たさないが、その構造は、機能的な活性部位を組み込むために拡張可能なビルディングブロックとして機能することを目的としている。これらの構造は、二次構造を特定する配列部分間の接続ループの分析に基づいた新しいヒューリスティックスを用いて、計算機的に発見された<ref>{{cite news |title=Proteins made to order |author=Jessica Marshall |url=http://www.nature.com/news/proteins-made-to-order-1.11767 |newspaper=Nature News |date=November 7, 2012 |access-date=November 17, 2012}}</ref>。

=== 膜タンパク質の設計 ===
いくつかの膜貫通型タンパク質の設計が成功しており<ref>[https://opm.phar.umich.edu/superfamilies/478 Designed transmembrane alpha-hairpin proteins] in [[:en:OPM database|OPM database]]</ref>、その他に多くの膜関連ペプチドやタンパク質もともに成功している<ref>[https://opm.phar.umich.edu/species/213 Designed membrane-associated peptides and proteins] in [[:en:OPM database|OPM database]]</ref>。最近、Costas Maranasらは、大腸菌由来の外膜ポリンType-F（OmpF）の細孔径を任意のサブナノメートルサイズに再設計し、それらを膜に組み込んでオングストロームスケールの精密な分離を実行する自動化ツールを開発した<ref>{{Cite journal|last1=Chowdhury|first1=Ratul|last2=Kumar|first2=Manish|last3=Maranas|first3=Costas D.|last4=Golbeck|first4=John H.|last5=Baker|first5=Carol|last6=Prabhakar|first6=Jeevan|last7=Grisewood|first7=Matthew|last8=Decker|first8=Karl|last9=Shankla|first9=Manish|date=2018-09-10|title=PoreDesigner for tuning solute selectivity in a robust and highly permeable outer membrane pore|journal=Nature Communications|language=en|volume=9|issue=1|pages=3661|doi=10.1038/s41467-018-06097-1|issn=2041-1723|pmc=6131167|pmid=30202038|bibcode=2018NatCo...9.3661C}}</ref>。

=== その他の応用 ===

タンパク質設計で最も望ましい用途の一つは、特定の化合物の存在を感知するタンパク質である[[バイオセンサー]]である。バイオセンサーの設計では、[[トリニトロトルエン]]（TNT）などの非天然分子用のセンサーを設計する試みもなされている<ref>{{cite journal |last1=Looger |first1=Loren L. |last2=Dwyer |first2=Mary A. |last3=Smith |first3=James J. |last4=Hellinga |first4=Homme W. |name-list-style=amp |year=2003 |title=Computational design of receptor and sensor proteins with novel functions |journal=[[:en:Nature (journal)|Nature]] |pmid=12736688 |volume=423 |issue=6936 |pages=185–190 |doi=10.1038/nature01556 |bibcode= 2003Natur.423..185L|s2cid=4387641 }}</ref>。最近では、Kuhlmanらが[[PAK1]]のバイオセンサーを設計した<ref>{{cite journal|last=Jha|first=RK|author2=Wu, YI |author3=Zawistowski, JS |author4=MacNevin, C |author5=Hahn, KM |author6= Kuhlman, B |title=Redesign of the PAK1 autoinhibitory domain for enhanced stability and affinity in biosensor applications.|journal=Journal of Molecular Biology|date=October 21, 2011|volume=413|issue=2|pages=513–22|pmid=21888918|doi=10.1016/j.jmb.2011.08.022 |pmc=3202338}}</ref>。

==参照項目==
* {{仮リンク|分子設計ソフトウェア|en|Molecular design software}}
* [[タンパク質工学]]
* {{仮リンク|タンパク質構造予測ソフトウェア|en|List of protein structure prediction software}}
* {{仮リンク|分子動力学モデリング用ソフトウェアの比較|en|Comparison of software for molecular mechanics modeling}}

==脚注==
{{Reflist|30em}}

==推薦文献==
*{{cite book |last1=Donald |first1=Bruce R. |author-link1=Bruce Donald |title=Algorithms in Structural Molecular Biology| year=2011|publisher=MIT Press |location=Cambridge, MA}}
*{{cite journal |last1=Sander |first1=Chris |last2=Vriend |first2=Gerrit |last3=Bazan |first3=Fernando |last4=Horovitz |first4=Amnon |last5=Nakamura |first5=Haruki |last6=Ribas |first6=Luis |last7=Finkelstein |first7=Alexei V. |last8=Lockhart |first8=Andrew |last9=Merkl |first9=Rainer ||year=1992 |title=Protein Design on computers. Five new proteins: Shpilka, Grendel, Fingerclasp, Leather and Aida |journal=Proteins: Structure, Function, and Bioinformatics |volume=12 |pmid=1603799 |issue=2 |pages=105–110 |doi=10.1002/prot.340120203|s2cid=38986245 }}
*{{cite journal |last1=Jin |first1=Wenzhen |last2=Kambara |first2=Ohki |last3=Sasakawa |first3=Hiroaki |last4=Tamura |first4=Atsuo |last5=Takada |first5=Shoji |name-list-style=amp |year=2003 |title=De Novo Design of Foldable Proteins with Smooth Folding Funnel: Automated Negative Design and Experimental Verification |journal=Structure |volume=11 |issue=5 |pages=581–590 |doi=10.1016/S0969-2126(03)00075-3 |pmid=12737823|doi-access=free }}
*{{cite journal |last1=Pokala |first1=Navin |last2=Handel |first2=Tracy M. |name-list-style=amp |year=2005 |title=Energy Functions for Protein Design: Adjustment with Protein–Protein Complex Affinities, Models for the Unfolded State, and Negative Design of Solubility and Specificity |journal=Journal of Molecular Biology |volume=347 |issue=1 |pages=203–227 |doi=10.1016/j.jmb.2004.12.019 |pmid=15733929}}  
[[Category:タンパク質構造]]
[[Category:タンパク質工学]]
{{DEFAULTSORT:たんはくしつせつけい}}