最大節約法のソースを表示
←
最大節約法
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループに属する利用者のみが実行できます:
登録利用者
。
このページのソースの閲覧やコピーができます。
'''最大節約法'''(さいだいせつやくほう、{{lang-en-short|maximum parsimony}})は、[[生物]]の系統進化を示す[[系統樹]]を推定する手法の一つ。ただし、系統樹を作製するための確率論的または決定論的な[[アルゴリズム]]は多数あるが、最大節約法はその答を求めるためのアルゴリズムではなく、複数の候補の中から最適な系統樹を選択するのに使う方法である。最大節約法においては、最も少ない変化の数で説明できる樹形が最適樹として扱われる<ref name=隈2006>{{Cite journal|和書|title=実践的系統樹推定方法 |author1=隈啓一 |author2=加藤和貴 |year=2006 |volume=44 |issue=3 |pages=185-191 |journal=化学と生物 |url=https://doi.org/10.1271/kagakutoseibutsu1962.44.185 |doi=10.1271/kagakutoseibutsu1962.44.185}}{{フリーアクセス}}</ref>。 == 理論 == === 基本的な理論 === 考えられる多くの系統樹のうちある特定の規準を満たすものを最適樹と呼称する。最大節約法においては、最大節約規準により、あるデータセットに対する最短樹が最適樹となる<ref name=系統分類学入門>{{Cite book|和書|title=系統分類学入門 分岐分類の基礎と応用|author1=E・O・ワイリー |author2=D・シーゲル=カウジー |author3=D・R・ブルックス |author4=V・A・ファンク|translator=宮正樹 |year=1992 |publisher=[[文一総合出版]] |pages=69-71 |isbn=978-4829930168}}</ref>。言い換えると、最大節約法は[[オッカムの剃刀]]による考え方である「一番単純な説明が一番優れている」という仮定を根拠としており、進化の事象数が最も少ない系統樹を最良のものとして選択する方法である<ref name=松井2021>{{Cite journal|和書|title=分子系統解析の最前線 |author=松井求 |journal=JSBi Bioinformatics Review |volume=2 |issue=1 |pages=30-57 |year=2021 |url= https://doi.org/10.11234/jsbibr.2021.7 |doi=10.11234/jsbibr.2021.7}}{{オープンアクセス}}</ref>。最大節約法では、構築された系統樹について進化の数を算出し、樹形を変化させて再び計算を行う。この2ステップを繰り返して、進化の回数が最小となる樹形を探索するのである<ref name=松井2021/>。 最大節約規準の下では、ある特定の系統樹の樹形における、ある特定の[[相同形質]]の集合の配置が最適と考えられる。この最適な配置においては、[[同形形質]]の数が最小で、[[派生形質]]の数が最大となる。ただし、この基準の下で自由に系統樹を構築するわけではなく、あくまで形成・変形された系統樹を事後的に評価することに注意が必要である。すなわち、同形形質の数を0にするような自由な系統樹の構築は不可能で、ある特定の系統樹の樹形において同形形質の数が最も数が少なくなる、というのみである<ref name=系統分類学入門/>。 Swofford and Olsen (1990) では、以下の4つの最節約規準が総括されている<ref name=系統分類学入門/>。 * ワグナーの最大節約規準 : 相同形質の集合内の形質状態の配列は決定されている。すなわち、ある形質状態aから形質状態cへの変化は、間に入る形質状態bを経る。形質状態の消失と再出現は無制限に認められる。 * フィッチの最大節約規準 : 相同形質の集合内の形質状態の配列は決定されていない。すなわち、形質状態aから形質状態cへの変化において、形質状態bが介在する必要はない。形質状態の消失と再出現は無制限に認められる。 * [[ドロの不可逆則|ドロの最節約性]] : 一つ一つの[[共有派生形質]]が固有に派生する。すなわち、共有派生形質は系統樹上で一度しか発生しない(二次的な消失は認められるが、その場合再度共有派生形質が出現することはできない)。 * カミン・ソーカルの最節約性 : 形質状態の進化は不可逆である(派生形質の二次的な消失はそれ自体が新たな派生形質として解釈される)。 これらの最節約規準を状況に応じて使い分けることで、形質状態の扱い方を変え、個々の形質に対する知見を系統樹推定に反映できる。このバランスを取る規準が、Swofford and Olsen (1990) で提案された総合最節約性である<ref name=系統分類学入門/>。 === アルゴリズム === 解析に含む内群が多い場合計算に膨大な時間を要するため、探索を開始するための初期系統樹(Initial Tree)を作成しておくのが通常の手法である<ref name=高松2005>{{Cite journal|和書|title=分子系統学の基礎 |author=高松進 |year=2005 |journal=植物防疫 |volume=59 |issue=3 |pages=64-69 |url=http://jppa.or.jp/archive/pdf/59_03_20.pdf}}</ref>。初期系統樹はランダムなものか、[[非加重結合法]]あるいは[[近隣結合法]]により求められたものであることが多い<ref name=松井2021/>。形質(DNAの場合はある部分の塩基配列<ref name=隈2006/>)iにおける形質状態aを節(ノード)kに割り当てた場合、pとqと節kと枝で繋がる次の節とし、<math>S_{ab}</math>を状態aから状態bへの進化回数(ステップ数){{Refnest|group="注"|より厳密には、形質状態aからbへの遷移に伴う「コスト」である。コストは進化回数の他に、形質状態の遷移確率のある関数値として定義されることがある<ref name=三中1998>{{Cite journal|和書|year=1998 |author=[[三中信宏]] |pages=49-72 |計量生物学 |volume=19 |issue=Special Issue |url=https://doi.org/10.5691/jjb.19.S49 |doi=10.5691/jjb.19.S49 |title=最節約法に基づく分子系統樹推定:系統樹の森の探検}}</ref>。}}とすると、この系統樹における最小の進化数は以下の再帰関数で定義される<ref name=松井2021/>。 <math>C_k^i(a)=\min_{b}(C_p^i(b)+S_{ab})+\min_{b}(C_q^i(b)+S_{ab})</math> ただしkが葉、すなわち次の節と枝で繋がることのない系統寿の末端の節である場合、形質の状態がaのときは<math>C_k^i(a)=0</math>、a以外のときは<math>C_k^i(a)=\infty</math>とする。また、全ての形質について<math>S_{aa}=0</math>、aと異なる形質bについて<math>S_{ab}=1</math>と定義すると、重みづけを行っていない非加重最大節約法となる。それ以外の場合には重みづけを行っている加重最大節約法となる<ref name=松井2021/>。この"重み"は、研究者が選択した最節約性の種類に反映される、形質進化の性質に関連する研究者側の仮定を表現している<ref name=系統分類学入門/>。 別の形質ではそれぞれ異なるステップ数が必要となるため、樹形全体の最小ステップ数Cは全ての形質の最小ステップ数の総和に等しい<ref name=隈2006/>{{Refnest|group="注"|ただし、形質の変化が生じておらず[[原始形質]]が全ての内群で保存されている場合や、内群のうち1つの節でのみ派生形質が出現している([[固有派生形質]])場合、これらの形質状態は類縁関係の推測に役立てることはできない。このため、必ずしも全ての形質において計算を行う必要はない<ref name=隈2006/>。}}。ここで、nは配列の長さ、Bは全ての形質状態(DNAの塩基配列の場合は[[アデニン]]、[[チミン]]、[[グアニン]]、[[シトシン]]の4塩基)、rootは系統樹の根となる節を指す<ref name=松井2021/>。 <math>C=\sum_{i=1}^n\min_{a\in B}C_{root}^i(a)</math> 上記の式で系統樹全体の進化数を計算した後、樹形を変化させながらその樹形における最小のステップ数を計算して、最適な樹形を探索していく<ref name=松井2021/>。この探索は発見的探索法と呼ばれ<ref name=高松2005/>、Nearest neighbor interchanges(NNI)、Subtree pruning regrafting(SPR)、Tree bisection-reconnection(TBR)などの手法がある。なお、発見的探索法は同じく形質状態法に分類される系統樹推定法である[[最尤推定|最尤法]]と共通する<ref name=松井2021/>。 === 信頼性の評価 === かつて、最大節約法を含む系統推定法で得られた最適樹の信頼性評価には[[内部枝検定]]や[[下川・長谷川検定]]が一般に使用されていた。2021年現在では最大節約法・[[最尤推定|最尤法]]・[[近隣結合法]]では[[ブートストラップ法]]が標準的に使用されている<ref name=松井2021/>。 == 特徴 == 最大節約法はHenning (1966) で形態形質を用いた系統推定法として提唱された。2021年現在、最大節約法は[[同形形質]]や[[長枝誘引]]の問題があるため、[[塩基]]配列や[[アミノ酸]]配列などの分子系統解析に用いられることは多くない。ただし、分子データが保存されていない[[化石]]種の系統推定など、形態形質に基づいて系統樹を推定する場合にはよく用いられている。 [[近隣結合法]]や[[最尤推定|最尤法]]など最大節約法以外の系統推定法も数多く存在するが、松井 (2021) では形態に基づく解析の場合には最大節約法が推奨されている<ref name=松井2021/>。 最大節約法は他の形質状態法(最尤法とベイズ法)と同様に、計算量が多く、計算時間が長いという欠点がある。追加された節に繋がる可能性が全ての枝に存在するため、内群の生物群を1つ追加すると可能な系統樹の数は2倍となり、2つ追加すると4倍、3つ追加すると8倍、と[[指数関数的成長]]を見せる<ref name=長谷川>{{Cite web|和書|title=第7章 進化と系統 -進化の歴史を再現する- |author=長谷川英祐 |publisher=[[北海道大学大学院農学研究院・大学院農学院・農学部]] |accessdate=2021-10-23 |url=http://lab.agr.hokudai.ac.jp/ecosys/ecolgy/Nattoku/nattoku7.htm}}</ref>。数式的に表すと、系統樹の樹形の総数はn個のOTU(操作上分類単位、系統樹の葉にあたる分類群)に対して<math>\frac{(2n-3)!} {2^{n-2}(n-2)!}</math>だけ存在するため、トータルの計算量はOTUの数に対して[[階乗]]のオーダーとなる<ref name=益子2003>{{Cite journal|和書|title=分枝系統樹構成法に関する最新技術動向|journal=情報処理学会第65回全国大会講演論文集 |author1=益子理絵 |author2=山田真介 |author3=山名早人 |year=2003 |pages=233-234 |issue=1}}</ref>。このため、最尤法ほどではないにせよ、計算時間の長さが指摘されている<ref name=長谷川/>。 また、最大節約法はステップ数が最小の樹形を最適樹として扱うため、複数回の進化が同一の形質において起きている場合にその進化を検知できず、進化回数を過小評価してしまう。[[収斂進化]]が数多く起きている場合には誤った推定結果が得られることになる<ref name=長谷川/><ref name=益子2003/>。長谷川英祐は、実際に起きた進化回数が少ない場合に最大節約法の有効性が高いと考えている<ref name=長谷川/>。 == 利用 == 最大節約法による系統推定は無償ソフトウェアで実行できる。代表的なソフトウェアには{{仮リンク|PHYLIP|en|PHYLIP}}や{{仮リンク|PAUP*|en|PAUP*}}<ref name=隈2006/><ref name=高松2005/>、TNTやPOYがある<ref name=三中2009>{{Cite journal|和書|url=http://jppa.or.jp/archive/pdf/63_03_66.pdf |author=[[三中信宏]] |journal=植物防疫 |year=2009 |volume=63 |issue=3 |title=分子系統学:最近の進歩と今後の展望 |pages=192-196}}</ref>。 == 脚注 == {{脚注ヘルプ}} === 注釈 === {{Notelist2}} === 出典 === {{Reflist|2}} == 関連項目 == *[[距離行列法]] **[[非加重結合法]](UPGMA) **[[近隣結合法]](NJ法) *[[最尤推定|最尤法]](ML法) *[[ベイズ法]](BI法) {{デフォルトソート:さいたいせつやくほう}} [[Category:系統学]] [[Category:分類学 (生物学)]] [[Category:進化]] [[Category:数学に関する記事]]
このページで使用されているテンプレート:
テンプレート:Cite book
(
ソースを閲覧
)
テンプレート:Cite journal
(
ソースを閲覧
)
テンプレート:Cite web
(
ソースを閲覧
)
テンプレート:Lang-en-short
(
ソースを閲覧
)
テンプレート:Notelist2
(
ソースを閲覧
)
テンプレート:Reflist
(
ソースを閲覧
)
テンプレート:Refnest
(
ソースを閲覧
)
テンプレート:オープンアクセス
(
ソースを閲覧
)
テンプレート:フリーアクセス
(
ソースを閲覧
)
テンプレート:仮リンク
(
ソースを閲覧
)
テンプレート:脚注ヘルプ
(
ソースを閲覧
)
最大節約法
に戻る。
ナビゲーション メニュー
個人用ツール
ログイン
名前空間
ページ
議論
日本語
表示
閲覧
ソースを閲覧
履歴表示
その他
検索
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
特別ページ
ツール
リンク元
関連ページの更新状況
ページ情報