呉恩輝、喬良*
復旦大学化学科、上海200433、中国
微生物は人間の病気や健康と密接な関係があります。微生物群集の構成とその機能をどのように理解するかは、早急に研究されるべき大きな課題です。近年、メタプロテオミクスは微生物の組成と機能を研究するための重要な技術手段となっています。しかし、微生物群集サンプルの複雑さと不均一性の高さにより、サンプル処理、質量分析データ取得、データ分析が現在メタプロテオミクスが直面する 3 つの主要な課題となっています。メタプロテオミクス分析では、さまざまな種類のサンプルの前処理を最適化し、さまざまな微生物の分離、濃縮、抽出、溶解スキームを採用することが必要になることがよくあります。単一種のプロテオームと同様に、メタプロテオミクスにおける質量分析データ取得モードには、データ依存取得 (DDA) モードとデータ独立取得 (DIA) モードが含まれます。 DIA データ収集モードは、サンプルのペプチド情報を完全に収集でき、大きな開発の可能性があります。しかし、メタプロテオームサンプルは複雑であるため、その DIA データ分析はメタプロテオームを深くカバーすることを妨げる大きな問題となっています。データ解析の観点から最も重要なステップは、タンパク質配列データベースの構築です。データベースのサイズと完全性は、識別数に大きな影響を与えるだけでなく、種および機能レベルでの分析にも影響します。現在、メタプロテオーム データベース構築のゴールドスタンダードは、メタゲノムに基づくタンパク質配列データベースです。同時に、反復検索に基づく公共データベースのフィルタリング方法にも、強力な実用的価値があることが証明されています。具体的なデータ解析戦略の観点から見ると、ペプチドを中心としたDIAデータ解析手法が絶対的な主流を占めています。深層学習と人工知能の発展により、マクロプロテオミクスデータ分析の精度、範囲、分析速度が大幅に向上します。下流のバイオインフォマティクス解析に関しては、近年、タンパク質レベル、ペプチドレベル、遺伝子レベルで種のアノテーションを実行して微生物群集の構成を取得できる一連のアノテーションツールが開発されています。他のオミクス手法と比較して、微生物群集の機能解析はマクロプロテオミクスのユニークな機能です。マクロプロテオミクスは微生物群集のマルチオミクス解析の重要な部分となっており、適用範囲の深さ、検出感度、データ解析の完全性の点で依然として大きな発展の可能性を秘めています。
01サンプルの前処理
現在、メタプロテオミクス技術は、ヒトマイクロバイオーム、土壌、食品、海洋、活性汚泥などの分野の研究に広く活用されています。単一種のプロテオーム分析と比較して、複雑なサンプルのメタプロテオームのサンプル前処理は、より多くの課題に直面しています。実際のサンプル中の微生物の組成は複雑で、存在量のダイナミックレンジは大きく、微生物の種類によって細胞壁の構造は大きく異なり、サンプルには多くの場合、大量の宿主タンパク質やその他の不純物が含まれています。したがって、メタプロテオームの分析では、さまざまな種類のサンプルを最適化し、さまざまな微生物の分離、濃縮、抽出、溶解スキームを採用することが必要になることがよくあります。
さまざまなサンプルからの微生物メタプロテオームの抽出には、いくつかの類似点といくつかの相違点がありますが、現在、さまざまな種類のメタプロテオームサンプルに対する統一された前処理プロセスが不足しています。
02質量分析データ取得
ショットガンプロテオーム解析では、前処理後のペプチド混合物がまずクロマトグラフィーカラムで分離され、イオン化後に質量分析計に送られてデータが取得されます。単一種プロテオーム解析と同様に、マクロプロテオーム解析における質量分析データ取得モードには、DDA モードと DIA モードが含まれます。
質量分析装置の継続的な反復と更新により、より高い感度と分解能を備えた質量分析装置がメタプロテオームに適用され、メタプロテオーム解析の範囲の深さも継続的に改善されています。長い間、Orbitrap を筆頭とする一連の高分解能質量分析装置はメタプロテオームで広く使用されてきました。
原文の表 1 は、2011 年から現在までのメタプロテオミクスに関するいくつかの代表的な研究を、サンプルの種類、分析戦略、質量分析装置、取得方法、分析ソフトウェア、同定数の観点から示しています。
03質量分析データ解析
3.1 DDA データ分析戦略
3.1.1 データベース検索
3.1.2デノボシーケンス戦略
3.2 DIA データ分析戦略
04種の分類と機能注釈
さまざまな分類レベルでの微生物群集の構成は、マイクロバイオーム研究における重要な研究分野の 1 つです。近年、微生物群集の構成を取得するために、タンパク質レベル、ペプチドレベル、遺伝子レベルで種に注釈を付ける一連の注釈ツールが開発されました。
機能アノテーションの本質は、ターゲットタンパク質配列を機能タンパク質配列データベースと比較することです。 GO、COG、KEGG、eggNOG などの遺伝子機能データベースを使用すると、マクロプロテオームによって同定されたタンパク質に対してさまざまな機能アノテーション分析を実行できます。注釈ツールには、Blast2GO、DAVID、KOBAS などが含まれます。
05総括と展望
微生物は人間の健康と病気において重要な役割を果たしています。近年、メタプロテオミクスは微生物群集の機能を研究するための重要な技術手段となっています。メタプロテオミクスの分析プロセスは単一種プロテオミクスと似ていますが、メタプロテオミクスの研究対象は複雑であるため、サンプルの前処理、データ取得、データ分析に至るまで、各分析ステップで特定の研究戦略を採用する必要があります。現在、前処理法の改善、質量分析技術の継続的な革新、バイオインフォマティクスの急速な発展のおかげで、メタプロテオミクスは同定の深さと応用範囲において大きな進歩を遂げています。
マクロプロテオームサンプルの前処理のプロセスでは、サンプルの性質を最初に考慮する必要があります。環境の細胞やタンパク質から微生物をどのように分離するかは、マクロプロテオームが直面する重要な課題の 1 つであり、分離効率と微生物の損失のバランスは解決すべき緊急の問題です。第二に、微生物のタンパク質抽出では、さまざまな細菌の構造的不均一性によって引き起こされる差異を考慮する必要があります。微量範囲のマクロプロテオームサンプルにも、特定の前処理方法が必要です。
質量分析装置に関しては、主流の質量分析装置は、LTQ-Orbitrap や Q Exactive などの Orbitrap 質量分析装置に基づく質量分析計から、timsTOF Pro などのイオンモビリティ結合飛行時間型質量分析装置に基づく質量分析装置へ移行しています。 。イオンモビリティの寸法情報を備えた timsTOF シリーズの装置は、高い検出精度、低い検出限界、優れた再現性を備えています。これらは、単一種のプロテオーム、メタプロテオーム、メタボロームなど、質量分析検出を必要とするさまざまな研究分野で徐々に重要な機器になりました。長い間、質量分析装置のダイナミックレンジにより、メタプロテオーム研究におけるタンパク質のカバー範囲の深さが制限されてきたことは注目に値します。将来的には、より広いダイナミックレンジを備えた質量分析装置により、メタプロテオームにおけるタンパク質同定の感度と精度が向上する可能性があります。
質量分析データ取得では、単一種のプロテオームには DIA データ取得モードが広く採用されていますが、現在のマクロプロテオーム解析のほとんどでは依然として DDA データ取得モードが使用されています。 DIA データ収集モードは、サンプルのフラグメントイオン情報を十分に取得でき、DDA データ収集モードと比較して、マクロプロテオームサンプルのペプチド情報を十分に取得できる可能性があります。しかし、DIA データは非常に複雑であるため、DIA マクロプロテオーム データの解析は依然として大きな困難に直面しています。人工知能とディープラーニングの発展により、DIA データ分析の精度と完全性が向上すると期待されています。
メタプロテオミクスのデータ解析において重要なステップの 1 つは、タンパク質配列データベースの構築です。腸内フローラなどの人気の研究分野では、IGCやHMPなどの腸内微生物データベースを利用することができ、良好な同定結果が得られています。他のほとんどのメタプロテオミクス解析では、最も効果的なデータベース構築戦略は、やはりメタゲノム配列データに基づいてサンプル固有のタンパク質配列データベースを確立することです。複雑性が高く、ダイナミックレンジが広い微生物群落サンプルの場合、配列の深さを増やして低存在量種の同定を増やし、それによってタンパク質配列データベースのカバー範囲を向上させる必要があります。配列データが不足している場合は、反復検索方法を使用して公開データベースを最適化できます。ただし、反復検索は FDR の品質管理に影響を与える可能性があるため、検索結果を注意深く確認する必要があります。さらに、メタプロテオミクス解析における従来の FDR 品質管理モデルの適用可能性については、依然として検討する価値があります。検索戦略の観点からは、ハイブリッド スペクトル ライブラリ戦略により、DIA メタプロテオミクスの範囲の深さを向上させることができます。近年、ディープラーニングに基づいて生成された予測スペクトルライブラリは、DIAプロテオミクスにおいて優れたパフォーマンスを示しています。ただし、メタプロテオーム データベースには数百万のタンパク質エントリが含まれることが多く、その結果、大規模な予測スペクトル ライブラリが生成され、大量のコンピューティング リソースが消費され、結果的に検索スペースが大きくなります。さらに、メタプロテオーム内のタンパク質配列間の類似性は大きく異なるため、スペクトルライブラリ予測モデルの精度を保証することが困難であるため、予測スペクトルライブラリはメタプロテオミクスでは広く使用されていません。さらに、配列類似性の高いタンパク質のメタプロテオミクス解析に適用するには、新しいタンパク質推論および分類アノテーション戦略を開発する必要があります。
要約すると、メタプロテオミクス技術は、新興マイクロバイオーム研究技術として重要な研究成果を上げており、大きな発展の可能性も秘めています。
投稿日時: 2024 年 8 月 30 日