メタボロームと臨床指標を機械学習と組み合わせることで、塗抹標本を正確に検出するための有望な診断マーカーが得られます
ホームページホームページ > ニュース > メタボロームと臨床指標を機械学習と組み合わせることで、塗抹標本を正確に検出するための有望な診断マーカーが得られます

メタボロームと臨床指標を機械学習と組み合わせることで、塗抹標本を正確に検出するための有望な診断マーカーが得られます

Oct 03, 2023

BMC 感染症第 22 巻、記事番号: 707 (2022) この記事を引用

1276 アクセス

4 引用

1 オルトメトリック

メトリクスの詳細

結核(TB)は、新型コロナウイルス感染症(COVID-19)の世界的なパンデミックが発生するまで、長い間(2014年から2019年)世界の主要な致死性感染症であり、今でも世界の死亡原因のトップ10に入っています。 世界中でこれほど多くの結核患者と死亡例が存在する重要な理由の 1 つは、特に一部の塗抹陰性肺結核 (SNPT) の場合、一般的な検出方法を使用した結核の正確な診断が難しいためです。 メタボロームと機械学習の急速な発展は、結核の正確な診断に大きな機会をもたらします。 しかし、塗抹陽性および塗抹陰性肺結核 (SPPT/SNPT) の精密診断のための代謝物バイオマーカーはまだ解明されていません。 この研究では、メタボロミクスと臨床指標を機械学習と組み合わせて、SPPT および SNPT 患者を正確に識別するための新しい診断バイオマーカーをスクリーニングしました。

非標的血漿メタボロームプロファイリングは、27 人の SPPT 患者、37 人の SNPT 患者および対照に対して実施されました。 次に、直交部分最小二乗判別分析 (OPLS-DA) を実行して、3 つのグループ間の差次的な代謝産物をスクリーニングしました。 代謝物富化パスウェイ、ランダム フォレスト (RF)、サポート ベクター マシン (SVM)、および多層パーセプトロン ニューラル ネットワーク (MLP) は、それぞれ Metaboanalyst 5.0、「caret」 R パッケージ、「e1071」 R パッケージ、および「Tensorflow」 Python パッケージを使用して実行されました。

メタボロミクス分析により、SPPT および SNPT 患者の血漿中の脂肪酸およびアミノ酸代謝産物の有意な濃縮が明らかになり、SPPT サンプルでは脂肪酸およびアミノ酸代謝におけるより深刻な機能不全が示されました。 さらにRF分析を行ったところ、SPPT、SNPT患者、対照を高精度(83~93%)で識別するための10の特徴(2つの脂質/脂質様分子と7つの有機酸/誘導体、および1つの臨床指標)を含む4つの最適化された診断バイオマーカーの組み合わせが明らかになった。 )、SVM と MLP によってさらに検証されました。 その中で、MLP は 3 つのグループを同時に正確に識別する際に最高の分類パフォーマンス (94.74%) を示し、RF/SVM よりも MLP がある程度有利であることを示唆しています。

私たちの発見は、SPPTおよびSNPT患者の血漿代謝学的特徴を明らかにし、さまざまなタイプの結核の正確な診断のためのいくつかの新規で有望な診断マーカーを提供し、ビッグデータからバイオマーカーをスクリーニングする際の機械学習の可能性を示しています。

査読レポート

WHO の報告によると、結核菌 (Mtb) によって引き起こされる結核 (TB) は、新型コロナウイルス感染症 (COVID-19) の世界的なパンデミック (2020 年から 2021 年) まで、長期間 (2014 年から 2019 年) にわたって世界の主要な致死性感染症でした [1]。毎年約 1,000 万人の新たな結核患者が発生しました [2、3]。 国家通知可能な疾病報告システム (NNDRS) から収集されたデータによると、新疆の年間発生率は 100,000 人あたり 169.05 人で、カシュガルで報告された PTB (肺結核) の年間平均発生率は、2011 年から 2020 年まで 100,000 人あたり 450.91 人でした [4]。 。 世界中で結核患者や死亡例がこれほど多いのはなぜでしょうか? 理由の 1 つは、結核、特に通常他の肺疾患と同様の症状を示す一部の塗抹陰性肺結核 (SNPT) 症例の場合、結核の正確な診断が難しいためです [5、6]。 一部の国/地域では、SNPT 患者が全結核症例の 50% 以上を占めていることさえあります [7]。

現在、3 つの一般的な方法 (喀痰塗抹顕微鏡検査、喀痰培養検査、Xpert MTB/RIF アッセイ) でほとんどの結核患者に対して比較的正確な診断が可能ですが、依然としていくつかの欠点があります (喀痰塗抹顕微鏡検査の感度が比較的低い、喀痰培養には時間がかかり、Xpert には比較的コストがかかるため)、さらに偽陰性/偽陽性のケースも発生します [1、6、8、9、10]。 診断が失敗すると、治療が遅れ、治療効果が低くなり、治療費が高くなる可能性があります[11、12]。 現在、さまざまな種類の結核をタイムリーかつ正確に検出する方法は、依然として世界的な結核対策にとって大きな課題となっています。

さまざまなオミクス技術の急速な発展は、さまざまな種類の疾患を正確に診断するための大きな機会を提供しています[13、14、15、16]。 中でも、メタボロームは疾患の遺伝子型や表現型と密接に関連していることが報告されているため、さまざまな疾患の検出、診断、治療のためのバイオマーカーの発見に広く応用されています[17]。 結核の研究分野では、Deng et al. 活動性結核患者の尿中のグルタチオンとヒスタミンが大幅に変化し、これにより潜在性結核感染患者と区別できる可能性があると報告した[18]。 Huang らは、結核診断のためのいくつかの潜在的な血漿代謝物バイオマーカー (キサンチン、4-ピリドキサート、および d-グルタミン酸) を提供しました [19]。 Sun らは、血漿中の L-バリン、ピルビン酸、ベタインによる小児結核診断のための潜在的な代謝物バイオマーカーをいくつか明らかにしました [20]。 しかし、塗抹陽性および塗抹陰性結核 (SPPT および SNPT) の精密診断のための代謝物バイオマーカーはまだ解明されていません。

私たちの研究では、SPPT患者27名、SNPT患者37名、対照36名から血漿メタボローム分析を実施しました。 メタボロミクスプロファイリングにより、SPPT および SNPT 患者における脂肪酸およびアミノ酸代謝の機能不全が明らかになりました。 次に、4 つの最適化された診断バイオマーカーの組み合わせ (2 つの脂質/脂質様分子と 7 つの有機酸/誘導体、および 1 つの臨床指標) がスクリーニングされ、ランダム フォレスト (RF) を通じて SPPT および SNPT 患者と対照の正確な診断が行われました。 4 つの組み合わせの分類パフォーマンスは、他の 2 つの機械学習手法、サポート ベクター マシン (SVM) と多層パーセプトロン ニューラル ネットワーク (MLP) によってさらに検証されました。 私たちの研究結果は、SPPT および SNPT 患者のメタボローム特性を明らかにし、さまざまなタイプの結核患者の正確な診断のためのいくつかの有望な診断マーカーを提供し、診断バイオマーカーの検出における機械学習の可能性を示しました。

私たちの研究では、すべての結核患者(SPPT患者27名とSNPT患者37名を含む)は、2017年10月から2018年10月の間にカシュガルの結核予防治療研究所、アクスの第二人民病院、クチャ郡感染症病院から募集された。新疆医科大学第一附属病院からの結核に感染していない対照群36人(Ctrl)も登録した(表1、追加ファイル1:図S1)。 結核の診断は、肺結核の診断 (WS 288-2017) に従って、臨床症状と微生物学的証拠に基づいて行われました。 SPPT 患者は、以下の微生物学的証拠のいずれかが得られた場合に診断されます:(1)抗酸菌染色陽性、(2)Mtb 培養陽性、(3)Xpert 検査陽性。 SNPT患者は、抗酸菌は陰性であったが、古典的な臨床症状に基づいて診断された。 除外基準には以下が含まれる:(1) 治療期間中の結核患者。 (2) 妊娠合併症、心機能不全、腎疾患、精神疾患、胃腸疾患、コントロール不良の高血圧、およびいくつかの重度のストレス状態(心血管イベントや脳血管イベント、重度の感染症、外傷性手術、および重度の消耗性疾患)。 この研究は、新疆医科大学第一付属病院の倫理委員会によって承認されました(20171123-06-1908A)。

各参加者から合計 0.5 ~ 1 mL の全血サンプルが、ヘパリン抗凝固採取チューブを使用した肘静脈瀉血によって採取されました。 次に、血液サンプルを 10 分間遠心分離して (1500 rpm/分、4 °C)、血球を除去し、上清を液体窒素中で直ちに凍結し、使用するまで -80 °C で保存しました。 凍結血漿サンプルを 4 °C でゆっくりと解凍し、各 100 μL アリコートを 400 μL の予冷したメタノール/アセトニトリル (1:1、v/v) 溶液と混合しました。 ボルテックス後、混合物を -20 °C で 10 分間インキュベートし、その後 15 分間遠心分離しました (14,000 rcf、4 °C)。 上清を凍結乾燥し、LC-MS/MS 分析用に 100 μL アセトニトリル/水 (1:1、v/v) 溶液で再構成しました (Shanghai Applied Protein Technology Co., Ltd、上海、中国)。

代謝物は血漿サンプルから抽出されました。 非標的メタボロミクス分析は、超高速液体クロマトグラフィー (UHPLC、1290 Infinity LC、Agilent Technologies、パロアルト、カリフォルニア州、米国) および四重極飛行時間型質量分析計 (TripleTOF 6600; AB Sciex、Framingham、米国マサチューセッツ州)。 分離は、2.1 mm × 100 mm ACQUITY UPLC BEH 1.7 μm カラム (Waters、Wexford、アイルランド) を使用して実行されました。 移動相は、A. 25 mM 酢酸アンモニウムと 25 mM 水酸化アンモニウムから構成されました。 B. アセトニトリル。 グラジエント溶出は次のように実行しました: 95% B で 0.5 分間、7 分で 65% まで直線的に減少しました。次に、グラジエントは 2 分で 40% まで減少し、0.1 分で 95% まで増加し、その後再度-平衡期間は 3 分間採用。 流量は 0.3 mL min-1、カラム温度は 25 °C、注入量は 2 μL に設定されました。 ESI 条件は次のとおりです。イオン ソース ガス 1(ガス 1): 40 psi。 イオン源ガス 2 (Gas2): 80 psi; カーテンガス (CUR): 30 psi; 源泉温度:650℃; IonSpray フローティング電圧 (ISVF) ± 5500 V。生データは、MSconventer (ProteoWizard、パロアルト、カリフォルニア州、米国) によって MzXML に変換され、アライメントのために XCMS ソフトウェア (Scripps Research Institute、ラ ホーヤ、カリフォルニア州、米国) にインポートされました。特徴の検出、保持時間の補正、データのフィルタリング。

多変量解析は、SIMCA-P ソフトウェア (バージョン 14.1 Umetrics、Umea、スウェーデン) を使用して実行されました。 次に、直交部分最小二乗判別分析 (OPLS-DA、Umetrics、Umea、スウェーデン) を実行して、差次的な代謝産物をスクリーニングし、7 重交差検証および応答順列テストを使用して OPLS-DA モデルの堅牢性を評価しました。 。 差次的に豊富な代謝物 (DAM) は、OPLS-DA モデルから得られた投影における変数重要度 (VIP) > 1 および Student の t 検定 p 値 (p < 0.05) に基づいて確認されました。 DAM の化学分類は、「ヒト メタボローム データベース (HMDB)」(https://hmdb.ca/) に従って決定されました。 代謝産物が豊富なパスウェイ分析は、Metaboanalyst 5.0 のオンライン ソフトウェアを使用して実装されました [21]。

欠損値の割合が大きい指標 (≧ 20%、詳細は追加ファイル 1: 表 S1 を参照) を削除した後、残りの 24 の臨床指標と 96 の DAM が潜在的な診断バイオマーカーをスクリーニングするために組み込まれました。 次に、カテゴリ変数はダミー変数でコード化されました。 次に、R キャレット パッケージ (http:/) の createDataPartition 関数を使用して、合計 100 名 (SPPT 患者 27 名、SNPT 患者 37 名、対照 36 名) をトレーニング セット (n = 81) とテスト セット (n = 19) にランダムに分離しました。 /topepo.github.io/caret/data-splitting.html)。 さらに、残りの指標の欠損値を代入するために K 最近傍法が採用されました [22]。 具体的には、トレーニング セットに基づいて KNN モデル (http://topepo.github.io/caret/pre-processing.html) が作成され、それがテスト セット内の欠損値を予測するために適用されました。 その結果、標準化されたデータセットが得られました。 次に、主成分分析 (PCA) を適用して、さまざまなサンプル間の全体的な臨床指標と代謝変化を検出しました [23]。 臨床指標と DAM 間のピアソン相関係数は、R ソフトウェア (https://github.com/topepo/caret/blob/master/pkg/caret/R/findCorrelation.R) の findCorrelation 関数によって計算されました。 高い平均絶対相関 (≥ 0.7) を持つ特徴は除外されました (追加ファイル 2)。

まず、事前に選択された 20 の臨床指標と 58 の特定された DAM (78 の特徴、F0 セットとして定義) が、SPPT/Ctrl、SNPT/Ctrl、SPPT/SNPT、および SPPT/SNPT/Ctrl グループの分類に含まれました。 次に、F0 セットの分類パフォーマンスを評価するために RF が採用されました。 AUC は、R の pROC パッケージの roc () 関数を使用した受信者動作特性 (ROC) 分析によって計算されました [24]。

次に、再帰的特徴削除 (R パッケージ キャレット) を使用して、RF モデル内の特徴の数を減らしました (パラメーターは「rfFuncs」と「cv」を使用) [25]。 さらに、ジニ係数の平均減少率 (MDG) を変数の重要度の測定に使用し、最終的に 90% 以上の精度を持つ重要な特徴の組み合わせが機械学習用に選択されました。 ここでは、SPPT/Ctrl、SNPT/Ctrl、SPPT/SNPT、SPPT/SNPT/Ctrl グループで選択された機能をそれぞれ F1、F2、F3、F4 として定義しました。 最終的に、上記の 4 つの特徴セットの分類精度は、他の 2 つの機械学習手法、SVM と MLP によって検証されました。 SVMは「e1071」Rパッケージを使用して実現されました。 2 つの隠れ層 (各層は 15 ノードで構成される) を含む MLP 分類アルゴリズムは、Python の "Tensorflow" パッケージを使用して完成されました [26]。 過剰適合を避けるために、トレイン セットでは 10 回の相互検証 (CV) が採用され、さらにランダムに 90% が「実際のトレイン セット」、10% が「検証セット」に 10 回分割されました。 最終的に、テスト セットは、トレーニングされた各モデルの精度、感度、特異度、陽性的中率 (PPV) および陰性的中率 (NPV) を評価するために使用されました。 コードは GitHub (https://github.com/ChenF-Lab/SPPT.git) に寄託されました。

連続変数は、平均 (標準偏差)、中央値、四分位範囲 (Q1 ~ Q3) を使用して記述されました。 カテゴリ変数は頻度率とパーセンテージとして記述されました。 独立したサンプルの t 検定は正規分布変数の平均値を比較するために使用され、一方、マン・ホイットニー U 検定は非正規分布変数に対して使用されました。 一元配置分散分析またはクラスカル ウォリス検定を使用して、3 つのグループ間の変数を比較しました。 カテゴリ変数はカイ二乗検定を使用して比較されました。 ボンフェローニ・ホルム補正を適用して、多重比較の補正された p 値を取得しました。 すべての統計分析は、R ソフトウェア (バージョン 4.0.2、オープンソースのフリー ソフトウェア) を使用して実行されました。 0.05 未満の両側 p 値は統計的に有意であるとみなされました。

私たちの研究では、結核診断のためのバイオマーカー候補を特定するために、SPPT患者27名とSNPT患者37名を含む64名の結核患者が登録されました。 36 人の非結核者も対照として含まれました。 ここでは、結核患者の大部分は男性 (59.4%) であり、結核患者の 80% 以上が農民です。 SNPT患者の年齢中央値は60.0歳(Q1~Q3:49.00~71.00)で、SPPT患者(51.0歳、Q1~Q3:32.50~71.00)および対照(43.5歳、Q1)より有意に高かった。 –Q3: 34.00–59.25)。 SPPT 患者と SNPT 患者の平均 BMI は、それぞれ 20.22 kg/m2 (SD: 3.95) と 22.82 kg/m2 (SD: 3.93) で、対照より有意に低かった (p < 0.001)。 一般的な症状は咳 (92.3%) と喀痰 (92.3%) で、次いで呼吸困難 (54.7%) と胸部不快感 (20.3%) でした。 注目すべきことに、SPPT患者の70.4%は空洞性肺結核に属しており、これはより高い細菌負荷と関連していることが以前に証明されている[27](表1)。

臨床特性分析では、結核患者のアルブミンと血清クレアチニンが大幅に減少し、赤血球沈降速度(ESR)が増加していることが示されました(表 2)。 ここで、SPPT 患者のアルブミンは SNPT 患者のアルブミンよりも有意に低く (SPPT: 35.30 g/L; SNPT: 39.20 g/L; 調整後 p = 0.002)、SPPT 患者の方がより深刻な慢性炎症/栄養失調であることを示しています [28, 29]; 血清クレアチニンは対照と比較して結核患者で有意に低かったが、SPPT患者とSNPT患者の間に差は示されず、結核薬によって誘発された腎損傷が示唆された。 SPPT 患者の ESR (67.50 mm/h) は SNPT 患者の ESR (43.00 mm/h) よりも有意に高く、ESR は活動性結核を特定し、肺結核と細菌性市中肺炎を区別することが報告されている [30]。

さらに、好中球、C反応性タンパク質、プロカルシトニンはSNPT患者よりもSPPT患者で有意に上方制御され、一方、SPPT患者のヘモグロビンはSNPT患者よりも大幅に下方制御された。 これらの指標はすべて SNPT 患者の正常範囲内であり、SPPT 患者のより強い免疫反応および炎症反応を反映しています。

SPPT、SNPT、および Ctrl グループの血漿サンプルに対してメタボローム分析を実行し、合計 103 個の DAM が同定されました (図 1A、B および追加ファイル 3、4、5)。 ヒートマップは 3 つのグループの DAM 発現プロファイルを示し、SPPT 患者のメタボロミクス プロファイリングは、対照よりも SNPT 患者のメタボロミクス プロファイリングに類似していました (図 1A)。 次に、「ヒト メタボローム データベース」(https://hmdb.ca/)による化学分類に基づいて、すべての DAM を 9 つのカテゴリーに分類しました。これには、「脂質および脂質様分子」(約 44%)、「有機酸」が含まれます。 「および誘導体」(~25%)、「有機複素環式化合物」(12%)および「有機酸素化合物」(~10%)(図1C)。

SPPT患者、SNPT患者および対照の血漿メタボローム分析。 3 つのグループ間で 103 個の異なる豊富な代謝物 (DAM、VIP > 1、p < 0.05) を示すヒートマップ。 ヒートマップ上の色付きのバーは、SPPT (赤)、SNPT (オレンジ)、および Ctrl (緑) のサンプルを表します。 カラーキーは、3 つのグループの 103 個の代謝産物のスケール化された発現レベルを示します。 B 3 つのグループ間の差次的な代謝物を示すベン図。 C HMDB データベースに基づいて、著しく異なる 103 種類の豊富な代謝物の化学的分類を示す円グラフ

SPPT/Ctrl グループでは 70 個の DAM が同定され、そのほとんどが脂質/脂質様分子 (31) および有機酸/誘導体 (16) でした (追加ファイル 3)。 対照と比較して、脂質/脂質様分子 (19 個の脂肪アシル、3 個のグリセロリン脂質など) の 77% (24/31) および有機酸/誘導体の 81.5% (13/16) が有意に下方制御される傾向を示しました。 SPPT グループでは (FC < 1、p < 0.05)、これは以前に報告されたように、SPPT 患者における脂質およびアミノ酸代謝の機能不全を示しています [31、32]。

SNPT/Ctrl グループでは 79 個の DAM が得られ、そのほとんどは脂質/脂質様分子 (37、トップ-1) および有機酸/誘導体 (16、トップ-2) にも属していました (追加ファイル 4)。 対照と比較して、SNPT サンプルでは脂質/脂質様分子の 73% (27/37) および有機酸/誘導体の 56% (9/16) が有意に下方制御される傾向を示し、これは脂質およびアミノ酸代謝の機能不全を示しています。 SNPT患者では。

SPPT/SNPT グループでは、33 個の DAM が同定され、そのほとんどが脂質/脂質様分子 (17) および有機酸/誘導体 (10) にも属していました (追加ファイル 5): 53% (9/17)脂質/脂質様分子は有意に下方制御され(4 つの脂肪アシル、2 つのグリセロリン脂質、2 つのプレノール脂質など)、そのうちの 47% (8/17) が有意に上方制御されました (5 つの脂肪アシルおよび 3 つのステロイド/ステロイド誘導体)。 ); 有機酸/誘導体の 90% (9/10) が大幅に下方制御され (8 つのカルボン酸と誘導体、および 1 つの有機炭酸/誘導体)、有意に上方制御されたのは 1 つだけ (ヒドロキシ酸/誘導体) でした。

全体として、3 つのグループ (SPPT/Ctrl、SPPT/Ctrl、および SPPT/SNPT) は、脂質/脂質様分子 (上-1) および有機酸/誘導体 (上-2) の大幅な濃縮を示しました。

3 つのグループの代謝特性を評価するために、MetaboAnalyst 5.0 を使用してこれらの DAM の経路分析をさらに実行しました。 結果は、3 つのグループ間で脂質およびアミノ酸代謝関連経路の濃縮が著しく異なることを示しました (図 2 および追加ファイル 1: 表 S2 ~ S4)。 SPPT/Ctrl グループでは、DAM は 2 つの脂肪酸代謝関連経路 (「不飽和脂肪酸の生合成経路」、「リノール酸代謝経路」) と 1 つのアミノ酸代謝関連経路 (「バリン、ロイシン、イソロイシン」) において有意に豊富でした。これは、以前に報告されたように、SPPT サンプルにおける不飽和脂肪酸およびアミノ酸の代謝が著しく制御されていないことを示しています [32、33、34、35]。 SNPT/Ctrl グループでは、DAM は SPPT/Ctrl グループと同じ 2 つの脂肪酸関連経路で有意に豊富でした。 SPPT/SNPT群では、「リノール酸代謝経路」、「グリセロリン脂質代謝経路」、「α-リノレン酸代謝経路」、「不飽和脂肪酸生合成経路」の4つの脂質関連代謝経路が大幅に濃縮され、これは、SNPT患者よりもSPPT患者の方が脂肪酸代謝のより深刻な機能不全を示している。 全体として、不飽和脂肪酸代謝に関連する 2 つの重要な濃縮経路が 3 つのグループ (SPPT/Ctrl、SNPT/Ctrl、および SPPT/SNPT) で共有されており、3 つのグループ間で同様の機能不全の脂肪酸代謝が示されています。 それらは結核の病気の進行と関連しているはずです。

3 つのグループ間で著しく濃縮された代謝経路を示す散布図。 円のサイズと色は、それぞれ濃縮された経路の影響スコアと p 値を示します。

まとめると、上記の結果は、SPPT 患者と SNPT 患者における脂肪酸とアミノ酸の代謝の機能不全を示しており、SPPT 患者のこれらの機能不全は SNPT 患者のものよりも深刻でした。

次に、すべての実用的な臨床検査指標 (24) と DAM (96) を使用して、3 つのグループ (SPPT、SNPT 患者、および対照) の分類効果を調査しました。 ここでは、HMDB データベースに基づく分類の一般的な適用性を高めるために、7 つの薬物関連代謝物 (デヒドロアビエチン酸、ジフィリン、EDTA、レボフロキサシン、酢酸ノルエチンドロン、スニチニブおよびチオエーテルアミド-PC) が除外されました [36、37]。 PCA 分析は、SPPT、SNPT、および対照サンプルを区別するために臨床指標と DAM を使用できるかどうかを調べるために最初に適用されました (図 3)。DAM は明らかな分離を示しましたが、臨床指標は 3 つのグループ間での分離が不十分でした。 DAM と組み合わせた臨床指標は、3 つのグループ間で最高の分類パフォーマンスを示しました。 ここで、PC1 と PC2 の寄与変数の上位 10 個はすべて DAM に属しており、臨床指標よりも DAM の寄与が大きいことを示しています (追加ファイル 1: 図 S2)。

SPPT、SNPT、および対照間の臨床指標 (A)、DAM (B)、およびそれらの組み合わせ (C) の主成分分析。 カラーキーは、上位 5 つの変数の寄与度を高い寄与度 (赤みがかった矢印) から低い寄与度 (青みがかった矢印) まで示します。

120 のすべての特徴 (24 の臨床指標と 96 の DAM) について、ペアごとの特徴間の相関係数がさらに計算されました (追加ファイル 2)。 42 個の特徴は、平均絶対相関係数が高い (≥ 0.7) ため除外され、残りの 78 個の特徴は 3 つのグループ間の分類分析用に F0 セットとして示されました。 次に、RF 分析と ROC 分析を使用して、SPPT/Ctrl、SNPT/Ctrl、SPPT/SNPT、および SPPT/SNPT/Ctrl グループの 78 個の特徴の分類パフォーマンスを評価しました。 結果は、SPPT/Ctrl、SNPT/Ctrl、および SPPT/ のバイナリ分類について、10 倍の相互検証の平均精度が 98% (SD: 0.06)、100% (SD: 0.00)、および 92% (SD: 0.09) であることを示しました。それぞれ検証セット内の SNPT グループ (追加ファイル 1: 表 S5)。 さらに、テストセット内のすべてのバイナリ分類で 100% の精度 (AUC: 1.00) が得られました (追加ファイル 1: 図 S3)。 SPPT/SNPT/Ctrl グループの 3 クラス分類では、78 個の特徴は検証セット (平均精度: 95% (SD: 0.09) およびテスト セット (精度: 94.74%、感度: 80%、 SPPT、SNPT、およびコントロールグループの場合は 100%、100%、特異度:SPPT、SNPT、およびコントロールグループの場合は 100%、91.67%、および 100%、PPV:SPPT、SNPT およびコントロールグループの場合は 100%、87.50%、および 100% ; NPV: SPPT、SNPT および対照群で 93.33%、100%、および 100%;) これらは、臨床指標と DAM (F0) の組み合わせを使用した、SPPT および SNPT 患者と対照間の正確な分類を示しました。

最適化された診断バイオマーカーの組み合わせを探索するために、ランダム フォレスト アルゴリズムを使用して分類に対する特徴の寄与を評価しました。 その結果、2つのバイオマーカーの組み合わせ(アルブミンと9-OxoODE、 SPPT とコントロールを正確に区別するための 3 つのバイオマーカーの組み合わせ (L-ピログルタミン酸 (PGA)、エンテロスタチン ヒト、および 9-OxoODE、「F2 セット」と定義))、SNPT とコントロールを正確に区別するための 3 つのバイオマーカーの組み合わせSPPT と SNPT を正確に区別するためのバイオマーカーの組み合わせ (Val-Ser、メトキシ酢酸 (MAA) および 3-ヒドロキシ酪酸エチル、「F3 セット」と定義)、および 9 つのバイオマーカーの組み合わせ (9-OxoODE、PGA、Val-Ser、エチル 3) -ヒドロキシ酪酸、MAA、エンテロスタチンヒト、DL-ノルバリン、His-Proおよびエイコサペンタエン酸(EPA)、「F4セット」と定義)により、SPPTおよびSNPT患者と対照を同時に正確に識別する(図4、追加ファイル1:表) S6)。

SPPT、SNPT患者を対照から識別するためのスクリーニングされた特徴の重要性。 ランダムフォレストモデルを使用して、SPPT/Ctrl、SNPT/Ctrl、およびSPPT/SNPTグループを(上から下に)正確にバイナリ分類するための、さまざまな最適化された組み合わせから得られる臨床的および代謝的特徴の重要性。 B SPPT、SNPT、および Ctrl グループの同時分類のための 4 つの最適化された組み合わせから得られる臨床的および代謝的特徴の重要性

上記のバイオマーカーの組み合わせ (F1、F2、および F3) のバイナリ分類パフォーマンスは、高い精度、感度、および特異性を備えたテスト セットでさらに検証されました (精度: SPPT/Ctrl 分類子で 83.33%、SNPT/Ctrl 分類子で 92.86%、83.33%) SPPT/SNPT 分類器の場合; 感度: SPPT/Ctrl 分類器の場合 80.00%、SNPT/Ctrl 分類器の場合 85.71%、SPPT/SNPT 分類器の場合 80.00%; 特異度: SPPT/Ctrl 分類器の場合 85.71%、SNPT/Ctrl 分類器の場合 100%、 SPPT/SNPT 分類子で 85.71%、PPV: SPPT/Ctrl 分類子で 80.00%、SNPT/Ctrl 分類子で 100%、SPPT/SNPT 分類子で 80.00%、NPV: SPPT/Ctrl 分類子で 85.71%、SNPT/Ctrl で 87.50%分類子、SPPT/SNPT 分類子では 85.71%、表 3)。 SPPT/SNPT/Ctrl グループでは、最適化されたバイオマーカーの組み合わせ (F4: 9 特徴) により、より高い 3 クラス分類精度 (89.47%)、感度 (SPPT、SNPT、およびコントロール グループで 80%、85.71%、および 100%) を達成できました。 、特異度 (SPPT、SNPT、およびコントロール グループの場合は 100%、91.67%、および 91.67%)、PPV (SPPT、SNPT およびコントロール グループの場合は 100%、85.71%、および 87.50%)、および NPV (93.33%、91.67%、および 100%) SPPT、SNPT、およびコントロールグループの場合)(図5)。 これらの結果は、SPPT および SNPT の患者および対照のいずれかを正確に識別するための 4 つの特徴セット (F1 ~ F4) の優れたパフォーマンスを実証しました。

SPPT、SNPT、およびテストセットに設定されたF4によるコントロールを区別するための混同行列。 混同行列は左から右に、それぞれ RF、SVM、MLP モデルを使用したテスト セット内の SPPT/SNPT/Ctrl グループの分類パフォーマンスを示します。 F4 セット: 9-OxoODE、PGA、Val-Ser、3-ヒドロキシ酪酸エチル、MAA、エンテロスタチンヒト、DL-ノルバリン、His-Pro、エイコサペンタエン酸

他の 2 つの機械学習方法 (SVM および MLP) をさらに採用して、上記の 4 つのバイオマーカーの組み合わせの分類性能を検証しました。 予想通り、上記の 4 つのバイオマーカーの組み合わせは、SVM 法および MLP 法でも RF 法と同様に高い分類精度を示しました (表 3、図 5)。 特に、RF および SVM 方法と比較して、MLP は最高の分類パフォーマンスを示しました (精度: 94.74%、感度: SPPT、SNPT、および対照群で 100%、85.71%、および 100%、特異度: 100%、91.67%、および 100%) SPPT、SNPT、およびコントロールグループの場合、PPV: SPPT、SNPT、およびコントロールグループの場合は 100%、100%、および 87.50%、NPV: SPPT、SNPT およびコントロールグループの場合は 100%、92.31%、および 100%) SNPT患者と対照(図5)は、MLPの疾患分類/診断における可能性を示しています。

私たちの研究では、SPPTおよびSNPT患者における脂質/脂質様分子および有機酸/誘導体の有意な濃縮が明らかになり、脂肪酸およびアミノ酸代謝の機能不全を示しており、これは以前の報告と一致している[32、33、34、35]。 。 ここで、SPPT サンプルは、脂肪酸とアミノ酸の代謝におけるより深刻な機能不全を示しました。 さらに、SPPT 患者、SNPT 患者、対照を高精度 (83.33 ~ 92.86%) で正確に分類するために、4 つの有望な診断マーカーの組み合わせ (9 つの脂質/脂質様分子および有機酸/誘導体分子と 1 つの臨床指標を含む) がスクリーニングされました。脂質様分子と臨床指標 (アルブミンおよび 9-OxoODE) を組み合わせると、SPPT 患者と対照患者を正確に区別できます (精度: 83.33%)。 2 つの脂質/脂質様分子と 1 つの有機酸分子 (PGA、エンテロスタチンヒトおよび 9-OxoODE) は、SNPT 患者と対照を正確に区別できました (精度: 92.86%)。 3 つの有機酸分子 (Val-Ser、MAA、および 3-ヒドロキシ酪酸エチル) は、SPPT 患者と SNPT 患者を正確に分類できました (精度: 83.33%)。 2 つの脂質/脂質様分子と 7 つの有機酸分子 (9-OxoODE、PGA、Val-Ser、3-ヒドロキシ酪酸エチル、MAA、エンテロスタチンヒト、DL-ノルバリン、His-Pro、EPA) は、SPPT 患者、SNPT を同時に正確に識別できます。患者と対照 (精度: 89.47%)。

ご存知のとおり、脂質/脂質様分子は、特に細菌の細胞壁において、Mtb の重要な構造材料の一種であり [38]、過酷な条件下での生存のために宿主の脂肪酸を利用するための脂質リモデリング酵素の豊富な貯蔵庫を備えています。さらに、低酸素微環境[39]、結核患者の脂質代謝の深刻な機能不全を引き起こす[40]。 アミノ酸代謝に関しては、結核は慢性消耗性疾患であるため、Mtbが人体内で生存するにはさまざまな種類のアミノ酸とタンパク質が不可欠であり、結核患者のアミノ酸代謝の機能不全につながります[32]。 予想通り、私たちの研究では、機械学習手法を通じて SPPT 患者、SNPT 患者、および対照を正確に区別するために、いくつかの有意に異なる(上方/下方制御される)脂質およびアミノ酸代謝物が特定されました。 確かに、これらのマーカーとパネルは、より大きなサンプルサイズの研究でさらなる確認と最適化を保証します。

4 つの潜在的な診断バイオマーカーの組み合わせからの 9 つの脂質/脂質様および有機酸/誘導体分子には、2 つの脂質/脂質様分子 (9-OxoODE および EPA) と 7 つの有機酸/誘導体 (PGA、DL-ノルバリン、MAA、 His-Pro、Val-Ser、3-ヒドロキシ酪酸エチルおよびエンテロスタチンヒト) (追加ファイル 3、4、5)。

まず、2 つの脂質/脂質様分子は、SPPT 患者と SNPT 患者において顕著な下方制御/阻害を示します (追加ファイル 1: 図 S5)。 ここで、9-OxoODEは、SPPT/Ctrl、SPPT/SNPT/Ctrl、SNPT/Ctrlグループの分類バイオマーカーでそれぞれ1位、1位、3位にランクされています(図4)。 以前の研究では、9-OxoODE(リノール酸の代謝産物)がPPARのリガンド核内受容体として脂肪生成機構を活性化する可能性があるため、有意に阻害された9-OxoODEは、SPPTおよびSNPT患者における脂肪分解誘発炎症反応の負の制御も反映していることが示されています。 -α および PPAR-γ [41、42、43、44]。 別の脂質/脂質様分子である EPA は、SPPT/SNPT/Ctrl の分類バイオマーカーで 7 位にランクされています (図 4)。 以前の研究では、大幅に下方制御されたEPAは、炎症誘発性サイトカインを下方制御し、免疫細胞の脂質合成を上方制御することにより、結核患者における炎症反応の機能不全を引き起こす可能性があると報告されている[45]。

潜在的な分類バイオマーカーとしての上記の 7 つの有機酸/誘導体について、対照と比較して、SPPT 患者と SNPT 患者の両方で 3 つ (PGA、MAA、および DL-ノルバリン) が有意なダウンレギュレーションを示し、His-Pro が有意なアップレギュレーションを示しました (追加ファイル 1: 図.S5)。 ここで、PGA は、SNPT/Ctrl グループと SPPT/SNPT/Ctrl グループの分類バイオマーカーでそれぞれ 1 位と 4 位にランクされています (図 4)。 大幅に下方制御された PGA は、人体内のグルタチオンの生合成を阻害することにより、Mtb の成長を改善することが報告されています [46、47、48、49]。 MAA は、SPPT/SNPT および SPPT/SNPT/Ctrl グループの分類バイオマーカーの中でそれぞれ 3 位と 5 位にランクされます (図 4)。 MAAがマイコバクテリウムタンパク質(チロシンホスファターゼB:mPTPB)の阻害剤の形成を触媒することが示されているため、大幅に下方制御されたMAAは、Mtbの生存に不可欠なmPTPBの阻害が不十分になる可能性があります[50]。 さらに、DL-ノルバリンとHis-Proは、SPPT/SNPT/Ctrlグループの分類バイオマーカーの中で8位と9位にランクされ(図4)、どちらも同様の発現傾向を示し、SPPT患者とSNPT患者の両方で機能不全が示唆されています。

残りの 3 つの有機酸バイオマーカー分子 (Val-Ser、3-ヒドロキシ酪酸エチル、およびヒトのエンテロスタチン) は、SPPT 患者と SNPT 患者の間で異なる濃縮を示します。 ここで、Val-Ser と 3-ヒドロキシ酪酸エチルは、SPPT 患者においてそれぞれ特異的に下方制御および上方制御されていることが示されています (追加ファイル 1: 図 S5)。 これらは、SPPT/SNPT グループの区別に関する特徴の中で 1 位と 2 位にランクされ、SPPT/SNPT/Ctrl グループの区別に関する特徴の中で 3 位と 2 位にランクされています (図 4)。 「エンテロスタチンヒト」はSNPT患者において特異的に上方制御されており、SNPT/Ctrl群とSPPT/SNPT/Ctrl群の区別のために選択された特徴の中でそれぞれ2位と6位にランクされています(図4)。 1 つのグループのみに特定の変化をもつ 3 つの有機酸/誘導体は、さまざまな種類の結核患者の分類に独自の特徴を示します。

さらに、アルブミンの臨床指標は、SPPT/Ctrl グループを区別するための機能セットで 2 番目にランクされており、メタボロームと臨床指標を組み合わせることで SPPT 患者の診断の精度が向上することを示しています (図 4)。 これまでの報告では、重要な栄養素および炎症関連タンパク質マーカーであるアルブミンに対する結核患者の予後マーカーが示されている[51]。

私たちの発見は、SPPT および SNPT 患者の正確な診断における機械学習の可能性をさらに示しています。 機械学習は、多次元ビッグデータの分析に広く普及しており、診断用バイオマーカーの同定 [52]、治療標的の検出 [53]、疾患の進行予測 [54]、因果関係など、多くの生物学/医学分野に広く応用されています。表現型と遺伝子型の間 [55]。 私たちの研究では、多次元データからさまざまな種類の結核を正確に分類するために、3 つの機械学習手法を使用して潜在的なバイオマーカーを選別しています。 RF は、ビッグデータの分類と特徴選択に広く適用されてきたため、正確な分類バイオマーカーをスクリーニングするために初めて採用されました。 次に、変数のランクとその予測重要度に従って、いくつかの重要な分類特徴を取得しました。 以前の研究でも、結核と非結核を区別するための RF 法の優れた性能が実証されています [56]。 他の 2 つの機械学習手法 (SVM と MLP) をさらに使用して、バイオマーカーの組み合わせの分類精度を検証しました。 SVM は、単一の分類器と比較して分類パフォーマンスを向上させるアンサンブル機械学習であり、乳がんなどの病気の進行の予測にも適用されています [57]。 MLP は事前の知識を必要としない自律学習能力で非常に有名で、結核の診断 [58] や SNPT 患者の予後リスクの評価にも使用されています [59]。 私たちの調査では、SPPT、SNPT、およびコントロールを同時に識別するための MLP の分類パフォーマンスが最高の精度 94.74% であることが示されており、RF および SVM に対する MLP の利点がある程度示唆されています。

私たちの研究にはいくつかの制限もあります。 2017年から2018年の間に3つの病院(カシュガルの結核予防治療研究所、アクスの第二人民病院、クチャ郡感染症病院)の包含基準と除外基準を満たすすべての結核患者を含めましたが、これは実際、疫学調査として必要なサンプルサイズを計算していないという私たちの研究の限界です。 トレーニング セットとテスト セットが比較的小さいため、結果の統計的検出力が低下する可能性があり、この点については、将来的にサンプル サイズを大きくした研究でさらに確認し、最適化する必要があります。 さらに、メタボロームプロファイルに対する人口統計的要因(年齢、職業、BMIなど)の影響は観察されていませんが(データは示されていません)、より大きなサンプルを使用してさらに確認することも保証されています。 確かに、私たちの分類モデルを臨床実践に応用するには、データ/ワークフロー/サンプリングに関する多くの標準化された作業が依然として必要です。 全体として、私たちの研究から得られたすべての二値および三クラス分類子は、いくつかの制限にもかかわらず、SPPT、SNPT、およびCtrlグループを正確に識別するのに優れたパフォーマンスを示し、いくつかの分類バイオマーカーは結核と密接に関連していることも報告されています[45、49、 50]。

私たちの現在の研究は、血漿代謝物と臨床指標を組み合わせることにより、SPPTおよびSNPT患者を正確に検出するための4つのバイオマーカーの組み合わせをスクリーニングするだけでなく、多次元ビッグデータからの診断用バイオマーカーの同定における機械学習の有望な応用も示しています。

ここ数十年にわたり、さまざまな診断技術が急速に進歩したにもかかわらず、肺がんなどの多くの重要な疾患において、依然として診断エラー(診断の見逃し、遅れ、または誤った診断)が最も一般的な問題となっている[52]。 マルチオミックスと機械学習は、これらの問題を解決するための強力なツールを提供し、研究者はマルチオミクスデータを機械学習と統合することで、誤診された疾患の正確な分類/診断を達成できます[15、18、52]。 私たちの研究は、マルチオミクスデータと機械学習を統合することにより、さまざまなタイプの結核を正確に検出する成功した試みを示し、さらに、さまざまな誤診疾患の精密診断に関する将来の研究に良い例とワークフローを提供します。

この研究中に生成または分析されたすべてのデータは、この公開された論文とその補足情報ファイルに含まれており、さらなる問い合わせは対応する著者に送信できます。 メタボロミクス データは、識別子 MTBLS3787 で EMBL-EBI MetaboLights データベースに寄託されています [60]。 この研究で分析に使用されたデータとコードは、GitHub (https://github.com/ChenF-Lab/SPPT.git) で入手できます。

人をコントロールする

相互検証

特異的に豊富な代謝産物

エイコサペンタエン酸

赤血球沈降速度

四分位範囲

K最近隣

メトキシ酢酸

ジニ係数の平均減少率

多層パーセプトロン ニューラル ネットワーク

結核菌

直交部分最小二乗判別分析

主成分分析

L-ピログルタミン酸

ランダムフォレスト

塗抹陰性肺結核

受信機動作特性

塗抹陽性肺結核

サポートベクターマシン

結核

投影における変数の重要性

世界保健機関。 世界の結核レポート 2021。ジュネーブ: 世界保健機関。 2021。 https://www.who.int/teams/global-tuberculosis-programme/data。

ブッシ・C、グティエレスMG。 時空間における宿主細胞の結核菌感染。 FEMS 微生物改訂版 2019;43(4):341–61。

論文 CAS PubMed PubMed Central Google Scholar

Huang H、Ding N、Yang T、Li C、Jia X、Wang G 他中国における多剤耐性結核菌の横断的全ゲノム解読と疫学研究。 クリン感染症 2019;69(3):405–13。

論文 CAS PubMed Google Scholar

Tusun D、Abulimiti M、Mammoth X、Liu Z、Xu D、Li G、他肺結核の疫学的特徴 - 中国、新疆ウイグル自治区カシュガル県、2011 ~ 2020 年。 中国CDCウィークリー。 2021;3(26):557–61。

記事 PubMed PubMed Central Google Scholar

Lv L、Li C、Zhang X、Ding N、Cao T、Jia X 他活動性および潜伏性結核菌感染症患者由来の血清エクソソームの RNA プロファイリング分析。 フロント微生物。 2017;8:1051。

記事 PubMed PubMed Central Google Scholar

Zhang G、Zhang L、Zhang M、Pan L、Wang F、Huang J 他結核患者とBCGワクチン接種者を区別するための潜在的な血清診断マーカーとして、11種類の結核菌タンパク質をスクリーニングおよび評価する。 ゲノムプロテオムバイオインフォメーション 2009;7(3):107–15。

記事 CAS Google Scholar

カンポスLC、ロシャMV、ウィラーズDM、シルバDR。 結核と HIV 感染率が高い地域における塗抹陰性肺結核 (TB) 患者の特徴。 PLoS ONE。 2016;11(1): e0147933。

論文 PubMed PubMed Central CAS Google Scholar

Steingart KR、Ng V、Henry M、Hopewell PC、Ramsay A、Cunningham J、他。 結核に対する塗抹顕微鏡検査の感度を向上させるための喀痰処理方法:系統的レビュー。 ランセット感染症 2006;6(10):664–74。

論文 PubMed Google Scholar

Chakaya J、Khan M、Ntoumi F、Aklillu E、Fatima R、Mwaba P、他。 世界結核レポート 2020 — 世界的な結核の負担、治療、予防の取り組みを反映。 Int J 感染障害 2021;113:S7

論文 CAS PubMed PubMed Central Google Scholar

ドーマン SE、シューマッハ SG、アランド D、ナベタ P、アームストロング DT、キング B 他結核菌およびリファンピシン耐性の検出のための Xpert MTB/RIF ウルトラ: 前向き多施設診断精度研究。 ランセット感染症 2018;18(1):76–84。

論文 CAS PubMed PubMed Central Google Scholar

Getahun H、Harrington M、O'Brien R、Nunn P. 資源が限られた環境における HIV 感染症またはエイズ患者における塗抹陰性肺結核の診断: 緊急の政策変更を知らせる。 ランセット。 2007;369(9578):2042–9。

論文 PubMed Google Scholar

ベーメ CC、ナベタ P、ヒレマン D、ニコル MP、シェナイ S、クラップ F、他結核およびリファンピン耐性の迅速な分子検出。 N 英語 J 医学 2010;363(11):1005–15。

論文 CAS PubMed PubMed Central Google Scholar

オリヴィエ・M、アスミス・R、ホーキンス・ジョージア、ハワード・TD、コックス・LA。 精密医療におけるマルチオミクス バイオマーカー シグネチャの必要性。 Int J Mol Sci. 2019;20(19):4781。

論文 CAS PubMed Central Google Scholar

Wang E、Cho WCS、Wong SCC、Liu S. 精密医療のための疾患バイオマーカー: 課題と将来の機会。 ゲノムプロテオムバイオインフォメーション 2017;15(2):57–8。

記事 Google Scholar

Liu L、Wu J、Shi M、Wang F、Lu H、Liu J 他食道扁平上皮癌の血清中の新たな代謝変化と予測マーカー ピペコリン酸。 ゲノムプロテオムバイオインフォメーション 2022年。

Li Y、Chen L. 大きな生物学的データ: 課題と機会。 ゲノムプロテオムバイオインフォメーション 2014;12(5):187–9。

記事 Google Scholar

ジャーマンJB、バウマンDE、ブリンDG、ファイラML、フリークHC、キングJC他 21 世紀の最初の 10 年間におけるメタボロミクス: 個人の健康への道を築く。 J・ニュートル 2004;134(10):2729–32。

論文 CAS PubMed Google Scholar

Deng J、Liu L、Yang Q、Wei C、Zhang H、Xin H 他結核および潜在性結核の診断のための潜在的なマーカーを特定するための尿メタボローム分析。 アーチ生化学生物物理学。 2021;704: 108876。

論文 CAS PubMed Google Scholar

Huang H、Shi LY、Wei LL、Han YS、Yi WJ、Pan ZW 他血漿代謝物キサンチン、4-ピリドキサート、および d-グルタミン酸は、肺結核の新しい潜在的なバイオマーカーとして機能します。 クリン・チム・アクタ。 2019;498:135–42。

論文 CAS PubMed Google Scholar

Sun L、Li JQ、Ren N、Qi H、Dong F、Xiao J 他小児結核の診断における新規血漿代謝マーカーの有用性:分類および回帰木分析アプローチ。 Jプロテオーム研究。 2016;15(9):3118–25。

論文 CAS PubMed Google Scholar

Pang Z、Chong J、Zhou G、de Lima Morais DA、Chang L、Barrette M 他 MetaboAnalyst 5.0: 生のスペクトルと機能的な洞察の間のギャップを狭めます。 核酸研究所 2021;49(W1):W388–96。

論文 CAS PubMed PubMed Central Google Scholar

Pan R、Yang T、Cao J、Lu K、Zhang ZC 他グレーの関係構造と相互情報量に基づいた K 最近傍による欠損データの補完。 アプリケーションインテル。 2015;43:614–32。

記事 Google Scholar

アブディ・H、ウィリアムズ・LJ。 主成分分析。 Wiley Interdiscip Rev Comput Stat. 2010;2:433–59。

記事 Google Scholar

Bewick V、Cheek L、Ball J. 統計レビュー 13: 受信機の動作特性曲線。 クリティカルケア。 2004;8:508。

記事 PubMed PubMed Central Google Scholar

ブライマン L. ランダムフォレスト。 マッハラーニング。 2001;45:5–32。

記事 Google Scholar

アバディ M、アガルワル A、バーハム P、ブレブド E、チェン Z、シトロ C 他 Tensor フロー: 異種システムにおける大規模な機械学習。 2015。tensorflow.org からオンラインで入手できます。

Palaci M、Dietze R、Hadad DJ、Ribeiro FK、Peres RL、Vinhas SA 他肺結核の場合の空洞疾患および定量的な喀痰細菌量。 J クリン マイクロバイオル。 2007;45(12):4064–6。

記事 PubMed PubMed Central Google Scholar

Kang W、Wu M、Yang K、Ertai A、Wu S、Geng S 他中国の塗抹陰性結核患者におけるT-SPOT.TBの陰性結果に関連する要因。 Sci Rep. 2018;8(1):4236。

論文 PubMed PubMed Central CAS Google Scholar

中尾正人、村松英人、荒川真司、酒井裕也、鈴木裕也、藤田和也、他結核患者における免疫栄養状態と肺空洞:好中球/リンパ球比の評価による再検討。 呼吸調査。 2019;57(1):60–6。

論文 PubMed Google Scholar

Berhane M、Melku M、Amsalu A、Enawgaw B、Getaneh Z、Asrie F. 肺結核と細菌性市中肺炎の鑑別診断における好中球対リンパ球数比の役割: アイダー病院とメケル病院での横断研究、エチオピア。 クリンラボ 2019、65(4)。

シュベツ OM、シェフチェンコ OS、トドリコ LD、シェフチェンコ RS、ヤキメツ VV、チョポロワ OI 他両側肺病変とマイコバクテリア排泄を伴う結核患者の炭水化物と脂質の代謝プロファイル。 ウィアド・レック。 2020;73(7):1373–6。

論文 PubMed Google Scholar

Zhang P、Zhang W、Lang Y、Qu Y、Chen J、Cui L。1H 核磁気共鳴に基づく脳脊髄液の代謝プロファイリングによる、結核性髄膜炎の代謝特徴とマーカーの同定。 Genet Evolに感染してください。 2019;68:253–64。

論文 CAS PubMed Google Scholar

コリンズ JM、ウォーカー DI、ジョーンズ DP、トゥクヴァゼ N、リュー KH、トラン VT、他ヒトの活動性肺結核を区別する結核菌関連代謝産物を検出する高解像度血漿メタボロミクス分析。 PLoS ONE。 2018;13(10): e0205398。

論文 PubMed PubMed Central CAS Google Scholar

Frediani JK、Jones DP、Tukvadze N、Uppal K、Sanikidze E、Kipiani M、他。 ヒト肺結核疾患における血漿メタボロミクス: パイロット研究。 PLoS ONE。 2014;9(10): e108854。

論文 PubMed PubMed Central CAS Google Scholar

Zhou A、Ni J、Xu Z、Wang Y、Lu S、Sha W 他 (1)h NMR分光法に基づくメタボロミクスの結核患者血清への応用。 Jプロテオーム研究。 2013;12(10):4642–9。

論文 CAS PubMed Google Scholar

[ PubMed ] Kim E、Kang YG、Kim YJ、Lee TR、Yoo BC、Jo M、他。 デヒドロアビエチン酸は、Src、Syk、および TAK1 媒介経路の抑制を介して炎症反応を抑制します。 Int J Mol Sci. 2019;20(7):1593。

論文 CAS PubMed Central Google Scholar

Kartha S、Yan L、Ita ME、Amirshaghaghi A、Luo L、Wei Y、他。 ホスホリパーゼ A2 阻害剤を組み込んだリン脂質ミセルは、神経因性疼痛を解消します。 ACSナノ。 2020;14(7):8103–15。

論文 CAS PubMed PubMed Central Google Scholar

ジャンクテ M、コックス JA、ハリソン J、ベスラ GS。 マイコバクテリアの細胞壁の組み立て。 Annu Rev 微生物。 2015;69:405–23。

論文 CAS PubMed Google Scholar

Srivastava S、Chaudhary S、Thukral L、Shi C、Gupta RD、Gupta R、他。 マイコバクテリアによる不飽和脂質の同化には補助的なシス-トランスエノイルCoAイソメラーゼが必要です。 ケムバイオル。 2015;22(12):1577–87。

論文 CAS PubMed Google Scholar

Mu J、Yang Y、Chen J、Cheng K、Li Q、Wei Y 他結核性髄膜炎患者の脳脊髄液の iTRAQ ベースの定量的プロテオミクス分析により、宿主脂質代謝の上昇が明らかになりました。 Biochem Biophys Res Commun。 2015;466(4):689–95。

論文 CAS PubMed Google Scholar

後藤 哲也、Lee JY、寺南 明、Kim YI、平井 晋、上村 哲 他ペルオキシソーム増殖因子活性化受容体アルファの活性化は、脂肪細胞の分化と脂肪酸酸化の両方を刺激します。 J脂質分析。 2011;52(5):873–84。

論文 CAS PubMed PubMed Central Google Scholar

アンドレス・コントレラス・G、デ・コスター・J、デ・ソウザ・J、ラグーナ・J、マヴァンギラ・V、ネリ・RK、他脂肪分解は、周産期の乳牛の脂肪組織におけるリノール酸由来の炎症性脂質メディエーターの生合成を調節します。 J デイリー サイエンス 2020;103(2):1944–55。

論文 CAS PubMed Google Scholar

アームストロングMM、ディアスG、ケニオンV、ホルマンTR。 ヒトリポキシゲナーゼアイソザイムによるオキソ脂質の阻害および機構の研究。 Bioorg Med Chem. 2014;22(15):4293–7。

論文 CAS PubMed PubMed Central Google Scholar

マットミラー SA、カールソン BA、ガンディ JC、ソルディージョ LM。 マクロファージのセレノタンパク質発現の低下により、アラキドン酸およびリノール酸からの酸化脂質代謝産物の生合成が変化します。 J Nutr Biochem. 2014;25(6):647–54。

論文 CAS PubMed Google Scholar

Nienaber A、Baumgartner J、Dolman RC、Ozturk M、Zandberg L、Hayford FEA、他。 オメガ 3 脂肪酸と鉄の補給は単独ではなく、結核菌に感染したマウスの感染による炎症と貧血を軽減します。 栄養素。 2020;12(9):2897。

論文 CAS PubMed Central Google Scholar

Orlowski M、Meister A. ガンマ-グルタミル回路: アミノ酸の輸送システムの可能性。 Proc Natl Acad Sci US A. 1970;67(3):1248–55。

論文 CAS PubMed PubMed Central Google Scholar

ガマラ Y、サンティアゴ FC、モリーナ=ロペス J、カスターノ J、エレーラ=キンタナ L、ドミンゲス A 他敗血症性ショックの重症患者におけるグルタチオン再生阻害によるピログルタミン酸アシドーシス。 クリティカルケア。 2019;23(1):162。

記事 PubMed PubMed Central Google Scholar

バラジー M、カミンスキー PM、マオ K、タン J、ウォーリン MS。 S-ニトログルタチオン。一酸化窒素を生成するペルオキシ亜硝酸塩とグルタチオンの反応生成物。 J Biol Chem. 1998;273(48):32009–15。

論文 CAS PubMed Google Scholar

Ly J、ラグマン M、サイン T、シン MK、トゥデラ EV、モリス D、他リポソームグルタチオンの補給は、HIV 感染者の結核菌感染に対する TH1 サイトカイン応答を回復します。 J インターフェロン サイトカイン Res. 2015;35(11):875–87。

論文 CAS PubMed PubMed Central Google Scholar

He R、Zeng LF、He Y、Wu L、Gunawan AM、Zhang ZY。 結核の病原性因子である mPTPB の選択的阻害剤を獲得するための有機触媒多成分反応。 ケム・コミューン(キャンブ)。 2013;49(20):2064–6。

記事 CAS Google Scholar

Fu YR、Yi ZJ、Guan SZ、Zhang SY、Li M。活動性肺結核患者の喀痰のプロテオミクス分析。 クリン微生物感染症。 2012;18(12):1241–7。

論文 CAS PubMed Google Scholar

Zhang J、Han X、Gao C、Xing Y、Qi Z、Liu R 他非小細胞肺がんの潜在的なバイオマーカーとしての循環無細胞 DNA 中の 5-ヒドロキシメチローム。 ゲノムプロテオムバイオインフォメーション 2018;16(3):187–99。

記事 CAS Google Scholar

リニカー S、ワン Y、ジェンキンス JL、ランドラム GA。 過去のハイスループットスクリーニングからの情報を使用して、活性化合物を予測します。 J Chem Inf モデル。 2014;54(7):1880–91。

論文 CAS PubMed Google Scholar

Wang J、Xie X、Shi J、He W、Chen Q、Chen L 他ディープラーニング アルゴリズムであるノイズ除去オートエンコーダーは、肺腺癌の新しい分子サインの特定に役立ちます。 ゲノムプロテオムバイオインフォメーション 2020;18(4):468–80。

記事 Google Scholar

アッカシA、モエンスMF。 ディープニューラルモデルを使用した生物医学テキストからの因果関係の抽出: 包括的な調査。 J バイオメッド インフォーム。 2021;119:103820。

論文 PubMed Google Scholar

Yang Q、Chen Q、Zhang M、Cai Y、Yang F、Zhang J 他結核診断のための 8 つのタンパク質バイオシグネチャーの同定。 胸郭。 2020;75(7):576–83。

論文 PubMed Google Scholar

ファン・MW、チェン・CW、リン・WC、ケ・SW、ツァイ・CF。 乳がん予測における SVM および SVM アンサンブル。 PLoS ONE。 2017;12(1): e0161501。

論文 PubMed PubMed Central CAS Google Scholar

Er O、Temurtas F、Tanrikulu AC。 人工ニューラルネットワークを用いた結核疾患の診断。 J Med Syst. 2010;34(3):299–302。

論文 PubMed Google Scholar

デ・ソウザ・フィリョ JBO、デ・セイシャス JM、ガリエス R、デ・ブラガンサ・ペレイラ B、デ・メロ FCQ、ドス・サントス AM 他人工ニューラルネットワークを用いた塗抹陰性肺結核のスクリーニングシステム。 Int J 感染障害 2016;49:33–9。

記事 Google Scholar

Haug K、Cochrane K、Nainala VC、Williams M、Chang J、Jayaseelan KV、他。 MetaboLights: 科学コミュニティのニーズに応えて進化するリソース。 核酸研究所 2020;48(D1):D440–4。

CAS PubMed Google Scholar

リファレンスをダウンロードする

著者らは、この研究に貢献してくれたすべての研究参加者と、この研究を可能にしてくれた参加施設の臨床研究スタッフに感謝の意を表したいと思います。

この研究は、新疆医科大学の中央アジアにおける高発生率疾患の病因・予防・治療の国家重点研究所から資金提供を受けた(助成金番号:SKL-HIDCA-2021-JH10、SKL-HIDCA-2020-38、SKL-HIDCA-2020) -36 および SKL-HIDCA-2020-35)、新疆ウイグル自治区における主要科学技術特別プロジェクト (助成金番号 2017A03006-2)、中国国立自然科学財団 (NSFC) (助成金番号 82060609)、中国国立自然科学財団の国際協力および交流 (補助金番号 32061143024)、海南省の主要研究開発プロジェクト (ZDYF2021SHFZ228)。

Xin Hu、Jie Wang、Yingjiao Ju、Xiuli Zhang がこの作品に同様に貢献しました

中央アジアにおける高発生率疾患の病因、予防および治療の国家重点研究所、新疆医科大学第一付属病院呼吸器内科、ウルムチ、830000、新疆、中国

シン・フー&ジン・ワン

新疆医科大学第一附属病院呼吸器内科、ウルムチ、830011、新疆、中国

シン・フー

CAS Key Laboratory of Genome Sciences and Information、北京ゲノミクス研究所、中国科学院、中国国立生命情報センター、北京、100101、中国

Jie Wang、Yingjiao Ju、Xuli Zhang、Cuidan Li、Liya Yue、Fei Chen

中国科学院大学、北京、100049、中国

ジエ・ワン、インジャオ・ジュ、フェイ・チェン

新疆医科大学第二付属病院呼吸器内科、ウルムチ、830063、新疆、中国

呉守爾キマングリ

中央アジアにおける高発生率疾患の病因、予防および治療の国家重点研究所、ウルムチ、830011、新疆、中国

Bahetibieke Tuohetaerbaike、イン・リー、ハオ・ウェン、ウェンバオ・チャン、フェイ・チェン

分子ウイルス学および免疫学の主要研究室、病原性真菌感染症および宿主免疫部門、中国科学院上海パスツール研究所、上海、20003年、中国

チャンビン・チェン

海南医科大学第二付属病院呼吸器内科、海南市海口、570100、中国

ヤン・イェフェン&ワン・ジン

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

FC、JingW、HW、WBZは研究の構想と設計に貢献した JieW、JYJ、XLZはバイオインフォマティクス分析を実施 XH、BT、YL、YFY、CBCは血液サンプルを採取 XH、JieW、JYJ、XLZ、CDL、 YLY が図を描き、FC、JingW、XH、JieW、JYJ、XLZ、QW が原稿を執筆しました。著者全員が最終原稿を読んで承認しました。

Jing Wang または Fei Chen との通信。

この研究は、新疆医科大学第一付属病院の倫理委員会(記録番号 20171123-06-1908A)によって承認され、海南省臨床医療センターによって支援されたプロジェクトです。 登録された被験者は全員、書面によるインフォームドコンセントを提供しました。 すべての方法は、関連するガイドラインおよび規制に従って実行されました。

適用できない。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

補足データ。

120 個の特徴の相関行列。

SPPT患者と対照間の70のDAMの詳細情報。

SNPT患者と対照間の79のDAMの詳細情報。

SPPT 患者と SNPT 患者の間の 33 の DAM の詳細情報。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。 データのクレジットラインに別途記載がない限り、クリエイティブ コモンズ パブリック ドメインの献身的権利放棄 (http://creativecommons.org/publicdomain/zero/1.0/) は、この記事で利用できるデータに適用されます。

転載と許可

Hu, X.、Wang, J.、Ju, Y. 他メタボロームと臨床指標を機械学習と組み合わせることで、塗抹陽性/陰性肺結核を正確に検出するためのいくつかの有望な診断マーカーが提供されます。 BMC Infect Dis 22、707 (2022)。 https://doi.org/10.1186/s12879-022-07694-8

引用をダウンロード

受信日: 2022 年 1 月 7 日

受理日: 2022 年 8 月 22 日

公開日: 2022 年 8 月 25 日

DOI: https://doi.org/10.1186/s12879-022-07694-8

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供