ACS Sens 血液和尿液挥发性有机物联合分析,加强癌症诊断准确性
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">液体活检</strong>被认为是一种<strong style="color: blue;">成本效益高且<span style="color: black;">没</span>创的技术</strong>,<strong style="color: blue;"><span style="color: black;">能够</span>在<span style="color: black;">初期</span><span style="color: black;">发掘</span>癌症,对个体进行<span style="color: black;">归类</span>以进行定制治疗,并快速衡量治疗<span style="color: black;">方法</span><span style="color: black;">是不是</span>成功。</strong>它依赖于非固体样本的取样,<span style="color: black;">重点</span>是血液,并进一步分离循环肿瘤细胞和/或其他肿瘤衍生物质(例如循环肿瘤DNA、外泌体等)。尽管<span style="color: black;">拥有</span><span style="color: black;">显著</span>的<span style="color: black;">优良</span>,但成功实施该<span style="color: black;">办法</span><span style="color: black;">必须</span>过滤、分离和/或实时监测生物标志物,浓度为每1−10mL血液,<span style="color: black;">周边</span>有6 × 106个白细胞、2 × 108个血小板和4 × 109个红细胞,这使其<span style="color: black;">作为</span>一项非常<span style="color: black;">拥有</span>挑战性的任务。利用液体活检中存在的某些生物学特性来检测和分析抗原被证明是困难的,但仍然是可行的。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在肺癌的体外<span style="color: black;">科研</span>中,利用VOC进行鉴定的准确率达到90%,它在<span style="color: black;">初期</span><span style="color: black;">发掘</span>一系列癌症和转移的准确率分别为> 84%和97%。<strong style="color: blue;">虽然这些结果证明了<span style="color: black;">经过</span>基于</strong><strong style="color: blue;">挥发性有机化合物</strong><strong style="color: blue;">的液体活检进行</strong><strong style="color: blue;">癌症<span style="color: black;">没</span>创诊断的快速、易于<span style="color: black;">运用</span>和<span style="color: black;">低价</span><span style="color: black;">工具</span>的可行性</strong><strong style="color: blue;">,但</strong><strong style="color: blue;">更高的准确性</strong><strong style="color: blue;">将<span style="color: black;">引起</span>更有效的诊断和监测,从而<span style="color: black;">加强</span><span style="color: black;">存活</span>率。</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2023年3月,ACS Sensors在线<span style="color: black;">发布</span>了一篇利用GC-MS和传感器分析肾癌、肺癌和胃癌三种不同癌症<span style="color: black;">病人</span>血液中的挥发性有机物,在以上三种癌症<span style="color: black;">疾患</span>诊断方面<span style="color: black;">创立</span>数据模型。<span style="color: black;">科研</span>结果<span style="color: black;">显示</span>:</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">GC-MS和传感器阵列分析能够<span style="color: black;">测绘</span>人类血液和尿液样本中的<strong style="color: blue;">癌症特异性</strong><strong style="color: blue;">VOCs</strong>,以检测和区分癌症和对照组、不同类型的癌症和不同<span style="color: black;">周期</span>的特定癌症,准确度>90%,灵敏度>80%,特异性>80%。<strong style="color: blue;">血液和尿液的联合分析<span style="color: black;">加强</span>了</strong><strong style="color: blue;">区分能力</strong>,使模型的准确率<span style="color: black;">加强</span>了>3%。<span style="color: black;">另外</span>,该方式<span style="color: black;">亦</span>可用于在很长一段时间内跟踪<span style="color: black;">疾患</span>的<span style="color: black;">发展</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q4.itc.cn/images01/20240415/0ad87177a7104ce093f0cdcbe54adbfa.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">技术路线</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">1. 三组癌症<span style="color: black;">病人</span>的血液和尿液活检液:肾癌KC (N = 101)、肺癌LC (N = 26)和胃癌GC (N = 26),以及一组健康对照组(N = 152),其中<span style="color: black;">包含</span>22名有胃癌症状的对照组(FG)。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2. 采用了两种<span style="color: black;">办法</span>来检测:<span style="color: black;">运用</span>气相色谱-质谱(GC - MS)检测和鉴定<span style="color: black;">每一个</span>样品顶空中挥发性有机化合物的化学性质和<span style="color: black;">构成</span>;基于实验室的有机<span style="color: black;">保留</span>的小金纳米颗粒(GNPs,核心直径3 - 4 nm)的化学阵列,单壁碳纳米管(RN-SWCNTs)的二维随机网络,以及聚合物和ML<span style="color: black;">办法</span>的组合来识别和<span style="color: black;">归类</span>VOC模式。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q3.itc.cn/images01/20240415/3406c20c9ae245c58b035441c3505309.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;">科研</span>结果</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">1. GC-MS检测及结果分析</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">利用GC-MS技术在所有分析的血液和尿液样本中检测到>100个VOCs。从这些VOCs中筛选出<strong style="color: blue;">64</strong><strong style="color: blue;">种</strong><strong style="color: blue;">VOCs</strong>(存在于超过70%的人群中,且其在环境空气样本中的浓度比同等血液或尿液样本中的浓度低10倍以上)。有些挥发性有机化合物在血液和尿液中很<span style="color: black;">平常</span>,有些则<span style="color: black;">否则</span>,这些差异可能是<span style="color: black;">因为</span>不准确的初步鉴定。<span style="color: black;">因此呢</span><span style="color: black;">经过</span><strong style="color: blue;">随机森林(</strong><strong style="color: blue;">RF</strong><strong style="color: blue;">)和分层聚类<span style="color: black;">办法</span></strong>对筛选的挥发性有机化合物进一步分析,在血液和尿液样本的数据上构建了这些模型,并将血液和尿液样本的数据合并在<span style="color: black;">一块</span>,比较了所有模型的结果和性能。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">第1</span>步<span style="color: black;">首要</span>分析所有类型的癌症(即所有癌症类型<span style="color: black;">做为</span>一组)和对照组之间的二元<span style="color: black;">归类</span>。Wilcoxon秩和检验<span style="color: black;">表示</span>,<strong style="color: blue;">血液数据有</strong><strong style="color: blue;">26</strong><strong style="color: blue;">个特征</strong><strong style="color: blue;">p < 0.05</strong>(图1a,血液数据中区分癌症组和对照组最具区分性的六种挥发性有机化合物),<strong style="color: blue;">尿液数据有</strong><strong style="color: blue;">16</strong><strong style="color: blue;">个特征</strong><strong style="color: blue;">p</strong><strong style="color: blue;"><span style="color: black;">小于</span>阈值</strong>(图1b,尿液数据中六种最具区分性的挥发性有机化合物)。基于这些VOCs, RF模型在血液样本中<span style="color: black;">表示</span>出更高的准确性/灵敏度/特异性(92/ 90/89%),尿液模型相对偏低(82/78/70%;图2)。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q8.itc.cn/images01/20240415/eba5fa5e317c41949f009a5232999070.png" style="width: 50%; margin-bottom: 20px;"><img src="//q1.itc.cn/images01/20240415/e6777d777ec845a2bde506f3ce6f27a5.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">■ ■ ■ ■ ■</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">图1. 血液和尿液中典型VOC小提琴图</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">对血液和尿液VOC数据集的综合分析改善了所有参数,并<span style="color: black;">表示</span>出<strong style="color: blue;">癌症组和对照组之间的最高区分值</strong><strong style="color: blue;">:</strong><strong style="color: blue;">准确率</strong><strong style="color: blue;">94%</strong><strong style="color: blue;">,灵敏度</strong><strong style="color: blue;">92%</strong><strong style="color: blue;">,特异性</strong><strong style="color: blue;">91%</strong>(图2)。这些改进的结果可归因于在训练模型时数据的维度更高(即特征数量<span style="color: black;">更加多</span>)。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q7.itc.cn/images01/20240415/bf658e266a9f49b8ada9aa71ebffdff4.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">■ ■ ■ ■ ■</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">图2. 不同数据集ROC分析</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">利用以上模型<span style="color: black;">针对</span>特定癌症的检测进行测试,测试结果如下:</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q3.itc.cn/images01/20240415/d1debf190d754046ab0254217c8f11de.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">结合血液和尿液两种数据,将血液和尿液的<span style="color: black;">归类</span>准确率分别从0.91±0.08和0.83±0.06<span style="color: black;">加强</span>到0.93±0.03。加入年龄、性别和吸烟<span style="color: black;">情况</span>等人口统计学特征将使基于血液和尿液数据的模型的受试者工作特征曲线(AUROC)下面积<span style="color: black;">增多</span>0.02,F1分数(即精度和召回率的调和平均值,可<span style="color: black;">做为</span>准确性的衡量标准)<span style="color: black;">增多</span>0.01。这些模型的准确性<span style="color: black;">显著</span>较低,可能受到<span style="color: black;">每一个</span>类别中样本数量较少的影响。<strong style="color: blue;">以血液为<span style="color: black;">基本</span>的模型比以尿液为<span style="color: black;">基本</span>的模型更好,并且两种<span style="color: black;">源自</span>的组合并<span style="color: black;">无</span>提高它们的性能。</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在许多<span style="color: black;">状况</span>下,<span style="color: black;">研发</span>的模型<span style="color: black;">能够</span>检测和区分不同<span style="color: black;">周期</span>的癌症。<span style="color: black;">然则</span><span style="color: black;">因为</span>用于测试的255名<span style="color: black;">病人</span>中<span style="color: black;">仅有</span>87名<span style="color: black;">病人</span>的癌症分期信息,且<span style="color: black;">每一个</span><span style="color: black;">周期</span>的<span style="color: black;">病人</span>数量较少(分别为16例和19例),<strong style="color: blue;"><span style="color: black;">没</span>法从中得出任何结论,<span style="color: black;">亦</span><span style="color: black;">没</span>法训练任何模型来预测癌症<span style="color: black;">周期</span></strong>。<span style="color: black;">然则</span>在其他<span style="color: black;">状况</span>下,<span style="color: black;">研发</span>的模型能够区分<span style="color: black;">身患</span>癌症的受试者和有胃癌症状的受试者,在这个<span style="color: black;">检测</span>示例中,血液模型比尿液模型<span style="color: black;">表示</span>出更高的准确性,分别为92%和88%。测试模型的灵敏度较低(两种模型均为33%),不像血液模型的100%和尿液模型的95%的高特异性。联合模型改善了所有性能指标,并<span style="color: black;">表示</span>出最高的识别准确率、灵敏度和特异性(分别为96%、66%和100%)。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为了<span style="color: black;">科研</span>所检查的组之间的关系进行了分层聚类分析(Ward最小方差法),结果<span style="color: black;">表示</span>在血液树形图和星座图中,健康对照和KC受试者<span style="color: black;">显著</span>是<span style="color: black;">掰开</span>聚类的,而其他较小的<span style="color: black;">实验</span>组<span style="color: black;">无</span>聚类,而是被同化到<span style="color: black;">很强</span>的组中(图3a,b)。尿液VOC样本的聚类效果较差,并且大<span style="color: black;">都数</span>VOC<span style="color: black;">无</span>聚集到不同的亚组中(图3c,d)。结合血液和尿液两组数据改善了聚类(图3e,f),这是<span style="color: black;">经过</span>观察GC, LC和FG组除了健康对照和KC两个<span style="color: black;">重点</span>聚类外的联合亚组来表达的(图3e)。<span style="color: black;">运用</span>每组中<span style="color: black;">每一个</span>VOC的平均丰度而不是原始数据进行分层聚类,<span style="color: black;">能够</span><span style="color: black;">明显</span>改善聚类。有趣的是,<strong style="color: blue;">血液和尿液样本中</strong><strong style="color: blue;">VOC</strong><strong style="color: blue;">的平均丰度数据集的组合完美地聚集了单独的两组</strong>。健康对照组和FG组<span style="color: black;">做为</span>亚组聚在<span style="color: black;">一块</span>,不同癌症类型分别聚在<span style="color: black;">一块</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q8.itc.cn/images01/20240415/c3e0c4aa8a984d799f949a24b45ab31a.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">■ ■ ■ ■ ■</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">图3. 分层聚类和相应的星座图</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">2. 基于实验室的传感器阵列分析</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">将血液和尿液顶空样本暴露于传感器阵列后,对610份样本(305份尿液和305份血液)进行了判别函数分析(DFA),其中153份来自确诊癌症<span style="color: black;">病人</span>,152份来自对照组。为了<span style="color: black;">评定</span>二次DFA模型的有效性,随机<span style="color: black;">选取</span>盲测组30%的数据集被<span style="color: black;">运用</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">与GC-MS模型<span style="color: black;">同样</span>,<span style="color: black;">首要</span>将所有癌症病例分组为一个“癌症”组,将FG和健康个体分组为“对照组”。<span style="color: black;">针对</span>这两组<span style="color: black;">研发</span>了单独分析血液样本、单独分析尿液样本或血液和尿液组合数据集的模型。所选特征的平均原始数据的雷达图<span style="color: black;">表示</span>了传感器对癌症组或对照组反应的差异。雷达图中的<span style="color: black;">每一个</span>点<span style="color: black;">表率</span>DFA<span style="color: black;">选取</span>的传感特征的真实值(<span style="color: black;">全部</span><span style="color: black;">关联</span>组的平均值)。点之间的连接创建了一个雷达图,<span style="color: black;">能够</span>在<span style="color: black;">选取</span>的组之间进行直观的比较,而<span style="color: black;">没</span>需将数据更改为不同的维度(图4a)。<strong style="color: blue;">在</strong><strong style="color: blue;">DFA</strong><strong style="color: blue;">的训练<span style="color: black;">周期</span>,血液(准确性</strong><strong style="color: blue;">93.3%</strong><strong style="color: blue;">,<span style="color: black;">敏锐</span>性</strong><strong style="color: blue;">88.5%</strong><strong style="color: blue;">,特异性</strong><strong style="color: blue;">98%</strong><strong style="color: blue;">)和尿液(准确性</strong><strong style="color: blue;">86.1%</strong><strong style="color: blue;">,<span style="color: black;">敏锐</span>性</strong><strong style="color: blue;">95.8%</strong><strong style="color: blue;">,特异性</strong><strong style="color: blue;">76.7%</strong><strong style="color: blue;">)中所有三种模型的结果都<span style="color: black;">得到</span>了高分</strong>。<strong style="color: blue;">联合模型<span style="color: black;">供给</span>了</strong><strong style="color: blue;">88.7%</strong><strong style="color: blue;">的准确度,</strong><strong style="color: blue;">95.8%</strong><strong style="color: blue;">的灵敏度和</strong><strong style="color: blue;">81.6%</strong><strong style="color: blue;">的特异性</strong>,这些值与VOC相比<span style="color: black;">无</span><span style="color: black;">表示</span>出任何改善。盲测组(30%)的分析结果更好,联合模型的准确性、<span style="color: black;">敏锐</span>性和特异性分别<span style="color: black;">加强</span>了97.6、97.7和97.4%。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">进一步针对不同类型癌症(</strong><strong style="color: blue;">GC</strong><strong style="color: blue;">、</strong><strong style="color: blue;">KC</strong><strong style="color: blue;">和</strong><strong style="color: blue;">LC</strong><strong style="color: blue;">)的区分分析<span style="color: black;">显示</span>,</strong><strong style="color: blue;">每种癌症都有其独特的传感器阵列,<span style="color: black;">因此呢</span><span style="color: black;">能够</span>用于区分不同类型的癌症</strong>(图4b-d)。不同模型的训练集的准确率在75 ~ 91.5%之间,而测试集的准确率在80 ~ 100%之间。组合模型始终表现出较好的性能。例如,血液中区分KC和GC的准确率为92%,尿液中区分KC和GC的准确率为91.6%,在联合模型中达到97.2%。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q9.itc.cn/images01/20240415/f8e8c20e99294693a70a181995816b69.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">■ ■ ■ ■ ■</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">图4. 传感器数据雷达图</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为了<span style="color: black;">保证</span>分析不因混杂<span style="color: black;">原因</span>影响而产生偏差,作者<span style="color: black;">检测</span>了年龄、性别和吸烟<span style="color: black;">情况</span>对癌症组和对照组<span style="color: black;">得到</span>的诊断和鉴别结果的影响。结果<span style="color: black;">显示</span><span style="color: black;">因为</span>一个或多个混杂<span style="color: black;">原因</span>,癌症组和对照组之间的差别在30%到56.6%之间,即大部分是任意的。对<span style="color: black;">每一个</span>癌症组的类似分析<span style="color: black;">显示</span>,<span style="color: black;">因为</span>混杂<span style="color: black;">原因</span><span style="color: black;">引起</span>的区分准确率为~ 50%,即<span style="color: black;">无</span>迹象<span style="color: black;">显示</span>混杂<span style="color: black;">原因</span>对模型性能有影响。假设不均匀的群体规模和<span style="color: black;">原因</span>分布<span style="color: black;">引起</span>了这些数字,<span style="color: black;">因此呢</span>,应该收集更平衡的数据,以便能够忽略这些<span style="color: black;">原因</span>。<span style="color: black;">另外</span>,在混杂<span style="color: black;">原因</span>确实影响诊断的<span style="color: black;">状况</span>下,应计算其权重并将其纳入诊断模型<span style="color: black;">研发</span>。<a style="color: black;"><span style="color: black;">返回<span style="color: black;">外链论坛:http://www.fok120.com/</span>,查看<span style="color: black;">更加多</span></span></a></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">责任编辑:网友投稿</span></p>
外链发布论坛学习网络优化SEO。 我完全赞同你的观点,思考很有深度。 感谢楼主的分享!我学到了很多。
页:
[1]