美國時間2018年6月2日-5日,美國消化疾病周(DDW2018)在波托馬克河畔的首都華盛頓哥倫比亞特區舉行。本次會議由美國肝病研究學會(AASLD)、美國胃腸病學會(AGA)、美國胃腸內鏡學會(ASGE)和美國消化道外科學會(SSAT)四大學會聯合主辦,是國際消化系統疾病領域規模最大、學術水平最高的會議及展覽會。
美國加州大學爾灣分校胃腸病學和肝病學系的Priyam V. Tripathi在DDW 2018會議上分享了和同事共同進行的一項最新研究,高水平的結腸鏡專家可以在人工智能的輔助下比沒有輔助時識別出多于20%的結腸息肉。
研究概要
·機器學習模型的速度可達每秒98幀,達到了進行腸鏡操作時實時圖像的處理速度要求
·機器學習模型可以達到98%的敏感性和93%的特異性,低假陽性率( 7%),高陰性預測值 (99.5%)
·機器學習模型檢測出了專家所識別的所有息肉,并且幫助發現了另外的20%的息肉
·未來隨機的臨床驗證試驗會進一步幫助明確機器學習模型是否可以提高息肉識別率
假設:人工智能輔助檢測提高腺瘤檢測率
提高腺瘤檢測率(ADR)可以顯著降低結直腸癌風險。而機器學習(ML)作為一種人工智能的方法,有輔助息肉檢測提高ADR的潛能。于是,研究者通過8641張息肉和正常結腸的圖像訓練了一個卷積神經網絡(convolutional neural network) 機器學習模型,這個模型達到了AUC (ROC曲線下的面積)0.99, 息肉識別準確性96%, 并且它的處理速度也超過了實時圖像所需的速度。在這種情況下,研究者假設這種模型會增加腸鏡專家在回顧結腸鏡圖像視頻時的息肉檢出率。
證實:人工智能輔助檢測效果不次于專家
在研究中,4名結腸鏡專家(ADR≥50%)觀看9個結腸鏡檢查視頻,來識別出視頻中的所有息肉。他們所看的是一個從頭到尾(start-to-end frames) 連續的視頻,其中他們達成共識所檢測出的被認為是息肉。機器學習模型所識別的息肉的定義是,在大于連續8幀(250毫秒),ML的預測值大于95% (ML認為它是息肉的可能性大于>95%時)。一位資深專家(ADR = 50%,> 20K 結腸鏡)來回顧機器學習模型所分析的腸鏡視頻,并給出每一個息肉是真的息肉的可能性(置信水平)高低(圖1)。研究還比較了機器學習模型自身以及機器學習模型輔助專家讀片兩種情況下,所識別出來的息肉數和非息肉數。

圖 1 機器學習分析結腸鏡視頻的代表性幀鏡頭
結果顯示,在9個結腸鏡錄像中,專家識別出了36個息肉,機器學習模型識別出了45個息肉,在這45個息肉中只有28個被最初做腸鏡的醫生切除(圖2)。機器學習模型沒有遺漏掉任何一個息肉。 在機器學習模型輔助下發現的另外9個息肉中,有3個是息肉的可能性較大,6個較低(圖1)。 ML識別息肉的敏感性和特異性分別是0.98和0.93 (卡方檢驗, P <0.00001)。假陰性的結果主要是在較遠的或視野邊緣的息肉,假陽性結果主要是塌陷的黏膜、碎片、吸引痕跡和息肉切除部位。
?
圖 2 結腸鏡切除的息肉情況,以及有或無人工智能輔助視頻分析的息肉情況
啟發:人工智能在結腸鏡檢查輔助診斷中的應用,腳步近了
研究者訓練的ML模型識別出了所有專家檢測到的所有息肉,并輔助發現了另外9個息肉。在進行實時結腸鏡檢查時,該模型可能會促使檢查更仔細,幫助發現更多的息肉。當然研究也存在一定的局限性,比如,所用于研究的腸鏡視頻總數小,機器學習模型所檢測的視頻,只有一位專家進行回顧分析,可行性研究僅局限于視頻回顧分析等。在未來的研究中,可進一步檢驗人工智能機器學習模型,來測試ADR提高以及降低腺瘤漏檢率的有效性。
據研究者介紹,人工智能已經在結腸鏡的檢查中應用,主要是檢查腸道準備夠不夠徹底,以及監測示蹤劑在腸道的放置和排出。這項研究的發表是不是意味著人工智能可以在結腸鏡檢查中發揮更多的診斷輔助作用呢?研究者對此深信不疑,那看到這篇研究的你呢?
