2023年6月6日
【資料圖】
理化研究所國(guó)家癌癥研究中心
-逼近內(nèi)鏡??漆t(yī)生的診斷精度-
理化學(xué)研究所(理研)光量子工程研究中心圖像信息處理研究小組的竹本智子研究員、橫田秀夫小組組長(zhǎng)(信息綜合總部尖端數(shù)據(jù)科學(xué)項(xiàng)目副項(xiàng)目組長(zhǎng))、國(guó)立癌癥研究中心東醫(yī)院消化道內(nèi)鏡科的矢野友規(guī)科長(zhǎng)、堀圭介醫(yī)生(研究當(dāng)時(shí))等共同研究小組確立了接近內(nèi)窺鏡專業(yè)醫(yī)生診斷精度的早期胃癌自動(dòng)范圍診斷AI。根據(jù)本研究成果,在今后全世界預(yù)計(jì)會(huì)增加的消化內(nèi)鏡檢查中,有望輔助醫(yī)生的診斷,減少因熟練度的差異導(dǎo)致的漏診等誤診和因裝置性能的不同導(dǎo)致的設(shè)施間的診斷差距等。早期的胃癌缺乏形態(tài)變化,很難與胃炎等炎癥區(qū)分開(kāi)來(lái),所以在內(nèi)窺鏡檢查中,即使是??漆t(yī)生也有可能難以發(fā)現(xiàn)。 另外,不僅是發(fā)現(xiàn),正確判斷癌癥浸潤(rùn)范圍也與之后的治療精度有很大關(guān)系,但早期胃癌的病變邊界不明確,醫(yī)生也有難以進(jìn)行范圍診斷的情況。此次,共同研究小組發(fā)展了利用深度學(xué)習(xí)[1]進(jìn)行早期胃癌自動(dòng)檢測(cè)的先行研究,開(kāi)發(fā)了可以進(jìn)行早期胃癌領(lǐng)域預(yù)測(cè)的AI,并使用臨床現(xiàn)場(chǎng)一年的連續(xù)病例進(jìn)行了驗(yàn)證。 結(jié)果,在137個(gè)病例中的130個(gè)病例( 94.9% )成功發(fā)現(xiàn)了早期胃癌。 另外,在將AI決定的病變范圍與6名??漆t(yī)生的范圍診斷進(jìn)行比較的初步調(diào)查中,AI靈敏度優(yōu)異,與真正病變區(qū)域的區(qū)域一致率獲得了與??漆t(yī)生大致相同的結(jié)果。本研究刊登在科學(xué)雜志《Journal of Gastroenterology》在線版( 5月31日)上。
胃癌是死亡率最高的癌癥之一,據(jù)報(bào)道,全世界每年約有100萬(wàn)新發(fā)病例,死亡人數(shù)約為80萬(wàn)人。注1 )。 近年來(lái),日本也逐漸引入了基于內(nèi)鏡檢查的檢查,有報(bào)告稱胃癌的早期發(fā)現(xiàn)會(huì)降低死亡率。 另一方面,早期胃癌缺乏隆起和凹陷等形態(tài)特征,很難判別胃炎等炎癥引起的變化,因此在內(nèi)窺鏡檢查中可能會(huì)出現(xiàn)漏診的問(wèn)題。 另外,由于檢查裝置和醫(yī)生技能的不同導(dǎo)致的病變發(fā)現(xiàn)率的差異也成為問(wèn)題,為了診斷能力的均化[2]和減輕醫(yī)生對(duì)不斷增加的檢查需求的負(fù)擔(dān),需要利用計(jì)算機(jī)的診斷支援技術(shù)。因此,將機(jī)器學(xué)習(xí)引入內(nèi)窺鏡檢查的醫(yī)生開(kāi)始采取支援診斷的措施。 關(guān)于以大腸內(nèi)窺鏡為對(duì)象的輔助診斷AI,在世界范圍內(nèi)報(bào)告了很多研究成果,日本也有根據(jù)醫(yī)藥品·醫(yī)療器械等法律取得了批準(zhǔn),并開(kāi)始實(shí)用化的。 但是,特別是早期胃癌,還沒(méi)有獲得大腸內(nèi)窺鏡輔助診斷AI那樣的成果。 一般來(lái)說(shuō),AI的學(xué)習(xí)需要大量的學(xué)習(xí)用數(shù)據(jù),但早期胃癌即使是消化內(nèi)鏡的專家也很難發(fā)現(xiàn),存在著制作學(xué)習(xí)用數(shù)據(jù)需要花費(fèi)很多時(shí)間的問(wèn)題。針對(duì)這個(gè)問(wèn)題,聯(lián)合研究小組在先行研究中,提出了用少量數(shù)據(jù)就可以高效學(xué)習(xí)病變特征的AI,成功地自動(dòng)檢測(cè)了早期胃癌的大致區(qū)域注2 )。 另一方面,在實(shí)際的臨床現(xiàn)場(chǎng),為了面向正在成為早期胃癌標(biāo)準(zhǔn)治療的內(nèi)鏡切除術(shù),需要正確鑒定應(yīng)該切除的范圍,因此,通過(guò)大部分的區(qū)域檢測(cè),在將來(lái)的實(shí)用化中是不充分的。
注1)Bray F, Ferlay J,et al., Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries.CA Cancer J Clin., 68(6): 394-424, 2018.
注2)2018年7月21日プレスリリース「AIで早期胃がん領(lǐng)域の高精度検出に成功」
聯(lián)合研究小組為了早期胃癌的范圍診斷,構(gòu)建了可以以圖像的1像素為單位預(yù)測(cè)病變存在概率的AI。 在該AI中,維持了能夠高效學(xué)習(xí)前期研究中的小規(guī)模數(shù)據(jù)的功能,消化內(nèi)鏡的專業(yè)醫(yī)生實(shí)現(xiàn)了以正確注釋病變區(qū)域的“癌癥圖像”150張、不含癌癥的“正常圖像”150張共計(jì)300張為基礎(chǔ)的學(xué)習(xí)。 這些圖像是從國(guó)立癌癥研究中心東醫(yī)院約1年間收集的連續(xù)68個(gè)病例中隨機(jī)抽取的。 通過(guò)數(shù)據(jù)擴(kuò)展[4]等增加到約113萬(wàn)張的基礎(chǔ)上,可以通過(guò)深度學(xué)習(xí)之一的卷積神經(jīng)網(wǎng)絡(luò)( CNN ) [5]學(xué)習(xí)早期胃癌的表面性狀和色調(diào)等詳細(xì)的圖像特征。在已學(xué)習(xí)的CNN中,針對(duì)新的輸入圖像以1像素為單位預(yù)測(cè)病變的存在概率。 在本研究中,將想預(yù)測(cè)的圖像分割為多個(gè),然后輸入CNN,將多次預(yù)測(cè)結(jié)果疊加起來(lái),實(shí)現(xiàn)預(yù)測(cè)的高精度化。 具體來(lái)說(shuō),將想要進(jìn)行范圍診斷的內(nèi)窺鏡圖像分割為約1,600個(gè)塊,預(yù)測(cè)每個(gè)塊的病變存在概率(圖1 )。 根據(jù)加權(quán)函數(shù)[6]疊加預(yù)測(cè)結(jié)果,各像素的預(yù)測(cè)最多約為1,600次,預(yù)測(cè)精度大幅提高。 因?yàn)閴K分割數(shù)和預(yù)測(cè)精度成正比,而分割數(shù)和預(yù)測(cè)時(shí)間成反比,所以在將來(lái)的檢查和日常診療等中,可以根據(jù)重視預(yù)測(cè)性能和實(shí)時(shí)性的哪一個(gè)等目的決定塊數(shù),然后進(jìn)行預(yù)測(cè)。
圖1早期胃癌領(lǐng)域預(yù)測(cè)流程
顯示使用學(xué)習(xí)完的卷積神經(jīng)網(wǎng)絡(luò)( CNN ),實(shí)現(xiàn)輸入圖像(內(nèi)窺鏡檢查圖像)中存在的早期胃癌的區(qū)域預(yù)測(cè)的流程。 將輸入圖像分割成可變數(shù)量的塊,通過(guò)CNN預(yù)測(cè)每個(gè)塊的病變存在概率。 通過(guò)根據(jù)加權(quán)函數(shù)將存在概率應(yīng)用于原始輸入圖像,求出每個(gè)像素的存在概率。 熱圖是將存在概率為50%以上的像素作為病變區(qū)域用彩虹彩色表示的東西。使用與學(xué)習(xí)用數(shù)據(jù)不同的約1年間收集的連續(xù)137個(gè)病例(癌圖像462張,正常圖像396張)對(duì)構(gòu)建的AI進(jìn)行評(píng)價(jià),結(jié)果,用癌圖像387張( 83.8% ),正常圖像307張( 77.5% )正確判定了有無(wú)早期胃癌 陽(yáng)性準(zhǔn)確率[7]為81.3%,陰性準(zhǔn)確率[7]為80.4%。 在病例基礎(chǔ)上,130例( 94.9% )正確判定了有無(wú)病變。 另外,將??漆t(yī)生參照內(nèi)窺鏡檢查后的病理診斷制作的正確范圍診斷與基于AI的預(yù)測(cè)區(qū)域進(jìn)行比較后,關(guān)于被稱為IoU[8]的正確區(qū)域和預(yù)測(cè)區(qū)域的一致度,其評(píng)價(jià)指標(biāo)之一的mIoU[8]獲得了66.5%。 圖2顯示了預(yù)測(cè)結(jié)果的一個(gè)示例。圖2專科醫(yī)生對(duì)內(nèi)鏡檢查影像的范圍診斷與AI預(yù)測(cè)區(qū)域的比較
表示基于AI的區(qū)域預(yù)測(cè)結(jié)果與??漆t(yī)生制作的正確答案區(qū)域的重疊。 在此,針對(duì)早期胃癌的肉眼型分類中的表面隆起型( Type 0-Ⅱa )、表面平坦型( Type 0-Ⅱb )、表面凹陷型( Type 0-Ⅱc )這3種類型,給出了代表性的結(jié)果示例。
另外,作為初步調(diào)查,在AI在圖像中正確判定胃癌存在的387張癌癥圖像中,隨機(jī)抽取38張,與6名消化內(nèi)鏡專家和AI對(duì)病變的檢測(cè)能力以及范圍診斷進(jìn)行了比較。 另外,在日常診療中醫(yī)生多并用放大內(nèi)鏡和NBI內(nèi)鏡,但在這次的比較中,??漆t(yī)生通常只使用來(lái)自使用白色光的非放大內(nèi)鏡的圖像。 結(jié)果顯示,AI具有很好的靈敏度,mIoU獲得了與??漆t(yī)生幾乎同等的精度(表)。 關(guān)于早期胃癌領(lǐng)域的預(yù)測(cè),AI獲得接近??漆t(yī)生范圍診斷的性能,這是本研究的第一次。
mloU | 感度 | 特異點(diǎn) | 精度 | 陽(yáng)性的中率 | 陰性的中率 | |
---|---|---|---|---|---|---|
AI | 68.7% | 69.9% | 94.0% | 91.7% | 62.9% | 96.3% |
専門醫(yī)6名の平均値 | 68.3%(4.0) | 49.8%(12.5) | 98.9%(1.8) | 93.3%(0.9) | 89.0%(10.2) | 93.8%(1.3) |
表??漆t(yī)生范圍診斷與AI領(lǐng)域預(yù)測(cè)的比較
AI與??漆t(yī)生相比靈敏度更好,mloU基本相當(dāng)。 靈敏度是指陽(yáng)性的正確判斷為陽(yáng)性的比例,特異度是指陰性的正確判斷為陰性的比例。 另外,括號(hào)內(nèi)表示標(biāo)準(zhǔn)偏差。
本研究開(kāi)發(fā)了能夠以少量學(xué)習(xí)用數(shù)據(jù)高效學(xué)習(xí)早期胃癌病變的AI,不僅可以在內(nèi)窺鏡檢查圖像內(nèi)有無(wú)病變,還可以以與??漆t(yī)生的范圍診斷同等的精度進(jìn)行病變的區(qū)域預(yù)測(cè)。 學(xué)習(xí)用數(shù)據(jù)較少具有將AI應(yīng)用于其他設(shè)施或其他裝置的圖像的再學(xué)習(xí)容易的優(yōu)點(diǎn)。 此外,也有可能適用于像稀有癌癥等那樣難以收集學(xué)習(xí)用數(shù)據(jù)的對(duì)象。另外,在本研究中,關(guān)于早期胃癌的區(qū)域預(yù)測(cè),顯示出了與由內(nèi)窺鏡專業(yè)醫(yī)生進(jìn)行的范圍診斷同等的性能。 這有望成為將來(lái)在全世界預(yù)計(jì)會(huì)增加的檢查和日常診療中導(dǎo)入內(nèi)窺鏡影像診斷時(shí),減輕醫(yī)生的負(fù)擔(dān),減輕熟練度和裝置性能差異導(dǎo)致的診斷性能的差異等診斷技術(shù)均等化的有力工具。
1 .深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的計(jì)算方法之一,是多層(狹義上為4層以上)的神經(jīng)網(wǎng)絡(luò)。 它被用于圖像、視頻、文本、語(yǔ)音等分類識(shí)別問(wèn)題。 神經(jīng)網(wǎng)絡(luò)是以用計(jì)算機(jī)上的模擬來(lái)表現(xiàn)大腦功能中看到的幾個(gè)網(wǎng)絡(luò)為目標(biāo)的數(shù)學(xué)模型。2 .均勻化在這里,目標(biāo)是糾正醫(yī)療技術(shù)等的差距,讓很多患者能夠毫無(wú)區(qū)別地接受針對(duì)癌癥的標(biāo)準(zhǔn)專業(yè)醫(yī)療。3 .注釋在深度學(xué)習(xí)等機(jī)器學(xué)習(xí)時(shí),有時(shí)會(huì)將人類的判斷作為正確信息來(lái)使用,例如如果是圖像診斷,則需要對(duì)只是數(shù)值集合的圖像賦予某種意義信息。 這項(xiàng)工作稱為注釋。 在此,是指醫(yī)生對(duì)檢查圖像正確地標(biāo)記病變區(qū)域的作業(yè)。4 .數(shù)據(jù)擴(kuò)展對(duì)學(xué)習(xí)用數(shù)據(jù)進(jìn)行轉(zhuǎn)換,增加數(shù)據(jù)量。 特別是在需要大量學(xué)習(xí)數(shù)據(jù)的CNN等情況下,有助于提高學(xué)習(xí)性能。 變換有縮放、反轉(zhuǎn)、旋轉(zhuǎn)移位、顏色變換等。5 .卷積神經(jīng)網(wǎng)絡(luò)( CNN )是在圖像的分類和識(shí)別中發(fā)揮高性能的深度學(xué)習(xí)之一。 從預(yù)先給定的圖像數(shù)據(jù)中直接提取圖像的特征量,學(xué)習(xí)網(wǎng)絡(luò)。 CNN是Convolutional neural network的縮寫(xiě)。6 .加權(quán)函數(shù)在此,是指在將針對(duì)每個(gè)區(qū)塊預(yù)測(cè)的病變的存在概率與原始圖像重合時(shí),針對(duì)每個(gè)像素決定與預(yù)測(cè)值相乘的權(quán)重的函數(shù)。 預(yù)先定義為接近塊中央的像素具有較大的權(quán)重,遠(yuǎn)離的像素具有較小的權(quán)重,每個(gè)塊的存在概率與各像素的權(quán)重相乘后的值成為各像素的預(yù)測(cè)值。 由于每個(gè)像素跨越多個(gè)塊,實(shí)際上,將多次預(yù)測(cè)值的平均值作為最終的預(yù)測(cè)值。7 .陽(yáng)性準(zhǔn)確率、陰性準(zhǔn)確率陽(yáng)性準(zhǔn)確率是指,例如在檢查為陽(yáng)性(在這次的情況中為胃癌)的情況下,真正陽(yáng)性(癌癥)存在的比例。 陰性準(zhǔn)確率是指在檢查為陰性(這里指的不是胃癌)時(shí),真正為陰性(正?;蚍俏赴?的比例。8.IoU,mIoUIoU是表示正確區(qū)域(例如,人標(biāo)記的區(qū)域)與預(yù)測(cè)區(qū)域的重疊情況的指標(biāo)之一。 重疊越大,值越大。 mIoU(mean IoU )是每類計(jì)算區(qū)域重疊( IoU )的平均值。 這里針對(duì)“癌癥”和“正確答案”的等級(jí),表示了計(jì)算與正確答案區(qū)域的重疊的平均值。 IoU是Intersection over Union的縮寫(xiě)。
理化研究所光量子工程研究中心圖像信息處理研究小組研究員竹本智子隊(duì)長(zhǎng)橫田秀夫(信息綜合總部前沿?cái)?shù)據(jù)科學(xué)項(xiàng)目副項(xiàng)目組長(zhǎng))技術(shù)人員ⅱ(研究當(dāng)時(shí))坂井良匡技術(shù)人員ⅰ西村將臣國(guó)立癌癥研究中心東醫(yī)院消化道內(nèi)鏡科科長(zhǎng)矢野友規(guī)醫(yī)長(zhǎng)池松弘朗醫(yī)員(研究當(dāng)時(shí))堀圭介醫(yī)員中條惠一郎醫(yī)員稻場(chǎng)淳住院治療(研究當(dāng)時(shí))笹部真亞沙住宅(研究當(dāng)時(shí))青山直樹(shù)癌癥專家渡邊崇癌癥專業(yè)實(shí)習(xí)醫(yī)生南方信久
本研究的一部分是日本學(xué)術(shù)振興會(huì)( JSPS )科學(xué)研究費(fèi)資助事業(yè)基礎(chǔ)研究( c )“利用早期胃癌功能特征的AI內(nèi)鏡影像診斷( 21K12742, 研究代表者:竹本智子)”以及國(guó)立癌癥研究中心研究開(kāi)發(fā)費(fèi)“關(guān)于構(gòu)筑使用新的內(nèi)窺鏡AI機(jī)器等創(chuàng)造針對(duì)癌癥的創(chuàng)新醫(yī)療的產(chǎn)學(xué)合作開(kāi)發(fā)平臺(tái)的研究( 2020-A-10,研究代表者:矢野友規(guī))”的資助下實(shí)施。
Satoko Takemoto, Keisuke Hori, Yoshimasa Sakai, Masaomi Nishimura, Keiichiro Nakajo, Atsushi Inaba, Maasa Sasabe, Naoki Aoyama, Takashi Watanabe, Nobuhisa Minakata, Hiroaki Ikematsu, Hideo Yokota, Tomonori Yano, "Computer-aided demarcation of early gastric cancer: a pilot comparative study with endoscopists",Journal of Gastroenterology,10.1007/s00535-023-02001-x
理化研究所光量子工程研究中心圖像信息處理研究小組研究員竹本智子隊(duì)長(zhǎng)橫田秀夫(信息綜合總部前沿?cái)?shù)據(jù)科學(xué)項(xiàng)目副項(xiàng)目組長(zhǎng))國(guó)立癌癥研究中心東醫(yī)院消化道內(nèi)鏡科科長(zhǎng)矢野友規(guī)醫(yī)員(研究當(dāng)時(shí))堀圭介
理化研究所宣傳室新聞發(fā)言人將在新選項(xiàng)卡中打開(kāi)咨詢表單
責(zé)任編輯: