Kolonoskopi çalışması: AI poliplerinin tespiti deneyimli doktorlara pek yardımcı olmuyor

Kolonoskopi kullanılarak kolon kanseri taraması söz konusu olduğunda, AI sistemleri daha fazla polipin tespit edilmesine yardımcı olmayı amaçlamaktadır. Almanya'da yapılan yeni bir randomize kontrollü çalışma şimdi çarpıcı bir sonuca varıyor: deneyimli gastroenterologların klinik uygulamalarında bilgisayar destekli polip tespiti ölçülebilir herhangi bir avantaj sağlamamaktadır.

Reklamdan sonra devamını okuyun

Npj Digital Medicine dergisinde açık erişim olarak yayınlanan çok merkezli çalışma, Würzburg Üniversite Hastanesi'nde geliştirilen EndoMind sistemini beş Alman özel muayenehanesinde inceledi. Bu tasarım, Almanya'daki tarama kolonoskopilerinin çoğunluğunun akademik merkezlerde değil, gastroenteroloji uygulamalarında ayaktan tedavi bazında gerçekleştirilmesi nedeniyle seçilmiştir. Kasım 2021 ile Kasım 2022 arasında 914 hasta, yapay zeka desteği olan veya olmayan bir muayeneye rastgele atandı. İlgili on incelemecinin tümü on yıldan fazla deneyime sahipti ve her biri 10.000'den fazla kolonoskopi gerçekleştirmişti.

Temel sonuç: Adenom tespit oranı (ADR) olarak adlandırılan, en az bir adenomun bulunduğu muayenelerin oranı, AI destekli grupta yüzde 34,5 ve kontrol grubunda yüzde 32,9 idi. Yüzde 1,6'lık fark istatistiksel olarak anlamlı değildi (p = 0,656). Çalışmaya göre, tüm ikincil son noktalar da anlamlı bir farklılık göstermedi: ne genel polip tespit oranı ne de tırtıklı lezyonların tespit oranı, muayene başına adenom sayısı veya endoskopun çekilme süresi iki grup arasında farklılık göstermedi.

EndoMind: Ticari sistemlerle aynı seviyede teknoloji

Kullanılan EndoMind sistemi, gerçek zamanlı nesne tanıma için 506.000'den fazla manuel açıklamalı görüntüyle eğitilmiş bir YOLOv4 mimarisini kullanıyor. Sistem, tespit edilen polipleri gerçek zamanlı olarak bir sınırlayıcı kutu ile işaretler; ilk tespite kadar geçen ortalama süre 130 milisaniyedir. Yanlış pozitif raporların oranı yalnızca yüzde 2,2 idi. Önceki bir pilot çalışmada EndoMind, ticari CADe (bilgisayar destekli algılama) sistemleri düzeyinde performans gösterdi. Teknik olarak sistem, klinik etki eksikliğinin kusurlu yazılıma atfedilmemesi için tüm gereksinimleri karşılamalıdır.

Beklenmedik sonuca rağmen, Würzburg Üniversite Hastanesi Gastroenterolojide Dijital Dönüşüm Profesörü ve çalışmanın ortak yazarı Alexander Hamm şunları söyledi: “Bu çalışmayla, kolorektal kanser taraması için bir yapay zekanın, taramanın her gün yapıldığı yerde, yani gastroenteroloji odaklı uygulamalarda test edilen Almanya'daki ayakta tedavi verilerini kullanarak üniversite ortamında oluşturulabileceğini gösterebildiğimiz için mutluyuz.”

Yapay zeka neden yardımcı olmuyor?

Reklamdan sonra devamını okuyun

Yazarlar, anlamlı bir etkinin olmaması için çeşitli faktörleri tanımlamaktadır. Birincisi, kontrol grubunda gözlemlenen ADR yüzde 32,9 idi; bu, çalışmayı planlarken varsayılan yüzde 25'in oldukça üzerindeydi. Yapay zeka olmadan doktorlar ne kadar iyi olursa, iyileştirme için o kadar az alan kalır; bu da tavan etkisi anlamına gelir. Ayrıca katılan doktorların hepsi çok tecrübeliydi. Çalışma, ADR'de yüzde 9'luk bir iyileşme sağlayacak şekilde tasarlandı; Yazarların tahminine göre, gözlemlenen küçük bir etkiyi (eğer varsa) istatistiksel olarak kanıtlayabilmek için grup başına 6.000'den fazla hasta gerekli olacaktı.

Bu sonuçlar giderek artan sayıda kritik bulguya katılıyor. 43 randomize kontrollü çalışmayı değerlendiren 2024 tarihli kapsamlı bir meta-analiz, AI yoluyla ADR'de istatistiksel olarak anlamlı bir artış buldu; ancak kanıt kalitesini “çok düşük” olarak derecelendirdi ve önemli yayın yanlılığına atıfta bulundu. Japonya ve ABD'deki mevcut RCT'ler de deneyimli araştırmacılar arasında anlamlı bir farklılık göstermedi. Buna göre, Amerikan Gastroenterologlar Derneği AGA, mevcut kılavuzlarında CADe sistemleri için herhangi bir öneride bulunmazken, Avrupa uzman topluluğu ESGE yalnızca “zayıf bir öneride” bulunmaktadır.

Vasıfsızlaşma riski

Halihazırda çevrimiçi olarak yayınlamış olduğu iki makale, bu sonuçların farklılaştırılmış sınıflandırmasına katkıda bulunmaktadır. Geçen yıl Haberler Online ile yaptığı röportajda Alexander Hann, gerçek hayat koşullarında yapay zeka poliperlerinin tanınmasının zorluklarını anlattı. Akademik merkezlerden elde edilen umut verici çalışma sonuçları ile deneyimli pratisyen hekimlerin günlük uygulamaları arasındaki uçurumu vurguladı.

Tartışma, The Lancet Gastroenterology & Hepatology dergisinde yayınlanan, vasıfsızlaştırma etkisi olarak adlandırılan ve internette de tartışılan bir çalışmayla özellikle patlayıcı bir hal alıyor. Polonya'daki dört tıp merkezindeki araştırmacılar, hepsi en az 2.000 kolonoskopi yapmış ve ortalama 28 yıllık mesleki deneyime sahip 19 deneyimli endoskopisti inceledi. Yalnızca üç aylık düzenli AI kullanımından sonra, AI desteği olmayan bu doktorların ADR'si yüzde 28,4'ten yüzde 22,4'e düştü; bu, istatistiksel olarak yüzde 6 puanlık önemli bir düşüş. 19 doktordan 15'inin durumu kötüleşti. Yazarlar “temel becerilerin sessizce erozyona uğramasından” bahsetti.

Alexander Hann'ın ekibi şu anda yoğun bir şekilde “fayda mı zarar mı” konusunu araştırıyor. [der KI-Unterstützung] eğitimde olan meslektaşlarımızla”.

(vza)

Kolonoskopi çalışması: AI poliplerinin tespiti deneyimli doktorlara pek yardımcı olmuyor

EndoMind: Ticari sistemlerle aynı seviyede teknoloji

Yapay zeka neden yardımcı olmuyor?

Vasıfsızlaşma riski

Yorumlar

Bir yanıt yazın Yanıtı iptal et