Vatandaş bilimi ve geleneksel üniversite araştırmaları genellikle karşıt olarak algılanır ve tasvir edilir. Ancak gerçekte, farklılıklardan çok daha fazla ortak noktaları vardır. Nihayetinde, hem vatandaş bilimi projeleri hem de geleneksel profesyonel araştırmalar, nesnellik, doğruluk veya doğruluk, şeffaflık, doğrulanabilirlik, dürüstlük ve alaka düzeyi gibi iyi bilimsel uygulama ile aynı kalite kriterlerine tabidir.
Aslında, vatandaş bilimi projeleri ve geleneksel araştırmalar aslında birbirlerini giderek daha fazla desteklemekte ve zenginleştirmektedir. Viel-Falter İzleme Projesi'nin mevcut araştırma sonuçları bunu açıkça göstermektedir. Bir sinir ağı, geniş tabanlı bir vatandaş bilimi projesinin bir parçası olarak 25.000'den fazla gönüllü tarafından toplanan 500.000'den fazla kelebek fotoğrafını kullanarak kelebek türlerini tanımak için eğitildi, bir sinir ağı kelebek türlerini tanımak için eğitildi ve sonuçlar eleştirel olarak değerlendirildi. Bu, Avrupa'nın en güçlü bilgisayarlarından biri kullanılarak yapıldı. Kullanılan veri kümesi, komut dosyaları ve modeller artık ilgili kamuoyu tarafından kullanılabilir.
Makine öğrenimi modelleri (yapay zeka olarak adlandırılan) kullanarak türlerin otomatik olarak tanımlanması, inaturalist, flora inkognita ve diğerleri gibi uygulamaların kullanıcılarına aşinadır. Bununla birlikte, az sayıda kişi bu tür tanımlama araçlarının başarılı bir şekilde geliştirilmesi ve daha sonra uygulanması için neyin gerekli olduğunu düşünmektedir. Birçoğu, etkili tanımlama modelleri geliştirmek için gereken eğitim verilerinin ve bilgi işlem gücünün farkında değildir.

Avusturya kelebek izleyen Viel-Falter'da doktora öğrencisi Friederike Barkmann, bu soruları veri bilimi alanındaki ikinci yüksek lisans tezinde ele aldı. Ayrıca her tür için tanımlama doğruluğunu eleştirel olarak değerlendirdi. Bunu başarmak için, gönüllüler tarafından derlenen çok büyük bir veri seti, son on yıl içinde Billa Vakfı Bülhendes Österreich tarafından yürütülen Kelebekler Projesi'nin bir parçası olarak derledi. 500.000'den fazla görüntüye dayanarak, bir sinir ağı kelebek türlerini tanımak için eğitildi. Bu tür modelleri eğitmek sadece çok fazla veri değil, aynı zamanda çok fazla bilgi işlem gücü gerektirir, bu nedenle güçlü bilgisayarlara erişim şarttır. LEO5, Innsbruck Üniversitesi'ndeki yüksek performanslı bilgisayar başlangıçta bu amaca iyi hizmet etti. Bununla birlikte, model çalışmaları bu süper bilgisayar üzerinde bile birkaç saat sürdüğü için, süreç ilk olarak Eurocc Avusturya'dan paralelleştirme yoluyla süper bilgisayar uzmanı Andreas Lindner'ın yardımıyla optimize edildi. Bu, bir bilgi işlem görevini çözmek için birkaç işlemcinin (GPU) birbirine bağlı olduğu anlamına gelir.
Nihayetinde, Eurocc Avusturya projesi sonuçta Avrupa'nın en güçlülerinden biri olan Leonardo SuperComputer'a erişim sağladı ve uygulamayı yüksek performanslı bilgi işlem alanında uzmanlıkla destekledi. Bu, tüm görüntülerin% 97'sini doğru bir şekilde tanımlayabilecek ilk modellerin eğitilmesini sağladı. Bu yüksek tanımlama doğruluğu, bu tür modellerin uygulama kullanıcılarına gözlemleri hakkında geri bildirim sağlamak için çok uygun olduğunu göstermektedir. Doğruluk, belirsiz tanımlamalarla görüntüleri çıkararak da artırılabilir. Örneğin bu görüntüler uzmanlar tarafından yeniden tanımlanabilir. Bu yaklaşım, vatandaş bilimi verilerinin yeniden tanımlanması ve kalite kontrol edilmesinde önemli zaman kazandırabilir. Aynı zamanda yüksek veri kalitesi sağlar. Ayrıca bazı türlerin tanımlanmasının diğerlerinden daha kolay olduğu da belgelenmiştir. Skippers ailesi ve Erebia cinsi gibi uzmanlar için bile zor olabilecek tür grupları da bilgisayar modelinin tanımlaması daha zordur.
Kelebek fotoğrafları, bilgisayar komut dosyaları ve modelleri içeren veri kümesi bir veri kağıdının bir parçası olarak yayınlandı. Açık (vatandaş) bilimi ruhuyla, veri kümesi halka açık hale getirilmiştir. Bugüne kadar benzer çalışmalarda kullanılan veri kümelerinden önemli ölçüde daha büyüktür. Daha fazla araştırma için değerli bir kaynaktır ve diğerleri arasında inaturalistte kullanılanlar gibi tanımlama algoritmalarının daha da iyileştirilmesine katkıda bulunabilir.
Bu çemberi kapatır: Vatandaş Bilimi Girişimleri, bilimsel araştırmaları destekler ve genişletir, bu da vatandaş biliminin olasılıklarını daha da genişleten yöntem ve teknikler geliştirir. Bununla birlikte, bu çapraz gübreleme ancak çeşitli paydaşlar işbirliği yapar ve sorunları birlikte çözerse mümkündür. Küresel biyolojik çeşitlilik ve iklim krizleri göz önüne alındığında, çözülecek birçok sorun var.
Barkmann, F., Lindner, A., Würflinger, R., Höttinger, H., Rüdisser, J. (2025) Makine öğrenimi eğitimi verileri: tür etiketleri olan 500.000'den fazla kelebek ve güve (Lepidoptera). Sci Veri 12 (1), 1369. https://doi.org/10.1038/s41597-025-05708-z
Bir yanıt yazın