Objekterkennung von Desmidiaceen mit Ki

Begonnen von Klaus, Juli 30, 2025, 12:25:10 NACHMITTAGS

Vorheriges Thema - Nächstes Thema

Klaus

Liebes Forum,

im Rahmen unseres Projektes DesmidHH, in dem wir eine Bestandsaufnahme der Zieralgen in etlichen Hamburger Mooren durchführen, versuche ich mich an der Erstellung eines KI basierten Models zur Erkennung von Desmids. Dabei habe ich schon gute Fortschritte gemacht und ein funktionierendes Model entstellt. Da ich kein Experte auf diesem Gebiet bin, frage ich mich, ob hier im Forum jemand an ähnlichem Projekt arbeitet. Ich bin an einem Gedankenaustausch interessiert.

Vielleicht meldet sich je jemand?

Gruß

Klaus

Noch so'n Michael

Hallo Klaus,

ich mache dasselbe seit einigen Jahren mit Diatomeen, wobei mein Schwerpunkt aktuell eher in der Segmentierung als der Klassifikation liegt, aber mit letzterem habe ich auch schon reichlich rumexperimentiert. Außerdem arbeite ich viel mit automatisierter Mikroskopie. Infos zu meiner Arbeit findest du hier: Google Scholar

Die Herausforderung auf eurer Seite dürfte eher in der Zusammenstellung geeigneter Trainingsdaten liegen, besonders für seltenere Arten, da erfahrungsgemäß mindestens einhundert unterschiedliche Trainingsbilder pro Art benötigt werden, und vielleicht sogar mehr, falls unterschiedliche Aufnahmesysteme zum Einsatz kommen. Dieses Problem gibt aber bei so ziemlich allen KI-Modellen zur Identifikation biologischer Organismen, insofern gibt es da auch schon eine Reihe von Lösungsansätzen, wenn auch noch keine einfach anzuwendende eierlegende Wollmilchsau.

Ein paar Desmidiaceen finden sich auch in meinem Lieblingshobbyprojekt UDE BioSLiDES.

Viele Grüße nach Hamburg (habe mal fast direkt am Bahnhof ALtona gewohnt),
noch so'n Michael

Klaus

Hallo Michael,

vielen Dank für Deine Antwort und den interessanten Artikel, den ich noch genauer studieren werde.

Meine Trainingsdaten bestehen derzeit aus ca. 80 Taxa mit jeweils mehr als 100 Bildern. Da wir kontinuierlich die Moore beproben, wächst die Zahl der Taxa undTrainingsdaten ständig. Mit Mobilenet v2 und gut angepasster Learning Rate erreiche ich derzeit eine Validation Genauigkeit von ca. 93%. Würdest Du empfehlen andere CNNs als Mobilenet v2 auszuprobieren? Ist Tensorflow/Keras als Plattform eine gute Wahl?

Gruß

Klaus



Noch so'n Michael

Hi Klaus,

die Trainingsdaten hören sich schonmal gut an :D. Die passende Deep Learning Architektur muss, abhängig von der Problemstellung, ausprobiert werden, und hängt auch von den technischen Rahmenbedingungen ab (auf welcher Hardware soll das ganze für die Inferenz, also die spätere Bestimmung, laufen?). Mobilenet v2 sieht so aus, als sollte die Inferenz später direkt auf einem Smartphone stattfinden, ist aber schon eine relativ alte Architektur. Da gibt es mittlerweile bestimmt besseres.

Meine Empfehlungen wären Keras/Tensorflow (Keras ist die übliche Wahl für den Einstieg ins Deep Learning), oder PyTorch (das braucht mehr Hintergrundwissen, ist aber für Standard-Anwendungen auch kein Hexenwerk), und ich würde das ganz pragmatisch angehen abhängig davon, für welches der Frameworks die gewünschten Architekturen/Modelle bereitstehen. Überlicherweise dienen bereits auf andere Dinge trainierte Modelle als Grundlage, und diese werden dann nur noch relativ kurz mit den eigenen Bilddaten nachtrainiert (Transfer Learning). Wenn es um aktuellere Architekturen geht, ist die Verfügbarkeit unter PyTorch vermutlich deutlich größer. Und es gibt natürlich noch eine Menge anderer Frameworks für jede erdenkliche Hardware, Keras/Tensorflow und PyTorch sind aber mit Abstand am weitesten verbreitet und immer eine gute Wahl. Falls ihr etwas Geld in die Hand nehmen könnt, wäre vielleicht auch sowas wie Roboflow eine Alternative, damit dürfte das Ganze deutlich einfacher werden, aber das ist halt ein kommerzielles Angebot (weswegen ich damit noch nicht gearbeitet habe). Einen möglichst "sanften" ;) Einstieg ohne tiefergehende Programmierkenntnisse ermöglicht ZeroCostDL4Mic.

Welche Hardwareressourcen stehen für das Training zur Verfügung? Wie willst du das trainierte Modell in die Anwendung bringen? Und ist geplant, das Modell regelmäßig mit durch die Nutzung neu dazugekommenen Daten zu erweitern?

Ich hoffe, ich bin jetzt nicht zu sehr in meinen Dozenten-Modus abgeglitten 8). Melde dich am besten mal per PM oder Mail bei mir, dann können wir einen Zoom-Termin ausmachen, um direkt drüber zu quatschen.

Viele Grüße,
noch so'n Michael