230 likes | 341 Views
Automated counting of phytoplankton by pattern recognition: a comparison with a manual counting method. K. V. EMBLETON, C. E. GIBSON AND S. I. HEANEY. Introduzione.
E N D
Automated counting of phytoplankton bypattern recognition: a comparison with amanual counting method K. V. EMBLETON, C. E. GIBSON AND S. I. HEANEY
Introduzione • In questo articolo si mettono a confronto 2 metodi di studio del fitoplancton nel lago Lough Neagh nell’Irlanda del nord: uso di reti neurali e analisi manuali. • Problema: le misure manuali tramite microscopio richiedono troppo tempo. • L’analisi delle immagini in modo automatico e il metodo del pattern recognition permette l’identificazione, il conteggio e le misurazioni del fitoplancton. • Trasformazione dei dati in parametri utilizzati dalle reti neurali. • Confronto del volume totale delle cellule ottenuto dai 2 metodi.
Metodologia: analisi convenzionali • Il campione selezionato per l’analisi fa parte del programma di monitoraggio del Dipartimento dell’Agricoltura dell’Irlanda del nord (DANI). • I campioni sono raccolti in superficie e fissati con la soluzione di Lugol. • I vetrini studiati al microscopio invertito, sono di 2.2 ml con diametro 26 mm. • Analizzate 4 specie di volume noto: 2 cianobatteri filamentosi Planktothrix agardhii (Gomont) Anagnostidis e Limnothrix redekei (Van Goor) Meffert; colonia di diatomea Aulacoseira subarctica (Müller) Haworth; la diatomea Stephanodiscus astraea (Eh.) Kütz.
Metodologia: sistema automatico di conteggio • I vetrini per l’analisi automatico sono di volume 0.71 ml. • La media del numero di oggetti contenuti per ogni immagine è nel range 1.6-12.5. • Microscopio utilizzato è Olympus con ingrandimento 20x. • Macchina fotografica Sony DXC-930P. • Dimensioni immagini 768x576 pixel. • Analisi immagini con pacchetto software KS400. • Le reti neurali usano NeuroSolution. • I risultati portati poi in fogli Excel.
Metodologia: elaborazione delle immagini • L’acquisizione, il trattamento e l’analisi delle immagini è controllato da una macro scritta nel pacchetto software KS400. • Le foto sono scattate da un operatore che calibra la luminosità e la messa a fuoco. • Per ogni foto viene fissata una soglia per identificare le regioni di interesse trasformandola in un’immagine binaria (2 livelli di grigio).
Metodologia: elaborazione delle immagini • Vengono eliminati i bordi e riempiti i buchi all’interno delle regioni di interesse. • All’immagine binaria viene applicato un filtro mediano per lisciare i contorni. • Le regioni troppo piccole vengono eliminate. • Con l’uso di un filtro passa basso vengono identificati gli incroci fra i filamenti. • Infine ogni regione viene etichettata.
Metodologia: elaborazione delle immagini • immagine al microscopio. • Soglia binaria. • Filtro mediano. • Filtro passa basso. • Identificazione incroci. • Immagine etichettata.
Reti neurali • Funzionano come il cervello umano, fatti di tanti neuroni che lavorano insieme per risolvere un problema. • Imparano per esempi. • Si occupano del riconoscimento delle immagini (Pixel [0,255]). • Si ha una risposta finale che è si o no. • Esiste una fase di addestramento e uno di funzionamento. • Implicazione più importante pattern recognition. • Esistono diversi tipi di reti neurali: feed-forward, feedback.
Addestramento delle reti neurali • Viene stabilito un set di 74 parametri per ogni immagine (per lo più geometrici). • Il database contenente i parametri viene riempito anche con parametri di oggetti estranei per addestrare e riconoscere i falsi. • Tutte le reti neurali utilizzate sono feed-forward MLP addestrate con l’algoritmo di back propagation. • Ogni rete ha come nodi di input un sottoinsieme dei 74 parametri, un hidden layer di 10 nodi, 1 solo nodo di output (range +1,-1).
Addestramento delle reti neurali • Sono stati fatti tentativi con più hidden layer senza un miglioramento apprezzabile del risultato. • Durante l’addestramento i pesi sui nodi venivano continuamente aggiustati anche a mano per ridurre l’errore tra risultato desiderato ed ottenuto. • Il database contenente i valori dei parametri è stato diviso in 2 parti.
Addestramento delle reti neurali • 80% dei dati è stato usato come insieme d’addestramento, 20% come test della rete. • L’addestramento è continuato finchè l’errore sul test set non ha cominciato ad aumentare invece che diminuire. • Per ognuna delle 4 specie è stata fatto una differente rete neurale. • L’output di queste reti era “riconosciuto” o “non riconosciuto”. • Questo approccio è stato scelto in previsione di aggiungere nuove specie.
Addestramento delle reti neurali • In questo modo per ogni specie nuova si aggiunge una rete nuova simile alle precedenti. • Altrimenti usando una sola rete con più nodi di output ogni nuova aggiunta comporterebbe il riaddestramento di una nuova rete. • Ogni rete aveva come parametri di input solo un piccolo insieme dei 74 parametri misurati, diverso per ogni rete, scelto in modo da ottimizzare il riconoscimento. • Si sono usate delle regole aggiuntive sui parametri per validare la classificazione ottenuta dalla rete.
Nella tabella sotto sono riportati i parametri considerati ottimali in quanto comportano minori errori. Nella tabella sono riportati i 74 parametri ottenuti dalle misurazioni dei campioni.
Prova del sistema • I classificatori sono stati testati prendendo campioni del lago Lough Neagh, 75 immagini per ogni campione. • I volumi sono stati calcolati a mano e con il metodo automatico per il confronto dei risultati. • 5 campioni sono stati messi da parte per poter poi ripetere la procedura più volte.
Risultati • La procedura automatica richiede 7 minuti circa di tempo operatore per scattare 75 foto per ogni campione; 30-40 minuti di tempo di computazione. • Alla fine della procedura automatica viene generato una tabella in Excel per la visualizzazione dei risultati.
Risultati • Confronto fra metodo manuale e automatico. • Il volume calcolato automaticamente è entro il 10% di quello calcolato manualmente. • La misura del volume può essere soggetta a doppio errore che si compensa (mancate identificazioni compensate da falsi positivi).
Risultati • Confronto fra le classificazioni delle singole specie. • Problemi nel distinguere tra 2 specie filamentose simili.
Risultati • Confronto tra i volumi delle singole specie. • Risultato simile alla precedente siccome il volume medio è sempre lo stesso.
Conclusioni • Vantaggi del sistema automatico: veloce, richiede meno esperienza, dà risultati accettabili nella stima del volume totale. • Con il progredire della tecnologia (macchine digitali più sofisticate, maggiore risoluzione, maggiori capacità di calcolo) è possibile ridurre gli errori. • Sono richiesti ulteriori studi per affinare la scelta dei parametri delle immagini da utilizzare nelle reti neurali. • Con minor parametri (scelti opportunamente) in input si risparmia tempo e si riducono gli errori.
Conclusioni • La maggior parte degli errori è dovuta a cellule in contatto fra loro difficilmente separabili con tecniche di elaborazione delle immagini. • Molti altri errori sono dovuti alla larghezza dei filamenti che con la risoluzione utilizzata spesso era di 2-3 pixel (il filtro mediano li cancella). • Il contrasto può essere migliorato con l’utilizzo della soluzione di Lugol o con l’utilizzo della fluorescenza (o anche tramite il metodo del Calcofluor nel caso dei dinoflagellati).
Ordine Peridiniales Haeckel 1894:Famiglia Protoperidiniaceae Balech 1988 • Protoperidinium steinii e Protoperidinium conicum
Ordine Dynophysiales Lindemann 1928: Famiglia Dinophysiaceae Stein 1883 • Dinophysis rotundata Claparède et Lachmann • Dinophysis sacculus Stein