System CVC

Crop Vegetation Control
Wykorzystanie zaawansowanych metod klasyfikacji

Celem działania oprogramowania CVC jest rozpoznawanie zmian zdrowotnych roślin na podstawie wykonanych zdjęć. Najprostszym podejściem jest określenie wskaźników opartych na obecności określonej długości fal w badanych próbkach. Metody identyfikacji roślin mogą również polegać na analizie ilościowej histogramów interpretowanych zdjęć w poszczególnych kanałach R,G,B dla światła widzialnego. W naszym podejściu interpretacji poddawane są dane pochodzące ze zdjęć, przedstawione jako wielowymiarowe zbiory punktów opisanych w skali HSL. Pozwala to na precyzyjną identyfikację skupień danych charakterystycznych dla badanych defektów.

cvc_p2

Aby skutecznie analizować dane należy zastosować taki sposób klasyfikacji, który będzie jednocześnie wydajny i będzie pozwalał na porównywanie uzyskiwanych wyników z dużym zbiorem danych wzorcowych. Wśród metod klasyfikacji dużych zbiorów danych mamy do dyspozycji wiele nowoczesnych podejść, takich jak K-means, metoda CLASS, SOM czy GnG. O ile metoda K-means zakłada określenie liczby klas, na które dzielimy zbiór, który to parametr nie jest w badanym przypadku znany, to metody SOM i GnG nie determinują tej liczby. Ponadto w przypadku wybranego podejścia można interpretować zidentyfikowane klasy jako wielowymiarowe zbiory wektorów identyfikujące skupienia

cvc_p3
cvc_p1

Reprezentacja zbiorów metodą CLASS i GNG

Istnieje wiele odmian i adaptacji metody GnG, stosowanych w zależności od charakterystyki danych wejściowych lub będących udoskonaleniem metody (m.in. FGNG, AING, AGiNG). Do naszych badań wybraliśmy własną implementację metody GnG rozszerzoną o algorytmy wyznaczające oczekiwaną jakość reprezentacji zbioru wejściowego przez wygenerowane sieci.

Baza wzorcowa wytworzona przy zastosowaniu systemu CVC składa się ze zdjęć, odpowiadających im histogramów oraz map wytworzonych sieci. Wszystkie elementy prezentowane są w postaci graficznej. Każdy wzorzec może zawierać opis tekstowy identyfikujący zmianę zdrowotności. Wzorce są klasyfikowane atrybutami tekstowymi opisującymi gatunek, odmianę i inne warunki jego wytworzenia.

Wyniki analizy zbioru testowego prezentują wyżej wymienione elementy wraz z listą zidentyfikowanych wzorców odpowiadających testowi. Podobieństwa są określone parametrem odchylenia, przy czym dla każdego badania wskazywany jest najbardziej odpowiedni wzorzec lub ich grupa.

CVCClientHist