Spis treści

Maksymilian Knap

Zaproszenie na obronę pracy doktorskiej

DZIEKAN i RADA WYDZIAŁU
ELEKTROTECHNIKI, AUTOMATYKI, INFORMATYKI i ELEKTRONIKI
AKADEMII GÓRNICZO-HUTNICZEJ im. ST. STASZICA W KRAKOWIE
zapraszają na
publiczą dyskusję nad rozprawą doktorską

mgra inż. Maksymiliana Knapa
Badania nad nowymi algorytmami generowania drzew decyzji
Dyskusja odbędzie się 15 czerwca 2009 roku o godz. 11:00 w bud. B-1, sala 102
al. Mickiewicza 30, 30-059 Kraków
PROMOTOR: Prof. dr hab. inż. Zdzisław S. Hippe – Wyższa Szkoła Informatyki i Zarządzania w Rzeszowie
RECENZENCI: Dr hab. inż. Marian Wysocki – Politechnika Rzeszowska
Prof. dr hab. inż. Edward Nawarecki– Akademia Górniczo-Hutnicza
Z rozprawą doktorską i opiniami recenzentów można się zapoznać
w Czytelni Biblioteki Głównej AGH, al. Mickiewicza 30



Streszczenie

Badania nad nowymi algorytmami generowania drzew decyzji

Mgr inż. Maksymilian Knap


Promotor: Prof. dr hab. inż. Zdzisław S. Hippe – Wyższa Szkoła Informatyki i Zarządzania w Rzeszowie
Dyscyplina: Informatyka

W ramach rozprawy opracowane zostały dwa nowe algorytmy generowania drzew decyzji: TVR (Tree-Via-Rule) oraz VCF (Varied-Confidence-Factor). Pierwszy z nich, tworzy drzewo decyzji z uprzednio wygenerowanych quasi-optymalnych reguł składniowych. Natomiast drugi algorytm, wykorzystuje podczas generowania drzewa informację o istotności w procesie klasyfikacji poszczególnych atrybutów opisujących, pobraną z generowanej w tle – dla analizowanych danych – sieci przekonań Bayesa. W korzeniu tak generowanego drzewa, umieszczony zostaje atrybut opisujący, ujawniający największy wpływ marginalnego prawdopodobieństwa na atrybut decyzyjny. Dodatkowo, algorytm TVR został zaprojektowany z uwzględnieniem elementów teorii zbiorów przybliżonych Pawlaka, co pozwoliło na przetwarzanie zbiorów uczących zawierających przypadki sprzeczne.

Wspomniane algorytmy zostały zaimplementowane w specjalnie opracowanym systemie analizy danych TreeSEEKER, umożliwiającym m. inn. generowanie drzew decyzji przy pomocy różnych algorytmów (poza wspomnianymi nowo-opracowanymi algorytmami TVR i VCF system pozwala generować drzewa algorytmami ID3/C4.5 oraz algorytmem opartym o współczynniki Czerwińskiego), graficzną ich reprezentację oraz testowanie ich skuteczności klasyfikacyjnej.

Opracowany system informacyjny poddano szczegółowym badaniom, wykorzystując bazy informacyjne, zaczerpnięte z repozytorium Uniwersytetu Kalifornijskiego w Irvinie, powszechnie używane w badaniach z dziedziny uczenia maszynowego, a także własne dane o znamionach melanocytowych skóry.



Autoreferat

Pełna wersja autoreferatu autoreferat-mknap.pdf.


Ważniejsze publikacje dokotoranta

  1. Z.S. Hippe, M. Knap, W. Paja: Feasibility Studies of Quality of Knowledge Mined from Multiple Secondary Sources, W: Kłopotek M.A., Wierzchoń S., Michalewicz M. (Red.), Springer-Verlag, Heidelberg 2002, s. 361-364.
  2. Z.S. Hippe, J.W. Grzymała-Busse, S. Bajcar, P. Błajdo, M. Knap, W. Paja, M. Wrzesień: Baza zmian melanocytowych skóry: stan aktualny oraz przyszłe kierunki badań, W: Nowakowski A. (Red.), Infobazy ’02. Bazy dla nauki, Centrum Informatyczne Politechniki Gdańskiej, Gdańsk 2002, s. 51-56.
  3. Z.S. Hippe, M. Knap, W. Paja: From Research on Pre-processing and Post-processing of Data in the Process of Creation Quasi-optimal Decision Trees, W: Burczyński T., Cholewa W., Moczulski W. (Red.), Methods of Artificial Intelligence, Silesian University of Technology Edit. Office, Gliwice 2002, s. 177-180.
  4. Z.S. Hippe, M. Knap: Badania nad generowaniem pewnych oraz możliwych drzew decyzji, Zeszyty Naukowe Wydziału ETI Politechniki Gdańskiej, Technologie informacyjne Nr 1, Wyd. Wydziału ETI Politechniki Gdańskiej, Gdańsk 2003, s. 189-194.
  5. J.W. Grzymała-Busse, Z.S. Hippe, M. Knap, T. Mroczek: Nowe narzędzia programowe inżynierii wiedzy i uczenia maszynowego, II. Porównanie wybranych modeli reprezentacji niepewnej wiedzy ukrytej, W: Bubnicki Z., Grzech A. (Red.), Inżynieria wiedzy i systemy ekspertowe, Oficyna Wydawnicza Politechniki Wrocławskiej, Wrocław 2003, Tom 1, s. 239-247.
  6. Z.S. Hippe, S. Bajcar, P. Błajdo, J.P. Grzymała-Busse, J.W. Grzymała-Busse, M. Knap, W. Paja, M. Wrzesień: Diagnosing Skin Melanoma: Current versus Future Directions, TASK Quarterly, 2003 (7 No 2) 289-293.
  7. J.W. Grzymała-Busse, Z.S. Hippe, M. Knap, T. Mroczek: Nowy algorytm generowania drzew decyzji – zamysł i realizacja, W: Nowakowski A. (Red.), Biocybernetyka i Inżynieria Biomedyczna, Oficyna Wydawnicza Politechniki Gdańskiej, Gdańsk 2003, s. 257–262.
  8. P. Błajdo, J.W. Grzymała-Busse, Z.S. Hippe, M. Knap, T. Mroczek, M. Wrzesień: Suita narzędzi uczenia maszynowego do ekstrakcji informacji i wiedzy z danych, W: Tadeusiewicz R., Ligęza L., Szymkat M. (Red.), Metody i systemy komputerowe w badaniach naukowych i projektowaniu inżynierskim, Wyd. Oprogramowanie Naukowe, Kraków 2003, s. 479-484.
  9. J.W. Grzymała-Busse, Z.S. Hippe, M. Knap, T. Mroczek: A New Algorithm For Generation Of Decision Trees, TASK Quarterly, 2004 (8 No 2) 243-247.
  10. J.W. Grzymała-Busse, Z.S. Hippe, P. Błajdo, M. Knap, T. Marek, T. Mroczek, M. Wrzesień: A suite machine learning for data mining: chemical applications, W: Dębska B., Fic G. (Red.), Information Systems in Chemistry.
  11. Z.S. Hippe, M. Knap, W. Paja: System klasyfikacji i diagnozowania zmian melanocytowych i czerniaka skóry – nowe narzędzie dla teledermatologii, Sztuczna Inteligencja w Inżynierii Biomedycznej 2004, Akademia Górniczo-Hutnicza w Krakowie.
  12. Z.S. Hippe, J.W. Grzymała-Busse, M. Knap, W. Paja: Infoscience Technology: An Impact of Internet Accessible Melanoid Data on Health Issues, 19th International CODATA Conference, Berlin, Germany 7-10 November 2004.
  13. P. Błajdo, JW. Grzymała-Busse, ZS. Hippe, M. Knap, T. Mroczek and Ł. Piątek: A Comparison of Six Approaches to Discretization — A Rough Set Perspective, Lecture Notes in Computer Science, Springer Berlin, Volume 5009/2008, 2008.