Nastavni program

Ustrojstvo nastave

Naziv predmeta: Rudarenje podataka
Kod: I120
Vrsta: Teorijski i praktični

  • Predavanja: 30
  • Seminari: 0
  • Vježbe: 30

Razina: Osnovni predmet
ECTS: 5

Nastavnik: doc.dr.sc. Darko Dukić

Kompetencije koje se stječu: Cilj kolegija je osposobiti svakog pristupnika za primjenu odabranih metoda rudarenja podataka. Odabrane metode koje će biti obrađene u ovom kolegiju, kako teorijski tako i uz upotrebu softvera (Sas, Statistica), su regresijska analiza, stabla odlučivanja i neuronske mreže.
Preduvjeti za upis: Nema

Sadržaj

  1. Što je rudarenje podataka
    • objašnjava se pojam rudarenja podataka i daju se primjeri uspješnog rudarenja podataka
  2. Što je modeliranje
    • koje odluke treba razmotriti prilikom postavljanja ciljeva rudarenja podataka
  3. Definiranje problema koji se treba riješiti
    • koje metodologije upotrijebiti prilikom definiranja problema koji će biti riješeni odabranim metodama rudarenja podataka
  4. Pripremanje podataka
    • s obzirom na definirani problem, donijeti odluke o tome koje podatke je potrebno prikupiti. Pored toga, objasniti kako pristupiti podacima, kako integrirati podatke, kako konveritati podatke
  5. Odabrane metode rudarenja podataka
    • teorijski i praktično obraditi neke od metoda rudarenja podataka
      • regresijska analiza
      • stabla odlučivanja
      • neuronske mreže
  6. Analiza slučajeva
    • primjena metoda rudarenja podataka

Vrednovanje znanja

Kolokviji
Pišu se dva kolokvija. Prvi kolokvij je teorijskog karaktera, a drugi obuhvaća provjeru znanja rada u dostupnom programskom paketu. Pismenog dijela ispita oslobođen je student koji je pozitivno ocijenjen iz oba kolokvija.

Pismeni ispit
Pismeni ispit se sastoji od pitanja i zadataka koji pokrivaju cjelokupno gradivo.

Usmeni ispit
Usmeni ispit obavezan je za sve studente.

Na ispitu se, u ovisnosti od sudjelovanja i zalaganja na predavanjima i vježbama, broja bodova ostvarenih na kolokvijima ili pismenom dijelu ispita te znanju pokazanom na usmenom dijelu ispita, konačna ocjena formira na sljedeći način:

  • Sudjelovanje i zalaganje na predavanjima i vježbama: 20 %.
  • Uspješno položeni kolokviji ili pismeni dio ispita: 50 %.
  • Usmeni dio ispita: 30 %.

Literatura

Preporučena literatura

  1. Westphal, C., Blaxton, T.; Data Mining Soulutions, John Whiley & Sons, Toronto, 1998.
  2. Afifi, A.A., Clark, V., Computer-Aided Multivariate Analysis, Chapman&Hall, Washington, D.C., 2000.

Dopunska literatura

  1. Han, J., Kamber, M., Data Mining: Concepts and Techniques, Morgan Kaufman Publishers, San Francisco, 2001.
  2. Trippi, R., Turban, E editori; Nerual Networks in Finance and Investing, Probus Publishing Company, Chicago, 1993.