Ključna razlika: Data Mining je dejansko analiza podatkov. To je računalniško podprt proces kopanja in analiziranja ogromnih sklopov podatkov, ki jih je računalnik zbral ali vnesel v računalnik. Skladiščenje podatkov je proces zbiranja informacij ali podatkov v podatkovnem skladišču. Podatkovno skladišče je baza podatkov, ki se uporablja za shranjevanje podatkov.
Namen rudarjenja podatkov, znan tudi kot odkrivanje znanja, je omogočiti podjetjem, da si ogledajo ta vedenja, trende in / ali odnose ter da jih lahko vključijo v svoje odločitve. To podjetjem omogoča, da sprejemajo proaktivne odločitve, ki temeljijo na znanju.
Izraz »podatkovno rudarjenje« izhaja iz dejstva, da je proces rudarjenja podatkov, tj. Iskanja razmerij med podatki, podoben rudarstvu in iskanju dragocenih materialov. Orodja za rudarjenje podatkov uporabljajo umetno inteligenco, strojno učenje, statistiko in sisteme podatkovnih baz, da bi našli korelacije med podatki. Ta orodja lahko pomagajo odgovoriti na poslovna vprašanja, ki so bila običajno preveč dolgotrajna za reševanje.
Data Mining vključuje različne korake, vključno s surovim korakom analize, vidiki upravljanja baz podatkov in podatkov, predobdelavo podatkov, premisleki modelov in zaključkov, meritve zanimivosti, premisleki o kompleksnosti, naknadno obdelavo odkritih struktur, vizualizacijo in spletno posodabljanje.
Namen podatkovnega skladišča je uporabniku zagotoviti fleksibilen dostop do podatkov. Skladiščenje podatkov se na splošno nanaša na kombinacijo različnih baz podatkov na celotnem podjetju.
Glavna razlika med skladiščenjem podatkov in podatkovnim rudarjenjem je, da je skladiščenje podatkov proces zbiranja in organiziranja podatkov v eno skupno bazo podatkov, medtem ko je rudarjenje podatkov proces pridobivanja pomembnih podatkov iz te baze podatkov. Podatkovno rudarjenje je mogoče storiti šele, ko je skladiščenje podatkov končano.