Mikä on Data Mining? Perusteet ja tekniikat.

Sisällysluettelo:

Mikä on Data Mining? Perusteet ja tekniikat.
Mikä on Data Mining? Perusteet ja tekniikat.

Video: Mikä on Data Mining? Perusteet ja tekniikat.

Video: Mikä on Data Mining? Perusteet ja tekniikat.
Video: Web Development - Computer Science for Business Leaders 2016 - YouTube 2024, Saattaa
Anonim

Neljännen teollisen vallankumouksen perusta riippuu pitkälti data ja liitettävyys. Analyysipalvelut kykenevä kehittämään tai luomaan tiedonlouhintaratkaisuja, on avainasemassa tässä suhteessa. Se voi auttaa analysoimaan ja ennakoimaan asiakkaiden ostokäyttäytymisen tuloksia potentiaalisten ostajien kohdistamiseen. Tiedot tulevat uusiksi luonnonvaroiksi, ja prosessin, jolla asiaankuuluvat tiedot saadaan pois tästä lajittelemattomasta tiedosta, on erittäin tärkeä. Sellaisena, käsitteen oikea ymmärrys - Data Mining, sen prosessit ja sovellus voisivat auttaa meitä kehittämään kokonaisvaltaista lähestymistapaa tästä sävyisestä sanasta.

Data Mining perusteet ja sen tekniikat

Image
Image

Data mining, tunnetaan myös nimellä Knowledge Discovery Data (KDD) on etsimässä suuria tietomyymälöitä mallien ja trendien paljastamiseksi, jotka ylittävät yksinkertaisen analyysin. Tämä ei kuitenkaan ole yksiportainen ratkaisu vaan monivaiheinen prosessi ja valmistunut eri vaiheissa. Nämä sisältävät:

1] Tiedonkeruu ja valmistelu

Se alkaa tiedonkeruusta ja sen asianmukaisesta järjestämisestä. Tämä auttaa merkittävästi parantamaan mahdollisuuksia löytää tiedon, joka voidaan löytää tiedon louhinnasta

2] Mallirakennus ja arviointi

Toinen vaihe tietojenkäsittelyprosessissa on erilaisten mallintatekniikoiden soveltaminen. Näitä käytetään kalibroida parametrit optimaalisiin arvoihin. Käytettävät tekniikat riippuvat pitkälti analyyttisistä ominaisuuksista, joita tarvitaan organisatoristen tarpeiden kattamiseksi ja päätöksentekoon.

Tarkastellaan lyhyesti joitain tietojenkäsittelymenetelmiä. On havaittu, että useimmat organisaatiot yhdistävät kahta tai useampaa tiedonlouhintatekniikkaa muodostamaan sopivan prosessin, joka vastaa liiketoiminnan vaatimuksia.

Lukea: Mikä on Big Data?

Data Mining Techniques

  1. Association - Yhdistys on yksi laajalti tunnetuista tiedonlouhintatekniikoista. Tämän mukaisesti kuvio tulkitaan samassa tapahtumassa olevien kohteiden välisen suhteen perusteella. Siksi se tunnetaan myös relaatiotekniikaksi. Suuret brändin jälleenmyyjät luottavat tähän tekniikkaan tutkimaan asiakkaiden ostotottumuksia / mieltymyksiä. Esimerkiksi ihmisten ostotottumusten seurannassa vähittäiskauppiaat voivat havaita, että asiakas ostaa aina kermaa, kun he ostavat suklaata, ja siksi ehdottaa, että seuraavan kerran, kun he ostavat suklaata, he saattavat myös haluta ostaa kermaa.
  2. Luokitus - Tämä tiedonlouhintatekniikka poikkeaa edellä esitetystä tavalla, joka perustuu koneen oppimiseen ja käyttää matemaattisia tekniikoita, kuten lineaarinen ohjelmointi, päätöspuut, neuroverkko. Luokituksessa yritykset yrittävät rakentaa ohjelmistoa, joka osaa luokitella tietomäärät ryhmiin. Esimerkiksi yritys voi määritellä hakemuksen luokituksen, jonka mukaan "kaikkien työntekijää koskevien tietojen perusteella, jotka ovat tarjoutuneet erottamaan yrityksestä, ennustaa niiden henkilöiden lukumäärää, jotka todennäköisesti eroavat tulevaisuudessa yrityksestä." Tällaisessa tilanteessa yritys voi luokitella työntekijöiden kirjaa kahteen ryhmään eli "lähteä" ja "pysyä". Sen jälkeen se voi käyttää tiedonhankintaohjelmistoaan luokitellakseen työntekijät aiemmin luotuihin erillisiin ryhmiin.
  3. klustereiden - Eri objekteja, joilla on samankaltaiset ominaisuudet, ryhmitellään yhteen klusteriin automaation avulla. Monet tällaiset klusterit luodaan luokkiin ja esineet (vastaavilla ominaisuuksilla) sijoitetaan sen mukaisesti. Jotta voisimme ymmärtää tämän paremmin, harkitsemme esimerkkiä kirjan hallinnoinnista kirjastossa. Kirjastossa on suuri luettelo kokoelmasta. Saman tyyppiset kohteet luetellaan yhdessä. Tämä helpottaa meitä löytämään kiinnostavan kirjan. Samoin käyttämällä klusterointitekniikkaa voimme pitää kirjaa, jolla on jonkinlaisia samankaltaisuuksia yhdellä klusterilla ja antaa sille sopiva nimi. Joten, jos lukija haluaa tarttua kiinnostuksensa kannalta tärkeään kirjaan, hänen täytyy vain mennä tuolle hyllylle sen sijaan, että hän etsi koko kirjaston. Siten klusterointitekniikka määrittelee luokkiin ja asettaa kohteet jokaiseen luokkaan, kun taas luokitustekniikoissa kohteet on määritetty ennalta määritettyihin luokkiin.
  4. ennustus - Ennuste on datanlouutustekniikka, jota käytetään usein yhdessä muiden datanlouhintatekniikoiden kanssa. Se käsittelee trendien, luokittelun, mallin sovittamisen ja suhteen analysointia. Analysoimalla aikaisempia tapahtumia tai tapauksia oikeassa järjestyksessä voi turvallisesti ennustaa tulevaa tapahtumaa. Esimerkiksi ennusteanalyysitekniikkaa voidaan käyttää myyntiin tulevan voiton ennakoimiseksi, jos myynti on valittu itsenäiseksi muuttujaksi ja voitto muuttuvalta riippuen myynnistä. Sitten historiallisen myynti- ja tulosdatan perusteella voidaan tehdä sopiva regressiokäyrä, jota käytetään tulosennusteessa.
  5. Päättävät puut - Päätöksessä puututaan yksinkertaisella kysymyksellä, jossa on useita vastauksia. Jokainen vastaus johtaa toiseen kysymykseen, jonka avulla voidaan luokitella tai tunnistaa tiedot niin, että ne voidaan luokitella tai jotta ennuste voidaan tehdä kunkin vastauksen perusteella. Käytämme esimerkiksi seuraavaa päätöstekstiä päättäessäkö krikettiä vai ei. ODI: Data Mining Decision Tree: Aloittamalla juurisolmu, jos sääennuste ennustaa sateen, meidän on vältettävä päivän ottelua. Vaihtoehtoisesti, jos sääennuste on selvä, meidän pitäisi pelata ottelua.

Data Mining on keskeinen analyysityö eri teollisuudenaloilla ja tieteenaloilla kuten viestintä, vakuutus, koulutus, valmistus, pankki-ja vähittäiskauppa ja enemmän. Siksi on tärkeää saada oikeat tiedot ennen kuin käytät erilaisia tekniikoita.

Suositeltava: