Žurnál 2

SEOUL, KOŠICE. Páni Kun Chang Lee*, Jin Sung Kim, Nam Ho Chung, Soon Jae Kwon z Sung Kyun Kwan University (School of Business Administration) využívajú na tvorbu Fuzzy kognitívnej mapy metódy webmining-u. Pri Web-miningu sa jedná o využitie techník Data-miningu na automatické objavovanie a extrahovanie informácií z webových dokumentov a služieb. Pričom to zahŕňa celý proces objavovania potencionálne užitočnej a predtým neznámej informácie alebo poznatku z prostredia webu. Prolémom je však interpretovanie web-mining výsledkov, tak aby mali nejaky všeobecný výsledok. Preto sa páni z univerzity rozhodli zaviesť tri fázy inferenčného „zosilnenia“ procedúr (Obr. 1). V prvej fáze aplikujeme association rule mining. V druhej fáze transformujeme association rule na FCM riadenú kauzálnu bázu znalostí. V tretej fáze priradíme k zosilnenej inferencii bázu dát. Najprv si definovali fuzzy kognitívne mapy (FCM). Kognitívna mapa (CM) je orientovaný ohodnotený graf, kde uzly predstavujú pojmy a spojenia kauzálne väzby medzi nimi. Každý uzol má priradenú určitú hodnotu, ktorá vyjadruje, či pojem v danom okamihu platí, alebo nie (1 resp. 0). Ohodnotenie spojení predstavuje kauzálnu závislosť medzi pojmami. Fuzzy kognitívna mapa (FCM) predstavuje rozšírenie klasickej CM. Fuzzy rozšírenie spočíva v tom, že spojenia môžu nadobúdať hodnoty z intervalu <0;1> resp. <-1;1> a pojmy použitím prahovacej funkcie môžu byť buď binárne, alebo fuzzy. Dalej sa venovali definovaním konceptu asociačných pravidiel, vychádzali z [Agrawal 93, 94]. Odtiaľ je aj nasledovná definícia: Nech L = I1, I2, … , Im je množina binárnych atribútov nazývaných položky. Nech T je databáza transakcií. Každá transakcia t je reprezentovaná ako binárny vektor, kde t[k] = 1 ak t kúpil položku Ik a t[k] = 0 inak. Nech X je množina určitých položiek v L. Hovoríme, že transakcia t vyhovuje X ak pre všetky položky Ik v X, t[k] = 1. Pod asociačným pravidlom sa rozumie implikácia v tvare X=> Ij, kde X je množina určitých pložiek v L a Ij je jedna položka z L, ktorá nie je prítomná v X. Pravidlo je vyhovujúce v množine transakcií T s faktorom dôvery 0 ≤ c ≤ 1 ak minimálne c% z transakcií v T, ktoré vyhovujú X vyhovujú aj Ij. Dôvera býva označovaná ako c. Podpora pravidla je definovaná ako percento transakcií v L, ktoré obsahuje X∪Ij. Označuje sa s. Fáze I. (association rules mining) pozostáva z nájdenia často sa vyskytujúcich množín položiek, na ktoré sa dá použiť algoritmus Apriori, ktorý je uvedený v [Agrawal94]. Apriori postupne generuje množiny frekventovaných položiek, pričom postupuje od najmenších (s najmenším počtom prvkov) k najväčším. Pokiaľ je to možné, z frekventovaných množín s n prvkami sa generujú množiny s n+1 prvkami. Súbor frekventovaných množín, ktoré majú n prvkov sa označuje Ln. Fáza II (transformácia do FCM riadenu kauzálnu bázu znalostí) pozostáva z kauzálnej znalosti. Je velmi ľahko reprezentovaná adekvátnou maticou Wt., kde všetky spojitosti v FCM sú označené. Wij je prvok matice Wt, ktorý je vlastne kauzálna hodnota (váha) arc z vrchola i do vrcholu j.

picc2.jpg

Fáza III (priradenie k zosilnenej inferencii bázu dát) ktorú tvorí elminácia pravidiel redudancie, pričom na odstranenie skrytej redudancie použijeme fázu II. Ďalej na hľadanie priamych a nepriamych zreťazených pravidiel používame zreťazené pravidlo, ktoré obsahuje časť nejakého ineho pravidla. A na koniec použjeme samotné zosilnenie inferencie.

Spracované na základe: Fuzzy_cognitive_map_approach_to_web-mining_inference_amplification.pdf

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License