Žurnál 1

PEKING, KOŠICE. Páni Jinlong Wu a Tiejun Li z Pekingingskej Univerzity (LMAM and School of Mathematical Sciences) kombináciou dvoch metód Matrix Factorization (MF) a Fuzzy C-means (FCM) navrhli novú metódu Modified Fuzzy C-means (Obr. 1, MFCM). V našom projekte sme sa rozhodli, že pre nás bude vhodná reprezentácia zhlukov použitím fuzzy množín. Z toho vyplíva, že jeden používateľ teda môže patriť do viacerých zhlukov, ku každému s určitým stupňom príšlušnosti. Jedným zo spôsobov nájdenia týchto fuzzy množín, môže byť použitím algoritmu Fuzzy C- means (FCM), ktorý popisuju aj páni z Pekingingskej Univerzity. V pricipe (FCM) výstupom sú dve matice Z a C. Matica Z hovorí o príslušnosti používateľa u k zhluku k (UxK veľkosť). Matica C hovorí o strednej hodnote hodnotenia filmu m v zhluku k (KxM veľkosť). Vynásobením týchto matíc dostaneme predpokladané hodnotenie všetkých používateľov ku všetkým filmom. Otázkou je určenie matíc Z a C. Najjednoduchšou cestou je nájdenie klasifikačnej funkcie a jej následná optimalizácia pre matice Z a C. Faktorizácia matice slúži pre dekompozíciu matice na dve menšie matice, ktoré po vynásobení vytvoria pôvodnú maticu. Táto technika dovoľuje zmenšiť príznakový priestor kombináciou pôvodných príznakov. Tým nám vznikajú nezávislé príznaky, ktoré lepšie popisujú daný predmet. Výsledný tvar vyzerá nasledovne: V =W * H , kde V je pôvodná matica (napr. matica Term-Dokument veľkosť TxD), W je matica váh veľkosti FxD, H je matica nových príznakov veľkosti DxF, F je počet nových príznakov.Z ich experomentov a testovaní (Obr.1) MFCM má lepšiu interpretáciu ako MF a lepšiu presnosť ako FCM. MFCM taktiež podporuje novú perspektívu MF modelu.

pic1.jpg

Záverom práce Jinlong Wu a Tiejun Li bolo to, že metódu MFCM podrobili experimentom na Netflix prize data. MFCM dosilahla Root Mean Squared Error (RMSE) 0,9469. Čo v podstate z experimentov predstavovalo najlepšie výsledky z metód MF (0.9201 RMSE) a FCM.Typicky MF konverguje zvyčajne po niekoľkých tuctov iterácií a FCM konverguje po niekoľkych stovkach iterácií. MFCM konverguje podobne ako MF ale s lepšou interpretáciou.

Spracované na základe: A Modified Fuzzy C-Means Algorithm For Collaborative Filtering

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License