Zhlukovanie

Vzory v hodnotení používateľov je možné hľadať napríklad pomocou zhlukovacích
algoritmov. Pre účely hľadania vzorov pri hodnotení filmov je vhodné použiť menej striktné
algoritmy (striktný je napr. K-Means, kde 1 používateľ by mohol byť zaradený len do
jedného zhluku).
Vhodná reprezentácia zhlukov sa zdá byť použitím fuzzy množín. Jeden používateľ teda
môže patriť do viacerých zhlukov, ku každému s určitým stupňom príšlušnosti.
Jedným zo spôsobov nájdenia týchto fuzzy množín môže byť použitím algoritmu Fuzzy C-
means (FCM). Výstupom FCM sú dve matice Z a C. Matica Z hovorí o príslušnosti
používateľa u k zhluku k (UxK veľkosť). Matica C hovorí o strednej hodnote hodnotenia filmu
m v zhluku k (KxM veľkosť).
Vynázobením týchto matíc dostaneme predpokladané hodnotenie všetkých používateľov ku
všetkým filmom.
Otázkou je určenie matíc Z a C. Najjednoduchšou cestou je nájdenie klasifikačnej funkcie a
jej následná optimalizácia pre matice Z a C.

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License