Як выбраць аптымальны да ў к-protoypes?

Для аналізу набору дадзеных з банкаўскай у мяне ёсць і лікавыя і катэгарыяльныя значэння. Я трансфармаваць іх для аналізу з да-прататыпаў.

Арыгінальны набор дадзеных:

enter image description here

Мадыфікаваны набор дадзеных:

  • г.д.: Работа (для 1 да 12, «таму што ёсць 12 узроўняў)

enter image description here

Ці павінен я маштабаваць набор дадзеных, перш чым рабіць K-прататыпы?

Як я мог вызначыць аптымальную «к», каб выбраць (кадаваньне)?

Я думаў, што для выканання:

library(clustMixType)

lbd <- lambdaest(BPor)

kpres <- kproto(BPor, 5, lambda = lbd) #Change '5' for every possible value of k.

print(kpres)

А затым, вылічыць суму ў межах хібнасці кластара (выбар малую).

2
дададзена аўтар Brandon Haugen, крыніца
@ Anony-мус Ці не ад таго ж карыстальніка, і нават крос-пост. Такім чынам, не павінна быць зачынены з гэтай прычынай
дададзена аўтар Serge, крыніца

адказаў няма

0