Ці магчыма мадэль ML выконваць горш, чым выпадковая класіфікацыя?

Я рэалізаваў розныя алгарытмы машыннага навучання на матрыцы з двайковымі дадзенымі для прагназавання аднамерных мэтаў з двума класамі.

    <Літый> выпадковага лесу (дакладнасць = 62,01) <Літый> нейронавай сеткі (соотв = 58,9) <Літый> SVM-радыяльная ядра (дакладнасць = 58.02) <Літый> аналіз лінейны дискриминантный (дакладнасць = 57,9) <Літый> лагістычнай рэгрэсіі (дакладнасць = 57,6).

Мая базавая дакладнасць 52,55. Але ў выпадку наіўнага байесовского ў той жа абстаноўцы дае толькі 48,5 дакладнасць, якая ідэнтыфікуе толькі адзін клас у. прадказаць.

Ці магчыма мадэль машыннага навучання, каб паводзіць сябе горш, чым выпадковая класіфікацыю?

3

3 адказы

Так, гэта магчыма.

Проста азначае, што мадэль прыстасоўваецца да шуму, так гэта ацэнкі «няправільнай» рыса.

У якасці аналогіі, калі вы выпадкова адгадаў вынікі гульні ў баскетбол, вы, верагодна, лепш, чым хто-небудзь думае, што менш ачкоў лепш і гадаць на аснове ацэнкі папярэдніх гульняў

4
дададзена
Ці магу я паведаміць вынік NaiveBayes мадэлі нароўні з іншымі мадэлямі выніку? Я павінен паведаміць у маёй магістарскай дысертацыі?
дададзена аўтар product researcher, крыніца
Наіўны байесовский прагназуе y.pred ў адным класе. Гэта тое, што паказвае на тое, што мадэль зрушаная да аднаго класа. Я не разумею, гэта паводзіны. Хоць мае класы збалансаваныя.
дададзена аўтар product researcher, крыніца
Не, я не змяніў параметры для наіўных Nayes. Я напісаў сцэнары ў R
дададзена аўтар product researcher, крыніца
Ну, вы, безумоўна, CAN. Гэта толькі азначае, што Наіўная мадэль Байеса ня падыходзіць для вашай праблемы. Рабіць, калі вы не павінны ведаць, хоць. Гэты кантэкст усё, што вы!
дададзена аўтар AMC, крыніца
Мянялі Ці Вы якія-небудзь параметры для наіўнай мадэлі Байеса? На якой мове вы пішаце сцэнар?
дададзена аўтар AMC, крыніца
Калі вы выкарыстоўвалі адны і тыя ж дадзеныя, і няма ніякіх параметраў, для мяне гэта проста азначае, што Наіўны байесовский не пасуюць для вашых дадзеных, не тое, што там было нешта не так з вашай тэхнікай мадэлявання або дадзенымі. Асабліва ўлічваючы, што вы мелі «нармальныя» вынікі з іншымі мадэлямі
дададзена аўтар AMC, крыніца

Ваша мадэль можа быць горш, чым выпадковая, напрыклад, калі некаторыя фундаментальныя дапушчэння парушаюцца, у незбалансаванай абстаноўцы, калі ваша выкарыстанне дакладнасці ў якасці базавай або ў вас ёсць шумныя дадзеныя і г.д.

Аднак, у двайковай наладзе, калі вашы класы ідэальна збалансаваны, і калі ваш класіфікатар пастаянна робяць ілжывыя прадказанні (не з-за выпадковасць), вы заўсёды можаце наладзіць мадэль, каб быць лепш, чым выпадковая, прадказаўшы поўную супрацьлегласць мадэлі.

2
дададзена
Мае класы збалансаваны, я не ўхіліў коллинеарность асабліва ў кожнай мадэлі, таму я захаваў асноўныя рамак аднолькавыя для ўсіх мадэляў, але і для наіўнага байесовскога я атрымліваю дрэнныя вынікі. Вось яшчэ адна спасылка stackoverflow.com/questions/32211157/…
дададзена аўтар product researcher, крыніца

Ну, зусім. У мяне была такая ж праблема ў апошні час (і ў канчатковым выніку тут). Так што я проста імітавалі набор дадзеных і незалежную пазнаку ( поўны тэкст артыкула тут )

У асноўным, калі няма нічога, каб даведацца, ваша мадэль будзе вырабляць прагнозы некоррелированных на этыкетцы. У сваю чаргу, гэтыя прадказанні (калі паўтараецца шмат разоў) паказваюць цікавае размеркаванне каэфіцыента памылак (ацэньваецца па праверцы абгрунтаванасці або з дапамогай крыжаванай праверкі).

Тым не менш, у вашым выпадку, я вельмі здзіўлены, што адна канкрэтная мадэль не працуе належным чынам, калі іншыя, здаецца, паказваюць адпаведныя прагнозы.

1
дададзена