បង្កើត, ការអប់រំមធ្យមសិក្សានិងសាលារៀន
វិធីសាស្រ្តអ្នកជិតខាងដែលនៅជិតបំផុត: ឧទាហរណ៍នៃការងារ
វិធីសាស្រ្តអ្នកជិតខាងដែលនៅជិតបំផុតគឺការចាត់ថ្នាក់កាលដែលងាយស្រួលបំផុតដែលត្រូវបានផ្អែកលើការវាយតម្លៃនៃការស្រដៀងគ្នានៃវត្ថុផ្សេងគ្នានេះ។
វត្ថុដែលបានវិភាគជាកម្មសិទ្ធិរបស់ថ្នាក់ដែលពួកគេជាកម្មសិទ្ធិប្រធានបទនៃគំរូបណ្តុះបណ្តា។ សូមឱ្យយើងរកឃើញដែលជាអ្នកជិតខាងដែលនៅជិតបំផុត។ សូមព្យាយាមដើម្បីយល់ពីបញ្ហាស្មុគស្មាញ, ឧទហរណ៍បច្ចេកទេសផ្សេងគ្នា។
វិធីសាស្រ្តសម្មតិកម្ម
វិធីសាស្រ្តអ្នកជិតខាងដែលនៅជិតបំផុតអាចត្រូវបានចាត់ទុកថាជាក្បួនដោះស្រាយដែលបានប្រើសម្រាប់ចាត់ថ្នាក់ទូទៅបំផុត។ វត្ថុដែលបានទទួលការចាត់ថ្នាក់ជាកម្មសិទ្ធិរបស់ y_i ថ្នាក់ដើម្បីរៀនគំរូ x_i ដែលវត្ថុដែលនៅជិតបំផុត។
វិធីសាស្រ្តជាក់លាក់ជិតខាងដែលនៅជិតបំផុត
អ្នកជិតខាងដែលនៅជិតបំផុតវិធីសាស្រ្ត k បង្កើនភាពត្រឹមត្រូវនៃការអាចចាត់ថ្នាក់នេះ។ វត្ថុដែលបានវិភាគជាកម្មសិទ្ធិរបស់ថ្នាក់ដូចគ្នាជាច្រើននៃប្រទេសជិតខាងរបស់ខ្លួនគឺថា k ជិតស្និទ្ធទៅនឹងវត្ថុនៃ x_i វាបានវិភាគគំរូ។ ការដោះស្រាយបញ្ហាជាមួយនឹងការនៅពីរថ្នាក់នៃចំនួននៃប្រទេសជិតខាងនោះនឹងមានសេសដើម្បីជៀសវាងស្ថានភាពនៃភាពមានន័យមិនច្បាស់លាស់មួយ, ប្រសិនបើចំនួនដូចគ្នានៃប្រទេសជិតខាងនឹងជាកម្មសិទ្ធិរបស់ថ្នាក់ផ្សេងគ្នា។
បច្ចេកទេសនៃប្រទេសជិតខាងបានផ្អាក
postgresql-បានវិភាគវិធីសាស្រ្តនៅជិតលោកអ្នកបំផុតប្រទេសជិតខាងគឺត្រូវ tsvector បានប្រើពេលចំនួនយ៉ាងហោចណាស់បីថ្នាក់នេះហើយអ្នកមិនអាចប្រើចំនួនសេស។ ប៉ុន្តែភាពមិនច្បាស់លាស់កើតឡើងសូម្បីតែនៅក្នុងករណីទាំងនេះ។ បន្ទាប់មកអ្នកជិតខាងខ្ញុំទទួលបានទីទម្ងន់ w_i ដែលមានការថយចុះដោយមានឋានៈជិតខាងខ្ញុំ។ វាសំដៅទៅលើថ្នាក់នៃវត្ថុដែលនឹងមានទំងន់សរុបអតិបរមាក្នុងចំណោមប្រទេសជិតខាងយ៉ាងជិតស្និទ្ធ។
សម្មតិកម្មនៃការបង្រួម
នៅក្នុងបេះដូងនៃការទាំងអស់នៃវិធីសាស្រ្តខាងលើនេះគឺមានសម្មតិកម្មនៃការបង្រួមបាន។ វាបានបង្ហាញថាការតភ្ជាប់រវាងរង្វាស់នៃភាពស្រដៀងគ្នានៃវត្ថុនិងជាកម្មសិទ្ធិរបស់ពួកគេទៅថ្នាក់ដូចគ្នានេះ។ នៅក្នុងស្ថានភាពនេះ, ព្រំដែនរវាងប្រភេទផ្សេងគ្នានោះគឺជាទម្រង់សាមញ្ញនិងបង្កើតថ្នាក់នៃវត្ថុនៅក្នុងចន្លោះតំបន់ចល័តបង្រួម។ នៅក្រោមតំបន់ដូចជានៅក្នុងការវិភាគគណិតវិទ្យាបានយកទៅមានន័យថាសំណុំចងជាបានបិទ។ សម្មតិកម្មនេះមិនត្រូវបានទាក់ទងទៅនឹងការយល់ឃើញជារៀងរាល់ថ្ងៃនៃពាក្យនេះ។
រូបមន្តមូលដ្ឋាន
សូមឱ្យយើងពិចារណាអ្នកជិតខាងដែលនៅជិតបំផុតបន្ថែមទៀត។ ប្រសិនបើការបណ្តុះបណ្តាប្រភេទដែលបានស្នើគំរូ "វត្ថុដែលបានឆ្លើយតប» X ^ m = \ {(x_1 y_1,) \ ចំណុច (x_m, y_m) \}; ប្រសិនបើមានពហុភាពនៃវត្ថុមួយដើម្បីកំណត់ចម្ងាយមុខងារ \ rho (x, x ') ដែលត្រូវបានតំណាងនៅក្នុងសំណុំបែបបទនៃការស្រដៀងគ្នាគំរូគ្រប់គ្រាន់នៃវត្ថុដោយបង្កើនតម្លៃនៃអនុគមន៍នេះមានការថយចុះស្រដៀងគ្នារវាងវត្ថុ x, x' ។
សម្រាប់វត្ថុណាមួយ, អ្នកនឹងកសាងគំរូបណ្តុះបណ្តាជាមួយនឹងការកើនឡើងវត្ថុ x_i ចម្ងាយទៅអ្នក:
\ rho (u, x_ {1; អ្នក}) \ le \ rho (u, x_ {2; អ្នក}) \ le \ cdot \ le \ rho (u, x_ {ម៉ែត្រ; u})
ដែលជាកន្លែងដែល x_ {i; អ្នក} គំរូរៀនលក្ខណៈវត្ថុដែលជាកម្មវត្ថុប្រភពអ្នកជិតខាងទីប៉ុន្មានខ្ញុំ។ ការកំណត់និងការប្រើប្រាស់បែបនេះដើម្បីឆ្លើយតបទៅនឹងប្រទេសជិតខាងលើកទី i-: y_ {i; ប៉ុន្មាន} ។ ជាលទ្ធផលយើងបានរកឃើញថាវត្ថុណាមួយដែលអ្នកដាស់អារម្មណ៍ renumbering គំរូផ្ទាល់។
ការប្តេជ្ញាចិត្តរបស់ប្រទេសជិតខាងចំនួន k
វិធីសាស្រ្តអ្នកជិតខាងដែលនៅជិតបំផុតនៅពេលដែលមាន k = 1 គឺសមត្ថភាពនៃការផ្តល់ចំណាត់ថា្នាក់ដែលមានការភាន់ច្រលំ, មិនត្រឹមតែនៅលើវត្ថុបំភាយឧស្ម័នប៉ុន្តែថែមទាំងសម្រាប់ថ្នាក់ផ្សេងទៀតដែលនៅក្បែរ។
ប្រសិនបើយើងយក k = ម៉ែត្រ, ក្បួនដោះស្រាយនេះនឹងមានស្ថេរភាពហើយនឹងចុះទន់ខ្សោយចូលទៅក្នុងតម្លៃថេរមួយ។ នោះជាមូលហេតុដែលអាចជឿជាក់បានជាការសំខាន់ដើម្បីជៀសវាងសន្ទស្សន៍ខ្លាំង k ។
ក្នុងការអនុវត្តលក្ខណៈវិនិច្ឆ័យដែលជាសន្ទស្សន៍ល្អប្រសើរបំផុតដែលបានប្រើ K ធ្លាក់ត្រួតពិនិត្យ។
ការបំភាយឧស្ម័នបញ្ចាំង
វត្ថុនៃការសិក្សានេះគឺមិនស្មើគ្នាច្រើនប៉ុន្តែក្នុងចំណោមពួកគេមានអ្នកដែលមានលក្ខណៈនៃថ្នាក់មួយហើយត្រូវបានបញ្ជូនទៅដូចជាស្តង់ដា។ នៅជិតទៅនឹងប្រធានបទនៃប្រូបាប៊ីលីតេគំរូល្អរបស់ខ្លួនក្នុងការដែលជាកម្មសិទ្ធិខ្ពស់ថ្នាក់នេះទៅ។
តើមានវិធីសាស្រ្តនៃប្រទេសជិតខាង rezultativen នៅជិតលោកអ្នកបំផុត? ឧទាហរណ៍មួយអាចត្រូវបានគេមើលឃើញនៅលើមូលដ្ឋាននៃប្រភេទគ្រឿងកុំព្យូទ័រដែលមិនបានផ្ដល់ដំណឹងនិងវត្ថុ។ វាត្រូវបានសន្មត់បរិយាកាសក្រាស់នៃវត្ថុតំណាងផ្សេងទៀតនៃថ្នាក់នេះ។ នៅពេលដែលអ្នកយកពួកវាចេញពីចំណាត់ថ្នាក់នៃគំរូដែលមានគុណភាពនឹងមិនទទួលរងនោះទេ។
ទទួលបានការចូលទៅក្នុងចំនួនជាក់លាក់នៃគំរូអាចផ្ទុះសំឡេងរំខានដែលមាន "នៅលើដី»របស់ថ្នាក់មួយ។ ការដោះផលប៉ះពាល់ជាវិជ្ជមានយ៉ាងខ្លាំងលើគុណភាពនៃការចាត់ថ្នាក់នេះ។
ប្រសិនបើគំរូដែលបានយកពីវត្ថុ uninformed សំឡេងរំខាននិងលុបបំបាត់, អ្នកអាចពឹងផ្អែកលើលទ្ធផលវិជ្ជមានមួយចំនួននៅពេលតែមួយ។
នេះជាលើកដំបូង វិធីសាស្រ្តការកែខៃនៃ ការចាត់ថ្នាក់អ្នកជិតខាងដែលនៅជិតបំផុតអនុញ្ញាតឱ្យប្រសើរឡើងនូវគុណភាពកាត់បន្ថយចំនួននៃការរក្សាទុកទិន្នន័យដែលបានកាត់បន្ថយពេលវេលានៃចំណាត់ថា្នាក់ដែលត្រូវបានចំណាយលើជម្រើសនៃស្តង់ដាក្រោយនេះ។
ការប្រើប្រាស់គំរូជ្រុលធំ
វិធីសាស្រ្តអ្នកជិតខាងដែលនៅជិតបំផុតគឺមានមូលដ្ឋានលើការផ្ទុកពិតប្រាកដនៃវត្ថុរៀន។ ដើម្បីបង្កើតគំរូខ្នាតធំខ្លាំងណាស់ដោយប្រើបញ្ហាបច្ចេកទេស។ គោលបំណងនេះត្រូវបានមិនមែនគ្រាន់តែដើម្បីរក្សាទុកមួយចំនួនទឹកប្រាក់យ៉ាងសំខាន់នៃពទេតែថែមទាំងក្នុងចំនួនអប្បបរមានៃការពេលវេលាដើម្បីមានពេលវេលាដើម្បីស្វែងរកវត្ថុណាមួយក្នុងចំណោមប្រទេសជិតខាង U k ជិតបំផុត។
ដើម្បីដោះស្រាយជាមួយនឹងភារកិច្ចនេះ, វិធីសាស្រ្តចំនួនពីរត្រូវបានប្រើ:
- គំរូស្តើងតាមរយៈវត្ថុដែលមិនមែនជាទិន្នន័យឆក់;
- រចនាសម្ព័នមានប្រសិទ្ធិភាពក្នុងការប្រើប្រាស់ពិសេសនិងលេខកូដទិន្នន័យសម្រាប់ការស្វែងរកបន្ទាន់នៃប្រទេសជិតខាងដែលនៅជិតបំផុត។
ច្បាប់នៃវិធីសាស្រ្តការជ្រើសរើស
នេះជាការចាត់ថ្នាក់ខាងលើនេះត្រូវបានគេចាត់ទុកថាជា។ វិធីសាស្រ្តអ្នកជិតខាងដែលនៅជិតបំផុតគឺត្រូវបានប្រើក្នុងការដោះស្រាយបញ្ហាជាក់ស្តែងដែលត្រូវបានគេស្គាល់នៅក្នុងជាមុនចម្ងាយមុខងារ \ rho (x, x ') ។ នៅក្នុងវត្ថុដែលអធិប្បាយអំពីវ៉ិចទ័រលេខតោនអឺគ្លីតប្រើ។ ជម្រើសនេះគ្មានយុត្តិកម្មពិសេសនោះទេប៉ុន្តែពាក់ព័ន្ធនឹងការវាស់វែងនៃសញ្ញាទាំងអស់ "នៅក្នុងទ្រង់ទ្រាយដូចគ្នា។ » ប្រសិនបើមានកត្តានេះមិនត្រូវបានគេយកទៅក្នុងគណនី, បន្ទាប់មកវានឹងលុបម៉ែត្រលក្ខណៈពិសេសដែលមានតម្លៃលេខខ្ពស់បំផុត។
ប្រសិនបើមានគឺជាចំនួនទឹកប្រាក់ច្រើននៃលក្ខណៈពិសេស, ការគណនាចម្ងាយជាផលបូកនៃគម្លាតនៅលើរោគសញ្ញាជាក់លាក់លេចឡើងវិមាត្របញ្ហាធ្ងន់ធ្ងរ។
ក្នុងចន្លោះវិមាត្រខ្ពស់ឆ្ងាយពីមួយទៅមួយនឹងមួយទៀតវត្ថុទាំងអស់។ ទីបំផុតគំរូណាមួយនឹងក្លាយជាជាប់នឹងវត្ថុត្រូវបានសិក្សា k អ្នកជិតខាង។ ដែលបានជ្រើសរើសមួយចំនួនតូចមួយនៃលក្ខណៈពិសេសផ្ដល់ដំណឹងដើម្បីលុបបំបាត់បញ្ហានេះ។ ក្បួនដោះស្រាយការគណនាការប៉ាន់ប្រមាណនៃការសាងសង់នៅលើមូលដ្ឋាននៃការមានគស្ញសំណុំផ្សេងគ្នានេះហើយសម្រាប់បុគ្គលនីមួយកសាងមុខងារជិតរបស់ពួកគេ។
សេចក្តីសន្និដ្ឋាន
ជាញឹកញាប់ពាក់ព័ន្ធនឹងការគណនាគណិតវិទ្យានៃភាពខុសគ្នានៃការប្រើបច្ចេកទេសដែលមានលក្ខណៈដោយឡែក, គុណសម្បត្តិនិងគុណវិបត្តិរបស់ពួកគេផ្ទាល់មួយ។ វិធីសាស្រ្តអ្នកជិតខាងបានមើលការពិតនៅជិតលោកអ្នកអាចដោះស្រាយបញ្ហាធ្ងន់ធ្ងរដោយសារតែលក្ខណៈនៃវត្ថុគណិតវិទ្យា។ គំនិតពិសោធន៍ដោយផ្អែកលើវិធីសាស្រ្តវិភាគត្រូវបានប្រើយ៉ាងសកម្មនៅក្នុងការស៊ើបការណ៍សិប្បនិម្មិត។
នៅក្នុងប្រព័ន្ធអ្នកជំនាញដែលវាគឺជាការចាំបាច់មិនមែនគ្រាន់តែដើម្បីចាត់ថ្នាក់វត្ថុ, ប៉ុន្ដែថែមទាំងបង្ហាញអ្នកប្រើដែលបានពន្យល់ពីចំណាត់ថា្នាក់នៅក្នុងសំណួរនេះ។ ក្នុងវិធីសាស្រ្តនេះ, ការពន្យល់នៃបាតុភូតនេះត្រូវបានបញ្ជាក់នៅក្នុងការទាក់ទងទៅនឹងវត្ថុនៃថ្នាក់ជាក់លាក់មួយព្រមទាំងទីតាំងរបស់វាទាក់ទងទៅនឹងគំរូដែលបានប្រើ។ អ្នកជំនាញឧស្សាហកម្មផ្នែកច្បាប់, ភូគព្ភសាស្ត្រ, គ្រូពេទ្យ, យកនេះ "អាទិភាព" តក្កយ៉ាងសកម្មប្រើវានៅក្នុងការស្រាវជ្រាវរបស់ពួកគេ។
ក្នុងគោលបំណងដើម្បីត្រូវបានវិភាគវិធីសាស្រ្តជាការគួរឱ្យទុកចិត្តបំផុត, មានប្រសិទ្ធិភាព, ផ្តល់លទ្ធផលដែលចង់បាន, អ្នកត្រូវតែយក K តួលេខអប្បបរមាខណៈពេលដែលការផងដែរជៀសវាងការបញ្ចេញឧស្ម័នក្នុងចំណោមវត្ថុវិភាគ។ នោះហើយជាមូលហេតុដែលការប្រើប្រាស់នៃស្តង់ដារនិងវិធីសាស្រ្តជ្រើសរើសព្រមទាំងម៉ែត្របង្កើនប្រសិទ្ធិភាពនោះទេ។
Similar articles
Trending Now