ኪ.የምክሌት (clustering) ማለት ምንድን ነው?

በ k-ጥቃቅን ስልተ-ቀመር የውሂብ ማውጣት

k- ማመላከቻ ስልት ቀመር የአሰሳ ስልት የማንበብ እና የማሽን መማሪያ መሳሪያዎች እነዚህን ግንኙነቶች ያለበቂነታ ሳይንሳዊ አስተያየቶችን በቡድን ለመከፋፈል ጥቅም ላይ የዋለ ነው. ናሙና በማንሳት, ስልቱ በየትኛው ምድብ ወይም ስብስብ, መረጃው በሚያዘው መሠረት ከቁልቁዎች ቁጥር ጋር እንዲታይ ለማድረግ ይሞክራል .

k- ዘዴዎች ቀመሮቹን ቀለል ያሉ የቁልፍ አሰጣጥ ዘዴዎች እና በአብዛኛው በሕክምና ምህዳር, ባዮሜትሪክ እና ተዛማጅ መስኮች ላይ ጥቅም ላይ ይውላል. የ k- ጥቃቅን መጠቀምን ማለት የተጀመረው ስሇመጀመሪያው ስሌጠና (በዘህ-ትዕዛዙ የተከተለውን የአሊጎሪዝም ቅርጽ በመጠቀም) መገምገም እንጂ ስሇ ( ስሇማይተገበረው ዯረጃዎ) የተዯረገውን ስሇሚነዲው መረጃ ነው.

አንዳንዴም የሎይድ አልጎሪምዝም በተለይም በኮምፒተር ሳይንስ ክቦች ውስጥ የሚታወቀው አንዳንዴም ስታንዳርድስ አልጎሪዝም ለመጀመሪያ ጊዜ በስታዋርት ሎይድ አማካይነት የቀረበው በ 1957 ነበር. "ኪው ሜይድ" የሚለው ቃል በ 1967 በጄኔጅ ማክቼን የተጀመረው.

የ k-means የአልጎሪዝም ተግባሮች እንዴት ነው

k- ዘዴው ቀመር አልማሪዝም ስያሜውን ከሥራ አሰራር ዘዴው ውስጥ የሚያስወጣው የዝግመተ ለውጥ ስልተ-ቀመር ነው. የአልጎሪዝም አባሎች የግድ ግኝቶችን ለ k ቡድኖች, እና k እንደ የግቤት ግቤት (ግቤት ግቤት) ይቀርባል. በእያንዲንዲው ጉብኝት ወዯ ትብሌቅ (ግማሽ) ማሇት ሇመመዯብ የተዯረጉትን ጉዲዮች ይመዴራሌ. የክላስተር መካከለኛ ፍቺው እንደገና የተገናኘ እና ሂደቱ እንደገና ይጀምራል. ስልተ ቀመር እንዴት እንደሚሰራ ይኸውና:

  1. አልጎሪዝም እንደ መጀመሪያዎቹ ክላስተር ማእከሎች (ነጥቦቹን) እንደ k ነጥቦችን በግዴታ ይመርጣል.
  2. በእያንዳንዱ ነጥብ እና በእያንዳንዱ የክላስተር ማዕከል መካከል ባለው የኢቱሊያን ርቀት ላይ በመመርኮዝ የውሂብ ክምችት እያንዳንዱ ነጥብ በተዘጉ ክላስተሮች ይመደባል.
  3. እያንዳንዱ ክላስተር ማዕከል በእዚያ ጥቅል የአማካይ ነጥቦች አማካይነት እንደገና ይሰራል.
  4. ቅደም ተከተል 2 እና 3 ተደጋግመው ክላስተሮች እስከሚገናኙ ድረስ. የመዋሃድ ውህደት በተግባሩ ላይ ተመስርቶ በተለያየ መንገድ ሊገለፅ ይችላል, ነገር ግን በተለምዶ የተደላደለ እርምጃዎች ደረጃ 2 እና 3 ሲደጋገሙ, ወይም የተደረጉት ለውጦች የቁጥሮች ትርጓሜ ልዩነት ላይ ለውጥ አያመጡም ማለት ነው.

የክምችት ብዛት መምረጥ

K- ዋንኛ ኪሳራ አንዱ-ጥምረት ማለት የግብሩን ቁጥር እንደ አልጎሪዝም ግቤት አድርጎ መጥቀስ ነው. በተሰየመው መሠረት አልጎሪዝም ተገቢውን የቁጥር ቅንጅቶችን ለመወሰን ችሎታ የለውም, እና በቅድሚያ ይህንን ለመለየት በተጠቃሚው ይወሰናል.

ለምሳሌ, ወንድ ወይም ሴት ባላቸው ሁለትዮሽ የፆታ ማንነት መለያ ስብስቦች ላይ የተመሰረቱ ቡድኖች ካሉ, የግብስብ k = 3 ን በመጠቀም የ k- የግብዓት ስልተ- መጠንን በመጥራት ሰዎች ሁለት ጊዜ ብቻ ሲገደቡ ሶስት ስብስቦች ያስገድዷቸዋል ወይም የ k = 2 ግብዓት , የበለጠ ተፈጥሯዊ ምቾት ያቀርባል.

በተመሳሳይ ሁኔታ, የተወሰኑ ግለሰቦች በቤት አቋም ላይ ተመስርቶ በቀላሉ የተደባለቁ ከሆነ እና k- የሰዎችን የአልትሪዝም ስልት በግብዓት k = 20 ብለው ቢጠሩ ውጤቱ ውጤታማ ለመሆን በጣም ብዙ ጥቅል ሊባል ይችላል.

ለዚህ ምክንያቱ ብዙውን የ k ዋጋዎችን ለመሞከር የሚመች ነው. በተጨማሪም በሂደት ላይ ያለ የሂሳብ የማጎሪዎች ዕውቀት ወደ ማይክሮ-አውቃቂ እውቀት መጠቀምን ለማሰስ ፍላጎትዎን ሊፈልጉ ይችላሉ.