Top > Info > Data Mining > 2-3. ±ºÁýºÐ¼®(Automatic Cluster Detection)


¢¹¢º ±ºÁýºÐ¼®(Automatic Cluster Detection)

 

°Å´ëÇÑ µ¥ÀÌÅͺ£À̽º´Â ¸¹Àº º¯¼ö¿Í ¸¹Àº Â÷¿ø, ¸¹Àº º¹ÀâÇÑ ±¸Á¶·Î µÇ¾î ÀÖ¾î Á¦ÀÏ ÁÁÀº Á÷Á¢ÀûÀÎ µ¥ÀÌÅ͸¶ÀÌ´× ±â¹ýÀÏÁö¶óµµ µ¥ÀÌÅͺ£À̽º·ÎºÎÅÍ ÀÇ¹Ì ÀÖ´Â ÆÐÅÏÀ» À̲ø¾î ³¾ ¼ö ¾ø´Ù. ´ëºÎºÐÀÇ °æ¿ì, ¹®Á¦´Â ãÀ» ¼ö ÀÖ´Â ÆÐÅÏÀÌ ¾ø´Ù´Â °ÍÀÌ ¾Æ´Ï¶ó ³Ê¹« ¸¹Àº ÆÐÅÏÀÌ ÀÖ´Ù´Â °ÍÀÌ´Ù . ÀÌ·¯ÇÑ µ¥ÀÌÅÍ º£À̽º¿¡¼­ ¾î¶² Ưº°ÇÑ ´äÀ» ¿øÇÏ´Â µ¥ÀÌÅ͸¶ÀÌ´×À» ÇÒ ¶§ ¸¹Àº °æ¿ì ´ÜÁö ÀâÀ½¸¸À» ã´Â´Ù.

¸¶ÄÉÆÿ¡¼­ ÀÌ¹Ì ÁÁÀº ½Äº°ÀÚ·Î ¾Ë·ÁÁø º¯¼ö·Î Áý´ÜÀ» ¼¼ºÐÇÏ´Â °ÍÀ» ¡®ºÐÇÒ¡¯À̶ó ºÎ¸¥´Ù. ¸¹Àº °æ¿ì, ¸Å¿ì ÀâÀ½ÀÌ ¸¹Àº µ¥ÀÌÅÍ ¼ÂÀÌ ´Ù¼öÀÇ ÁÁÀº ÇൿÀ» ÇÏ´Â Áý´ÜÀ¸·Î ±¸¼ºµÇ¾î ÀÖ´Ù°í ÁüÀÛÇÏÁö¸¸, ¾î¶»°Ô ±× Áý´ÜÀ» Á¤ÀÇ ÇÒ Áö¿¡ ´ëÇÑ ÀÇ°ßÀº ¾ø´Ù. ¼¼ºÎÁý´Ü¿¡ ´ëÇØ Áö½ÄÀÌ ¾ø¾î¼­ Àüü¸¦ ÀÌÇØÇÒ ¼ö ¾øÀ» ¶§ ÀÚµ¿Áý´Ü¹ß°ßÀÌ ÁÁÀº ±â¹ýÀÌ µÉ ¼ö ÀÖ´Ù.

Ŭ·¯½ºÅ͸µÀº ºñÅëÁ¦ ÇнÀÀ̳ª °£Á¢ÀûÀÎ Áö½Ä¹ß°ß°ú °°ÀÌ ¹¦»çµÉ ¼ö ÀÖ´Â ±Ø¼Ò¼öÀÇ µ¥ÀÌÅ͸¶ÀÌ´× ÇൿÁßÀÇ ÇϳªÀÌ´Ù. ´ë´Ù¼öÀÇ µ¥ÀÌÅ͸¶ÀÌ´× ÀÛ¾÷¿¡¼­ ÀÌ¹Ì ºÐ·ùµÈ TRAINING SET¿¡¼­ ½ÃÀÛÇÏ¿© »õ·Î¿î ·¹Äڵ带 ¾î¶»°Ô ºÐ·ùÇÒ °ÍÀΰ¡¸¦ ¿¹ÃøÇÒ ¼ö ÀÖ´Â ¸ðµ¨ °³¹ßÀ» ½ÃµµÇÑ´Ù. Å©·¯½ºÆ®¸µ¿¡¼­´Â µ¶¸³º¯¼ö¿Í Á¾¼Óº¯¼ö»çÀÌÀÇ ±¸º°À̳ª ÀÌ¹Ì ºÐ·ùµÈ µ¥ÀÌÅÍ ¼ÂÀÌ ÇÊ¿ä¾ø´Â ´ë½Å¿¡ À¯»çÇÑ °í°´µé, Á¦Ç°µéÀ» ´ëÇ¥ÇÏ´Â À¯»çÇÑ ·¹ÄÚµåµéÀÌ À¯»çÇÏ°Ô ÇൿÇϸ®¶ó´Â ±â´ëÇÏ¿¡¼­ ¡®Å©·¯½ºÅÍ¡¯¶ó°í ÇÏ´Â ¼­·Î À¯»çÇÑ ·¹ÄÚµåÀÇ ±×·ìÀ» ã°íÀÚ ÇÑ´Ù.

Ŭ·¯½ºÅ͸¦ ãÀº °ÍÀÌ ¸ñÀûÀÌ ¾Æ´Ï±â ¶§¹®¿¡ ÀÚµ¿Áý´Ü ¹ß°ß¸¸À» »ç¿ëÇÏ´Â °æ¿ì´Â ¸Å¿ì µå¹°´Ù. ±×·¡¼­ Å©·¯½ºÅÍ°¡ ¹ß°ßµÇ¸é Å©·¯½ºÅÍÀÇ Àǹ̸¦ ã±â À§ÇÏ¿© ´Ù¸¥ ¹æ¹ýµéÀÌ Àû¿ëµÈ´Ù. Ŭ·¯½ºÆ®¸µÀÌ ¼º°øÀûÀ̸é, °á°ú´Â ±ØÀûÀ¸·Î ³ªÅ¸³¯ ¼ö ÀÖ´Ù.

 

Fitting the Troops

¿¹¸¦ µé¸é, ¹Ì±¹ ±º´ë¿¡¼­ ÃÖ±Ù¿¡ ¿©±ºÀÇ À¯´ÏÆûÀ» ¾î¶»°Ô ´Ù½Ã µðÀÚÀÎÇÒ °ÍÀΰ¡¸¦ °í¹ÎÇÏ°í ÀÖ´Ù°í ÇÏÀÚ. Áï, ±º´ëÀÇ ¸ñÀûÀº ¿©±ºµé¿¡°Ô Àß ¸Â´Â ¿ÊÀ» Á¦°øÇϸ鼭µµ »çÀÌÁ Â÷À̸¦ ¾î¶»°Ô µç ÁÙ¿©º¸°í ½Í´Ù°í ÇÏÀÚ. ±×·¡¼­, ±×µéÀº ±âÁ¸¿¡ ³ª¿ÍÀÖ´Â ¹«¼öÈ÷ ¸¹Àº ¿©¼º ¿ÊÀ» »çÀÌÁî ü°è´ë½Å ƯÁ¤ÇÑ ½ÅüºÎÀ§¸¦ Àé »çÀÌÁ µµÀÔÇß´Ù. Áï, ±ä body, º¸Åë ÆÈ »çÀÌÁî, ³ÐÀº ¾î±ú¸¦ °¡Áø »ç¶÷Àº ªÀº ´Ù¸®, Àß·ÏÇÑ Ç㸮, Å« °¡½¿À» °¡Áø »ç¶÷ÀÇ »çÀÌÁî°¡ ÀûÇÕÇÏ´Ù.

µ¥ÀÌÅͺ£À̽º´Â 3000¸í ¿©¼ºÀÇ 100°¡ÁöÀÇ ÃøÁ¤À» ´ã°í ÀÖ´Ù. ÀÌ·¯ÇÑ °æ¿ì¿¡ ¾²ÀÌ´Â ¹æ¹ýÀº k-means ¾Ë°í¸®ÁòÀÌ´Ù. ´Ü°è¸¦ »ìÆ캸¸é, ¸ÕÀú Çü¼ºÇÏ°í ½ÍÀº Å©·¯½ºÅ͸µÀÇ ¼ö¸¦ °áÁ¤ÇÑ´Ù À̶§ÀÇ ¼ö°¡ ¹Ù·Î K-meansÀÇ K°¡ µÇ´Â °ÍÀÌ´Ù. ±×¸®°í k°³ÀÇ ½Ãµå°¡ Å©·¯½ºÅ͸µÀÇ Áß½ÉÀÌ µÇµµ·Ï ¼±ÅõǾîÁø´Ù. ±×¸®°í, µ¥ÀÌÅͺ£À̽ºÀÇ °¢°¢ÀÇ ·¹Äڵ尡 ±×°ÍÀÇ °¡Àå °¡±î¿î ½Ãµå¸¦ ±â¹ÝÀ¸·Î ÇÏ´Â Å©·¯½ºÅ͸µ ÇÒ´ç¿¡ ÁÖ¾îÁø´Ù.±×¸®°í ³ª¼­ »õ·Î¿î Å©·¯½ºÅÍÀÇ Áß½ÉÀÌ

¡®means¡¯°¡ °è»êµÈ´Ù. »õ·Î¿î Áß½ÉÁ¡Àº ¿ø·¡ ½Ãµåó·³ °°Àº ÀÚ¸®°¡ ¾Æ´Ï±â ¶§¹®¿¡ ¾î¶² ·¹ÄÚµå´Â ù¹ø° Å©·¯½ºÅÍ¿¡¼­ À̵¿ÇÑ´Ù.(½ÇÁ¦·Î´Â Å©·¯½ºÅÍÀÇ °æ°è°¡ ¿òÁ÷ÀÌ´Â °ÍÀÌ´Ù.) ¸î ¹øÀÇ ¹Ýº¹À» ÅëÇØ, °¢°¢ Å©·¯½ºÅÍÀÇ Áß½ÉÀº »õ·Î¿î À¯´ÏÆûÀÇ »çÀÌÁîÁßÇϳª¸¦ Á¤ÀÇÇÒ ¼ö ÀÖ´Â Ãøµµ°¡ µÈ´Ù.

 

THE K-MEANS METHOD

Cluster Detection ÀÇ K-means method´Â ½ÇÁ¦·Î °¡Àå º¸ÆíÀûÀ¸·Î ÀÌ¿ëµÇ´Â ¹æ¹ýÀÌ´Ù. »çÀü¿¡ °áÁ¤µÈ ±ºÁý¼ö k¿¡ ±âÃÊÇÏ¿© Àüü µ¥ÀÌÅ͸¦ »ó´ëÀûÀ¸·Î À¯»çÇÑ k°³ÀÇ ±ºÁýÀ¸·Î ±¸ºÐÇÏ´Â º´¹ýÀÌ´Ù. ¼³¸íÀ» °£´ÜÈ÷ Çϱâ À§ÇØ 2Â÷¿øÀÇ ´ÙÀ̾î±×·¥À» ÀÌ¿ëÇÏ¿© ¼³¸íÇÑ´Ù.(½ÇÁ¦·Î´Â ¸¹Àº Â÷¿øÀÇ È¯°æ¿¡¼­ ÀÌ·ç¾îÁø´Ù.)

ù¹ø° ´Ü°è¿¡¼­ ±ºÁýÀÇ ¼ö k¸¦ Á¤ÇÑ´Ù..
µÎ¹ø° ´Ü°è¿¡¼­ Ãʱâ K°³ ±ºÁýÀÇ Áß½ÉÀ» ¼±ÅÃÇÑ´Ù.
¼¼¹ø° ´Ü°è¿¡¼­ °¢ °üÂûÄ¡¸¦ ±× Á߽ɰú °¡Àå °¡±î¿î °Å¸®¿¡ ÀÖ´Â ±ºÁý¿¡ ÇÒ´çÇÑ´Ù.
³×¹ø° °¢ ±ºÁýº°·Î ±×¿¡ ¼ÓÇÏ´Â °üÂûÄ¡¸¦ ÀÌ¿ëÇØ »õ·Î¿î Áß½ÉÀ» °è»êÇÑ´Ù.

À§ÀÇ °úÁ¤À» ±âÁ¸ÀÇ Á߽ɰú »õ·Î¿î Áß½ÉÀÇ Â÷ÀÌ°¡ ¾øÀ» ¶§±îÁö ¹Ýº¹ÇÑ´Ù.

K-means method´Â »ó¾÷¿ë software tool°ú ÇÔ²² °è»ê¹æ½Ä¿¡ ¸¹Àº º¯µ¿À» °¡Á³´Ù. Áï, ÃʱâÀÇ ½ÃµåµéÀ» ¼±ÅÃÇÏ´Â µ¥ À־ ¶Ç ´ÙÀ½ Á᫐ °ªÀ» °è»êÇϴµ¥ À־ ´Ù¸¥ ¹æ¹ýÀÌ Àû¿ëµÇ°Å³ª ±ºÁý°ú °ü·ÃÇÑ ·¹ÄÚµåµéÀÇ °Å¸®¸¦ °è»êÇϱ⠺¸´Ù´Â È®·ü¹Ðµµ¸¦ ÀÌ¿ëÇϱ⵵ ÇÑ´Ù.

 

Similarity , Association ,And Distance

k-means ¾Ë°í¸®ÁòÀÇ ´Ü°è¸¦ »ìÆ캸¸é, µ¥ÀÌÅͺ£À̽ºÀÇ ·¹ÄÚµåµéÀº ÀÏ´Ü °ø°£¿¡¼­ Á¡À¸·Î ¸ÞÇÎÀÌ µÇ¾î¾ß ÇÑ´Ù. ÇÏÁö¸¸ ¿ì¸®°¡ ¸¶ÄÉÆÃ, ¿µ¾÷ µî¿¡¼­ Á¢ÇÏ´Â µ¥ÀÌÅÍ º£À̽ºµéÀº ±×·¯ÇÏÁö ÇÏ´Ù. ±×·¡¼­ ¿ì¸®´Â ·¹Äڵ带 °ø°£ÀÇ Á¡À¸·Î Ãë±ÞÇϱâ À§Çؼ­ ¸ðµç Çʵ带 ¼öÄ¡Çü º¯¼ö·Î ¹Ù²Û´Ù. ¸¸¾à µÎ Á¡µéÀÌ °¡±îÀÌ ±ÙÁ¢ÇØ ÀÖ´Ù¸é, ¿ì¸®´Â ±× Á¡µéÀ» µ¥ÀÌÅͺ£À̽º¿¡¼­ °°Àº ·¹ÄÚµå¶ó°í Ç¥ÇöÇÒ ¼ö ÀÖ´Ù. ±×·¯³ª ÀÌ·¯ÇÑ Á¢±ÙÀº ¿©·¯ ÇüÅÂÀÇ º¯¼ö ŸÀÔµéÀÌ º¤ÅÍÀÇ ¿ä¼Ò·Î Ç¥ÇöµÇ±â ¾î·Æ´Ù¶ó´Â ¹®Á¦Á¡À» °¡Áö°í ÀÖ´Ù.

 

º¯¼öÀÇ ´Ù¾ç¼º : ¹üÁÖÇü, ¼ø¼­Çü, ±¸°£Çü

¼Ò°³ÇÒ ¼¼ °¡Áö ¹æ¹ý Áß Ã³À½ µÎ°³´Â ±¸°£º¯¼ö¿Í true measure¿¡ ÀûÇÕÇÏ°í ¼¼ ¹ø°´Â ¹üÁÖÇü º¯¼ö¿¡ ÀûÇÕÇÏ´Ù.

1. µÎÁ¡µé»çÀÌÀÇ °Å¸® ÃøÁ¤

µÎ Á¡µé »çÀÌÀÇ °Å¸®°¡ ¿¬°ü¼º Ãøµµ·Î½á ¾²ÀδÙ. µÎ Á¡ÀÌ °¡±õ´Ù¸é µÎ Á¡µé »çÀÌÀÇ »óÈ£°ü°è°¡ ºñ½ÁÇÏ´Ù. ÀÌ ¹æ¹ýÀº ÁÖ·Î ¼ö º¯¼ö¿¡ ÁÖ·Î ¾²ÀδÙ.

2. µÎ º¤ÅÍÀÇ °¢µµ

°ø°£¿¡¼­ X¿Í Y¸¦ Á¡À¸·Î »ý°¢ÇÏ°í ±× °Å¸®¸¦ °í·ÁÇÏ´Â °Í ´ë½Å, ¿ì¸®´Â µÎ »çÀÌÀÇ º¤ÅÍ¿Í °¢À» °í·ÁÇÑ´Ù. ¿¹¸¦ µé¾î »çÀÚ¿Í °í¾çÀÌÀÇ ÀÌ»¡, ¸öÅë, ²¿¸®, ¼ö¿°ÀÇ ±æÀ̸¦ Àç¾î¼­ ±×°ÍÀ» Á¡À¸·Î Ç¥ÇöÇÏ¿© ±×¸°´Ù¸é ±× Á¡µéÀº ¼­·Î ¸Ö¸® ¶³¾îÁ® ÀÖÀ» °ÍÀÌ´Ù. ÇÏÁö¸¸, µÎ µ¿¹°µéÀÇ À§¿¡¼­ÀÇ ±æÀÌÀÇ ºñÀ²À» Á¶»çÇØ º¸¸é µÑÀº ºñ½ÁÇÒ °ÍÀÌ´Ù. º¤ÅÍ»çÀÌÀÇ °¢Àº µÎ »ç¹°ÀÌ ¾ó¸¶³ª ¸¹ÀÌ ¶³¾îÁ® ÀֳĴ °Í¿¡´Â ¿µÇâÀ» ¹ÞÁö ¾Ê´Â´Ù.

 

K-means°¡ ¹«¾ùÀΰ¡?

¸ðµç º¯¼öµéÀÌ µ¶¸³ÀûÀ̶ó¸é ±ºÁýÀº Çü¼ºµÇÁö ¾ÊÀ» °ÍÀÌ´Ù. ¶ÇÇÑ, ±× ¹Ý´ë¶ó¸é ÇϳªÀÇ Å©·¯½ºÅ͸¦ »ý¼ºÇÒ °ÍÀÌ´Ù. µû¶ó¼­, ¿ì¸®´Â ¾ó¸¶³ª ¸¹Àº Å©·¯½ºÅÍ°¡ Á¸ÀçÇÏ´ÂÁö ¸ð¸¥´Ù. ÀÌ·¯ÇÑ °æ¿ì »çÀü¿¡ KÀÇ ¼ö¸¦ ÁöÁ¤ÇØ ÁÖ°í ±ºÁýÀ» Çϴµ¥, ¸¸ÀÏ ±ºÁý¼ö K°¡ ¿ø µ¥ÀÌÅͱ¸Á¶¿¡ ÀûÇÕÇÏÁö ¾ÊÀ¸¸é ÁÁÀº °á°ú¸¦ ¾òÀ» ¼ö ¾ø´Ù. µû¶ó¼­ ÀûÀýÇÑ ±ºÁý¼ö¸¦ ÅÃÇؾ߸¸ ÀÇ¹Ì ÀÖ´Â ºÐ¼®°á°úµµ ¾òÀ» ¼ö ÀÖÀ» °ÍÀÌ´Ù. º¸Åë K-means±ºÁýºÐ¼®¿¡¼­ ±ºÁý¼ö¸¦ °áÁ¤ÇÏ´Â ¹æ¹ýÀº ¸ÕÀú ÀûÀýÇÑ ´Ùº¯·® Åë°èºÐ¼®¹ýÀ» ÀÌ¿ëÇØ °üÂûÄ¡ÀÇ À§Ä¡¸¦ ½Ã°¢È­ÇØ À̸¦ °üÂûÇؼ­ °áÁ¤ÇÏ´Â ¹æ¹ýÀÌ ÀÖ´Ù. ÀÌ´Â º¸Åë ÁÖ¼ººÐ ºÐ¼®À» ÅëÇؼ­ º¯¼öÀÇ ¼ö¸¦ ÁÙÀÌ°í À̸¦ 2Â÷¿ø ȤÀº 3Â÷¿ø ÀÇ ±×·¡ÇÁ¸¦ ÅëÇؼ­ »ìÆ캻´Ù.

 

Agglomeration Methods

ÀÌ ¹æ¹ýÀº °¢°¢ ¼Ò¼ÓµÈ ±ºÁý³»ÀÇ Çü¼ºµÈ °¢ dataÁ¡À¸·ÎºÎÅÍ ½ÃÀÛÇؼ­ Á¡Â÷ÀûÀ¸·Î ÇϳªÀÇ Å« ±ºÁý¿¡ ¸ðµç Á¡ÀÌ ¸ðÀÏ ¶§±îÁö Èí¼öÇÏ´Â °ÍÀÌ´Ù. ÀÌ ¾Ë°í¸®ÁòÀÇ Ã¹¹ø° ´Ü°è´Â À¯»ç¼º matrix¸¦ ¸¸µé¾î ³»´Â °ÍÀÌ´Ù. À¯»ç¼º matrix´Â Á¡µé »çÀÌÀÇ °Å¸®³ª °ü·ÃÁ¤µµ¸¦ ³ªÅ¸³»´Â tableÀÌ´Ù.

°Å¸®¸¦ °è»êÇÏ´Â µ¥ ´Â ¼¼°¡Áö ¹æ¹ýÀÌ ÀÖ´Ù.

 

EVALUATION CLUSTERS

K-MEANS¹æ¹ýÀ» »ç¿ëÇÒ ¶§ ¿ì¸®´Â °¡Àå Àß ±ºÁýÀ» Çü¼ºÇϱâ À§ÇØ KÀÇ °ªÀ» °áÁ¤ÇØ¾ß ÇÑ´Ù.ÀÌ¿Í ºñ½ÁÇÏ°Ô °èº¸Àû ±ºÁý ¹æ¹ýÀ» ÀÌ¿ëÇÒ ¶§, °èÃþÀû ±¸Á¶³»ÀÇ ¾î¶² ´Ü°è°¡ °¡Àå Àß ±ºÁýÀ» Çü¼ºÇÏ´ÂÁö °ËÅäÇÒ ÇÊ¿äµµ ÀÖ´Ù. ±×·¯¸é, ¿ì¸®´Â ¹«¾ùÀ» ÁÁÀº ±ºÁýÀ̶ó°í ÇÒ ¼ö Àִ°¡? ÀϹÝÀûÀ¸·Î, ¿ì¸®´Â ±× ±ºÁý³»ÀÇ ¿ä¼ÒµéÀÌ ³ôÀº ¿¬°ü¼ºÀ» °®±â¸¦ ¹Ù¶õ´Ù. ÀÌ·¯ÇÑ ¼­·ÎÀÇ À¯»ç¼ºÀ» ÃøÁ¤ÇÏ´Â °¡Àå ±âº»ÀûÀÎ ¹æ¹ýÀº ºÐ»êÀ» ÀÌ¿ëÇÏ´Â °ÍÀÌ´Ù. µû¶ó¼­, ¿ì¸®´Â °¡Àå ³·Àº ºÐ»êÀ» ³ªÅ¸³»ÁÖ´Â ±ºÁýÀ» Çü¼ºÇÏ´Â °ÍÀ» ¸ñÀûÀ¸·Î µÎ°í ÀÖ´Ù. ±×·¯³ª, °èº¸Àû ±ºÁýÀº ÀÌ°ÍÀ» ÀÌ¿ëÇÒ ¼ö ¾ø±â ¶§¹®¿¡ ´Ù¸¥ ¹æ¹ýÀ» Á¦½ÃÇÑ´Ù. Áï, ´ÙÀ½ ´Ü°è¿¡ ÅëÇյǾúÀ» ¶§ÀÇ °Å¸®°ª°ú ±×ÀüÀÇ °ªÀ» ºñ±³ÇÏ´Â ¹æ¹ýÀ» Àû¿ëÇÑ´Ù.

 

INSIDE THE CLUSTER

¸¸¾à ¾ÆÁÖ ÀßµÈ ±ºÁýÀ» º¸¾ÒÀ» ¶§, ¾Æ¸¶ ±× ±ºÁý¾ÈÀÇ ·¹Äڵ尡 ¾î¶°ÇÑÁö ±Ã±ÝÇÏ°í, ¶Ç ±×°ÍµéÀ» Çϳª·Î ¹­´Â ¿øÀÎÀÌ ¹«¾ùÀÎÁö ±Ã±ÝÇÒ °ÍÀÌ´Ù. ´õ ³ª¾Æ°¡, ±× ¾ÈÀÇ ÆÐÅÏ°ú ±ÔÄ¢ÀÌ ±Ã±ÝÇÒ °ÍÀÌ°í, µ¥ÀÌÅͺ£À̽º¿¡¼­ ³ëÀÌÁîÀÇ Á¦°Å¿¡µµ ±Ã±ÝÇØ ÇÒ °ÍÀÌ´Ù.

ù¹ø° Áú¹®ÀÇ ÇØ°áÇϱâÀ§ÇÑ °£´ÜÇÑ ¹æ¹ýÀº ±ºÁý ³»¿¡ ÀÖ´Â º¯¼öÀÇ Æò±ÕÀ» ÃëÇÏ¿© ±ºÁýÀ» Çϱâ ÀüÀÇ Æò±Õ°ú ºñ±³Çغ»´Ù. ¶ÇÇÑ Â÷À̸¦ °¡Áö°í ¼øÀ§¸¦ ¸Å°Üº¸±âµµ ÇÑ´Ù. Â÷ÀÌ°¡ ¸¹Àº º¯¼öÀϼö·Ï ±ºÁýÀ» Àß ¼³¸íÇØÁØ´Ù.

 

AUTOMATIC CLUSTER DETECTIONÀÇ ÀåÁ¡

- Automatic Cluster DetectionÀº undirected knowledge discovery±â¹ýÀÌ´Ù. µû¶ó¼­ µ¥ÀÌÅÍ¿¡ ´ëÇÑ ¾î¶°ÇÑ »çÀüÀû Áö½ÄÀ» ¿ä±¸ÇÏÁö ¾Ê´Â´Ù. ¶ÇÇÑ, directed ±â¹ýÀÇ Àû¿ëÀ» Áö¿øÇϱâÀ§ÇØ »ç¿ëµÉ ¼û°ÜÁø ±¸Á¶¸¦ ¹àÇô³½´Ù.

- Automatic Cluster Detection´Â ºÐ¼®À» À§Çؼ­´Â ±âº»ÀûÀ¸·Î °üÂûÄ¡ °£ÀÇ °Å¸®¸¦ µ¥ÀÌÅÍÇüÅ¿¡ ¸Â°Ô¸¸ Á¤ÀÇÇϸé, ¹üÁÖÇü, ¼öÄ¡Çü, textual µ¥ÀÌÅÍ µî ¾î¶² µ¥ÀÌÅÍ¿¡µµ Àû¿ëµÈ´Ù.

- ºÐ¼®¹æ¹ýÀÇ Àû¿ë ¿ëÀ̼º : ´ëºÎºÐÀÇ ±ºÁý¹æ¹ýÀÌ ºÐ¼®´ë»ó µ¥ÀÌÅÍ¿¡ ´ëÇØ »çÀüÁ¤º¸¸¦ °ÅÀÇ ¿ä±¸ÇÏÁö ¾ÊÀ¸¹Ç·Î Àû¿ëÇÏ´Â µ¥¿¡ Å« ¾î·Á¿òÀÌ ¾ø´Ù. Áï, ¸ðÇüÈ­¸¦ À§ÇÑ ºÐ¼®°ú °°ÀÌ »çÀü¿¡ ƯÁ¤ º¯¼öµé¿¡ ´ëÇÑ ¿ªÇÒ Á¤ÀÇ°¡ ÇÊ¿äÇÏÁö ¾Ê°í, ´Ù¸¸ °üÂûÄ¡µé »çÀÌÀÇ °Å¸®¸¸ÀÌ ºÐ¼®¿¡ ÇÊ¿äÇÑ ÀÔ·ÂÀÚ·á°¡ µÈ´Ù.

.

AUTOMATIC CLUSTER DETECTIONÀÇ ´ÜÁ¡

* °¡ÁßÄ¡¿Í °Å¸®Á¤ÀÇ : ±ºÁýºÐ¼®ÀÇ °á°ú´Â °üÂûÄ¡ »çÀÌÀÇ °Å¸® ¶Ç´Â À¯»ç¼ºÀ» ¾î¶»°Ô Á¤ÀÇÇϴ°¡¿¡ Å©°Ô Á¿ìµÈ´Ù. µû¶ó¼­ ƯÈ÷ ¿©·¯ °¡Áö ÀÚ·áÀ¯Çü(¿¬¼ÓÇü, ¹üÁÖÇü)À» Æ÷ÇÔÇÏ´Â µ¥ÀÌÅÍÀÇ °æ¿ì, °üÂûÄ¡µé »çÀÌÀÇ °Å¸®¸¦ Á¤ÀÇÇÏ°í °¢ º¯¼ö¿¡ ´ëÇÑ °¡ÁßÄ¡¸¦ °áÁ¤ÇÏ´Â °ÍÀº ¸Å¿ì ¾î·Á¿î ¹®Á¦´Ù.

* ÃʱⰪ¿¡ ¹Î°¨ : k-means ¹æ¹ý¿¡¼­ k¿¡ ´ëÇÑ °ª ¼±ÅÃÀº ±ºÁý ¼ö¸¦ °áÁ¤ÇØ ¹ö¸°´Ù. ÀÌ k°¡ data±¸Á¶¿¡ ÀûÀýÇÏÁö ¸øÇÏ´Ù¸é ÁÁÁö ¸øÇÑ °á°ú¸¦ ³º´Â´Ù.

* °á°ú Çؼ®ÀÇ ¾î·Á¿ò : Ž»öÀûÀÎ ºÐ¼®¹æ¹ýÀ¸·ÎÀÇ ÀåÁ¡À» °¡Áö°í ÀÖ´Â ¹Ý¸é¿¡, »çÀü¿¡ ÁÖ¾îÁø ¸ñÀûÀÌ ¾øÀ¸¹Ç·Î °á°ú¸¦ Çؼ®ÇÏ´Â µ¥ À־ ¾î·Á¿òÀÌ ÀÖ´Ù. µû¶ó¼­ ÁÖ¾îÁø º¯¼ö¿¡ µû¶ó Àß ±¸ºÐµÈ ±ºÁýÀ̶ó ÇÏ¿©µµ ±× °á°ú¸¦ ÃæºÐÈ÷ ÀÌÇØÇÏ°í ½ÇÁ¦ÀûÀ¸·Î È°¿ëÇϱâ´Â ½±Áö ¾Ê´Ù

 

WHEN TO USE CLUSTERING

±ºÁýºÐ¼®Àº ¸¹Àº º¯¼ö¸¦ °¡Áö°í ÀÖ´Â º¹ÀâÇÏ°í ´ë¿ë·®ÀÇ µ¥ÀÌÅÍ¿¡´Â Àß Àû¿ëµÉ ¼ö ÀÖ´Ù. µû¶ó¼­ µ¥ÀÌÅ͸¶ÀÌ´×À» ¼öÇàÇϱâ À§ÇÑ Ãʱâ ÀÛ¾÷À» À¯¿ëÇÏÁö¸¸, ÀÌ´Â º¹ÀâÇÑ µ¥ÀÌÅ͸¦ ¿ä¾àÇÏ´Â µµ±¸ÀÏ »ÓÀÌ°í, À¯»ç¼ºÀ» °®´Â ±ºÁý³»ÀÇ °üÂûÄ¡ µéÀ» ÅëÇÑ º¯¼öµé »çÀÌÀÇ ±ÔÄ¢À̳ª ÆÐÅÏÀ» ã´Â ¶Ç ´Ù¸¥ µ¥ÀÌÅ͸¶ÀÌ´× ±â¹ýÀ» »ç¿ëÇÏ¿© ´õ¿í À¯¿ëÇÑ °á°ú¸¦ ¾òµµ·Ï ³ë·ÂÇØ¾ß ÇÒ °ÍÀÌ´Ù


Top > Info > Data Mining > 2-3. ±ºÁýºÐ¼®(Automatic Cluster Detection)