Info > Data Mining > 3-4. RDB > °ü°èÇü µ¥ÀÌÅÍ ¸ðµ¨°ú Á¤±ÔÈ ÀÌ·Ð
¢¹¢º °ü°èÇü µ¥ÀÌÅÍ ¸ðµ¨°ú Á¤±ÔÈ ÀÌ·Ð
4.1 Á¤±ÔÈÀÇ °³³ä
Á¤±ÔÈ ÀÌ·Ð : ´Ù¾çÇÑ À¯ÇüÀÇ °Ë»ç¸¦ ÅëÇÏ¿© °ü°èÇü µ¥ÀÌÅÍ ¸ðµ¨ÀÇ °ü°è¸¦ º¸´Ù ±¸Á¶ÈµÈ °ÍÀ¸·Î °³¼±½ÃÄÑ ³ª°¡´Â ÀýÂ÷¿¡ °üÇÑ ÀÌ·Ð. ±¸Á¶ÈµÈ °ü°è¶õ µ¥ÀÌÅͺ£À̽º »ó¿¡¼ »ðÀÔ, »èÁ¦, ¼öÁ¤ÀÌ ÀÌ·ç¾î Áú ¶§ ¹®Á¦Á¡ÀÌ ¹ß»ýÇÏÁö ¾Ê´Â °ü°è
4.1.1 ±¸Á¶ÈµÈ °ü°è
µ¥ÀÌÅͺ£À̽º¿¡ ÀúÀåµÇ´Â µ¥ÀÌÅÍÀÇ Áߺ¹À» ÃÖ¼ÒȽÃÅ´À¸·Î½á »ðÀÔ, »èÁ¦, ¼öÁ¤À¸·Î ÀÎÇÑ ¿À·ù³ª µ¥ÀÌÅÍÀÇ ºÒÀÏÄ¡¸¦ ¹ß»ý½ÃŰÁö ¾Ê´Â °ü°è.
<±×¸² 4.1> ¼ö° °ú¸ñ °ü°è
Çйø |
°ú¸ñ ¹øÈ£ |
°ú¸ñ À̸§ |
9419046 |
BB203 |
ÄÄÇ»ÅÍ ÇÁ·Î±×·¡¹Ö |
==> »ðÀÔÀÌ»ó, »èÁ¦ÀÌ»ó, ¼öÁ¤ÀÌ»ó
<±×¸² 4.2> ºÐ¸®µÇ¾î ±¸Á¶ÈµÈ °ü°è
¼ö° |
|
°ú¸ñ |
|
4.1.2 ±¸Á¶ÈµÈ °ü°èÀÇ ¹®Á¦Á¡
- Á¤±ÔÇüÀÇ ¼öÁØÀ» ³ôÀϼö·Ï µ¥ÀÌÅÍÀÇ »ðÀÔ, »èÁ¦, ¼öÁ¤ ÀÌ»óÀº °¨¼ÒµÇ³ª µ¥ÀÌÅͺ£À̽ºÀÇ ½ÇÇà¼Óµµ³ª ÂüÁ¶ ¹«°á¼ºµîÀÇ ¹®Á¦´Â ´õ¿í ½É°¢ÇØ Áø´Ù ->ÀûÀýÇÑ ¼öÁرîÁöÀÇ Á¤±Ô¼º Ãß±¸
- ½Ç¹«¿¡¼´Â ´ë¶ô 3Â÷ Á¤±ÔÇüÀ» ÀûÀýÇÑ ¼öÁØÀ¸·Î º¸°íÀÖÀ¸³ª ÀÌ ¼öÁØÀÇ
Á¤±ÔÇü °ü°è°¡ ³Ê¹« ¼¼ºÐÈ µÇ¾î ÀÖÀ» ¶§ ƯÁ¤ °ü°è¸¦ ´Ù½Ã °áÇÕ½ÃŰ´Â Å»Á¤±ÔÈ(denormalizeation)
¹æ¹ýµµ Á¦½Ã.
4.2 ÇÔ¼öÀû Á¾¼Ó°ú Á¤±ÔÈ
4.2.1 ÇÔ¼öÀû Á¾¼Ó
¡¤Á¤±ÔÈ ÀÌ·ÐÀº ¼Ó¼º°£ÀÇ ÇÔ¼öÀû Á¾¼Ó°ü°è¿¡ ±âÃÊ. ¼Ó¼º Y°¡ ¼Ó¼ºX¿¡ ÇÔ¼öÀûÀ¸·Î Á¾¼ÓµÇ¾ú´Ù´Â °ÍÀº XÀÇ ¼Ó¼º°ªÀÌ YÀÇ ¼Ó¼º°ªÀ» °áÁ¤Áþ´Â´Ù´Â °Í
X -> Y
¡¤X´Â YÀÇ °áÁ¤ÀÚ (determinant)
4.2.2 1Â÷ Á¤±ÔÇü
- ¹Ýº¹Áý´ÜÀ» Æ÷ÇÔÇÏÁö ¾Ê´Â ¿øÀÚ°ªÀ¸·Î¸¸ ±¸¼ºµÈ ŸÇÃÀ» °®´Â °ü°è
<±×¸² 4.1> ºñÁ¤±ÔÇüÀÇ °ü°è
ÁÖ¹® |
|
<±×¸² 4.2> 1Â÷ Á¤±ÔÇüÀÇ °ü°è
ÁÖ¹® |
|
4.2.3 2Â÷ Á¤±ÔÇü
¢º1Â÷ Á¤±ÔÇüÀÇ ¹®Á¦Á¡
¡¤»ðÀÔÀÌ»ó
¡¤»èÁ¦ÀÌ»ó
¡¤¼öÁ¤ÀÌ»ó
-->ÀÌ·¯ÇÑ ¹®Á¦Á¡À» Á¦°ÅÇϱâ À§ÇÏ¿© ¼Ó¼º°£ÀÇ ÇÔ¼öÀû Á¾¼Ó¼ºÀ» ºÐ¼®ÇÏ¿©, ÇϳªÀÇ °ü°è¸¦
µÎ °³ ÀÌ»óÀÇ °ü°è·Î ºÐ¸®½ÃÄÑ¾ß ÇÑ´Ù.
<±×¸² 4.3> ÁÖ¹® °ü°èÀÇ ÇÔ¼öÀû Á¾¼Ó
ÁÖ¹® (ÁÖ¹®¹øÈ£, Á¦Ç°¹øÈ£, ÁÖ¹®ÀÏ, °í°´À̸§, °í°´¹øÈ£, ÀüÈ, Á¦Ç°¸í, ¼ö·® )
¡¤ÁÖ¹®¹øÈ£, Á¦Ç°¹øÈ£ -> ¼ö·®
¡¤ÁÖ¹®¹øÈ£ -> ÁÖ¹®ÀÏ, °í°´À̸§, °í°´¹øÈ£, ÀüÈ
¡¤Á¦Ç°¹øÈ£ -> Á¦Ç°¸í
¢º2Â÷ Á¤±ÔÇü : ¾î´À °ü°è°¡ 1Â÷ Á¤±ÔÇüÀÇ Á¶°ÇÀ» ¸¸Á·ÇÏ¸é¼ ÁÖ۸¦ ±¸¼ºÇÏÁö ¾Ê´Â ³ª¸ÓÁö ¼Ó¼ºÀÌ ÁÖŰ¿¡ ¿ÏÀü ÇÔ¼öÀû Á¾¼ÓÀ» ÀÌ·ê ¶§. Áï, 1Â÷ Á¤±ÔÇü¿¡¼ ºÎºÐÁ¾¼ÓÀ» Á¦°ÅÇÑ °Í.
¡¤¿ÏÀü ÇÔ¼öÀû Á¾¼Ó : ÁÖŰÀÇ ÀϺθ¸À¸·Î´Â ºñÁÖŰ ¼Ó¼ºÀÇ °ªÀ» °áÁ¤ÁöÀ»
¼ö ¾ø´Ù.
¡¤ºÎºÐ Á¾¼Ó
<±×¸² 4.4> 2Â÷ Á¤±ÔÇüÀ¸·Î ÀüȯµÈ ÁÖ¹® °ü°è
ÁÖ¹®-Á¦Ç°
|
Á¦Ç°
|
||||||||||||
|
4.2.4 3Â÷ Á¤±ÔÇü
¢º2Â÷ Á¤±ÔÇüÀÇ ¹®Á¦Á¡
¡¤»ðÀÔÀÌ»ó
¡¤»èÁ¦ÀÌ»ó
¡¤¼öÁ¤ÀÌ»ó
-->ÀÌ·¯ÇÑ ¹®Á¦Á¡Àº ¼Ó¼º°£ÀÇ ÀÌÀüÁ¾¼Ó ¶§¹®¿¡ ¹ß»ýÇÑ´Ù. ÀÌÀüÁ¾¼ÓÀ» Á¦°ÅÇϱâ À§Çؼ´Â
ÀÌÀüÁ¾¼Ó°ú °ü·ÃµÈ ºñÁÖŰ ¼Ó¼ºµéÀ» ´Ù¸¥ °ü°è·Î ºÐ¸®½ÃÄÑ¾ß ÇÑ´Ù.
<±×¸² 4.5> ÁÖ¹®-°í°´ °ü°èÀÇ ÇÔ¼öÀû Á¾¼Ó
ÁÖ¹® (ÁÖ¹®¹øÈ£, ÁÖ¹®ÀÏ, °í°´À̸§, °í°´¹øÈ£, ÀüÈ )
¡¤ÁÖ¹®¹øÈ£ -> ÁÖ¹®ÀÏ, °í°´À̸§, °í°´¹øÈ£, ÀüÈ
¡¤°í°´¹øÈ£ -> °í°´À̸§, ÀüÈ
¢º3Â÷ Á¤±ÔÇü : ¾î´À °ü°è°¡ 2Â÷ Á¤±ÔÇüÀÇ Á¶°ÇÀ» ¸¸Á·ÇÏ¸é¼ ÀÌÀü Á¾¼ÓÀÌ Á¸ÀçÇÏÁö ¾Ê´Â °ü°è.
<±×¸² 4.6> 3Â÷ Á¤±ÔÇü °ü°è·Î ÀüȯµÈ °í°´ ÁÖ¹®¼ °üÁ¡
ÁÖ¹®-Á¦Ç°
|
Á¦Ç°
|
||||||||||||
ÁÖ¹®-°í°´
|
°í°´
|
4.2.5 º¸À̽º-ÄÚµå Á¤±ÔÇü
- ±âÁ¸ÀÇ 3Â÷ Á¤±ÔÇü¿¡¼ ÇÔ¼öÀû Á¾¼ÓÀ¸·Î ÀÎÇÏ¿© Ãß°¡ÀûÀ¸·Î ¹ßÇàÇÒ ¼ö
ÀÖ´Â ¹®Á¦Á¡À» ¹ß°ßÇϰí À̸¦ º¸¿ÏÇϱâ À§ÇÏ¿© Á¦½ÃÇÑ º¸´Ù ¾ö°ÝÇÑ 3Â÷ Á¤±ÔÇüÀÌ´Ù.
- ¾î´À °ü°èÀÇ ¸ðµç °áÁ¤ÀÚ°¡ Èĺ¸Å°ÀÇ ¿ªÇÒÀ» ¼öÇàÇÒ ¼ö ÀÖ´Â °ü°è.
<±×¸² 4.7> ¼ö°°ú¸ñ-±³¼ö °ü°è (3Â÷ Á¤±ÔÇü °ü°è)
¼ö°°ú¸ñ-±³¼ö
Çлý¸í |
°ú¸ñ¸í |
±³¼ö¸í |
È«±âÈ£ |
µ¥ÀÌÅͺ£À̽º |
±èÁØ½Ä |
--> ¡¤»ðÀÔÀÌ»ó
¡¤»èÁ¦ÀÌ»ó
¡¤¼öÁ¤ÀÌ»ó
==> º¸À̽º-ÄÚµå Á¤±ÔÇüÀ¸·Î Àüȯ½Ã۱â À§ÇØ °áÁ¤ÀÚ ÀÌÁö¸¸ Èĺ¸Å°°¡ ¾Æ´Ñ ±³¼ö¸í
¼Ó¼ºÀ» ºÐ¸®ÇؾßÇÔ.
Çлý-±³¼ö ( Çлý¸í, ±³¼ö¸í )
±³¼ö-°ú¸ñ ( ±³¼ö¸í, °ú¸ñ¸í )
4.2.6 ´ÙÁß°ª Á¾¼Ó°ú 4Â÷ Á¤±ÔÇü
¡¤º¸À̽º-ÄÚµå Á¤±ÔÇüÀ» ¸¸Á·½ÃŰ´Â °ü°è´Â ÇÔ¼öÀû Á¾¼ÓÀ¸·Î ÀÎÇÑ ¹®Á¦´Â
´õ ÀÌ»ó ¹ß»ýÇÏÁö ¾ÊÀ¸³ª ´ÙÁß°ª Á¾¼ÓÀ¸·Î ÀÎÇÑ ¹®Á¦°¡ ¹ß»ýÇÒ ¼ö ÀÖ´Ù.
¡¤´ÙÁß°ª Á¾¼Ó : °¡ÀÇ ¾î¶² ¼Ó¼º°ª¿¡ ´ëÀÀÇÏ´Â ³ªÀÇ ¼Ó¼º°ªÀÌ ¿©·¯°³ ÀÖ°í, °¡ÀÇ ¾î¶²
¼Ó¼º°ª¿¡ ´ëÀÀÇÏ´Â ´ÙÀÇ ¼Ó¼º°ªÀÌ ¿©·¯°³ ÀÖÀ¸¸ç, ³ªÀÇ ¼Ó¼º°ª°ú ´ÙÀÇ ¼Ó¼º°ª »çÀÌ¿¡ ¾Æ¹«
»ó°ü°ü°è°¡ ¾øÀ» °æ¿ì.
<±×¸² 4.8> Á÷¿ø-Ư±â-¾ð¾î °ü°è |
<±×¸² 4.9> 1Â÷ Á¤±ÔÇüÀ¸·Î ÀüȯµÈ Á÷¿ø-Ư±â-¾ð¾î °ü°è |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
--> ¡¤»ðÀÔÀÌ»ó |
(a)¸ðµç °¡´ÉÇÑ Á¶ÇÕ |
(b) ¹«ÀÛÀ§ ¹èÁ¤À» ÅëÇÑ |
==>µÎ°³ÀÇ »óÈ£ µ¶¸³ÀûÀÎ ´ÙÁß°ª ¼Ó¼ºÀ» ¼·Î ´Ù¸¥ µÎ °ü°è·Î ºÐ¸®
<±×¸² 4.10> 4Â÷ Á¤±ÔÇüÀ¸·Î ÀüȯµÈ Á÷¿ø-Ư±â-¾ð¾î°ü°è
Á÷¿ø-Ư±â |
|
Á÷¿ø-¾ð¾î |
|
4.3 Á¤±ÔÈµÈ °ü°èÀÇ ÅëÇÕ
4.3.1 »ç·Ê
¢º ¸í¹® °¡±¸ÀÇ °í°´, Á¦Ç°, Á÷¿ø¿¡ ´ëÇÑ °ü°è ½ºÅ°¸¶
(1) ÁÖ¹®-Á¦Ç° ( ÁÖ¹®¹øÈ£, Á¦Ç°¹øÈ£, ¼ö·® )
(2) Á¦Ç° ( Á¦Ç°¹øÈ£, Á¦Ç°¸í, ´Ü°¡ )
(3) ÁÖ¹®°í°´ ( ÁÖ¹®¹øÈ£, ÁÖ¹®ÀÏ, °í°´¹øÈ£
)
(4) °í°´ ( °í°´¹øÈ£, °í°´À̸§, ÁÖ¼Ò, ÀüÈ )
(5) °í°´ ( °í°´¹øÈ£, ¼º¸í, ÁÖ¼Ò, ½Å¿ë Çѵµ¾× ) - 3Â÷ Á¤±ÔÇü °ü°è
(6) °í°´ ±¸¸ÅÇöȲ ( °í°´¹øÈ£, °í°´À̸§, ´ã´çÁ÷¿ø) - 3Â÷ Á¤±ÔÇü °ü°è
(7) Á¦Ç° ( Á¦Ç°¹øÈ£, Á¦Ç°¸í, Àç°í·®, ÀçÁÖ¹® ½ÃÁ¡, ¿ø°¡, ÆÇ¸Å°¡ ) - 3Â÷ Á¤±ÔÇü
°ü°è
(8) Á÷¿ø ( Á÷¿ø¹øÈ£, ¼º¸í, ÁÖ¼Ò, »ý³â¿ùÀÏ, È£ºÀ ) - 3Â÷ Á¤±ÔÇü °ü°è
(9) Á÷¿ø ¸ÅÃâ ÇöȲ ( Á÷¿ø¹øÈ£, ¼º¸í, ÇÒ´ç¾×, ÃÖ´ë ÇÒÀηü ) - 3Â÷ Á¤±ÔÇü °ü°è
4.3.2 °ü°èÀÇ ÅëÇÕ
- µ¿ÀÏÇÑ °³Ã¼¸¦ Ç¥ÇöÇÑ ¿©·¯ °ü°è¸¦ ÇϳªÀÇ °ü°è·Î ÅëÇÕÇÏ´Â °úÁ¤
- °üÁ¡ ÅëÇÕ ( ¿©·¯ »ç¿ëÀÚÀÇ °üÁ¡À» ÅëÇÕÇϹǷΠ)
- ÁÖÀÇÇÒ Á¡ : ÀÌÀ½ µ¿ÀǾî, µ¿À½ ÀÌÀǾî, ÀÌÀü Á¾¼Ó, ÀϹÝÈÀÇ ¹®Á¦Á¡
¢º°í°´°ü°è
°í°´ ( °í°´¹øÈ£, °í°´À̸§, °ÅÁÖÁö ÁÖ¼Ò, ¹è´ÞÁÖ¼Ò, ÀüÈ, ½Å¿ë Çѵµ¾×, ´ã´çÁ÷¿ø ) |
- ÀϹÝÀûÀ¸·Î ÁÖ۰¡ µ¿ÀÏÇÑ °ü°è´Â ÇÑ °ü°è·Î ÅëÇÕµÉ ¼ö ÀÖ´Ù.
(4) °í°´ ( °í°´¹øÈ£, °í°´À̸§, ÁÖ¼Ò, ÀüÈ )
(5) °í°´ ( °í°´¹øÈ£, ¼º¸í, ÁÖ¼Ò, ½Å¿ë Çѵµ¾× )
(6) °í°´ ±¸¸ÅÇöȲ ( °í°´¹øÈ£, °í°´À̸§, ´ã´çÁ÷¿ø)
==>
¡¤ÀÌÀ½ µ¿ÀǾî : ¼º¸í, °í°´À̸§ --> ÇϳªÀÇ ¸íĪÀ¸·Î ÅëÇÕ/»ç¿ëÀÚ°¡ ÀÚ½ÅÀÇ Ä£¼÷ÇÑ
¸íĪÀ¸·Î ºÎ¸¦¼ö ÀÖµµ·Ï DB³»¿¡ ¼Ó¼ºÀÇ º°¸í¸¦ ÀúÀå
¡¤µ¿À½ ÀÌÀǾî : (4)ÀÇ ÁÖ¼Ò-¹è´ÞÁÖ¼Ò , (5)ÀÇ ÁÖ¼Ò-°í°´ÀÇ °ÅÁÖÁö --> »õ·Î¿î ¼Ó¼ºÀ̸§
ºÎ¿©
¢ºÁ¦Ç°°ü°è
Á¦Ç° ( Á¦Ç°¹øÈ£, Á¦Ç°¸í, Àç°í·®, ÀçÁÖ¹® ½ÃÁ¡, ¿ø°¡, ÆÇ¸Å°¡) |
(2) Á¦Ç° ( Á¦Ç°¹øÈ£, Á¦Ç°¸í, ´Ü°¡ )
(7) Á¦Ç° ( Á¦Ç°¹øÈ£, Á¦Ç°¸í, Àç°í·®, ÀçÁÖ¹® ½ÃÁ¡, ¿ø°¡, ÆÇ¸Å°¡)
==>
¡¤ÀÌÀ½ µ¿ÀǾî : ´Ü°¡, ÆÇ¸Å°¡ --> ÆÇ¸Å°¡·Î ÅëÀÏ
¢ºÁ÷¿ø°ü°è
Á÷¿ø ( Á÷¿ø¹øÈ£, ¼º¸í, ÁÖ¼Ò, »ý³â¿ùÀÏ, È£ºÀ, Á÷¿øÀ¯Çü
) |
(8) Á÷¿ø ( Á÷¿ø¹øÈ£, ¼º¸í, ÁÖ¼Ò, »ý³â¿ùÀÏ, È£ºÀ )
(9) Á÷¿ø ¸ÅÃâ ÇöȲ ( Á÷¿ø¹øÈ£, ¼º¸í, ÇÒ´ç¾×, ÃÖ´ë ÇÒÀηü )
==> (9)¹ø °ü°è´Â ¿µ¾÷Á÷¿ø¿¡¸¸ ÇØ´çµÇ´Â ¼Ó¼º --> »óÀ§ °³Ã¼¿Í ÇÏÀ§ °³Ã¼¸¦ ³ªÅ¸³»´Â
°ü°è·Î ±¸º°.
¢ºÃÖÁ¾°á°ú
ÁÖ¹®-Á¦Ç° ( ÁÖ¹®¹øÈ£, Á¦Ç°¹øÈ£, ¼ö·® ) |
Info > Data Mining > 3-4. RDB > °ü°èÇü µ¥ÀÌÅÍ ¸ðµ¨°ú Á¤±ÔÈ ÀÌ·Ð