[크래프톤 정글 ] 합병정렬

크래프톤 정글/Algorithm

[크래프톤 정글 ] 합병정렬

하루이2222 2024. 9. 20. 14:09

합병 정렬(Merge Sort)은 분할 정복(Divide and Conquer) 알고리즘의 대표적인 예로, 안정적인 정렬 알고리즘 중 하나이다. 합병 정렬은 데이터를 작은 단위로 분할한 후, 각 단위를 정렬하면서 합병(Merge)하여 최종적으로 정렬된 리스트를 만드는 방식으로 동작한다.

합병 정렬의 기본 개념

분할 정복: 합병 정렬은 주어진 리스트를 반으로 나누어 더 이상 나눌 수 없을 때까지 재귀적으로 분할한 다음, 분할된 리스트를 병합하면서 정렬한다.
안정성: 합병 정렬은 안정적인 정렬 알고리즘이다. 즉, 두 개의 동등한 키를 가진 원소의 순서는 정렬 후에도 유지된다.

합병 정렬의 작동 원리

합병 정렬은 다음과 같은 세 단계로 구성된다:

분할(Divide):
- 주어진 리스트를 반으로 나누어 두 개의 서브 리스트로 분할한다.
- 이 과정을 리스트의 크기가 1이 될 때까지 재귀적으로 반복한다.
정복(Conquer):
- 각 분할된 서브 리스트를 정렬한다. 리스트의 크기가 1이면 이미 정렬된 상태이므로, 이 단계에서는 별도의 작업이 필요 없다.
병합(Merge):
- 정렬된 서브 리스트를 병합하여 더 큰 정렬된 리스트를 만든다. 이 과정은 두 개의 정렬된 리스트를 하나의 정렬된 리스트로 합치는 방식으로 진행된다.

합병 정렬의 동작 과정

합병 정렬의 동작 과정을 예제와 함께 단계별로 살펴보자.

예제: [38, 27, 43, 3, 9, 82, 10] 리스트를 합병 정렬하는 과정

초기 리스트: [38, 27, 43, 3, 9, 82, 10]
분할 단계:
- 리스트를 반으로 분할한다.
- [38, 27, 43] | [3, 9, 82, 10]
다시 반으로 분할:
- [38, 27] | [43] | [3, 9] | [82, 10]
다시 분할:
- [38] | [27] | [43] | [3] | [9] | [82] | [10]
이제 모든 서브 리스트가 크기 1인 상태로, 더 이상 분할할 수 없다.
병합 단계:
- 이제 정렬하면서 병합을 시작한다.
첫 번째 병합:
- [27, 38] | [43] | [3, 9] | [10, 82]
두 번째 병합:
- [27, 38, 43] | [3, 9, 10, 82]
최종 병합:
- [3, 9, 10, 27, 38, 43, 82]

각 단계의 시각화

분할 과정:
[38, 27, 43, 3, 9, 82, 10]
   |
   V
[38, 27, 43]   |   [3, 9, 82, 10]
   |              |
[38, 27] | [43]   [3, 9] | [82, 10]
   |       |       |       |
[38] | [27] [43]   [3] | [9] [82] | [10]

병합 과정:
[27, 38] | [43]   [3, 9] | [10, 82]
   |        |       |        |
[27, 38, 43]       [3, 9, 10, 82]
   |
   V
[3, 9, 10, 27, 38, 43, 82]

합병 정렬의 구현

합병 정렬은 재귀적으로 구현할 수 있다. Python에서의 구현 예시는 다음과 같다:

def merge_sort(arr):
    if len(arr) <= 1:
        return arr

    # 리스트를 두 개의 서브 리스트로 분할
    mid = len(arr) // 2
    left_half = merge_sort(arr[:mid])
    right_half = merge_sort(arr[mid:])

    # 두 개의 정렬된 서브 리스트를 병합
    return merge(left_half, right_half)

def merge(left, right):
    sorted_list = []
    i = j = 0

    # 두 서브 리스트를 비교하며 병합
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            sorted_list.append(left[i])
            i += 1
        else:
            sorted_list.append(right[j])
            j += 1

    # 남아있는 요소들을 병합
    sorted_list.extend(left[i:])
    sorted_list.extend(right[j:])

    return sorted_list

# 사용 예시
arr = [38, 27, 43, 3, 9, 82, 10]
sorted_arr = merge_sort(arr)
print(sorted_arr)  # [3, 9, 10, 27, 38, 43, 82]

합병 정렬의 시간 복잡도

합병 정렬의 시간 복잡도는 모든 경우에서 O(n log n)이다. 이는 다음과 같이 계산된다:

분할 단계: 리스트가 분할될 때마다 그 크기가 반으로 줄어든다. 분할하는 작업은 O(log n)이다.
병합 단계: 병합 단계에서 각 단계마다 모든 요소를 한 번씩 비교하면서 병합하므로 O(n)이다.
따라서, 전체 시간 복잡도는 O(n log n)이다.

합병 정렬의 공간 복잡도

합병 정렬의 공간 복잡도는 O(n)이다. 병합 과정에서 추가적인 메모리 공간이 필요하기 때문에, 원본 리스트의 크기에 비례하는 추가 메모리가 필요하다. 이 점에서 합병 정렬은 제자리 정렬(in-place sorting)이 아니다.

합병 정렬의 장점과 단점

장점:

안정성: 합병 정렬은 안정적인 정렬 알고리즘이다. 즉, 동일한 값의 원소들이 입력 리스트에서의 순서를 유지한다.
일관된 성능: 최선, 최악, 평균 경우 모두 O(n log n)의 시간 복잡도를 가진다. 즉, 입력 데이터의 특성에 상관없이 일관된 성능을 제공한다.
대규모 데이터 처리: 대용량 데이터를 처리할 때도 효율적이다. 특히, 외부 정렬(External Sorting)에서 효과적으로 사용할 수 있다.

단점:

공간 복잡도: 추가적인 메모리 공간이 필요하기 때문에, 메모리 사용량이 중요한 상황에서는 비효율적일 수 있다.
제자리 정렬이 아님: 합병 정렬은 제자리 정렬이 아니므로, 추가적인 메모리 공간이 필요하다.

합병 정렬의 응용

합병 정렬은 여러 응용 분야에서 사용될 수 있으며, 특히 다음과 같은 상황에서 유용하다:

외부 정렬: 매우 큰 데이터셋을 처리해야 하는 경우, 합병 정렬은 외부 메모리(디스크)에 저장된 데이터를 정렬하는 데 사용된다. 이는 데이터를 작은 청크로 분할하여 각각을 정렬한 다음, 병합하는 방식으로 이루어진다.
링크드 리스트 정렬: 링크드 리스트를 정렬할 때도 합병 정렬이 자주 사용된다. 링크드 리스트는 배열처럼 임의 접근이 어렵기 때문에, 합병 정렬의 분할 정복 전략이 효율적이다.
복잡한 데이터 정렬: 비교 기반 정렬 알고리즘 중 안정성을 요구하거나, 데이터를 병합하면서 정렬해야 하는 상황에서 유용하다.

결론

합병 정렬은 안정적이고 일관된 성능을 제공하는 강력한 정렬 알고리즘이다. 특히, 대규모 데이터 처리 및 외부 정렬에서 중요한 역할을 한다. 그러나 추가 메모리 공간을 필요로 하기 때문에, 메모리 제약이 있는 환경에서는 신중히 사용해야 한다. 합병 정렬의 이론적 기반과 구현 방법을 이해하는 것은 알고리즘 및 데이터 구조 설계에서 중요한 부분을 차지한다.

'크래프톤 정글 > Algorithm' 카테고리의 다른 글

[크래프톤 정글] 그래프 개념 (1)	2024.09.20
[크래프톤 정글 ] 이분 탐색 (1)	2024.09.20
[크래프톤 정글] 우선순위 큐 (0)	2024.09.20
[크래프톤 정글] 힙트리 (1)	2024.09.20
[크래프톤 정글 ] 시간 복잡도 (0)	2024.09.20

현재글[크래프톤 정글 ] 합병정렬

하루이의 개발 노트

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

하루이의 개발 노트