다익스트라 알고리즘(최단 경로 알고리즘 )기본 개념 원리
이 글은 나동빈님의 '이것이 취업을 위한 코딩테스트다' 책을 보고 정리한 내용입니다.
https://book.naver.com/bookdb/book_detail.nhn?bid=16439154
다익스트라 알고리즘(Dijkstra algorithm)
최단 경로 알고리즘은 보통 그래프로 표현하는데 각 지점은 그래프에서 '노드'로 표현되고, 지점 간 연결된 도로는 그래프에서 '간선'으로 표현된다. 또한 실제 코딩 테스트에서는 최단 경로를 모두 출력하는 문제보다는 단순히 최단 거리를 출력하도록 요구하는 문제가 많이 출제된다.
다익스트라 알고리즘은 그래프에서 여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구해주는 알고리즘이다.
다익스트라 최단 경로 알고리즘은 '음의 간선'이 없을 때 정상적으로 동작한다. 음의 간선이란 0보다 작은 값을 가지는 간선을 의미하는데, 현실 세계의 길(간선)은 음의 간선으로 표현되지 않으므로 다익스트라 알고리즘은 실제로 GPS소프트웨어의 기본 알고리즘으로 채택되곤 한다.
다익스트라 알고리즘은 기본적으로 그리디 알고리즘으로 분류된다.
매번 '가장 비용이 적은 노드'를 선택해서 임의의 과정을 반복하기 때문이다.
알고리즘의 원리
- 출발 노드를 설정한다.
- 최단 거리 테이블을 초기화한다.
- 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
- 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
- 3, 4번 과정을 반복한다.
최단 경로를 구하는 과정에서 '각 노드에 대한 현재까지의 최단 거리' 정보를 항상 1차원 리스트에 저장하며 리스트를 계속 갱신한다는 특징이 있다.
매번 현재 처리하고 있는 노드를 기준으로 주변 간선을 확인한다. 나중에 현재 처리하고 있는 논드와 인접한 노드로 도달하는 더 짧은 경로를 찾으면 '더 짧은 경로도 있었네? 이제부터는 이 경로가 제일 짧은 경로야'라고 판단하는 것이다.
따라서 '방문하지 않은 노드 중에서 현재 최단거리가 가장 짧은 노드를 확인'해 그 노드에 대하여 4번 과정을 수행한다는 점에서 그리디 알고리즘으로 볼 수 있다.
다익스타라 알고리즘 구현 원리
1번 노드에서 다른 모든 노드로 가는 최단 경로를 구하는 문제를 보겠다.
예시에서 출발 노드를 1이라 하겠다.
1번 노드에서 다른 모든 노드로의 최단 거리를 계산할 것이다.
초기 상태에서는 다른 모든 노드로 가는 최단 거리를 '무한'으로 초기화한다.
코드로는 999,999,999등의 값으로 설정할 수 있다.
Step 0
먼저 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하는데,
출발 노드에서 출발 노드로의 거리는 0으로 보기 때문에 처음에는 출발 노드가 선택된다.
Step 1
이제 1번 노드를 거쳐 다른 노드로 가는 비용을 계산한다.
1번 노드와 연결된 모든 간선을 하나씩 확인하면 된다.
1번 노드를 거쳐서 2번, 3번, 4번 노드로 가는 최소 비용은 2, 5, 1이다.
현재 2번, 3번, 4번 노드로 가는 비용이 '무한'으로 설정되어 있는데, 세 노드에 대하여 더 짧은 경로를 찾았으므로 각각 새로운 값으로 갱신한다.
Step 2
이후 모든 단계에서도 마찬가지로 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택해야 한다.
따라서 그 다음은 4번 노드가 선택된다.
이어서 4번 노드를 거쳐서 갈 수 있는 노드를 확인한다.
4번 노드를 통해 갈 수 있는 노드는 3번과 5번이다.
이때 4번 노드까지의 최단거리는 1이고 3번과 5번 노드로 가는 최소 비용은 차례대로 4(1+3), 2(1+1)이다.
이 두 값은 기존의 리스트에 담겨 있던 값보다 작으므로 다음처럼 리스트가 갱신된다.
Step 3
다음은 2번 노드가 선택된다.
2번과 5번 노드까지의 최단거리가 2로 같은데, 이럴 때는 일반적으로 번호가 작은 노드를 선택한다.
그리고 2번 노드를 거쳐서 도달할 수있는 노드 중에서 거리가 더 짧은 경우가 있는지 확인한다.
지금 2번 노드의 경우에는 최단거리를 갱신할 수 있는 노드가 없다.
2번 노드를 거쳐서 3번노드로 이동하는 경우, 5(2+3)만큼의 비용이 발생하는데, 이미 최단 거리 테이블에서 3번 노드까지의 최단거리는 4이므로 값을 갱신하지 않는다.
4번 노드로 가는 경우도 마찬가지다.
이런 과정을 모든 노드에 반복한다.
그림은 생략.
다익스트라 알고리즘은 방문하지 않은 노드 중에서 가장 최단 거리가 짧은 노드를 선택하는 과정을 반복하는데,
이렇게 선택된 노드는 최단거리가 완전히 선택된 노드이므로, 더 이상 알고리즘을 반복해도 최단 거리가 줄어들지 않는다.
다익스트라 알고리즘은 진행되면서 한 단계당하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해할 수 있다.
그렇기에 사실상 마지막 노드에 대해서는 다른 노드로 가는 경우를 확인할 필요가 없다.
다익스트라 알고리즘 C++ 코드 구현에 대한 포스팅
https://hub1234.tistory.com/33