재귀를 설명한 글의 끝부분에서 입력값이 조금만 커져도 재귀호출 횟수가 급격하게 늘어나는 문제점에 대해서 언급했는데, 이렇게 되는 이유는 중복되는 부분 문제를 계산하는 횟수가 너무 많기 때문이다. 이 문제를 풀어 보면 알 수 있지만 피보나치 수를 구하기 위해서 이 글에 나온 것처럼 코드를 짜면 함수 호출의 횟수 자체가 피보나치 수만큼 증가하기 때문에 이렇게 해서는 빠른 코드를 짤 수 없다.
하지만 중복되는 부분 문제를 살펴보면 중복되는 부분 문제에 대한 답이 항상 같기 때문에, 만약 어떤 부분 문제의 답을 계산했다면 그 계산 결과를 저장한 뒤 나중에 같은 부분 문제를 풀 때 기존에 계산한 답을 사용하면 되므로 성능을 크게 향상시킬 수 있다. 이러한 방법을 메모이제이션(Memoization)이라고 한다. (Memorization이 아니다. 두 단어는 각각 Memo와 Memorize에서 파생된 말로 기본형부터 다르다.) 또한 메모이제이션을 활용해서 문제를 해결하는 방법을 동적 계획법(Dynamic Programming, DP)이라고 한다. (줄임말인 DP 역시 매우 많이 쓰이는 단어이므로 알아 두는 것이 좋다.) 동적 계획법 역시 그리디와 마찬가지로 매우 자주 등장하고, 활용되는 범위도 넓기 때문에 많은 연습이 필요하다.
이 글에 나온 코드를 메모이제이션을 사용하여 훨씬 빠른 코드로 바꾸면 이렇게 된다.
int f(int n)
{
if(a[n])return a[n];
if(n < 2)return a[n] = 1;
return a[n] = f(n-2) + f(n-1);
}
배열을 전역 변수로 선언한다면 모든 원소가 $0$으로 초기화되고, 피보나치 수열에는 $0$이 등장하지 않으므로 $a[n]$이 $0$이 아니라는 것은 이전에 $f(n)$이 계산되었다는 것과 같다. 따라서 이 값을 바로 쓸 수 있다. 만약 그렇지 않다면 이전에 계산한 정보들을 바탕으로 $f(n)$을 계산에서 $a[n]$에 저장한다. 이때 값을 저장하는 배열 $a$를 DP 테이블(DP Table)이라고 한다.
위의 코드는 가장 큰 부분 문제부터 접근하여 재귀호출을 통해서 답을 구하는데, 이러한 방식을 탑다운(Top-Down)이라고 한다. 이와 대비되는 개념으로 바텀업(Bottom-Up) 방식이 있는데, 이 방식은 기저 사례에서 시작해서 점점 큰 부분 문제를 해결하고 최종적으로 원래 문제의 답을 구한다. 바텀업 방식은 대부분 재귀함수 없이 구현할 수 있어서 실행시간이나 메모리 사용량의 측면에서 탑다운 방식보다 약간 더 효율적이다. 다만 성능에 크게 영향을 주지 않는 경우도 많고 탑다운 방식의 코드는 더 직관적이어서 가독성의 측면에서 더 효율적인 경우가 많으므로 상황에 따라 적절한 방식을 선택하면 된다. 피보나치 수를 구하는 코드를 바텀업 방식으로 짜면 이렇게 된다.
a[0] = a[1] = 1;
for(int i = 2;i <= n; i++)a[i] = a[i-2] + a[i-1];
두 코드 모두 $\Theta(n)$의 시간복잡도를 가짐을 확인할 수 있다.
동적 계획법은 유형이 다양하므로 카테고리 E에서 더 자세히 살펴볼 것이기 때문에 일부 유형에 해당하는 연습문제는 넣지 않았다.
[연습문제]
$f(0)=0$이고 $f(n)=\min(f(n/3),f(n/2),f(n-1))+1$인데 $f(n/3)$과 $f(n/2)$는 각각 $n$이 $3$의 배수일 때와 $2$의 배수일 때만 포함된다. 만약 그렇지 않다면 해당 값들을 빼고 계산해야 한다.
배낭 문제 또는 냅색 문제(Knapsack Problem)이라고 불리는 유명한 문제이다. 각각의 물건을 배낭에 넣을지 안 넣을지를 결정해야 하는데, 이것을 $i$번째 물건까지 고려했을 때 배낭에 넣은 물건의 가치가 $j$일 때의 최소 무게, 또는 $i$번째 물건까지 고려했을 때 배낭에 넣은 물건의 무게가 $j$일 때의 최대 가치를 DP 테이블에 채우면 된다. 후자의 경우 반복 횟수가 $1000$만까지 올라갈 수 있지만 제한시간 내에 충분히 통과한다.
$i$일째에 $j$장의 쿠폰이 있을 때 지불한 비용의 최솟값을 DP 테이블에 채워 넣으면 된다.
괄호값이 $k$인 문자열 $s_k$ 중에서 $\text{val}(s)$의 값이 가장 작은 문자열을 $t_k$라고 하면 $t_k$는 다음 문자열 중에서 $\text{val}$값이 가장 작은 문자열이 된다. 기저 사례는 $k = 1, 2, 3$일 때이다.
- $t_{k-1}+$"()"
- $t_{k-2}+$"{}"
- $t_{k-3}+$"[]"
- "()"$+t_{k-1}$
- "{}"$+t_{k-2}$
- "[]"$+t_{k-3}$
- "("$+t_{k/2}+$")" ($k$가 $2$의 배수인 경우)
- "{"$+t_{k/3}+$"}" ($k$가 $3$의 배수인 경우)
- "["$+t_{k/5}+$"]" ($k$가 $5$의 배수인 경우)
이때 "{"와 "}"가 "["와 "]"보다 아스키 코드값이 크기 때문에 단순히 string을 비교하는 식으로 하면 틀렸습니다를 받게 된다.
CF 1105C. Ayoub and Lost Array (1500)
길이가 $i$일 때 원소의 합을 $3$으로 나눈 나머지가 $0, 1, 2$인 배열의 개수를 DP 테이블에 채워서 풀 수 있다.
CF 1427C. The Hard Work of Paparazzi (2000)
각각의 유명인사를 만날 경우 이전에 만날 수 있는 유명인사 수의 최댓값을 찾으면 되는데, 두 유명인사가 나타나는 시간의 차이가 $2r-2$ 이상일 경우 무조건 이동할 수 있다는 점을 이용해서 탐색의 범위를 줄이면 통과할 수 있다.
'Algorithm > B. Basic Algorithms' 카테고리의 다른 글
26. Bitmasks (0) | 2021.02.05 |
---|---|
25. Divide and Conquer (0) | 2021.02.04 |
23. Backtracking (0) | 2021.01.30 |
22. Recursion (0) | 2021.01.30 |
21. Greedy (0) | 2021.01.29 |