on1ystar 머릿속을 정리, 기록하는 곳

<백준 14888번-python> 연산자 끼워넣기



시간 제한 : 2초

메모리 제한 : 512 MB

정답 비율 : 49.774%

출처 : 백준-14888번 https://www.acmicpc.net/problem/14888



문제

N개의 수로 이루어진 수열 A1, A2, …, AN이 주어진다. 또, 수와 수 사이에 끼워넣을 수 있는 N-1개의 연산자가 주어진다. 연산자는 덧셈(+), 뺄셈(-), 곱셈(×), 나눗셈(÷)으로만 이루어져 있다.

우리는 수와 수 사이에 연산자를 하나씩 넣어서, 수식을 하나 만들 수 있다. 이때, 주어진 수의 순서를 바꾸면 안 된다.

예를 들어, 6개의 수로 이루어진 수열이 1, 2, 3, 4, 5, 6이고, 주어진 연산자가 덧셈(+) 2개, 뺄셈(-) 1개, 곱셈(×) 1개, 나눗셈(÷) 1개인 경우에는 총 60가지의 식을 만들 수 있다. 예를 들어, 아래와 같은 식을 만들 수 있다.

  • 1+2+3-4×5÷6
  • 1÷2+3+4-5×6
  • 1+2÷3×4-5+6
  • 1÷2×3-4+5+6

식의 계산은 연산자 우선 순위를 무시하고 앞에서부터 진행해야 한다. 또, 나눗셈은 정수 나눗셈으로 몫만 취한다. 음수를 양수로 나눌 때는 C++14의 기준을 따른다. 즉, 양수로 바꾼 뒤 몫을 취하고, 그 몫을 음수로 바꾼 것과 같다. 이에 따라서, 위의 식 4개의 결과를 계산해보면 아래와 같다.

  • 1+2+3-4×5÷6 = 1
  • 1÷2+3+4-5×6 = 12
  • 1+2÷3×4-5+6 = 5
  • 1÷2×3-4+5+6 = 7

N개의 수와 N-1개의 연산자가 주어졌을 때, 만들 수 있는 식의 결과가 최대인 것과 최소인 것을 구하는 프로그램을 작성하시오.


입력

첫째 줄에 수의 개수 N(2 ≤ N ≤ 11)가 주어진다. 둘째 줄에는 A1, A2, …, AN이 주어진다. (1 ≤ Ai ≤ 100) 셋째 줄에는 합이 N-1인 4개의 정수가 주어지는데, 차례대로 덧셈(+)의 개수, 뺄셈(-)의 개수, 곱셈(×)의 개수, 나눗셈(÷)의 개수이다.


출력

첫째 줄에 만들 수 있는 식의 결과의 최댓값을, 둘째 줄에는 최솟값을 출력한다. 연산자를 어떻게 끼워넣어도 항상 -10억보다 크거나 같고, 10억보다 작거나 같은 결과가 나오는 입력만 주어진다. 또한, 앞에서부터 계산했을 때, 중간에 계산되는 식의 결과도 항상 -10억보다 크거나 같고, 10억보다 작거나 같다.



내가 적어본 문제 풀이

연산자를 조합할 수 있는 모든 순열을 찾으면 되는 브루트 포스 문제다. 처음에 문제를 풀었을 당시 순열을 이용해서 풀었는데, 시간 초과가 났다. 이번에는 재귀를 이용한 DFS를 이용해 풀었고, 다른 아이디어도 추가해 훨씬 빠른 속도를 낼 수 있었는데, 두 코드를 비교해 보려고 한다.

처음 코드

from itertools import permutations

def calc(n1, n2, op):
    if op == "+":
        return n1 + n2
    elif op == "-":
        return n1 - n2
    elif op == "*":
        return n1 * n2
    else:
        if n1 < 0:return -(abs(n1) // n2)
        return n1 // n2

if __name__ == "__main__":
    N = int(input())
    sequence = list(map(int, input().split()))
    oper = []
    max_res, min_res = -10**9, 10**9
    for o, n in zip(['+', '-', '*', '//'], list(map(int, input().split()))):
        if not n == 0:
            oper = oper + ([o]*n)
    oper_combi = permutations(oper, N-1)
    for oc in oper_combi:
        res = sequence[0]
        for i, op in enumerate(oc):
            res = calc(res, sequence[i+1], op)
        max_res = max(max_res, res)
        min_res = min(min_res, res)
    print(max_res, min_res, sep="\n")

(pypy3은 가능…)

개선된 코드

def dfs(res, sq_idx, plus, sub, multi, div):
    if sq_idx == N-1:
        global max_res, min_res
        max_res = max(max_res, res)
        min_res = min(min_res, res)
        return

    if plus: dfs(res+sequence[sq_idx+1], sq_idx+1, plus-1, sub, multi, div)
    if sub: dfs(res-sequence[sq_idx+1], sq_idx+1, plus, sub-1, multi, div)
    if multi: dfs(res*sequence[sq_idx+1], sq_idx+1, plus, sub, multi-1, div)
    if div:
        if res < 0: dfs(-(abs(res)//sequence[sq_idx+1]), sq_idx+1, plus, sub, multi, div-1)
        else: dfs(res//sequence[sq_idx+1], sq_idx+1, plus, sub, multi, div-1)

if __name__ == "__main__":
    N = int(input())
    sequence = list(map(int, input().split()))
    oper_list = list(map(int, input().split()))
    max_res, min_res = -10**9, 10**9
    dfs(sequence[0], 0, oper_list[0], oper_list[1], oper_list[2], oper_list[3])
    print(max_res, min_res, sep="\n")

  • itertools.permutations vs dfs

처음 코드와 개선된 코드 모두 결과적으로 모든 순열을 탐색하는 건 같다. 하지만 계산량은 크게 차이가 난다. itertools.permutations를 이용하면 함수 하나로 모든 순열들을 찾아 순환할 수 있는 형태로 반환해 주기 때문에 매우 편하다. 하지만, 각각의 순열을 이용해 계산할 때 항상 처음부터 계산해야 한다. 무슨 말이냐면,

# 수열: 1, 2, 3, 4, 5, 6
# case 1: + + + - *
# case 2: + + + * -

위 두 경우를 계산해야 한다고 해보자. itertools.permutations를 이용해 순열을 구한 결과 안에는 case 1과 case 2가 그대로 들어가 있어 각각의 case를 순회하면서 주어진 수열과 조합해 계산해야 한다. 계산 과정을 쭉 나열해 보면,

# itertools.permutations 이용 시,
res = 1 + 2    # res = 3
res = res + 3  # res = 6
res = res + 4  # res = 10
res = res - 5  # res = 5
res = res * 6  # res = 30
return res

res = 1 + 2    # res = 3
res = res + 3  # res = 6
res = res + 4  # res = 10
res = res * 5  # res = 50
res = res - 6  # res = 44
return res

위와 같은 방식처럼 각 case 마다 순서대로 계산해 나갈 것이다. 하지만 dfs를 사용하면 각 재귀마다 현재까지 계산한 위치나 값을 기억할 수 있기 때문에 불필요한 반복 계산을 줄일 수 있다.

# dfs 이용 시,
res = 1 + 2    # res = 3
res = res + 3  # res = 6
res = res + 4  # res = 10
res = res - 5  # res = 5
res = res * 6  # res = 30
return res

# res = 10 까지 return
res = res * 5  # res = 50
res = res - 6  # res = 44
return res

결국 입력 값이 클 수록, 계산량이 많아질 수록 효율성 차이가 심하게 벌어진다. 이게 완전 탐색 문제에서 순열과 조합보다 dfs나 bfs를 사용하는 이유다.

  • 불필요한 로직 제거

사칙연산을 해주는 calc()함수도 사실 구현할 필요가 없었다. 재귀를 호출할 때 바로바로 결과 값을 계산해 인자 값으로 넣어주면 된다.

또한 연산자 기호를 이용해 순열을 만들지 않고도 재귀를 사용하면 입력 연산자 번호 리스트를 가지고도 사칙연산을 구분할 수 있다. 이 역시 처음에는 순열을 만들어야 겠다는 생각에 연산자들을 리스트 안에 담으려고만 했는데, 재귀를 사용하면서 그럴 필요가 없어졌다.