차곡차곡 성 쌓기

1. 문제

캐시

지도개발팀에서 근무하는 제이지는 지도에서 도시 이름을 검색하면 해당 도시와 관련된 맛집 게시물들을 데이터베이스에서 읽어 보여주는 서비스를 개발하고 있다.
이 프로그램의 테스팅 업무를 담당하고 있는 어피치는 서비스를 오픈하기 전 각 로직에 대한 성능 측정을 수행하였는데, 제이지가 작성한 부분 중 데이터베이스에서 게시물을 가져오는 부분의 실행시간이 너무 오래 걸린다는 것을 알게 되었다.
어피치는 제이지에게 해당 로직을 개선하라고 닦달하기 시작하였고, 제이지는 DB 캐시를 적용하여 성능 개선을 시도하고 있지만 캐시 크기를 얼마로 해야 효율적인지 몰라 난감한 상황이다.

어피치에게 시달리는 제이지를 도와, DB 캐시를 적용할 때 캐시 크기에 따른 실행시간 측정 프로그램을 작성하시오

 

 

입력 형식

  • 캐시 크기(cacheSize)와 도시이름 배열(cities)을 입력받는다.
  • cacheSize는 정수이며, 범위는 0 ≦ cacheSize ≦ 30 이다.
  • cities는 도시 이름으로 이뤄진 문자열 배열로, 최대 도시 수는 100,000개이다.
  • 각 도시 이름은 공백, 숫자, 특수문자 등이 없는 영문자로 구성되며, 대소문자 구분을 하지 않는다. 도시 이름은 최대 20자로 이루어져 있다.

출력 형식

  • 입력된 도시이름 배열을 순서대로 처리할 때, "총 실행시간"을 출력한다.

조건

  • 캐시 교체 알고리즘은 LRU(Least Recently Used)를 사용한다.
  • cache hit일 경우 실행시간은 1이다.
  • cache miss일 경우 실행시간은 5이다.

 

요약

`LRU 캐시 교체 전략`을 사용해서 총 걸린 시간 구하기

 

2. 접근

기존의 코테 문제랑은 뭔가 다르게 실전에서도 생각해볼 수 있는 문제라서 좋았다. 캐시 교체 알고리즘만 배웠지, 구현 해본 적은 없는데 이 문제 풀면서 생각해볼게 많았다.

 

우선 풀고자 했던 방향은 miss와, hit 연산은 모두 O(1)로 끝날 수 있는 것이었다.

하지만 아무리 생각해도 한 가지 자료구조만으로는 생각이 안났다. 우선 hit의 경우 O(1)로 찾기 위해 HashMap을 생각했다. 하지만 문제는 새로운 값으로 갱신을 해주는 것이었다. 아무리 생각해도 O(n)으로 밖에 못한다.

 

다음은 우선순위 큐도 생각해봤지만, 가장 안쓰인 데이터를 뺴는 것은 쉽지만, 얘는 중간에 찾는 것이 어렵고 무엇보다 hit를 찾는 것도 O(n)이다.

 

그래서 할 수 없이 캐시의 최대 크기는 30이므로, O(n)으로 풀고자 했다. List든, Map이든 사용해도 되지만 나는 Map을 사용했다.

 

3. 코드

import java.util.*;

class Solution {
    public int solution(int cacheSize, String[] cities) {
        if (cacheSize == 0)
            return cities.length * 5;
        
        HashMap<String, Integer> map = new HashMap();
        int ans = 0;
        
        for(int time =0; time< cities.length; time++){
            String city = cities[time].toLowerCase();
            // hit
            if(map.containsKey(city)){
                ans += 1;
                map.put(city, time);
            }
            
            // miss
            else{   
                ans += 5;
                
                if(map.size() == cacheSize) {
                    // 지우기 - 가장 늦게 참조된 것
                    String leastKey = " ";
                    int least = time;

                    for(String key : map.keySet()){
                        if(map.get(key) < least){
                            leastKey = key;
                            least = map.get(key);
                        }
                    }
                    map.remove(leastKey);
                }
                
                map.put(city, time);
            }
        }
        
        return ans;
    }
}

 

1) hit인 경우

- 맵에서 존재하면 hit로 간주한다.

- 새로운 데이터를 캐시에 삽입한다.

 

2) miss인 경우

- 캐시가 꽉찬 경우, 참조된지 제일 오래된 데이터를 꺼내서 맵에서 제거한다.

   for문으로 key들을 탐색해서 value가 제일 작은 값을 찾는다.

- 새로운 데이터를 캐시에 삽입한다.

 

 

4. 보완

O(1)로 풀 수 있는 방법이 있을 것 같아서 GPT한테 물어봤다.

방법은 DubleLinkedList를 사용하는 것이었다.

 

import java.util.HashMap;
import java.util.Map;

public class LRUCache {

    private class Node{
        String key;
        Node prev, next;

        Node(String key){
            this.key = key;
        }
    }

    private int capacity;
    private Map<String, Node> cache;
    private Node head, tail;

    public LRUCache(int cacheSize){
        this.capacity = cacheSize;
        this.cache = new HashMap();

        // Dummy head and tail nodes
        head = new Node("");
        tail = new Node("");
        head.next = tail;
        tail.prev = head;
    }

    private void remove(Node node){
        node.prev.next = node.next;
        node.next.prev = node.prev;
    }

    private void insertToFront(Node node){
        node.next = head.next;
        node.prev = head;
        head.next.prev = node;
        head.next = node;
    }

    public boolean get(String key){
        if(!cache.containsKey(key)) return false;

        Node node = cache.get(key);
        remove(node);
        insertToFront(node);    // 가장 앞에 삽입
        return true;
    }

    public void put(String key){    // miss인 경우
        if(cache.containsKey(key)){
            remove(cache.get(key));
        }
        else if(cache.size() == capacity){
            cache.remove(tail.prev.key);
            remove(tail.prev);
        }

        Node newNode = new Node(key);
        insertToFront(newNode);
        cache.put(key, newNode);
    }
}

class Solution {
    public int solution(int cacheSize, String[] cities) {
        if (cacheSize == 0) return cities.length * 5;

        LRUCache cache = new LRUCache(cacheSize);
        int totalTime = 0;

        for (String city : cities) {
            city = city.toLowerCase();
            if (cache.get(city)) {
                totalTime += 1; // Cache hit
            } else {
                cache.put(city);
                totalTime += 5; // Cache miss
            }
        }

        return totalTime;
    }
}

 

보통 List는 삭제하는 연산에서 바로 찾을 수가 없기 때문에 O(n)의 시간이 걸린다. 하지만 Double LinkedList를 사용하면 O(1)로 가능하다. 왜냐하면 현재 지울 Node를 ...

 

해시 맵에다 노드를 저장하면 되나? 그럼 삭제도 O(1)로 제고, 삽입도 그냥 맨 앞에다 삽입하면 됨. 이따 해봐야지

profile

차곡차곡 성 쌓기

@nagrang

포스팅이 좋았다면 좋아요