Book/Effective Java

[Effective Java] 6.불필요한 객체 생성을 피하라

마닐라 2022. 6. 3. 23:04

똑같은 기능의 객체를 매번 생성하기보다는 객체 하나를 재사용하는 편이 나을 때가 많다.

특히 불변 객체(아이템 17)는 언제든 재사용할 수 있다.

 

다음 코드는 하지 말아야할 극단적인 예이다.

String s = new String("bikini"); // 따라 하지 말 것!

 

이 문장은 실행될 때 마다 String 인스턴스를 새로 만들어 HEAP 영역에 할당된다.

완전히 쓸데없는 행위이므로 아래와 같이 사용하자.

String s = "bikini";

 

생성자 대신 정적 팩터리 메서드를 제공하는 불변 클래스에서는 정적 팩터리 메서드를 사용해 불필요한 객체 생성을 피할 수 있다. 예컨대 Boolean(String) 생성자 대신 Boolean.valueOf(String) 팩터리 메서드를 사용하는 것이 좋다.

그래서 해당 생성자는 자바 9에서 deprecated API로 지정되었다.

생성자는 호출할 때 마다 새로운 객체를 만들지만 팩터리 메서드는 전혀 그렇지 않다.

불변 객체만이 아니라 가변 객체라 해도 사용 중에 변경되지 않을 것임이 안다면 재사용할 수 있다.

생성 비용이 아주 비싼 객체도 더러 있다. 이런 '비싼 객체'가 반복해서 필요하다면 캐싱해서 재사용하자.

하지만 자신이 만드는 객체가 비싼 객체인지를 매번 명확하게 알 수가 없다.

예를 들어 주어진 문자열이 유효한 로마 숫자인지를 확인하는 메서드를 작성한다고 하자.

 

다음은 정규표현식을 활용한 가장 쉬운 해법이다.

// 코드 6-1 성능을 훨씬 더 끌어올릴 수 있다!
static boolean isRomanNumeralSlow(String s) {
    return s.matches("^(?=.)M*(C[MD]|D?C{0,3})"
            + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
}

 

이 방식의 문제는 String.matches 메서드를 사용한다는 데 있다.

String.matches는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만 성능이 중요한 상황에서 반복해 사용하기엔 적합하지 않다. 이 메서드가 내부에서 만드는 정규표현식용 Pattern 인스턴스는 한 번 쓰고 버려져서 곧바로 가비지 컬렉션 대상이 된다. Pattern은 입력받은 정규표현식에 해당하는 유한 상태 머신을 만들기 때문에 인스턴스 생성비용이 높다.

유한 상태 머신 - 알고리즘 디자인을 위해서 사용하는 수학적 도구이다.

 

// 코드 6-2 값비싼 객체를 재사용해 성능을 개선한다.
private static final Pattern ROMAN = Pattern.compile(
        "^(?=.)M*(C[MD]|D?C{0,3})"
                + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");

static boolean isRomanNumeralFast(String s) {
    return ROMAN.matcher(s).matches();
}

 

위와 같이 재사용하면 성능을 상당히 끌어올릴 수 있다.

성능만 좋아진 것이 아니라 코드도 더 명확해 졌다.

개선 전에는 존재조차 몰랐던 Pattern 인스턴스를 static final 필드로 끄집어내고 이름을 지어주어 코드의 의미가 훨씬 잘 드러난다.

 

개선된 isRomanNumeral 방식의 클래스가 초기화된 후 이 메서드를 한 번도 호출하지 않는다면 ROMAN 필드는 쓸데없이 초기화된 꼴이다. isRomanNumeral 메서드가 처음 호출될 때 필드를 초기화하는 지연 초기화(아이템 83)로 불필요한 초기화를 없앨 수는 있지만 권하지는 않는다.

지연 초기화는 코드를 복잡하게 만드는데 성능은 크게 개선되지 않을 때가 많기 때문이다.(아이템 67)

-> 싱글턴에서 성능상 제일 좋다고 알고 있던 Lazy Holder 방식이 크게 개선되지 않는다는 건가..?

초기화에 대한 비용이 크지 않아서 그런걸까?

 

객체가 불변이라면 재사용해도 안전함이 명백하다.하지만 훨씬 덜 명확하거나 심지어 직관에 반대되는 상황도 있다.어댑터를 생각해보자(Spring의 HandlerAdapter)어댑터의 실제 작업은 뒷단 객체에 위임하고 자신은 제 2의 인터페이스 역할을 해주는 객체이다.어댑터는 뒷단 객체만 관리하면 된다. 즉 뒷단 객체 외에는 관리할 상태가 없으므로 뒷단 객체 하나당 어댑터 하나씩만 만들어지면 충분하다.

 

예컨대 Map 인터페이스의 keySet 메서드는 Map 객체 안의 키를 전부 담은 Set 을 반환한다.keySet을 호출할 때마다 새로운 Set 인스턴스가 만들어지리라 생각할 수도 있지만 매번 같은 Set 인스턴스를 반환할지도 모른다.반환된 Set 인스턴스가 일반적으로 가변이더라도 반환될 인스턴스들은 기능적으로 모두 똑같다.즉 반환한 객체 중 하나를 수정하면 다른 모든 객체가 따라서 바뀐다. 모두가 똑같은 Map 인스턴스를 대변하기 때문이다.따라서 keySet이 Set 객체를 여러 개 만들어도 상관은 없지만 그럴 필요도 없고 이득도 없다.

 

불필요한 객체를 만들어내는 또 다른 예로 오토박싱을 들 수 있다.오토박싱은 기본 타입과 그에 대응하는 박싱된 기본 타입의 구분을 흐려주지만 완전이 없애주는 것은 아니다.의미상으로는 별 다를 것 없지만 성능에서는 그렇지 않다.

 

다음 메서드는 모든 양의 정수의 총합을 구하는 메서드이다.

private static long sum() {
    Long sum = 0L;
    for (long i = 0; i <= Integer.MAX_VALUE; i++)
        sum += i;

    return sum;
}

 

이 메서드는 변수하나 때문에 매우 느려졌다.

바로 Long 타입의 sum 때문인데 그 때문에 sum에 long 타입인 i를 더할 때 마다 불필요한 인스턴스가 만들어진다.

Long을 long으로 바꿔주면 테스트 상 6.3->0.59로 빨라진다.

따라서 박싱된 기본 타입보다는 기본 타입을 사용하고 의도치 않은 오토박싱이 숨어들지 않도록 주의해야한다.

 

이번 아이템을 "객체 생성은 비싸니 피해야 한다"로 오해하면 안된다.

요즘의 JVM에서는 별다른 일을 하지 않는 작은 객체를 생성하고 회수하는 일이 크게 부담되지 않는다.

프로그램의 명확성, 간결성, 기능을 위해 객체를 추가로 생성하는 것이라면 일반적으로 좋다.

 

거꾸로 아주 무거운 객체가 아닌 이상 단순히 객체 생성을 피하고자 자신만의 객체 풀을 만들지 말아야한다.물론 객체 풀을 만드는 게 나은 예가 있긴하지만(DB Conenction pool) 일반적으로 자체 객체 풀은 코드를 헷갈리게 만들고 메모리 사용량을 늘리고 성능을 떨어뜨린다.

 

이번 아이템은 방어적 복사를 다루는 아이템 50과 대조적이다.이번 아이템이 "기존 객체를 재사용해야 한다면 새로운 객체를 만들지 마라"라면아이템 50은 "새로운 객체를 만들어야한다면 기존 객체를 재사용하지 마라"다.방어적 복사가 필요한 상황에서 객체를 재사용했을 때의 피해가 필요없는 객체를 반복 생성했을 때의 피해보다 훨씬 크다는 사실을 기억해야한다.방어적 복사에 실패하면 언제 터져나올지 모르는 버그와 보안 구멍으로 이어지지만 불필요한 객체 생성은 그저 코드 형태와 성능에만 영향을 준다.