프로젝트에서 Hikari 옵션을 아래와 같이 정의하고 사용키로 하였다. 

        driver-class-name: org.postgresql.Driver
        auto-commit: true
        connection-init-sql: select 1
        minimum-idle: 3
        maximum-pool-size: 20
        connection-timeout: 600000
        validation-timeout: 120000
        idle-timeout: 108000000 # 600000*10*18 = 18hours
        max-lifetime: 0 # controlled by idle-timeout
        cachePrepStmts: true
        prepStmtCacheSize: 350
        prepStmtCacheSqlLimit: 2048
        useServerPrepStmts: true


**autoCommit:**
auto-commit설정 (default: true)
**connectionTimeout:**
pool에서 커넥션을 얻어오기전까지 기다리는 최대 시간, 허용가능한 wait time을 초과하면 SQLException을 던짐. 설정가능한 가장 작은 시간은 250ms (default: 30000 (30s))
**idleTimeout:**
pool에 일을 안하는 커넥션을 유지하는 시간. 이 옵션은 minimumIdle이 maximumPoolSize보다 작게 설정되어 있을 때만 설정.
pool에서 유지하는 최소 커넥션 수는 minimumIdle (A connection will never be retired as idle before this timeout.). 최솟값은 10000ms (default: 600000 (10minutes))
**maxLifetime:**
커넥션 풀에서 살아있을 수 있는 커넥션의 최대 수명시간. 사용중인 커넥션은 maxLifetime에 상관없이 제거되지않음. 사용중이지 않을 때만 제거됨. 풀 전체가아닌 커넥션 별로 적용이되는데 그 이유는 풀에서 대량으로 커넥션들이 제거되는 것을 방지하기 위함임. 강력하게 설정해야하는 설정 값으로 데이터베이스나 인프라의 적용된 connection time limit보다 작아야함. 0으로 설정하면 infinite lifetime이 적용됨(idleTimeout설정 값에 따라 적용 idleTimeout값이 설정되어 있을 경우 0으로 설정해도 무한 lifetime 적용 안됨). (default: 1800000 (30minutes))
**minimumIdle:**
아무런 일을 하지않아도 적어도 이 옵션에 설정 값 size로 커넥션들을 유지해주는 설정. 최적의 성능과 응답성을 요구한다면 이 값은 설정하지 않는게 좋음. default값을 보면 이해할 수있음. (default: same as maximumPoolSize)
**maximumPoolSize:** 
pool에 유지시킬 수 있는 최대 커넥션 수. pool의 커넥션 수가 옵션 값에 도달하게 되면 idle인 상태는 존재하지 않음.(default: 10)


PreparedStatement란:
데이터베이스 관리 시스템(DBMS)에서 동일하거나 비슷한 데이터베이스 문을 
높은 효율성으로 반복적으로 실행하기 위해 사용되는 기능을 말할다.


**cachePrepStmts (cachePreparedStatements)**
default: false, recommend: true
MySQL은 PreparedStatement Caching을 비활성화하고 있기 때문에, 이 옵션을 허용해줘야 아래의 옵션값들이 실제 DB에 영향을 줄 수 있다.

**prepStmtCacheSize (preparedStatementsCacheSize)**
default: 25, recommend: 250 ~ 500
MySQL 드라이버가 Connection마다 캐싱할 PreparedStatement의 개수를 지정하는 옵션이다. HikariCP에서는 250 ~ 500개 정도를 추천한다.

**prepStmtCacheSqlLimit (preparedStatementsCacheSqlLimit)**
default: 256, recommend: 2048
MySQL 드라이버가 캐싱할 PreparedStatement의 최대 길이를 지정하는 옵션이다. HikariCP 개발자들의 경험상, Hibernate와 같은 ORM framework를 사용하는 경우에 특히 이 기본값이 턱없이 모자란다고 한다.

**useServerPrepStmts (useServerSidePreparedStatements)**
default: false, recommend: true
Server-Side PreparedStatement를 사용하는 옵션이다. Server-Side Prepared



**PreparedStatement 동작방식**

1. 먼저 애플리케이션은 쿼리 틀을 만들고 이를 DBMS로 보낸다. 특정값은 지정하지 않은 채로 남겨진다 
      ex) INSERT INTO products (name, age) VALUES (?, ?);
2. 해당 쿼리를 컴파일하며(최적화 및 변환) 아직 실행하지 않고 결과만 저장한다.
3. 나중에 쿼리 틀의 변수에 값을 지정하면 DBMS는 (결과를 반환할 수도 있는) 문을 실행한다. 애플리케이션은 여러 값으로 원하는 횟수만큼 문을 실행할 수 있다. 
 
**Statement와 PreparedStatement차이**
Statement와 PreparedStatement의 아주 큰 차이는 바로 캐시(cache)사용여부이다.
Statement를 사용하면 매번 쿼리를 수행할 때마다 4단계를 거치게 되고(계속적으로 단계를 거치면서 수행)
PreparedStatement는 처음 한 번만 세 단계를 거친 후 캐시에 담아 재사용을 한다는 것이다. 

만약 동일한 쿼리를 반복적으로 수행한다면 PreparedStatment가 DB에 훨씬 적은 부하를 주며, 성능도 좋다.


출처
https://webstone.tistory.com/56
https://effectivesquid.tistory.com/entry/HikariCP-%EC%84%B8%ED%8C%85%EC%8B%9C-%EC%98%B5%EC%85%98-%EC%84%A4%EB%AA%85

모델 학습,데이터 결과 처리, 프로덕션 배포 및 SageMaker의 CI/CD에 대한 내용이다. 

  • SageMaker Training이란 무엇일까?
    • 완전 관리형 머신 러닝 학습 서비스
    • 데이터 과학자가 빠르고 쉽게 모델 개발 및 학습을 할 수 있도록 지원

 

두가지 타입으로 사용할 수 있다. 

고객이 준비할 건 파란 영역이며 AWS에서 제공하는 학습 컨테이너 이미지를 사용할 수도 있다. 추가로 필요한 패키지가 있는 경우는 Custom 학습 컨테이너 이미지를 직접 고객이 만들어서 올린 다음 사용할 수 있다.

 

작은 용량의 노트북 CPU를 띄워서 데이터 준비 및 코드를 작성하고, 모델 학습은 고성능 CPU에서 실행할 수 있게 한다.

 

모델 학습 환경의 구성

1. SageMaker 노트북 생성

2. 학습 코드 내 경로 수정

3. 학습 작업의 실행 노트북 작성

 

1. SageMaker 노트북 생성 

노트북 인스턴스에서 모델학습을 수행할 수 있지만, 학습의 확장성이 제한적입니다.

따라서, 별도 인스턴스를 띄워서 모델 학습을 진행하며, 이를 SageMaker Training이라고 합니다. 

비용을 절감, 학습의 확장성을 고려해서 노트북에서 학습하기 보다는 별도 인스턴스에서 학습하길 권장한다. 

학습이 끝나면 AWS에서 제공하는 학습 클러스터는 종료되고 과금되지 않는다. 

학습을 실행하게 되면 정의한 내용 대로 학습 인스턴스가 여러개 뜰 수도 있고 컨테이너 이미지가 여러개 뜰 수 있고 컨테이너들끼리 네트워크로 연결되어 분산 작업이 가능하다. 

 

동작방식은 어떻게 될까?

노트북에서 생성된 학습코드, S3에 저장된 데이터, AmazonECR에서 생성한 Custom학습 컨테이너 이미지가 학습 실행을 시작시키면 SageMaker 학습 클러스터에 복사되어 실행이 되고, 학습 종료 후 클러스터는 사라지게 된다. 

 

2. 학습 코드 내 경로 수정

 

학습코드를 노트북에 올리고, code 폴더는 자동으로 학습 클러스터의 학습 인스턴스에 자동으로 복사된다. 

경로가 너무 길면 별도 환경 변수를 활용하여 짧게 수정할 수도 있다.

 

클러스터가 종료되어도 산출물들은 저장되어야 하기 때문에 학습이 끝나면 위 경로에 자동으로 저장이 되게 한다.

3. 학습 코드 내 경로 수정

학습 클러스터의 인스턴스 종류/수 실행할 학습코드, 학습 환경 컨테이너 등을 Estimator로 정의

estimator에 정의하기
학습 클러스터에서 사용할 데이터 경로와 channel_name을 선언한 후 fit으로 실행하기
Estimator에 정의된 값에 더 알아보자
고가의 CPU, GPU를 활용해 빠르게 데이터를 가져오고 싶다 하면 Lustre를 활용하면 된다.
예상했던 것 보다 더 오래 동작하는 걸 방지하기 위해 최대 학습 수행시간을 조정한다.

작동원리

노트북에서 컨테이너 이미지를 받아와서 실행하여 디버깅을 한다. 비용 관점에서는 디버깅이 끝나면 노트북 인스턴스를 용량을 낮춰 비용을 절감한다.

 

간단하게 AWS 에서 제공하는 영상을 보면서 SageMaker가 어떤 건지 정도 알 수 있었다고 한다..

https://www.geeksforgeeks.org/static-synchronization-in-java/

위 글을 번역한 내용입니다.

 


 

동기화는 공유 리소스에 대한 멀티 스레드의 액세스를 컨트롤 할 수 있는 가능성입니다.

Java에서 동기화는 스레드 간의 안정적인 통신에 필수적이며, 이를 위해 Java에선 synchronized 키워드를 사용합니다.

 

Important Points Regarding Synchronization

  • Object level에 있는 메서드에만 해당됩니다.
  • 메서드 또는 블록이 동기화된 경우 object-level 잠금이 필요합니다.
  • 동기화는 deadlock 상태의 유일한 이유이기 때문에 Java에서 가장 위험한 단어입니다.
  • 필요할 땐 동기화된 키워드를 사용하고 동기화된 블록도 한번 사용해 보십시오.

Static Synchronization

동기화된 메서드는 순서가 지정된 출력을 가져오는 동작이 원하는대로 동작하지 않을 수 있습니다. 

클래스의 객체가 더 많을 경우 특정 인스턴스의 잠금만 획득합니다.

Synchronized을 유지하려면 정적 동기화로 달성할 수 있는 instance-level lock이 아닌  class-level lock이 필요합니다.

 

Static Synchronized 메소드는 두 개의 스레드가 synchronized 메소드에 대해 동시에 정적으로 작동할 수 없도록 Java에서 메소드를 동기화하는 메소드이기도 합니다. 유일한 차이점은 Static Synchronized를 사용하는 것입니다. 하나의 스레드만 메서드에서 작동하도록 class-level lock을 달성하고 있습니다. 스레드는 하나의 스레드만 정적 동기화 메서드에서 작동할 수 있도록 Java 클래스의 class level lock 을 획득합니다.

 

Syntax:

synchronized static return type class name{}

 

6개의 쓰레드가 있다고 가정하자. 실행 순서는 아래와 같다.

 

The complete declarations of  methods are:
method1: public static synchronized void method1()
method2: public static synchronized void method2()
method3: public static void method3()
method4: public synchronized int method4()
method5: public String method5()

 Threads and Classes

  1. 여기서 t1,t2… t6은 스레드 이름입니다.t1.method1()은 Manager 클래스의 클래스 수준 잠금을 획득하면서 실행을 시작합니다.
  2. t2.method2()는 실행 시작 시간을 기다립니다. 정적 동기화 메서드이므로 t1이 이미 클래스 수준 잠금을 획득했기 때문에 클래스 수준 잠금이 필요합니다. t2는 t1이 실행될 때까지 기다려야 합니다.
  3. t3.method2()는 클래스 수준 잠금이 필요하므로 대기하므로 t1이 잠금을 해제할 때까지 기다려야 합니다.
  4. t4.method3()은 잠금이 필요 없는 정적 메서드이므로 실행을 시작합니다.
  5. t5.method4()는 인스턴스 또는(일반) 수준의 동기화 메서드로 실행을 시작하고 개체 수준 잠금이 필요하므로 개체 수준 잠금을 얻습니다.
  6. t6.method5()는 인스턴스 메서드 또는 일반 메서드이므로 실행을 시작합니다.

 

Difference between Synchronized and Static Synchronized in Java

object-level lock. class-level lock.
메서드를 정적으로 선언할 필요는 없습니다.
해당 메서드는 정적으로 선언해야 합니다.
필요시 자주 사용됨 자주 사용 X
각 개체에 대해 다른 인스턴스가 생성됩니다.
전체 프로그램에 대해 단 하나의 인스턴스입니다.

MapStruct를 사용하는 이유
Controller, Service, Repository 등 레이어 간 데이터를 주고받을 때나 비즈니스 로직에서, 하나의 객체를 타입이 다른 객체로 형(Type) 변환하거나 여러 객체를 다른 객체로 합치는 일은 매우 빈번한여 결국 생산성을 떨어뜨리고, 비즈니스 로직에 섞이게 되면 코드가 복잡해집니다.

 

이 API에는 두 Java Bean 간에 자동으로 매핑되는 기능이 포함되어 있습니다.

MapStruct를 사용하여 인터페이스만 생성하면 라이브러리는 컴파일 시간 동안 구체적인 구현을 자동으로 생성합니다.

엔티티와 클라이언트 측으로 나가는 DTO 간에 변환이 발생하는 경우가 많은데 이때 수동으로 빈 mapper를 만드는 것은 시간이 많이 걸리고, 이 부분을 MapStruct가 해결합니다.

 

MapStruct 라이브러리는 자동으로 빈 매퍼 클래스를 생성합니다. MapStruct라이브러리를 추가하고, @Mapper 어노테이션이 선언된 interface를 선언합니다. 구현 클래스를 생성하지 않았도 MapStruct가 가 자동생성해줍니다. mvn clean install을 실행하여 MapStruct 처리를 trigger할 수 있고, 그러면 /target/generated-sources/annotations/ 아래에 구현 클래스가 생성됩니다.

 

Lombok과 함께 사용하는 경우

Lombok과 MapStruct를 함께 사용하면 런타임시 에러가 발생하는 것을 확인할 수 있었습니다.

Project Lombok은 (무엇보다도) 컴파일된 빈 클래스의 AST(추상 구문 트리)에 getter와 setter를 추가하는 주석 처리기인데
AST 수정은 Java 주석 처리 API에서 예측할 수 없으므로 Lombok과 MapStruct 내에서 둘 다 함께 작동하도록 하려면 별도 작업을 해줘야합니다. 기본적으로 MapStruct는 Lombok이 enhanced-bean에 대한 매퍼 클래스를 생성하기 전에 Lombok이 모든 수정을 완료할 때까지 기다립니다. Lombok 1.18.16 이상을 사용하는 경우 Lombok과 MapStruct가 함께 작동하도록 하기 위해 lombok-mapstruct-binding을 추가해야 합니다. MapStruct 또는 Lombok의 이전 버전을 사용하는 경우 솔루션은 Lombok에서 수정할 JavaBeans와 MapStruct에서 처리할 매퍼 인터페이스를 프로젝트의 두 개의 개별 모듈에 넣는 것입니다. 그런 다음 Lombok은 첫 번째 모듈의 컴파일에서 실행되어 두 번째 모듈을 컴파일하는 동안 MapStruct가 실행될 때 빈 클래스가 완료되도록 합니다.

 

작업내용 
mapstruct 라이브러리와 함께 lombok-mapstruct-binding을 추가하고,

아래와 같이 플러그인을 추가해주니 정상 작동 되는 것을 확인할 수 있었습니다.

    <properties>
        <org.mapstruct.version>1.4.2.Final</org.mapstruct.version>
        <org.projectlombok>1.18.20</org.projectlombok>
        <lombok-mapstruct-binding>0.2.0</lombok-mapstruct-binding>
    </properties>
        <dependency>
            <groupId>org.mapstruct</groupId>
            <artifactId>mapstruct</artifactId>
            <version>${org.mapstruct.version}</version>
        </dependency>
        <dependency>
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok-mapstruct-binding</artifactId>
            <version>${lombok-mapstruct-binding}</version>
        </dependency>
 <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.8.1</version>
                <configuration>
                    <source>${java.version}</source> <!-- depending on your project -->
                    <target>${java.version}</target> <!-- depending on your project -->
                    <annotationProcessorPaths>
                        <path>
                            <groupId>org.projectlombok</groupId>
                            <artifactId>lombok</artifactId>
                            <version>${org.projectlombok}</version>
                        </path>
                        <!-- This is needed when using Lombok 1.18.16 and above -->
                        <path>
                            <groupId>org.projectlombok</groupId>
                            <artifactId>lombok-mapstruct-binding</artifactId>
                            <version>${lombok-mapstruct-binding}</version>
                        </path>
                        <path>
                            <groupId>org.mapstruct</groupId>
                            <artifactId>mapstruct-processor</artifactId>
                            <version>${org.mapstruct.version}</version>
                        </path>
                        <!-- other annotation processors -->
                    </annotationProcessorPaths>
                </configuration>
            </plugin>

 

 

@Mapper(componentModel = "spring")
public interface TestMapper {
    Test toTestEntity(TestForm testForm);
}

 

 

참고 

https://mapstruct.org/faq/

 

Frequently Asked Questions (FAQ) – MapStruct

The strategies were developed over time and hence the naming / behavior deserves attention in future versions of MapStruct to getter better allignment. This would introduce backward incompatibillties, so we cannot not do this in the 1.x versions of MapStru

mapstruct.org

https://medium.com/uphill-engineering-design/deep-dive-into-mapstruct-spring-7ddd8dac3d6d

 

Deep dive into Mapstruct @ Spring

How to take advantage of Mapstruct to greatly reduce the amount of boilerplate code that would regularly be written by hand.

medium.com

 

 

현재 개발중인 애플리케이션은 Multi Datasource를 사용중이다. 

Header로 전달받은 값에 따라 연결할 데이터베이스를 결정하고, 경우에 따라선 한 API에서 2개 이상의 데이터베이스에 접근해야 한다. JPA를 사용중이고, 몇 십개의 엔티티들은 대부분 다 관계성을 띄고 있어 FetchType을 기본적으로 Lazy Association으로 가져간다.

 

OSIV (Open Session In View)

OSIV는 개발중에 처음 알게된 용어이다. 엔티티들의 수많은 관계속에서 딱 원하는 Response 데이터 형태를 만들어내기란 여간 힘든게 아니었다. 삽질의 시간속에서 허우적 댈 때쯤 Service Layer에서 CRUD중 C/U/D의 경우에는 @Transactional로 선언된 메소드들이 있었다. 그런데 @Transactional 메소들를 벗어난 이후의 동작이 예상대로 돌아가지 않는 것이다. 특히 데이터베이스 각각에 Update를 해야되는 경우였는데 (그 외에도 몇개의 문제상황이 있었다) A데이터베이스에서 쿼리를 하고, B데이터베이스에다 작업을 하기 위해 MultiDataSource를 사용하기 위해 이용되는 DatabaseContextHolder에 B데이터베이스를 재할당하였다. 당시 나는 당연히 B로 연결이 될 것이라 생각했는데 이게 웬걸 B 데이터베이스로 연결되지 않고 처음에 맺었던 A 데이터베이스에다가 모든 작업을 하고 있던게 아닌가. A에 하는 작업과 B에 하는 작업을 메소드 분리하고, 각각의 메소드에 @Transactional을 걸어줘봤는데 실패, propagation을 requires_new 로도 해보고 여러가지를 시도해봤는데도 실패. 그렇게 삽질을 하고 나서야 알게된게 OSIV였다.

 

일단 @Transactionl에 대해 알아보고, OSIV를 알아보도록 하자

 

  • @Transactional
    • 스프링에서는 간단하게 어노테이션 방식으로 @Transactional을 메소드, 클래스, 인터페이스 위에 추가하여 사용하는 방식이 일반적이다. 이 방식을 선언적 트랜잭션이라 부르며, 적용된 범위에서는 트랜잭션 기능이 포함된 프록시 객체가 생성되어 자동으로 commit 혹은 rollback을 진행해준다.
    • Spring이 제공하는 어노테이션으로 @Transactional을 메서드 또는 클래스에 명시하게 되면 특정 메서드 또는 클래스가 제공하는 모든 메서드에 대해 내부적으로 AOP를 통해 트랜잭션 처리코드가 전 후 로 수행된다.
      • AOP는 일반적으로 두가지 방식이 있는데 그 중에 하나인 Dynamic Proxy로 예를 들어보면
        • @Transactional가 걸려있는 메소드 a() 가 있으면 Proxy는 런타임 시점에 해당 a()메소드를 호출하는 코드를 포함, 트랜잭션 처리에 필요한 코드를 전후로 감싸 트랜잭션 처리를 다이나믹 프록시 객체에 대신 위임한다. 
    • 하지만, @Transactional이 걸려있는 메소드가 종료됟더라도 OSIV에 의해 트랜잭션이 끝나도 영속성 컨텍스트는 유지된다.
  • OSIV와 영속성컨텍스트
    • OSIV(Open Session In View)는 영속성 컨텍스트를 뷰까지 열어두는 기능이다. 영속성 컨텍스트가 유지되면 엔티티도 영속 상태로 유지된다. 뷰까지 영속성 컨텍스트가 살아있다면 뷰에서도 지연 로딩을 사용할 수가 있다.
    • OSIV 전략은 트랜잭션 시작처럼 최초 데이터베이스 커넥션 시작 시점부터 API 응답이 끝날 때 까지 영속성 컨텍스트와 데이터베이스 커넥션을 유지한다. 그래서 View Template이나 API 컨트롤러에서 지연 로딩이 가능하다.
    • 스프링에서는 OSIV가 기본값(true)으로 설정되어있다. 기본적으로는 트랜잭션을 시작할 때 영속성 컨텍스트가 DB 커넥션을 가져온다. 커넥션을 획득한 후에는 API 응답이 끝날때까지 유지한다. 트랜잭션이 끝나도 지연 로딩으로 프록시 객체를 초기화할 상황이 생기기 때문이다. 따라서 영속성 컨텍스트가 DB 커넥션을 계속 물고 있어야 한다.
    • JPA의 영속성 컨텍스트는 결국 DB를 1:1로 쓰면서 동작한다.
  • OSIV의 문제점?
    • 오랫동안 DB 커넥션을 물고 있기 때문에 실시간 트래픽이 중요한 애플리케이션에서는 커넥션이 모자랄 수 있다. 이는 결국 장애로 이어진다.
    • Multi Datasource를 사용하는 경우에는 처음 맺은 DB 커넥션을 계속 가져가기 때문에 DB Connection을 바꾸는 데에 있어 문제가 생길 수 있다.
  • OSIV = false
    • OSIV를 끄면 트랜잭션을 종료할 때 영속성 컨텍스트를 닫고, 데이터베이스 커넥션도 반환한다. 따라서 커넥션 리소스를 낭비하지 않는다. 하지만 모든 지연로딩을 트랜잭션 안에서 처리해야 한다. 따라서 지금까지 작성한 많은 지연 로딩 코드를 트랜잭션 안으로 넣어야 하는 단점이 있다. 그리고 view template에서 지연로딩이 동작하지 않는다.
    • CRUD 중에서 CUD의 경우에는 기본적으로 서비스레이어에 @Transactional을 설정하였고, Controller에는 비즈니스 로직이 없기 때문에 문제가 없을 수 있지만 R의 경우는 서비스레이어에서 Lazy Loading을 이용해 엔티티를 조작하려고 할 때 Exception이 발생하기 때문에 이 경우에는 @Transational과 read-only값을 true로 설정함으로써 해결이 가능하다.
  • OSIV=false & MultiDatasource
    • OSIV를 true로 하게 되면 최초 연결된 세션을 재사용하여 DetermineRoutingDatasource 클래스의 determineCurrentLookupKey 메소드가 동작하지 않게 되고, 결과적으로 DatabaseContextHolder로 재설정한 데이터베이스로 연결이 되지 않는다. 따라서 MultiDatasource를 사용하는 애플리케이션의 경우엔 OSIV를 false로 가져가는 것이 맞다. 

 

Datasoure를 변경하려고 하면 최초 연결된 세션을 재사용하기 때문에  DetermineRoutingDatasource 클래스의determineCurrentLookupKey 메소드가 동작하지 않게 되고, 결과적으로 DatabaseContextHolder로 재설정한 데이터베이스로 연결이 되지 않았다. 이 문제는 OSIV 를 false로 둠으로써 해결할 수 있었다. 

OSIV는 Spring에서 기본적으로 true로 가져가고 있지만, 애플리케이션의 복잡도와 성능을 고려해보고 이 값을 false로 변경해보는 것을 고려해보아야 한다.

 

 

참고

https://dodeon.gitbook.io/study/kimyounghan-spring-boot-and-jpa-optimization/04-osiv

https://ykh6242.tistory.com/102

https://incheol-jung.gitbook.io/docs/q-and-a/spring/osiv

 

  • Comparable과 Comparator 인터페이스의 차이는?
    • Comparable 인터페이스는 자연스러운 순서로 정렬할 때 사용하고. Comparator는 원하는 대로 정렬 순서를 지정한다.
    • Array와 Collection 클래스는 몇 가지 오버로딩된 정렬 메서드가 있다. 
      • 배열을 받는 메서드
      • 배열과 Comparator 객체를 받는 메서드 
    • 지정한 순서대로 정렬하고 싶으면 sort 메서드에서 사용할 Comparator 인터페이스를 구현한 후 이를 제공해야 한다.
      • Comparator를 인터페이스를 구현한 ReverseNumericalOrder 클래스가 있다고 치자.
        • 이 클래스는 compare 메소드를 오버라이드 한 것
      • 이것을 Collections.sort(number, new ReverseNumbericalOrder()); 이렇게 전달하면 원하는 순서대로 정렬이 되는 것을 볼 수 있다. 

 

 

  • 버블 정렬 알고리즘
    • 순환할 때 마다 하나의 원소만 변경한다. 
    • 최선의 경우는 이미 정렬되어 잇을 때
    • 최악의 경우는 역순으로 정렬되어 있을 떄 
    • O(n^2)
  • 삽입 정렬 알고리즘 
    • 정렬된 원소들을 새로운 리스트에 담아서 반환 (버블 정렬과 다른 점)
    • LinkedList를 사용하며 반환할 리스트가 구성되면 즉시 반환할 수 있다. 
    • 최악의 경우는 이미 정렬되어 있을 때고, 이때는 O(n^2)
    • 최선의 경우는 역순으로 정렬되어 있을 때고, 이때는 O(n)
  • 버블vs삽입
    • 삽입 정렬 알고리즘은 새로운 리스트를 반환해야 하므로 정렬하려는 리스트의 두배 정도 되는 저장 공간이 필요하다. 
    • 버블 정렬은 스왑할 때 사용하는 임시 변수용으로 사용할 여분의 메모리 슬롯 하나만 더 있으면 된다.
    • 따라서, (나의 의견)
      • 어느 정도 정렬된 아주 큰 배열은 버블정렬
      • 전혀 정렬되지 않았고 그다지 크지 않은 배열의 경우에는 삽입정렬
  • 퀵 정렬 알고리즘
    • 재귀적인 알고리즘으로 버블과 삽입 보다 훨씬 더 효율적이고 성능이 ㅇ좋음
    • 원소들을 두 개의 리스트로 분리하는 시간 복잡도는 O(n)이고, 각각의 재귀 호출은 각 리스트 숫자의 절반만큼의 횟수만 발생
    • 복잡도는 O(n logn)
    • 최악의 경우는 pivot (get(0)으로 무작위로 선택한 기준)을 선태갛는 기준에 있는데 리스트가 역순으로 정렬되어 있을 때
  • 병합 정렬 알고리즘
    • 분할정복 알고리즘
    • 리스트를 두 개로 나누고 각 하위 리스트를 정렬한 후 각각 하나로 합친다
    • 병합 정렬의 성능은 O(n logn)이고 각각의 병합시간은 O(n)이며 각 재귀 호출은 주어진 리스트 숫자의 절반 만큼만 발생

$ sudo wget -O /etc/yum.repos.d/jenkins.repo https://pkg.jenkins.io/redhat-stable/jenkins.repo
$ sudo rpm --import https://pkg.jenkins.io/redhat-stable/jenkins.io.key

이전에 Jenkins에서 키를 가져온 경우 이미 키가 있기 때문에 rpm --import가 실패합니다. 이땐 무시하고 진행하시기 바랍니다.

$ yum install epel-release # repository that provides 'daemonize'

$ yum install epel-release에서 에러가 나서 아래의 명령어로 대체

$ sudo amazon-linux-extras install epel

그리고, Jenkins 설치를 위해 자바를 설치해줍니다.

$ sudo yum install java-11-openjdk-devel
$ sudo yum install jenkins

 

 

 

jenkins를 시작하고, 잘 돌아가는지 확인합니다.

$ sudo systemctl start jenkins
$ sudo systemctl status jenkins.service

 

 

기본 포트가 8080이기 때문에 원하는 포트로 변경을 합니다.

$ sudo vim /etc/sysconfig/jenkins

JENKINS_PORT 부분을 맘에 드는 포트로 변경하고, 변경된 부분을 적용시키기 위해 서비스 재시작하면 끝!

 

$ sudo systemctl restart jenkins

 


출처: https://get.jenkins.io/redhat-stable/
출처: https://oingdaddy.tistory.com/354 

Spring Boot Application을 AWS Lambda에 올리려면 문제가 있음.

첫 번째 문제는 Spring Boot 애플리케이션을 이벤트 기반으로 만들어야 한다는 것.

AWS Lambda 함수가 호출되면 요청 객체를 핸들러로 보내는데

Spring Boot는 이 요청을 처리할 수 없으므로 앱을 변경해야 한다는 문제가..

 

이 문제를 해결하기 위해 AWS는 개발자가 사용자 지정 핸들러를 생성할 수 있는 라이브러리를 게시했다.

 


 

aws-serverless-java-container 라이브러리를 사용하여

AWS Lambda에서 Spring Boot 2 애플리케이션을 실행할 수 있습니다.

Lambda 핸들러 내의 라이브러리를 사용하여 Spring Boot 애플리케이션 및 프록시 이벤트를 로드합니다.

 

리포지토리에는 샘플 Spring Boot 애플리케이션이 포함되어 있습니다.

Serverless Java Container는 Spring Boot 버전 2.2.x, 2.3.x, 2.4.x 및 2.5.x에 대해 테스트 되었고,

Serverless Java Container 버전 1.4부터 WebFlux 애플리케이션도 지원합니다.

 

Maven archetype

 

아래 명령어를 통해 project를 생성해줍니다.

mvn archetype:generate -DgroupId=my.service -DartifactId=my-service -Dversion=1.0-SNAPSHOT \
       -DarchetypeGroupId=com.amazonaws.serverless.archetypes \
       -DarchetypeArtifactId=aws-serverless-springboot2-archetype \
       -DarchetypeVersion=1.6

 

Manual setup / Converting existing projects

 

<dependency>
    <groupId>com.amazonaws.serverless</groupId>
    <artifactId>aws-serverless-java-container-springboot2</artifactId>
    <version>1.6</version>
</dependency>

 

그러면 aws-serverless-java-container-core 및 aws-lambda-java-core 라이브러리도 자동으로 가져옵니다.
Spring을 사용한 종속성 주입은 함수의 cold start time에 상당한 영향을 미칠 수 있습니다.
이 문제를 해결하기 위해 spring-context-indexer 포함하여 컴파일 타임에 후보 구성 요소 목록을 생성할 수 있습니다.

애플리케이션 패키지에서 Lambda의 RequestStreamHandler 인터페이스를 구현하는 새 클래스를 선언합니다. 프록시 통합으로 API Gateway를 구성한 경우 기본 제공 POJO AwsProxyRequest 및 AwsProxyResponse를 사용할 수 있습니다.

 

다음 단계는 컨테이너 핸들러 객체를 선언하는 것입니다.

라이브러리는 AWS 프록시 이벤트에 대해 SpringBootLambdaContainerHandler 객체를 구성하는 유틸리티 정적 메서드를 노출합니다. 메서드는 Spring Boot의 @SpringBootApplication으로 주석이 달린 클래스를 수신합니다. 개체는 클래스 속성으로 선언되어야 하며 정적이어야 합니다. 이렇게 하면 Lambda가 후속 요청에 인스턴스를 재사용합니다.

 

클래스의 handleRequest 메소드는 이전 단계에서 선언한 핸들러 객체를 사용하여 Spring 애플리케이션에 요청을 보낼 수 있습니다.

 

public class StreamLambdaHandler implements RequestStreamHandler {
    private static SpringBootLambdaContainerHandler<AwsProxyRequest, AwsProxyResponse> handler;
    static {
        try {
            handler = SpringBootLambdaContainerHandler.getAwsProxyHandler(Application.class);
            // If you are using HTTP APIs with the version 2.0 of the proxy model, use the getHttpApiV2ProxyHandler
            // method: handler = SpringBootLambdaContainerHandler.getHttpApiV2ProxyHandler(Application.class);
        } catch (ContainerInitializationException e) {
            // if we fail here. We re-throw the exception to force another cold start
            e.printStackTrace();
            throw new RuntimeException("Could not initialize Spring Boot application", e);
        }
    }

    @Override
    public void handleRequest(InputStream inputStream, OutputStream outputStream, Context context)
            throws IOException {
        handler.proxyStream(inputStream, outputStream, context);
    }
}

위 코드는 mvn으로 생성한 프로젝트에 가보면 자동으로 생성되있는 것을 확인할 수 있다.

 

기본적으로 Spring Boot 프로젝트에는 spring-boot-maven-plugin 및 임베디드 Tomcat 애플리케이션 서버가 포함됩니다. AWS Lambda용 Spring Boot 애플리케이션을 패키징하려면 Spring Boot maven 플러그인이 필요하지 않으며 내장된 Tomcat을 제외하도록 shade 플러그인을 구성할 수 있습니다. serverless-java-container 라이브러리가 대신합니다.

 
<build>
    <plugins>
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-shade-plugin</artifactId>
            <version>2.3</version>
            <configuration>
                <createDependencyReducedPom>false</createDependencyReducedPom>
            </configuration>
            <executions>
                <execution>
                    <phase>package</phase>
                    <goals>
                        <goal>shade</goal>
                    </goals>
                    <configuration>
                        <artifactSet>
                            <excludes>
                                <exclude>org.apache.tomcat.embed:*</exclude>
                            </excludes>
                        </artifactSet>
                    </configuration>
                </execution>
            </executions>
        </plugin>
    </plugins>

 

Asynchronous initialization

 

Spring Boot 2 애플리케이션은 시작 속도가 느릴 수 있습니다.

위의 예에서 정적 블록 또는 RequestStreamHandler 클래스의 생성자를 사용하여 초기화 단계 동안 AWS Lambda에서 사용 가능한 더 높은 CPU를 활용하도록 프레임워크를 초기화하는 것이 좋습니다. 그러나 AWS Lambda는 초기화 단계를 10초로 제한합니다. 애플리케이션을 시작하는 데 10초 이상 걸리는 경우 AWS Lambda는 샌드박스가 중단된 것으로 가정하고 새 샌드박스 시작을 시도합니다. 초기화에 사용 가능한 10초를 최대한 활용하고 적시에 Lambda 런타임으로 제어를 반환하기 위해 비동기 초기화를 지원합니다.

public class StreamLambdaHandler implements RequestStreamHandler {
    private SpringBootLambdaContainerHandler<AwsProxyRequest, AwsProxyResponse> handler;
    
    public StreamLambdaHandler() throws ContainerInitializationException {
        long startTime = Instant.now().toEpochMilli();
        handler = new SpringBootProxyHandlerBuilder()
                .defaultProxy()
                .asyncInit(startTime)
                .springBootApplication(SlowApplication.class)
                .buildAndInitialize();
    }

    @Override
    public void handleRequest(InputStream inputStream, OutputStream outputStream, Context context)
            throws IOException {
        handler.proxyStream(inputStream, outputStream, context);
    }
}

비동기식 이니셜라이저는 타임스탬프를 사용하여 AWS Lambda가 핸들러를 생성한 후 이미 경과한 시간을 추정합니다. 이러한 이유로 생성자에서 가능한 한 빨리 이 측정을 수행하는 것이 중요합니다. 

 

비동기식 이니셜라이저는 별도의 스레드에서 Spring Boot 애플리케이션 컨텍스트를 시작하고 10초 제한 시간이 만료되기 직전에 AWS Lambda에 제어를 반환합니다. 분명히, 애플리케이션을 시작하는 데 10초 미만이 소요되는 경우 AWS Lambda에 제어 기능을 즉시 반환합니다. Lambda가 첫 번째 이벤트를 보낼 때 Serverless Java Container는 처리를 위해 이벤트를 보내기 전에 비동기 이니셜라이저가 작업을 완료할 때까지 기다립니다. 기본적으로 Serverless Java Container는 추가로 10초 동안 대기합니다. ContainerConfig 객체의 setInitializationTimeout 메소드를 사용하여 이를 변경할 수 있습니다.

 

-

내가 개발할 프로젝트의 경우 초기화가 오래 걸리지 않을 것으로 예상, Async 로 진행하는 코드는 생략하기로..

 

 

 

출처

https://github.com/awslabs/aws-serverless-java-container/wiki/Quick-start---Spring-Boot2

 

 

+ Recent posts