초록:
본 연구는 OpenAI Gymnasium의 루나랜더(LunarLander) 환경에 유전자 알고리즘(Genetic Algorithm, GA)을 적용하여 다양한 초기 조건에서도 안정적으로 착륙할 수 있는 프로그램을 구현하는 것을 목적으로 한다. 루나랜더 환경은 위치, 속도, 각도, 착륙 다리 상태 등 입력값에 따라 동작을 선택하는 시뮬레이션으로, 단순 무작위 시도만으로는 효율적인 착륙 전략을 찾기 어렵다. 이에 본 연구에서는 가상의 개체 집단을 구성하고, 각 개체의 착륙 성능을 적응도로 평가하여 선택, 교차, 돌연변이 과정을 거듭함으로써 점진적으로 성능을 향상시키고자 한다. 특히 엘리트 보존 방식을 통해 우수한 개체를 유지하면서도, 무작위성을 도입한 교차와 돌연변이를 통해 국소해(local optimum)에 빠지는 문제를 방지하고자 한다. 향후 연구에서는 다양한 선택 및 교차 기법을 비교하고, 환경 변수(중력, 바람 등)의 변화를 반영하여 알고리즘의 일반화 가능성을 검증하고자 한다. 본 연구는 유전자 알고리즘의 진화적 탐색 능력을 활용하여 강화학습 환경에서 효율적인 정책 학습의 가능성을 제시한다.
주제어: 유전자 알고리즘, 진화학습, 모델화, 선택법, 교차, 돌연변이