탭 버튼을 선택하면 분야별로 볼 수 있습니다.
현재 인터넷에서 이미지에 대한 정보를 얻을 수 있는 html 대체 텍스트에 대한 지원이 미비하다. 이 때문에 시각장애인의 웹 이미지 접근성은 매우 낮은 상황이다. 특히 이미 개발된 이미지 캡셔닝프로그램은 대부분이 영어 텍스트로 결과를 도출하고 있어 한국어를 사용하는 시각장애인이 사용하는데 어려움이 있다. 따라서 본 연구에서는 완벽한 대체 텍스트 표현을 위한 기술이 발전 할 때까지의 공백을 줄이기 위해 웹상의 이미지를 입력하였을 때 이미지 캡셔닝 기술을 활용하여 이미지에 대한 설명을 한국어 텍스트 및 음성으로 출력하는 모델을 개발하였고 사용자 편의성을 높이기 위해 해당모델을 이식한 확장프로그램을 구현하였다.
▪ 주제어: 인터넷 확장 프로그램, 시각 장애인, 한국어, 이미지 캡셔닝, 딥러닝
4차 산업 혁명의 핵심 기술 중 하나인 머신러닝을 이용한 연구로, 주변음과 효과음을 한글로 텍스트화하였다. 연구는 파이 기반으로, 텐서플로우와 케라스를 주로 사용하여 딥러닝으로 개발하였다.연구를 위하여 파이썬과 딥러닝, fft(고속 푸리에 변환) 등과 같은 선행 연구과정을 필요로 하였다. 이러한 연구를 바탕으로 모음과 자음을 따로 조합하는 형태로 모델을 결정하였다. 모델 결정을 바탕으로 CNN이 가장 적합한 학습 방법으로 판단되어 모델링을 시작하였다. 녹음에 관한 데이터는 직접 녹음하여 수집하였다. 학습은 녹음 파일로, 테스트는 유튜브 영상에서 추출한 뻐꾸기 울음소리를 이용하였다. 이를 통하여 뻐꾸기의 소리를 한글로 변환하는데 성공하였다. 지금까지의 연구를 바탕으로 현재 모델을 더 많고 다양한 데이터셋 기반의 효과음 해석 모델로 확장할 수 있다. 이를 통하여 청각장애인을 위한 소리의 시각화, 우리나라 의성어의 연구에 도움이 될 것으로 기대된다.
▪ 주제어: 인공지능, 머신러닝, 음성인식, 자막 효과음 번역, 의성어
본 연구에서는 데이터마이닝 방법 중 회귀분석을 활용하여 코로나-19와 한국의 경제 활동의 상관관계를 분석했다. 독립변인으로 한국의 코로나 일일 확진자 수를 설정하고 이에 따라 종속 변인으로 경제가 받는 영향을 알아보았다. 경제에 대한 데이터는 한국의 전체적인 경제 상태를 대표할 수 있는 지표로 코스닥 지수를 설정했다. 이를 통해 코로나 확진자 수가 일정한 값에 도달할 때까지 경제 활동이 활발히 진행되다가 이후 떨어지는 형태임을 확인했다. 코로나-19로 인한 사회적 거리 두기 단계정책이나 경제 관련 정책을 구상하고 세울 때 기초자료로 활용될 수 있다는 점에서 큰 의미가 있다.
▪ 주제어: 코로나-19, 경제 활동, 회귀분석, 데이터마이닝
적합도 함수는 유전알고리즘에서 어떠한 유전자가 원하는 해에 얼마나 가까운지 알려주는 지표이다. 하지만, 적합도 함수의 제작에 대한 중요성이나 제작 방법에 관한 정보는 찾기 힘들었다. 이에 의문을 느껴 본 연구에서 유전알고리즘을 활용하여 펜타고 보드게임 프로그램을 제작한 뒤, 적합도 함수에 따른 프로그램의 성능을 분석하여 유전알고리즘에서 적합도 함수의 중요성에 대해 생각해 보기로 하였다. 먼저 펜타고에서 나올 수 있는 여러 패턴을 분석하여 적합도 함수를 만들었다. 만든 적합도 함수를 변형시켜 추가적인 적합도 함수를 만들고, 적합도 함수만 다른 프로그램끼리 대결시킴으로써 성능을 분석하였고, 적합도 함수의 중요성에 대해 생각해 보았다.
본 연구의 목적은 유전 알고리즘을 통해서 생태계 내 생존하기 적합한 개체의 특성이 어떠한 양상으로 변하는지 관찰할 수 있도록 유전자를 설계하고, 이를 시뮬레이터로 제작하는 것이다. 이에, 본 연구의 시뮬레이터 제작에 근거를 더하기 위해서 실제 생태계 속 밀접한 관계에 있는 rough skinned newt와 common garter snake의 관계를 들어 시뮬레이터의 변수를 조정했으며, 유전 모델을 발전시키기 위해 유전 알고리즘을 이용하였다.
▪ 주제어: 유전 알고리즘, 생태계 시뮬레이터, rough skinned newt, common garter snake, python
발전하는 시대에 맞춰 자력으로 인터넷상에 나와 있는 정보를 습득하는 것에는 어려움이 있다. 이에 어려움을 줄이고 응용력을 높이기 위해 문제를 출제하는 인공지능을 설계해 도움을 주고자 한다. 문맥을 인공지능이 이해하기 위해서 GPT-2와 BERT 등의 기존 시퀀스 모델의 구조를 파악하고 구현한다. 토큰화를 통해 글을 작은 단위로 쪼개고 TextRank 등의 알고리즘으로 주요 단어를 추출해 Context, Answer 형식을 넘겨 Question을 output으로 낼 수 있는 인공지능을 설계한다.
▪ 주제어: GPT-2, BERT, 경쟁 시스템, GPU
현재 많은 기업들이 소비자의 연령이나, 성별을 분석해 다른 사람들에게 추천을 해주는 시스템을 사용하고 있다. 이러한 분석에 필요한 많은 데이터들은 실제 많은 사람들이 이용하는 SNS를 기반으로 한다. 그래서 우리는 SNS에 올라오는 여러 사진에서도 이러한 정보를 알아낼 수 있을 것이라고 생각했다. 우리는 사진에서 얻을 수 있는 많은 정보들 중 사진의 국가와 문화에 집중하여 SNS의 각국의 많은 사람들이 올리는 여러 사진들에 다양한 문화를 나타내줄 수 있는 특징들을 인공지능을 통해 추출하고 해석하고자 하였다. 우리는 사진을 통해 사진이 보여주는 국가와 문화를 예측하는 모델을 만들어 학습하고 더 나아가 그러한 결과를 결정하는데 기준이 된 주요한 요소들을 찾아내는 모델을 만들 것이다.
▪ 주제어: SNS 이미지, XAI, 히트맵, 문화
본 연구의 목적은 라즈베리파이를 이용하여 IoT 기반 스마트 양식장 튜토리얼 시스템을 구축하고, 센서가 수집한 데이터를 웹사이트로 제공하는 것이다. 본 연구에 필요한 데이터를 수집하기 위해서 양식 대상을 위한 최적의 수조 환경을 구성하였고, 온도 센서와 카메라를 설치하여 수집한 온도 데이터와 양식 대상을 촬영한 영상을 라즈베리파이로 전송하였다. 이를 토대로 수조의 환경과 양식 대상의 성장 속도를 계산하여 데이터베이스에 저장하고 시간에 따른 변화 그래프를 웹사이트를 통해 제공하여 실시간으로 모니터링할 수 있게 하였다. 또한, 추후 릴레이를 이용해 수조 열 발생기를 라즈베리파이와 연결해 수조의 온도가 최적 온도에서 벗어나면 온도를 변경할 수 있도록 할 것이다. 이를 통해 새롭게 양식업을 시작하는 귀어귀촌인들을 위한 양식 경험을 제공하고, 기존 양식업 종사자들에게는 편리함을 제공할 수 있다. 최종적으로, 양식업을 통한 수산물 생산량의 증가를 통해 점차 증가하는 소비를 따라가지 못하는 국내 수산업의 문제를 해결할 수 있을 것으로 기대된다.
▪ 주제어: 스마트 양식장, 튜토리얼 시스템, IoT, 데이터베이스, 라즈베리파이
타깃 트래킹(target tracking)이란 이동식 로봇이 물체로부터 일정 거리를 유지하도록 설계하고, 앞부분이 계속해서 물체를 향하게 하는 시스템이다. 본 연구는 3차원에서의 타깃 트래킹이 가능한 알고리즘을 제작하려고 한다. ‘목표로 하는 물체와 일정한 거리를 유지하면서 부드럽게 물체를 따라간다’를 실행하기 위해 구면좌표계로 이동 로봇과 타깃 사이의 관계를 나타낸다. 랴푸노프(Lyapunov) 함수로 안정성을 증명하고 이를 바탕으로 구면좌표계에서의 타깃 트래킹 모델을 본 연구에서 구현한다. 장애물과 이동 로봇 사이의 거리에 반비례하는 벡터를 사용하여 이동 로봇과 장애물의 충돌이 일어나지 않도록 구현한다. 만들어진 모델을 시뮬레이션을 통해 점검 및 평가한다.
▪ 주제어: 충돌 회피, 타깃 트래킹, 랴푸노프, 3차원
사진이라는 매체가 스마트폰을 통해 일반인들에게도 널리 보급되면서 사진 편집 기능 또한 발전을 거듭하고 있다. 하지만 여러 이유로 사진의 외곽을 넓이고 싶어도 일반적인 사진 포맷은 보여지지 않는 부분을 저장하지는 않기 때문에 불가능하다. 이 연구는 이미지 인페인팅 기술에서 영감을 얻어 사진 외곽을 자연스럽게 생성시키는 사진 편집 기능을 개발하여 사진의 비율을 더 다채롭게 조절하도록 하는 것이다. VAE와 GAN을 혼합한 인공신경망 모델을 제작하였고 이미지 가공 프로그램을 개발하여 외곽 5%가 투명한 입력 데이터와 사진 원본인 출력 데이터로 모델을 훈련시켰다. 결과는 미흡하였으나 그 원인을 GAN의 특징에 기반하여 분석하였고 향후 연구 방안을 고찰했다.
▪ 주제어: 딥러닝, 이미지, 생성 네트워크, 텐서플로우
본 연구의 목적은 사용자가 직접 식단 정보를 입력하지 않아도 사진 한 장만으로 식단 정보를 분석하고 사용자에게 직관적으로 정보를 제공하는 앱을 개발하고자 하는 것이다. 새롭게 입력 받은 이미지 데이터와 기존에 축적된 통계를 기반으로 음식 메뉴에 대해 세부적인 조언 제공 기능을 추가하여 더 정확하고 폭넓은 정보를 제공할 수 있게 만들고자 하였다.기존 R-CNN 기법에 이미지 자르기 과정에서 데이터가 손실되거나 fully-connected layer만 학습되는 문제가 있다. 따라서 이런 문제점을 보완하기 위해 최종 모델 개발 시 Mask-RCNN 기법을 사용하였다. 이에 소켓 통신을 활용하여 python 언어로 서버를 구축하였으며, 이때 이미지/텍스트를 변환하여 서버와 애플리케이션 간 통신을 진행하였다. 마지막으로 사용자가 입력한 이미지 데이터를 변환하여 서버로 송신하고, 서버에서는 수신한 이미지 데이터를 적합한 형태로 변환한 뒤 모델을 이용하여 분석하는 기능을 구현하였다.
▪ 주제어: Mask-RCNN, 기계학습, 소켓 통신, 이미지 분석, 식품 분석
머신러닝은 지금 전 세계에서 각광받고 있다. 하지만 소프트웨어적으로 다양한 지원 플랫폼이 존재하는 것에 비해 하드웨어적으로는 많이 빈약하다. 따라서 진입장벽을 낮추고 더 많은 사람들이 머신러닝을 쉽게 접할 수 있도록 하기 위한 적절한 플랫폼을 필요로 한다. 본 연구에서는 시뮬레이션 환경에서의 강화학습을 통해 구축된 모델을 바탕으로 실제 주행 로봇이 동일한 성능을 낼 수 있는지 여부를 확인하였다. 주행 로봇의 카메라를 통해 인식한 정보를 컴퓨터 비전을 통해 처리하여 학습된 모델의 입력으로 처리하여 로봇이 차선을 따라서 안정적으로 주행할 수 있도록 한다.
▪ 주제어: 머신러닝, 임베디드, 강화학습, 로봇, 자율주행