Intro
티맥스데이터 AI 연구실 개발자들이 직접 운영하는 블로그입니다. 최신 기술이나 논문에 대한 서베이 자료를 정리해서 공유할 예정입니다. 덧붙여서 따끈따끈한 연구실 제품이나 결과물을 개발자 관점에서 소개드릴 예정입니다. 게시물 하단에 코멘트를 달 수 있으니, 많은 관심과 피드백 부탁드립니다.
참고로, 블로그에 게재된 내용은 연구원 개인 의견입니다. 회사의 방향과 다를 수 있습니다.
연구 주제
현재 연구실에서 다루는 주제는 크게 세 가지입니다.
- 최적화 지능
- 비전 (이미지 또는 동영상 처리)
- 자연어처리
- 음성 처리
최적화 지능
주제 소개
- 팀의 연구 주제는 다양한 종류의 데이터를 이해하고(Representation Learning) 이를 기반으로 의사결정을 최적화 하는 기술(Optimization, Policy Learning)을 연구하는 것.
- 최적화(Optimization)는 수학, 프로그래밍, 경영, 경제 등 여러 분야에서 사용되고 있음
- 수학적 최적화: 특정의 집합 위에서 정의된 실수값, 함수, 정수에 대해 그 값이 최대나 최소가 되는 상태를 해석하는 문제
- 프로그램 최적화: 프로그램 최적화또는 소프트웨어 최적화는 정보 공학에서 시스템을 수정하여 어떠한 면의 작업이 더 효과적으로, 또는 자원을 덜 사용하도록 만드는 작업
- 계산복잡도가 NP-Hard 인 문제에서 근사 해를 더 빠르게 찾는 방법
- 소비자 효용 극대화 또는 이윤 극대화를 위한 수리경제학
- 기업에서 발생하는 문제, 자동화, 자료 분석과정 개선 등에 다양한 최적화 기법을 사용해서 효율적인 의사결정을 돕는 분야인 ‘운용 과학(Operations Research)’과 밀접한 관련이 있음
- 여러 타입의 raw 데이터 조합에서 연관성과 의미를 찾아 적절한 형태로 변환하는 Representation Learning 또한 중요한 연구 주제 중 하나.
연구방향
- 기업에서 발견되는 문제들 중 AI를 이용해서 해결하거나 개선할 수 있는 영역에 대한 탐색과 연구 수행
- 사내 제품과 서비스의 문제를 해결할 수 있는 AI 기반기술 확보를 위한 조사 및 연구 수행
목표
- 데이터 의미를 스스로 학습하고 분석하는 Representation Learning 관련기술 확보
- 다종의 데이터 조합에서 의미와 상관관계를 자동으로 분석하는 기술 확보
- 과거 환경을 기반으로 미래의 상황을 예측하는 기술 확보
- 의사결정 자동화 및 최적화 관련기술 확보
비전
- 이미지나 동영상 같은 데이터를 분석하고, 이를 활용하여 스마트한 주변환경을 구축하는 연구를 진행하고 있습니다.이를 통하여 사회 문제를 해결하는 Smart City/Smart Nation 구축을 목표로 하고 있고 이를 위해서 얼굴인식, 3차원 물체 추적 등을 연구하고 있습니다.
목표
- CCTV, 도로교통카메라 분석을 통한 Surveillance 관련 사회 문제 해결
- Smart City / Smart Nation을 위한 서비스 연구 개발
연구 주제 소개
- 얼굴 인식
- Face Detection : 이미지 기반 얼굴 detection 알고리즘
- Face Normalization : 인식률 향상을 위한 normalized face 생성을 위한 얼굴 normalization
- Face Identification : 얼굴 Identification / Verification 정확도 향상
- 교통 영상 분석
- Auto Calibration : 교통 영상을 분석하여 촬영 지역 및 물체를 3D real world 좌표로 재구성
- Vehicle Tracking : 영상 내 차량 및 보행자를 감지, 이동 경로를 추적
- Traffic Analysis : 교통 영상 기반 교통량 및 흐름 분석 및 비정상상황 (사고, 교통 법규 위반) 분석
자연어처리
목표
- 다국어 자연어 문장을 입력으로 받아서 특정 task를 처리해주는 대화형 시스템 개발
- 웹사이트 데이터 혹은 특정 매뉴얼과 같은 문서를 바탕으로 사용자의 질문을 답변, 또는 문서요약을 할 수 있는 Machine Reading Comprehension(MRC) 기술 연구 개발
연구 주제
- 대화형 시스템
- Tmax OS AI 비서 개발 : 한국어로 된 자연어 문장을 토대로, Tmax OS의 특정 기능을 처리해주는 AI비서 개발
- 대화형 시스템 플랫폼 개발 : Tmax OS의 third party application에서 AI 비서 기능을 사용할 수 있도록 대화형 시스템 플랫폼 기술 연구 및 개발
- MRC
- Language Representation : 다량의 자연어 말뭉치를 학습하여 맥락화된 언어 이해가 가능한 언어모델 학습, 다양한 NLP task 에 적용가능
- QnA 기술 개발 : 문서를 이해하고 주어진 질문에 대한 답을 자동으로 찾는 기술 연구 및 개발
음성 처리
팀 주제별 소개
- 음성 인식, 음성 합성, 발화자 인식 등 음성 데이터를 처리하고 그 안에서 정보를 뽑아내는 연구를 진행
- 음성 인식 : 음성 데이터에 포함된 텍스트 정보를 추출하여 음성 데이터를 텍스트로 변환
- 음성 합성 : 발화자의 음성 특징을 학습하여 그 발화자의 음성 특징에 맞게 음성을 생성
- 발화자 인식 : 음성 데이터에 포함된 성별, 국적, 언어, 나이 등 발화자의 정보를 추출
나아갈 방향
- 사용자가 제품이 실제 사람이라고 느낄 정도의 음성 인터페이스를 제공
목표
- 다양한 잡음이 포함된 음성 데이터에서도 정확한 정보 추출
- 적은 데이터로도 효과적인 학습이 가능한 모델 연구