TEAMLAB

Human knowledge belongs to the world . -AntiTrust

PICMET 2018 - 김진홍

PICMET 2018 후기

2018년 8월 19일 부터 23일까지 하와이(호놀룰루)에서 개최된 PICMET '18 Conference에 다녀왔습니다.
저희 연구실은 학회에 논문 등록이나 구두발표를 하진 않았지만, 해외 학회 경험과 더불어 다양한 주제의 최신 연구 동향을 파악하기 위해 참관하게 되었습니다.
연구실에서 해외 학회에 참석하는 것은 PICMET’18 이 처음이었는데, 처음이라 연구실에서도 개인적으로도 더 의미있고 뜻 깊은 학회였다고 생각합니다.

PICMET 학회 외관

이번 포스팅에서는 학회 참석 후 느꼈던 점과 인상 깊었던 발표에 대해 간략히 설명하고 글을 마치도록 하겠습니다.

학회 참석 후기

우선 학회 참석 전 가장 걱정했던 것은 영어였습니다.^^;
모든 발표가 영어로 이루어지기 때문에 그렇지 않아도 짧은 영어 실력인데 잘 알아들을 수 있을까, 생소한 분야의 발표를 심지어 영어로 발표하는데 알아들을 수 있을까에 대한 막연한 걱정때문에 두려움에 떨면서 발표장으로 갔지만 다행히도 걱정했던 것 보단 많은 내용을 알아들을 수 있었습니다.
다양한 국가에서 수 많은 사람이 모이는 자리이다 보니 고급 영어가 아닌, 많은 사람들이 자주 쓰는 어렵지 않은 어휘와 컴퓨터 관련 분야나 비즈니스 관련 분야에서 많이 활용되는 어휘를 발표자분들께서 사용하여 발표를 하기 때문에 발표한 모든 것을 완벽히 이해하는 것은 아니지만 어느정도 알아들을 수 있었습니다.
또한 나눠준 책자에 있는 개별 논문의 Abstract과 발표 자료를 함께 보면서 발표를 들으면 발표자분께서 전달하고자 하는 내용을 전반적으로 이해할 수 있었습니다. 혹시 저와 같이 영어 발표에 대한 두려움 때문에 해외 학회 참석이 망설여지시는 분이 계시다면, 듣고자 하는 발표의 Abstract 정도는 미리 읽고 가시면 훨씬 이해하시는데 도움이 될 것 같습니다.
그러나 역시 많이 들어보지 못한 영어 발음의 발표는 발표의 내용을 알아듣기 힘들었고, 학회 뿐만 아니라 하와이에 머물러 있으며 단순히 단어와 문법만 공부하는 것 말고도 회화 공부 또한 정말 필수적이라는 것을 느끼며 두 가지 모두 더 열심히 공부해야겠다는 생각을 하며 돌아왔습니다.

두번째로는, 여느 학회와 다르지 않게 다양한 사람들을 사귈 수 있습니다.(국내 학회보다 더 나은 점이 있다면, 의지만 있다면 좀 더 글로벌한 인맥을 쌓을 수 있습니다+_+)
세션 중간중간 Coffee break Time이 존재하는데, 이 때 로비에 가면 다양한 간식거리가 준비되어있는데 준비된 간식들을 먹으며 다른 사람들과 이야기를 나눌 수 있는 시간을 가질 수 있습니다. 이 시간에 대부분의 사람들은 이전 세션에서 들었던 발표의 발표자와 서로의 발표에 대해 좀 더 심도있게 대화를 나누는 듯 했습니다!
또한 저녁에는 다른 참가자들과 함께 식사하는 시간이 마련되어있는데, 원탁 테이블에 앉아 식사를 하기 때문에 서로 인사를 나누며 도란도란 이야기를 나누다 보면 금새 친구가 될 수 있습니다. (물론 모든 것은 다양한 친구를 사귀고 싶다는 의지가 있다는 가정이 존재합니다.)
직접 만나는 시간 말고도 학회 커뮤니티 어플리케이션이 잘 발달되어 있어서 언제나 발표 중 궁금했던 사항이나, 개인적으로 친분을 쌓고 싶은 참가자에게 메세지를 보낼 수 있고, 학회 중에 찍은 사진들도 공유를 할 수 있습니다.
학회를 통해 친구도 사귀고 친구를 사귀면 영어 회화 실력도 늘고 님도 보고 뽕도 따는 혜택를 누릴 수 있습니다.

마지막으로는, 다른 해외 학회의 경험이 없어 PICMET만 해당되는 사항안지는 모르겠지만 단순 참관의 목적으로 학회를 오는 사람이 드물었습니다.
PICMET에서 만났던 사람들 모두 꼭 물어보는 질문이 ‘발표는 하셨나요? 어떤 주제로 발표를 하셨나요?’ 였습니다. 단순히 발표 내용을 들으러 왔다고 말하면 좀 놀라는 듯한 반응이 대부분이였습니다.
국내 학회에서는 내가 발표자가 아니더라도 다른 사람들의 연구 내용을 듣기 위해 참관하는 경우가 많은데 해외 학회는 고액의 참가비 때문인지 아니면 다른 어떠한 이유 때문인지는 모르겠지만 참가자의 대부분이 발표자였다는 것에 조금 놀랐습니다.
다음 번에 또 해외 학회 참석의 기회가 생긴다면 그 땐 저도 발표자로써 참석할 수 있었으면 좋겠습니다^^.

Session 후기

아래는 제가 흥미롭게 들었던 발표에 대해 간략하게 설명드리도록 하겠습니다. 특별히 새로운 기술이나 새로운 finding은 없지만, 재미있는 주제로 가볍게 들을 수 있었던 발표였습니다.
“Artificial Intelligence on Job-Hopping Forecasting: AI on Job-Hopping” 이라는 제목에서 알 수 있듯이 종업원이 언제 이직을 할 것인가를 예측하는 방법에 대해 기술한 논문입니다. 본 논문에서는 예측뿐만 아니라 종업원들의 이직 패턴 분석을 통하여 missing value imputation도 할 수 있다고 주장합니다.
본 연구는 이직 패턴 분석, 패턴 분석을 통한 missing value imputation, SONB(Sequential Optimization of Naive Bayesian) 방법론 소개, 예측 성능에 대한 내용을 포함합니다.

Using Feature

우선 data preprocessing 과정에서는 다른 연구들과 다르지 않게 값이 아예 존재하지 않는 경우에는 0(이후 값이 0인 것에 대한 imputation이 진행됩니다.), 카테고리 데이터는 label encoding을, 범위가 넓은 데이터는 범위별로 잘라서 label encoding을 진행하였습니다. Location의 경우는 없을 경우 0, 나머지는 클러스터링을 통해 10개의 클러스터로 나누었습니다.
그리고 SONB 알고리즘을 통해

  • 누락 된 feature값 추정
  • 추정된 값을 포함한 전체 데이터로 Y값 예측

을 진행합니다.

수식

누락된 값 추정에 대한 아이디어는 간단합니다. 누락 된 feature X와 target Y의 우도값이 최대가 되는 X 값을 채택하는 것입니다.
Y 값 예측 또한 동일하게 우도값이 최대가 되는 Y값을 채택합니다.
각 feature 별로 나타난 주요 패턴은

  • 1월에 가장 많이 일을 시작한다.
  • 연말에 가장 많이 퇴사한다. (아마 연말 보너스를 받고 퇴사하는 것 같다.)
  • GPA가 높은 사람이 더 종사한다.
  • MBA와 PHD가 다른 그룹보다 더 오랫동안 종사하는 경향이 있다.
  • 전공이 CS와 마케팅인 종사자가 더 자주 이직하는 경향이 있다.
  • 마케팅 담당자가 더 자주 이직하는 경향이 있다.

정도로 정리할 수 있습니다.
패턴 분석 결과를 나름대로 이러이러 해서 이런 결과가 나온 것 같다라는 재미있는 이유를 붙여 설명해주셨는데 납득도 가면서 딱딱한 발표장의 분위기도 유하게 바꿀 수 있었던 것 같습니다.
그러나 결과는 CNN과 SONB를 비교하는데, CNN에 비해 성능이 낮을 뿐 아니라 raw data에 대한 성능을 평가할 수 없다는 점에 아쉬움이 조금 남는 발표였습니다.