TEAMLAB

Human knowledge belongs to the world . -AntiTrust

SIGIR 2019 - 장시온

SIGIR 2019

ACM이 주관하는 SIGIR Conference가 2019.07.21 ~ 2019.07.25 기간동안 프랑스 파리에서 개최 되었습니다. 파리와의 거리가 매우 멀어 가는길이 힘들고, 첫 해외학회이기 때문에 적응하는게 힘들지 않을까라는 걱정이 있었지만 해외의 연구자들과 만날 수 있다는 기대를 갖고 학회에 참여했습니다.

Tutorial(Deep Natural Language Processing for Search Systems)

제가 들은 Tutorial은 linked in에서 발표했습니다. 발표는 4분이서 진행 해주셨는데 검색시스템을 각각의 section으로 나누어 각자 발표를 해주셨고 자신감 넘치게 발표하시는게 멋있었습니다. 발표에서는 Attention, BERT등 최근 NLP에서 사용되는 모델을 알고 있고 검색시스템에 대해서는 잘 모르는 분들을 위해 개최된거 같았습니다. 실제 linked in에서 사용되고 있는 서비스를 기반으로 Learning Representation부터 검색시스템 기능인 Query Reformulation(Spell Check, Query Suggestion, Auto Complete)을 하기 위한 Query preprocessing(Language Detection, Tokenization, Normalization), Query Understanding(Query Tagging, Query Intention), Retrieval & Ranking의 과정을 설명해주시고 각각의 기능마다 모델도 설명해주셨습니다. 또한 서비스에서 어려운 부분도 설명해주셨는데, 사용자들이 “이름, 직군, 회사이름”과 같이 정형적으로 입력하지 하고 “직군, 회사이름, 이름”과 같이 순서를 바꾼다거나 ,를 안쓰고 띄어쓰기만 쓰고 동음이의어 문제도 있어 도전중이라고 말씀하셨습니다. 전반적으로 그림과 함께 친절한 설명으로 저에게 도움이 되는 발표를 들을 수 있었고 실제 서비스 과정을 공개 해주셔서 좋은 경험이였습니다.

Session: Question Answering - Adaptive Multi-Attention Network Incorporating Answer Information for Duplicate Question Detection

제가 들은 가장 재미 있던 발표는 Adaptive Multi-Attention Network Incorporating Answer Information for Duplicate Question Detection입니다. 이 논문은 Stackoverflow, Quora와 같이 다양한 분야에 걸쳐 지식을 가지고 있는 사용자들이 정보와 지식을 공유 할 수 있는 플랫폼에서 데이터가 축적됨에 따라 중복 질문을 감지하는 방법을 연구하는 것인데, 기존 방법에서는 질문만을 사용하여 중복질문을 감지하였는데 위의 논문에서는 질문, 답변을 둘 다 사용하여 모델을 제안하였습니다.

AMAN model image

질문-답변 2개 pair를 Adative Multi-Attention(Cross Attention, Adaptive Co-Attention)를 사용하여 Relevance를 학습하는 것이 이전과 다른 것이였습니다. 이전의 SOTA모델보다 Accuarcy가 1.87%가 향상되었습니다.

느낀 점

해외의 연구자들의 발표를 직접 보고 의견교환을 한다는 것은 좋은 경험이였던거 같습니다. 다만 제가 영어를 잘하지 않기 때문에 어려움이 많았고 놓치는 부분이 많았습니다. 또한 논문자체가 쉽지 않았기 때문에 이해하는데 어려움이 있었습니다. 그렇기 때문에 영어공부의 필요성과 학회 참석 전 학회의 accept paper를 많이 읽어야 될꺼 같습니다. 또한 Tutorial, Session을 듣고 제 연구에서 부족한 부분을 알 수 있었고, 해결 해야되고, 해결과정에서 어떤 방법을 추가 할수 있을지 알수 있고 고민할 수 있는 시간이 되었다는게 도움이 많이 되는 학회였습니다.