SIGIR(Special Interest Group on Information Retrieval) 학회 참석 후기
42nd International ACM SIGIR Conference on Research and Development in Information Retrieval 21-25 July 2019, Paris, France
2019.07.21 ~ 2019.07.25 5일동안 프랑스 파리에서 SIGIR(Special Interest Group on Information Retrieval) 학회가 진행되었습니다. 저는 작년에 이어 두번째 참석하는 해외 학회입니다. 제가 느낀 작년에 참석한 학회와 다른 점이 있다면 main Conference, Tutorial, Workshop 뿐만 아니라 다양한 프로그램이 준비되어 있었다는 것입니다. 학회 첫날 파리 외곽에 있던 학회 장소가 아닌 파리 시내에서 칵테일 파티를 열거나, 여성 연구자들을 위한 Women In IR, 시니어 리서쳐와 함께 식사하는 Student Luncheon 등 여러가지 이벤트가 진행되었습니다. 학회 참가자들간 교류를 중요하게 생각한 듯한 느낌이었습니다. 또한, Apple, amazon, Rakuten, Bloomberg 등 여러 기업에서 와서 부스를 열어 기업에서 현재 하고 있는 일과 개발한 프로그램들을 직접 시연하며 설명하기도 하고, 채용을 위한 행사를 진행하기도 했습니다. facebook 에서는 5개 정도의 간단한 문제를 풀게 하고, 많이 맞힌 사람에게 이메일로 연락을 주는 것 같았습니다. 저도 풀어봤는데 메일은 안올 것 같지만(ㅎㅎ) 여러 부스에 돌아다니면서 이야기도 듣고 스티커랑 에코백도 받을 수 있었던 즐거운 시간이었습니다.
학회에 참석하기 몇주 전 연구실에서는 하루동안 SIGIR 에 발표되는 논문 중 관심있는 논문을 읽고, 각자 읽은 논문에 대해 서로 공유하는 시간을 가졌습니다. 사람마다 관심사가 다른데 이 시간을 통해 제가 읽지 못했던 다른 논문에 대한 새로운 내용을 다른 사람을 통해 간접적으로 배울 수 있었습니다. 그리고 학회 전 내가 참석하는 학회에는 어떤 논문들이 발표되는지, 나는 어떤 발표를 듣고 싶은지 등을 어느정도 파악하고 갈 수 있었던 유익한 시간이었습니다. 이런 시간을 학회 참석 전 가져보는 것이 좋다고 생각합니다.
42도까지 올라간 여름의 파리는 너무 더웠지만, 많은 것을 보고 경험할 수 있었던 10일 간의 좋은 시간이었습니다. 끝으로 제가 인상깊게 들은 논문 하나를 공유드립니다.
Hot Topic-Aware Retweet Prediction with Masked Self-attentive Model
social media 에서 user 는 매일 다양한 주제로 수백만 개의 마이크로 블로그 항목을 만들고, retweet 은 소셜미디어에서 주제를 전파하는 데 중요한 역할을 합니다. 기존 Retweet prediction 의 대부분은 user profiles, user post history, user following relationships 등 다양한 정보를 활용하여 user 의 preference 를 모델링하는데에 초점을 둡니다. 하지만 이 연구에서는 user 의 followee 에 의해 논의된 hot-topic 를 인식하여, retweet prediction 작업을 수행하기 위한 새로운 masked self-attentive model을 제안합니다.
이 연구는 hierarchical attention 과 end-to-end memory network 를 결합하여 user 와 author 간의 interest Similarity 을 모델링하여, query tweet와 user 가 주어졌을 때 1) author 의 interests 를 표현하는 posting history, 2) user 의 interests 를 표현하는 posting history, 3) user 의 followee 가 포스팅한 실시간 tweets 등 세가지 정보를 가지고 트윗 tq를 retweet할지 여부를 예측하는 작업을 수행합니다.
제안된 모델(AUT- MSAM)은 사용할 수 있는 충분한 정보가 있을 때 모든 메트릭에서 다른 방법보다 더 나은 성능을 달성하였습니다. retweet prediction Task 의 SoTA 인 SUA-ACNN은 5 개의 tweet 만 사용하기 때문에 제한된 정보만을 사용할 때 약간 더 나은 성능을 얻지만, AUT- MSAM은 long-range dependencies 를 해결할 수 있고, 더 나은 hot topic aware representation 을 구성할 수 있기 때문입니다.