기업

답글 프롬프트와 함께 더 신중하게 트윗하세요

작성자
2021년 5월 13일 목요일

사람들은 지금 일어나고 있는 일에 대한 이야기를 나누기 위해 트위터를 찾습니다. 때로는 여러분의 관심사에 대한 대화가 격해질 수 있고 그 순간 후회로 남을 말을 하기도 합니다. 이런 이유에서 2020년 트위터는 이용자가 잠재적으로 유해하거나 불쾌감을 줄 수 있는 답글을 트윗하는 것을 재고하도록 안내 메시지를 제공하는 프롬프트를 테스트해 왔습니다.

테스트를 통한 피드백과 데이터를 바탕으로 이러한 알림이 전송되는 시점과 방식을 결정하는 시스템을 개선했습니다. 2021년 5월 5일부터 영어 트위터 앱 이용자(iOS 및 안드로이드)를 대상으로 개선된 프롬프트가 적용되기 시작했습니다.

볼 수 없는 트윗입니다
볼 수 없는 트윗입니다.

시스템 개선 배경

지난해 트위터는 이용자가 답글을 트윗하기 전에 해당 트윗이 모욕적인 언어 또는 혐오 발언과 같이 잠재적으로 유해하거나 공격적인 내용을 포함하고 있는지 재고하도록 유도하는 프롬프트 테스트를 진행했습니다. 안내 메시지가 표시되면 이용자들은 잠시 멈추고 트윗을 수정 또는 삭제하거나, 기존에 작성된 트윗 그대로 답글을 보내기도 했습니다.

초기 테스트에서는 프롬프트를 지원하는 알고리즘이 대화의 실제 뉘앙스를 원활하게 파악하지 못했고, 공격적일 수 있는 표현과 비꼬는 말, 친근한 농담 등을 구분하지 못해 사용자들은 때때로 불필요한 프롬프트를 받았습니다. 이에 테스트 과정 전반에 걸쳐 결과를 분석하고 사용자의 피드백을 취합해 비일관적 탐지 문제를 비롯한 오류를 해결하기 위한 작업을 진행했습니다.

그 결과 서비스 전반에 걸쳐 공격적인 답글 건수가 줄었고, 트위터 이용자들의 행동이 개선되었음을 확인할 수 있었습니다. 테스트 결과는 다음과 같습니다:

  • 안내 메시지가 표시된 경우 이용자의 34%가 기존 답글을 수정하거나 답글을 트윗하지 않았습니다.
  • 안내 메시지를 받은 이용자가 모욕적이거나 불쾌한 답글을 트윗하는 횟수가 평균 11% 감소했습니다.
  • 안내 메시지를 받은 경우 불쾌하거나 유해한 답글을 받을 가능성이 줄어들었습니다.

초기 테스트 결과, 알림을 보내는 시점과 방식을 결정하는 시스템에 다음과 같은 내용이 포함됐습니다:

  • 트윗 작성자와 답글 작성자가 상호 작용하는 빈도를 포함해 두 계정 간의 관계 특성을 고려하도록 했습니다. 예를 들어, 서로 팔로우하고 자주 답글을 트윗하는 두 계정의 선호하는 커뮤니케이션 톤을 더 잘 이해할 수 있게 됐습니다.
  • 소수자 커뮤니티에 의해 언어가 새롭게 정의되고 유해하지 않은 방식으로 사용될 수 있는 상황을 더 잘 파악할 수 있도록 시스템을 조정했습니다.
  • 욕설을 비롯해 공격적인 언어를 보다 정확하게 탐지할 수 있도록 시스템을 개선했습니다.
  • 프롬프트가 도움이 되거나 관련성이 있다고 생각하는 경우 이를 트위터에 쉽게 알릴 수 있는 장치를 추가했습니다.
볼 수 없는 트윗입니다
볼 수 없는 트윗입니다.

향후 계획 

답글 프롬프트, 기사 프롬프트 와 같은 프롬프트 및 그 외 다른 형태의 장치를 통해 트위터에서 건강한 대화를 독려할 수 있는 방법을 지속적으로 살펴볼 계획입니다. 트위터는 본 기능을 타 언어에 확장하는데 참고할 수 있도록 답글 프롬프트를 받은 사용자의 피드백을 취합할 것입니다. 트위터는 더욱 의미 있는 대화가 일어날 수 있도록 지속적으로 배우고 개선해 나가고 있습니다. 더 많은 업데이트를 관심 있게 지켜봐 주시기 바랍니다.

볼 수 없는 트윗입니다
볼 수 없는 트윗입니다.