• 최종편집 2024-04-19(금)
 

7.png

 

[시큐리티팩트=김상규 기자] 에스투더블유(S2W)가 자연어 처리 분야에서 선도적인 기술력을 인정받았다. S2W는 세계 최고 수준의 자연어처리(NLP) 학술대회인 ACL에 논문이 채택되었다고 4일 밝혔다.


S2W는 지난 2022년에도 자연어 처리 분야 국제 3대 학술 대회 중 하나인 북미 지역 NAACL에서 ‘다크웹 언어에 대한 새로운 조명(Shedding New Light on the Language of the DarkWeb)’ 논문을 발표한 바가 있다. 


ACL(Association for Computational Linguistics)은 컴퓨터 과학 및 인공 지능 분야의 세계적 학술 대회 중 하나로 올해 61회를 맞았다. ACL은 자연 언어 처리 (NLP) 및 기계 번역 (MT)과 같은 컴퓨터 과학 분야의 학자 및 전문가들이 모여 최신 연구 결과 및 기술 개발에 대해 발표하고 공유한다. 


S2W가 7월 ACL에서 발표할 논문 주제는 "다크버트: 인터넷의 어두운 단면을 위한 언어 모델 (DarkBERT: A Language Model for the Dark Side of the Internet)"이다. 논문 준비를 위해 S2W는 독자적으로 보유한 다크웹 수집, 정제, 분석 엔진과 범용 언어모델 BERT(언어 표현을 사전 학습시키는 방법)를 이용하여 다크웹에 특화된 언어모델 ‘다크버트’ (DarkBERT)를 제작하였다.


‘다크버트’는 최근 다양한 사이버 범죄 및 위협의 주요 원인으로 꼽히는 다크웹에서 음란물, 총기류, 마약 등의 콘텐츠를 자동으로 분류하고, 각종 사이버 위협과 관련된 키워드를 추론하는데 이용할 수 있다. 또한 기밀 정보 유출 사이트를 탐지하고 해킹포럼 내 중요 게시물을 분류하는 등 다양한 유형의 범죄 활동을 탐지하고 분석하는데 있어 기존의 범용 언어모델보다 우월한 성능을 자랑한다. 


S2W는 이러한 다크버트에 대한 설명과 관련된 벤치마크 데이터를 오는 6월 열릴 자체 정기 웨비나 <with>와 7월 정기 오프라인 세미나 <SIS 2023>을 통해서도 대중에 공개할 예정이다.

 

 

태그

전체댓글 0

  • 72293
비밀번호 :
메일보내기닫기
기사제목
S2W, 세계 최고 자연어처리 학회 논문 등재
보내는 분 이메일
받는 분 이메일