개인 정보 보호 마스킹 모델: 학습 데이터 구축 사례

개인 정보 보호를 위한 데이터 마스킹 모델 설계. 민감한 데이터를 안전하게 처리하는 마스킹 기술과 모델 설계 사례를 알아보세요!
TEXTNET's avatar
Aug 17, 2023
개인 정보 보호 마스킹 모델: 학습 데이터 구축 사례

개요

  • 산업 분류: IT/공학

  • 세부 Task: 데이터 레이블링(Labeled Corpus)

  • 데이터 출처: 고객사 제공 원문

  • 작업량: Confidential

  • 납품 형태: xlsx(Excel)

  • 활용 서비스: Confidential

문제

다양한 종류의 개인정보를 탐지하고 이를 마스킹하기 위한 모델 개발이 목표인 프로젝트였습니다. 개인정보에도 종류가 많은데 무엇을, 어떤 조건일 때 개인정보로 탐지할 것인지 확인하는 과정이 필수적이었습니다.

해결 방안

TEXTNET은 예시와 가이드를 작성해 고객사와 소통함으로써 이해도를 맞춰나갔습니다. 이 과정에서 정부의 개인정보 가이드를 참고하여 작업했습니다.

이 프로젝트의 데이터 기획은 아래 Project Manager가 담당했습니다.
남보름


TEXTNET 소개

지금의 딥러닝을 있게 한 AI Guru 제프리 힌튼의 데이터셋 'ImageNet'에 어원을 둔 TEXTNET은 (주)스피링크가 운영하는 AI/챗봇을 위한 텍스트 데이터 설계 및 구축 서비스입니다.

TEXTNET은 언어학, 심리학, 전산언어학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 데이터 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.

TEXTNET은 삼성, LG, KT, SK 등 유수 대기업의 데이터 구축 파트너로 함께하며 금융, 마케팅, 콘텐츠, 메타버스, 서비스 기획, CS 등 다양한 도메인을 다루고 있습니다.

Share article

텍스트넷 공식 블로그