자연스러운 소통을 위한 버추얼 휴먼 챗봇 대화 데이터 가공 사례

자연스러운 소통이 가능한 버추얼 휴먼을 위해선 사용자가 좋아할 대화 데이터를 가고하는 것이 중요합니다. 버추얼 휴먼의 핵심 대화 데이터 설계 원리와 전략을 알아보세요.
TEXTNET's avatar
Aug 17, 2023
자연스러운 소통을 위한 버추얼 휴먼 챗봇 대화 데이터 가공 사례

개요

  • 산업 분류: 서비스

  • 세부 Task: 싱글턴 대화 데이터 구축

  • 데이터 출처: 신규 생성

  • 작업량: Confidential

  • 납품 형태: xlsx(Excel)

  • 활용 서비스: 버츄얼 휴먼

문제

Virtual Human인 '노아'. '노아'를 데뷔 시키기 전, 사용자와의 친밀도를 쌓아나갈 수 있도록 고객사에서는 챗봇 서비스를 제공하고자 했습니다.

특히 이 챗봇 엔진은 매우 단순한 모델이어서, 대화 데이터가 극히 쉬운 난이도의 문장일 필요가 있었습니다.

해결 방안

TEXTNET은 타겟 유저인 15~25세 여성이 관심 있어 하는 분야를 조사했고, 그 분야에 맞춰 간단한 문장들을 생성했습니다.

이 프로젝트의 데이터 기획은 아래 Project Manager가 담당했습니다.
이지예


TEXTNET 소개

지금의 딥러닝을 있게 한 AI Guru 제프리 힌튼의 데이터셋 'ImageNet'에 어원을 둔 TEXTNET은 (주)스피링크가 운영하는 AI/챗봇을 위한 텍스트 데이터 설계 및 구축 서비스입니다.

TEXTNET은 언어학, 심리학, 전산언어학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 데이터 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.

TEXTNET은 삼성, LG, KT, SK 등 유수 대기업의 데이터 구축 파트너로 함께하며 금융, 마케팅, 콘텐츠, 메타버스, 서비스 기획, CS 등 다양한 도메인을 다루고 있습니다.

Share article

텍스트넷 공식 블로그