2024-04-26 02:00 (금)
무하유, 데이터 라벨링 시스템 AIDA 활용한 올바른 학습 데이터 구축
상태바
무하유, 데이터 라벨링 시스템 AIDA 활용한 올바른 학습 데이터 구축
  • 우진영 기자
  • 승인 2021.04.08 10:02
이 기사를 공유합니다

채용 시장의 변화에 따라 AI를 활용한 채용 시스템이 보편화되고 있다. 작년 초부터 시작된 코로나가 장기화되면서 비대면 채용을 위한 AI기반 서류 평가 및 면접 시스템이 확대되는 추세다. 

AI 기술기업 (주)무하유는 AI기반 채용 서류 평가 서비스 카피킬러 HR로 보다 공정하고 객관적인 평가가 이뤄질 수 있도록 하고 있다. 대량의 입사지원서를 AI 기술로 평가해주고, 표절여부와 직무적합도 등을 평가해 채용 과정에서 발생할 수 있는 오류를 해결한다. 

특히, 카피킬러 HR은 AI가 주목한 핵심어나 핵심 구절을 자소서 문항마다 뽑아주며 핵심 문장으로 자기소개서를 요약해 보여준다. 핵심어와 핵심 구절을 뽑기 위해서는 데이터 라벨링 기술이 필요한데, 무하유는 데이터 라벨링을 위해 자체 개발한 AIDA(아이다) 시스템을 활용하고 있다.

무하유의 AIDA 시스템은 단순 라벨링이 아닌 빅데이터 언어처리 기술이다. AIDA는 학습데이터를 위한 데이터정제가 우수할뿐 아니라 데이터 전처리 과정을 통해 편향되지 않고 올바른 학습데이터를 구축하고 있다. 카피킬러 HR의 경우 ‘채용’에 최적화된 데이터를 확보하고 있으며, 질높은 수준의 학습 데이터를 직접 생산하고 있다.

또한, 단순히 기계적으로 데이터를 학습하는 것이 아니라 딥러닝 기술을 통해 의미적 데이터 전처리를 거쳐 스스로 학습하게 한다. 의미적 데이터 전처리를 위해서는 도메인 및 IT 지식이 필요하다. 도메인 분야의 전문지식이 없는 일반인에게 전처리를 맡길 경우, 데이터의 중요 정보가 유실되거나 데이터의 질을 담보할 수 없다. 이러한 문제점을 예방하기 위해 무하유에서는 테스트를 통해 검증된 인력을 사용한다. 검증된 전문가들이 의미적 전처리를 진행하기 때문에 고품질의 데이터 확보가 가능하고, 데이터의 정확도를 높일 수 있다. 

AIDA시스템 개발을 담당하는 박혜린 연구원은 “데이터 전처리 과정에서 가장 중요한 것은 데이터가 편향되지 않도록 하는 것이다. 데이터 전처리가 잘못될 경우 AI가 제대로 학습되지 않아 데이터의 질이 떨어질 수 있다”며 “AIDA는 편견요소가 개입될 수 없도록 전수 검사와 함께 샘플링 테스트를 진행해 데이터의 정확도를 99.7%이상 올리고 있다. AI 활용 목적에 따라 도메인과 IT의 융합된 지식으로 의미적 데이터 전처리가 수행될 수 있도록 노력할 것이다”라고 말했다. 

무하유는 10년간의 자연어 처리 노하우와 텍스트 데이터 라벨링에 최적화된 AIDA 시스템이 합쳐져 놀라운 시너지 효과를 발휘하고 있다. 수시채용, 블라인드 채용 등의 채용 트렌드에 따라 AI기반 채용 서류 평가 서비스가 확대되고 있는 만큼 AI 학습 데이터를 생성하고 정제하는 일련의 과정에서 올바른 학습 데이터가 구축될 수 있도록 노력하고 있다.