SDQ For AI 7

[인터뷰]“고품질 AI 서비스를 위해선 학습용 데이터 품질 관리가 기본”

[비투엔 AIX그룹 박순혁 그룹장] 챗GPT(ChatGPT)바람이 불고 있다. 긍정적인 예측이 대부분이지만 모든 일이 그렇듯이 긍정적인 측면이 있으면 부정적인 측면이 있기 마련이다. 특히 챗GPT에 필수 요소인 AI 학습 데이터의 품질에 문제가 있을 경우 나타날 수 있는 부정적인 상황에 대한 우려가 많다. 이와 관련하여 비투엔의 박순혁 그룹장을 만나 학습용 데이터 품질 관리의 중요성과 품질 관리를 위안 방안 등에 대해 이야기를 나누었다. Q. 챗GPT(ChatGPT)로 인해 AI 서비스 품질의 중요성이 강조되고 있다고 한다. 그 이유는? 2022년 12월 오픈 AI의 챗GPT(챗GPT) 출시 이후 글로벌 IT 시장이 뜨겁게 달아오르고 있다. 챗GPT는 5일 만에 100만 명 이상의 신규 사용자를 확보했고..

[B2EN News] “데이터 활용성 높이려면 지속적인 품질 관리 뒤따라야” (1)

최근 다양해진 IT 시스템과 디바이스들로 인해 기업의 IT 환경은 급격한 변화를 맞이하고 있으며, 이를 통해 기업에서 관리되고 있는 데이터의 볼륨은 매년 급속도로 증가하고 있다. 최근에는 기업의 경쟁력 강화를 위해 축적된 데이터를 어떻게 활용할 것인가에 초점이 맞춰지고 있고, 기업 경영 전반에 걸쳐 이러한 데이터 활용도가 높아지면서 데이터의 정합성과 신뢰성 등 데이터 품질 수준이 기업의 의사결정에 매우 중요한 요소로 작용하고 있다. 데이터에 대한 신뢰도가 낮거나 정합성이 결여된다면 데이터를 기반으로 한 기업의 의사결정은 거의 불가능한 수준이 되기 때문에 고품질의 데이터를 유지하고 관리하기 위한 데이터 품질 관리가 최근 매우 중요한 요소로 부각되고 있다. 그리고 이는 정형 데이터를 포함해 반정형 데이터 그..

[B2EN News] 비투엔, ‘인공지능 학습용 데이터 구축사업’ 품질 검증으로 기술력 입증

비투엔은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2022년 인공지능(AI) 학습용 데이터 구축 사업’에서 총 8개 컨소시엄의 품질 점검을 완료했다. ‘인공지능(AI) 학습용 데이터 구축 사업’은 인공지능 연구, 기술 및 서비스 개발을 위한 학습용 데이터를 구축하고 누구나 활용할 수 있도록 개방해 인공지능 산업 활성화에 기여하는 국가 데이터 댐 사업이다. 비투엔이 품질 점검을 완료한 AI 학습용 데이터는 △이미지 272만 건 △텍스트 19만 건 △교통 12만 건 △음성 18,000시간 등 총 9종, 474만 건으로, 특히 반려견, 반려묘 건강정보 데이터 과제에서는 ‘구문 정확성’, ‘통계 다양성’ 검사와 더불어 구축된 학습용 데이터의 인공지능(AI) 알고리즘을 활용한 품질 ..

[B2EN News]"모든 분야 AI 학습용 데이터 구축···품질검사 자신"

비투엔이 지디넷코리아와 과학기술정보통신부, 한국소프트웨어산업협회가 주최 및 주관한 '제 6회 4차산업혁명대상'에서 기관장상인 한국지능정보사회진흥원(NIA) 원장상을 수상했다. 수상을 한 비투엔의 'SDQ for AI'는 AI 학습데이터 품질관리 솔루션으로 고성능 AI 서비스 구축을 위한 고품질 학습 데이터 확보, 라벨링 정확도 향상을 지원하기 위해 만들어졌다. 또한, 올해 초에는 목적에 맞춰 자유롭게 활용할 수 있는 라이선스 제공을 위해 서비스형 소프트웨어(SaaS) 버전으로도 출시했다. 'SDQ for AI'는 국내에서 유일하게 NIA의 품질관리 가이드라인에 정의된 구문 정확성 검사의 3가지 세부지표(데이터 구조, 입력 값 범위, 데이터 형식)와 통계다양성 지표(데이터 규모, 클래스별 분포)를 제공한다..

[B2EN News] - [신SW상품대상추천작]비투엔 'SDQ for AI'

비투엔은 AI 학습용 데이터 품질관리 솔루션 'SDQ for AI V2.0'을 출품했다. SDQ for AI는 비정형 데이터에 대한 품질 검증을 통해 양질 데이터 세트 구축과 라벨링 정확도 향상을 지원하고, 국내에서 유일하게 구문적 정확성과 통계적 다양성 지표를 통한 품질검사를 제공한다. 또한, 지난해 등록된 '어노테이션 자동 진단 시스템 기술 특허'(국제 특허 출원) 기반으로 개발됐으며, 추가 등록된 '어노테이션 변환 장치 및 그 제어 방법' 특허와 '검사 규칙 변환 장치 및 그 제어 방법' 특허 출원, GS 인증 1등급 획득을 통해 제품의 우수성을 인증 받았다. 주요 기능은 △데이터 수집 △규칙 △수행 △결과 등 4개다. AWS S3, 네이버 클라우드, NHN 클라우드와 연동을 통해 데이터 이관 없이..

[B2EN News] 비투엔 ‘SDQ for AI’, GMV 2022서 ‘호평’

비투엔이 대한무역투자진흥공사(KOTRA)가 주관하는 국내 최대 정보통신기술(ICT) 분야 비즈니스 행사인 ‘GMV(글로벌 모바일 비전) 2022’에 참가했다. 비투엔은 GMV 2022에서 자체 어노테이션 자동 진단 기술(국내특허등록, 국제특허출원)을 기반으로 개발한 AI 학습용 데이터 품질관리 소프트웨어인 ‘SDQ for AI’를 소개했으며, 해외 바이어 및 참관객들로부터 호평을 받았다. 특히 AI·IoT 등 기술 기업들이 AI 학습용 데이터 품질관리에 많은 관심을 보였고 제품 도입에 대한 문의도 상당했다. ‘SDQ for AI’는 AI 학습용 데이터에 대한 형식 및 구조 정확성, 통계 다양성 등을 진단하는 솔루션으로 2020년부터 현재까지 ‘AI 학습용 데이터 구축 사업’에서 360여종 학습 데이터의 ..

[인터뷰] “AI 서비스 품질, 학습용 데이터 품질에 달렸다”

정부의 디지털 뉴딜 정책 추진과 인공지능(AI) 산업 발전에 따라 AI 학습용 데이터 구축 시장이 급성장하고 있다. 하지만 구축되는 학습 데이터들의 품질 관리를 위한 세부 기준과 도구가 미흡해 실질적인 품질 관리가 힘든 것이 사실이다. 이와 관련하여 빅데이터·AI 전문 기업 비투엔은 회사가 보유한 품질 관리 노하우와 기술력을 담은 AI 학습용 데이터 품질 관리 플랫폼 ‘SDQ for AI’를 선보이며 관련 시장 선도에 나섰고, 이에 박순혁 비투엔 AIX 그룹장을 만나보았다. 데이터 품질 관리 시장 개척 박순혁 그룹장은 “‘SDQ for AI’ 출시 이전에는 품질이 낮은 데이터를 삭제해 모델 학습에 사용되는 데이터의 양이 부족한 상황이 빈번하게 발생했지만, ‘SDQ for AI’ 출시 이후 학습 데이터 구..