비투엔 라이프/사내 소식

[기술세미나] 비정형데이터 메타 항목 도출 방안(사례중심)

비투엔 마스터 2023. 9. 25. 16:58

 

안녕하세요. 비투엔입니다!

이번 9월 기술세미나는 ‘비정형데이터 메타 항목 도출 방안(사례중심)’이라는 주제로 진행이 되었습니다.

강연은 DX1본부의 이승훈 수석님께서 이끌어 주셨는데요. 프로젝트로 한창 바쁜 시기임에도 불구하고 ‘공공사업’ 및 ‘비정형데이터’에 관심있는 비투엔 임직원분들을 위해 열혈 강의를 진행해 주셨습니다.

이승훈 수석님께서 속해 계신 DX본부에 대해 짧게 소개 드리자면, DX본부는 국내의 유수한 기업들과 파트너십을 맺고 다양한 프로젝트를 수행하며 사물인터넷(IoT), 클라우드컴퓨팅, 인공지능(AI)과 머신러닝(ML), 빅데이터 솔루션 등 정보통신기술(ICT)을 플랫폼으로 구축·활용하는 등 전통적인 운영 방식과 서비스 등의 혁신을 실현해 나가고 있습니다.

강연에 대한 보다 자세한 정보는 아래 내용을 참고해 주세요!

 

 


강사
DX1본부 이승훈 수석님


장소
비투엔 본사 크리에테리아


교육 주제
비정형데이터 메타 항목 도출 방안(사례중심)


교육 내용
1. 프레임워크
2. 비정형데이터 개념
3. 기관 비정형데이터 현황
4. 기준 메타항목 정의
5. 기준 메타항목 매칭
6. 표준 메타항목 선정
7. 시범 개선


 

 

9월 기술세미나 소개에 앞서, 금번 강연은 사례중심으로 진행되었으나 게시글 내에 직접적인 기관명이나 수치를 언급 드리기에는 조심스러운 부분이 있습니다.

이에 따라 이번 포스팅에서는 강연 내용 중 소프트웨어 개발자 혹은 IT직군 근무자가 아니라면 생소할 만한 단어들을 함께 정리 및 소개하는 방식으로 설명 드리겠습니다.

 

 

 

 

공공기관 데이터의 특징

 

우선, 공공기관 데이터의 특징에는 무엇이 있을까요?
공공기관의 데이터는 특정 분야의 업무를 수행하는 공공기관의 특성이 반영되고, 공공재로서의 보편성도 확보되어야 합니다.

자세한 내용은 이미지를 참고해 주세요.

 

 

 

 

또한 기관 비정형데이터 표준 메타항목 도출을 위한 프레임워크를 수립해야 하는데요. 수행 프레임워크는 다음과 같습니다.

 

1) 목표 설정

2)대상 데이터 선정

3) 메타항목 도출

4) 메타항목 분류

5) 표준화 작업

6) 적용 및 검증

7) 개선 및 보완

8)유지보수

 

 


 

 

프레임워크란?

 

그렇다면! 프레임워크란 무엇일까요?
프레임워크(framework)는 컴퓨터 프로그래밍에서 복잡한 문제를 해결하거나 서술하는 데 사용되는 기본 구조를 말합니다. 이는 뼈대, 골조(骨組), 프레임워크(framework)라고도 불리며, 특정한 목적을 달성하기 위해 복잡하게 얽혀 있는 문제를 해결하기 위한 도구입니다. 개발자들이 소프트웨어를 조금 더 빠르게 설계할 수 있도록 도움을 주며, 다양한 분야에서 사용됩니다.

 

 

 

 

비정형데이터

 

비정형데이터 개념에 대해서도 간단히 안내 드리겠습니다.
비정형데이터는 비정형 정보, 비구조화 데이터, 비구조적 데이터 등으로 일컬어지며 미리 정의된 데이터 모델이 없거나 미리 정의된 방식으로 정리되지 않은 데이터를 의미합니다.

비정형데이터(unstructured data)는 다양한 형태로 존재하며, 정형데이터(Structured Data)와 반정형데이터(Semi-Structured Data)와는 구분됩니다.

 


정형데이터
미리 정해진 구조에 따라 저장된 데이터

비정형데이터
미리 정해진 구조에 따라 저장되지 않은 데이터로, 정형데이터와 달리 구조가 없기 때문에 분석하기 어려움

반정형데이터
구조에 따라 저장된 데이터로, 데이터 내용 안에 구조에 대한 설명이 함께 존재

 

 

 

 

비정형데이터 유형

 

비정형데이터는 다양한 분야에서 여러 가지 형태로 축적되며 일반적으로 분류하였을 때 멀티미디어 데이터, 공간정보 데이터, 기타 비정형데이터로 구분할 수 있습니다.

유형에는 텍스트 파일, 이메일, 이미지, 비디오, 오디오, 메타데이터, SNS 데이터, 웹사이트, 공간정보, 센서 데이터 등이 있으며, 이들은 log, elm, pdf, jpg, mp4, avi, mp3, txt, ngi, doc, hwp 등 다양한 형태로 저장됩니다.

 




9월 기술세미나에서는 제가 위에서 설명 드린 프레임워크, 비정형데이터 개념 외에도 이승훈 수석님께서 기관 비정형데이터 현황, 기준 메타항목 정의, 기준 메타항목 매칭, 표준 메타항목 선정, 시범 개선 등에 대해 더 자세히 다루어 주셨는데요. 내부 자료이다 보니 게시글에는 모두 소개하지 못한다는 점이 정말 아쉽네요.

알찬 강의 진행해 주신 이승훈 수석님께 다시 한번 감사 인사드리며, 비투엔 10월 기술세미나도 기대해 주세요!

글 읽어주셔서 감사합니다.