비정형 데이터 표준화 솔루션
의료 및 산업 분야에서 대형언어모델(LLM) 및 소형언어모델(sLLM)을 구축할 경우
양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션입니다.
비정형 데이터 표준화 솔루션
의료 및 산업 분야에서 대형언어모델(LLM) 및 소형언어모델(sLLM)을 구축할 경우
양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션입니다.
◼ 핵심 기술 내용 ◼
◾FAST 준 실시간 분석이 가능하며, 1,000건당 처리시간 약 2분 소요
◾SIMPLE 각 모듈 단위의 구조로 재사용이 용이, 일반 사용자도 손쉽게 사용 가능
◾CORRECT 고도화된 언어 처리 기술 활용을 통해 판독문, 보고자료, 기록지 등의 문서를 보다 정확하게 분석 가능
◾데이터 등록
-대량의 데이터 중 분석 대상 데이터를 선정하여 등록
-한 번 등록된 데이터는 재등록 필요없이 재사용 가능
◾텍스트 처리
-데이터를 분류 분석에 적합한 형태로 변환
-높은 품질의 분류 분석 결과를 도출하는데 유용하게 활용
◾데이터 분석
-대상 데이터의 기준 용어 사전에 맞게 Linguistics Rule 구축
-분류 체계에 맞게 분류 분석
◾데이터 후처리
-분류 분석한 결과를 정의된 항목에 맞게 정형화
-컬럼에 대응하는 코드 값으로 치환
◾데이터 갱신 시 일관된 결과 생성
◾프로세스 자동화로 검색 시간 절약
◾사용한 규칙 고도화 및 재사용
◾판독문 이외 병원의 다양한 비정형 데이터 확장
◾분석 결과 버전 관리
◾높은 접근성과 직관적인 UI
◼ 솔루션 차별성 ◼
◾Usability 병원 내 비정형 데이터의 처리
◾Set Rule 정해진 룰에 맞게 프로세스 진행
◾Efficiency 최소한의 인력으로 빠른 시간 내 정형화
◾Easy and Fast 쉽고 빠르게 원하는 자료 분류
◾Research 데이터의 활용도 증가로 연구력 향상
Data Scan을 통해 생성한 규칙은 API 등록으로 외부 시스템과 연계 활용 가능