비정형 데이터 표준화 솔루션

의료 및 산업 분야에서 대형언어모델(LLM) 및 소형언어모델(sLLM)을 구축할 경우

양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션입니다.


◼ 핵심 기술 내용 ◼

FAST   준 실시간 분석이 가능하며, 1,000건당 처리시간 약 2분 소요

SIMPLE   각 모듈 단위의 구조로 재사용이 용이, 일반 사용자도 손쉽게 사용 가능

CORRECT   고도화된 언어 처리 기술 활용을 통해 판독문, 보고자료, 기록지 등의 문서를 보다 정확하게 분석 가능

데이터 등록

    -대량의 데이터 중 분석 대상 데이터를 선정하여 등록

    -한 번 등록된 데이터는 재등록 필요없이 재사용 가능


◾텍스트 처리

    -데이터를 분류 분석에 적합한 형태로 변환

    -높은 품질의 분류 분석 결과를 도출하는데 유용하게 활용


◾데이터 분석

    -대상 데이터의 기준 용어 사전에 맞게 Linguistics Rule 구축

    -분류 체계에 맞게 분류 분석


◾데이터 후처리

    -분류 분석한 결과를 정의된 항목에 맞게 정형화

    -컬럼에 대응하는 코드 값으로 치환

데이터 갱신 시 일관된 결과 생성

◾프로세스 자동화로 검색 시간 절약

◾사용한 규칙 고도화 및 재사용

◾판독문 이외 병원의 다양한 비정형 데이터 확장

◾분석 결과 버전 관리

◾높은 접근성과 직관적인 UI


◼ 솔루션 차별성 ◼

Usability   병원 내 비정형 데이터의 처리

◾Set Rule  정해진 룰에 맞게 프로세스 진행

◾Efficiency  최소한의 인력으로 빠른 시간 내 정형화

◾Easy and Fast  쉽고 빠르게 원하는 자료 분류

◾Research  데이터의 활용도 증가로 연구력 향상

Data Scan을 통해 생성한 규칙은 API 등록으로 외부 시스템과 연계 활용 가능

궁금하신 내용은 언제든 문의 해주세요