본문으로 바로가기 주메뉴 바로가기 서브메뉴 바로가기

정보

사업

건강보험 요양기관 부정청구 감시를 위한 Data ㅡMining기법 적용방안

  • 작성일2004-11-02 11:08
  • 조회수2,715
  • 담당자 김우중
  • 담당부서보험관리과
 

 

등록번호

보험관리과-4555

 

사회복지주사

서기관

보험관리과장

연금보험국장

사회복지정책실장(의견있음)

차관

장관

 

등록일자

2004.10.20

 

 

 

 

 

 

 

 

 

 

 

 

 

10/20

 

김우중

김홍

김정석

송영중

문창진

송재성

김근태

결재일자

2004.10.20

 

공개구분

공개

 

 

 

협조자

 

 

 

 





건강보험 요양기관 부정청구 감시를 위한

Data Mining 기법 적용 방안








의견있음

   문창진(사회복지정책실장/사회복지정책실) Data Mining 기법을 건강보험 뿐 아니라 의료급여 요양기관에도 적용함이 바람직



보 건 복 지 부

보험관리과

Ⅰ. 개 요


 □ Data Mining의 개념

  ○ 대용량 데이터를 이용하여 데이터간의 관계, 패턴, 규칙 등을 탐색하고 이를 모형화하여 유용한 정보로 변환하고 의사결정에 활용

   ⇒ 심평원의 Data Ware House에 축적된 요양기관의 진료명세 등 종합적 정보를 활용, 부정청구 개연성이 높은 기관을 찾아냄


 □ 추진배경

  ○ 지금까지의 부정청구 요양기관 선정 시스템을 보완

   - 심사결과 진료비지표 상위기관 및 수진자 조회를 통한 부당청구 개연성이 있는 기관과,

   - 민원․언론보도로 사회적 이슈가 된 기관 등을 조사대상으로 선정

  최신 분석예측 기법인 Data Mining 기법을 적용, 모든 요양기관을 상으로 부정청구 가능성을 예측하는 부정청구 상시감시시스템 마련


 □ 추진경과

  ○ 의과의원급에 대한 현지조사 대상기관 선정 모델개발(2003. 8)

  ○ 모델 시범적용(2003. 9)

   - 10개 기관을 대상으로 현지조사한 결과 40%의 적중률로 모델보완 필요성 제기

  ○ 시범적용 결과 분석 및 모델 보완 개발(2004. 4)

  ○ 업무적용(2004. 5~7)

   - 완 개발된 모델을 적용하여 45개 부정청구 의심기관을 선정, 현지조사

Ⅱ. Data Mining Model의 주요내용

 □ 후보변수의 선정


  ○ 1단계 : 기존의 업무 경험치를 이용하여 부정의 개연성이  예측되는 항목과 요양기관의 일반적 특성을 후보변수로 선정

         (수진자당 요양급여비용총액, 수진자당 내원일수, 행위료비율, 진찰료단독청구비율, 표시과목, 월별건당요양급여비증가율 등)


  ○ 2단계 : 1단계 후보변수가 가진 데이터의 특성에 따라 양한 변수 가공 후 통계기법에 의거 유의성이 높은 변수를 채택

         (단위기간 동안 여러 병원을 다니는 환자의 비율 등)


  ○ 3단계 : 2단계 채택 후보변수에 대해 진료 구간별 유의성을 검증하여 모든 진료 구간에서 유의한 변수만 채택

        (수진자당 내원일수, 상병 종류수, 진찰료 독청구건 비율, 표시과목 등)


  ○ 4단계 : 3단계에서 채택된 후보변수를 적용한 모델 생성 및 검증 과를 중심으로 후보변수의 적정성 검토(최종 21개 변수 채)

 

 □ 사용된 주요 모델링 기법


  ○ 신경망(Neural Network) 기법

   - 데이터로 부터의 반복적인 학습과정을 거쳐 데이터에 내재되어있는 패턴을 찾아 분류 및 예측

  ○ 로지스틱회귀분석(Logistic Regression) 기법

   - 각각의 변수들에 의해 부당일 확률값을 나타내는 함수식을 이용, 분류 및 예측

  ○ 의사결정나무(Decision Tree) 기법

   - 부당기관과 정상기관을 분리할 가장 효과적인 변수부터 시작하여 더 이상 분류 효과가 없을 때까지 반복 분류


 □ 모델 검증

  ○ 검증 방법

   - 검증의 객관성 보장을 위해 모델생성에 사용하지 않은 자료사용

   - 모델생성 시 추출된 부당가능확률 결과를 검증 시 추출된 부당가능 확률과 비교․평가

   - 각 모델별 판정결과와 ‘02. 1~03. 8까지 실시한 현지조사 결과와의 일치여부 검증

  ○ 모델 검증결과

   - 부당가능 상위기관(10%)에 대한 구간별 적중률 : 약 77~86%

   - 무작위 추출시의 부당점수를 기준으로 비교한 적중률

     : 의사결정나무모델 87.1%, 신경망모델 82%, 로짓모델 84.5%

 □ 모델의 실제 현지조사 업무 적용

  ○ 조사개요

   - ‘04. 5. 24 ~ 6. 12,  15개 의원을 마이닝에 의해 선정 조사

   - ‘04. 6. 23 ~ 7. 1,  30개 의원을 마이닝에 의해 선정 조사

  ○ 조사결과

   - 45개 조사기관중 37개 기관의 부당청구 확인

    부당기관 적중률 82.2%로 시스템 개발은 성공적인 것으로 판단

     * ‘03년도 의과의원급 부당 적중률 : 80%

   - 추정 부당금액(196,350천원)과 예상 행정처분은 비교적 낮음

    시스템 보완과 부당청구 유형의 변화 등에 대비한 적용결과의 지속적인 분석 및 모델 개선 작업 필요


 □ 모델 적용에 따른 기대 효과

  ○ 최신기법을 활용한 지능화 분석으로 업무의 과학화

  ○ 과학적 기법을 이용한 불특정 다수 요양기관 적용으로 사전적 예방 효과 거양

  ○ 합리적이고 객관적인 조사 대상기관 선정으로 대외 신뢰도 제

  ○ 올바른 청구풍토 확립 및 보험재정보호에 기여

Ⅲ. 향후 추진계획


 □ 시스템을 활용한 현지조사 대상기관 선정 방침 전파(‘04. 10)

  ○ 요양기관의 올바른 진료비 청구를 유도하고 국민의 신뢰도 제고

  ○ 대한의사협회, 병원협회 등 관련 단체를 통해 회원에 전파


 □ 시스템 활용(‘04. 10 ~ )

  ○ 의과의원급 현지조사 대상기관 선정시 적용(30~50%)

  ○ 현지조사 적용결과 분석 등 지속적인 유지관리 및 개선


 □ 시스템 확대(2005. 1 ~ )

  ○ 적용 가능성이 높은 분야에 단계적 확대

   - 요양기관 종별(치과, 한의원 등) 모델 개발

   - 표시과목별 요양기관 특성 또는 상병별 특성이 반영된 모델개발

  ○ 여건 변화에 따른 리모델링(의과의원급)

  ○ 업무담당자별 심화교육으로 전문적인 모델 활용