정보
사업
건강보험 요양기관 부정청구 감시를 위한 Data ㅡMining기법 적용방안
- 작성일2004-11-02 11:08
- 조회수2,715
- 담당자 김우중
- 담당부서보험관리과
등록번호 | 보험관리과-4555 |
| 사회복지주사 | 서기관 | 보험관리과장 | 연금보험국장 | 사회복지정책실장(의견있음) | 차관 | 장관 | |||||||||
| ||||||||||||||||||
등록일자 | 2004.10.20 | |||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
| 10/20 | |||||
| 김우중 | 김홍 | 김정석 | 송영중 | 문창진 | 송재성 | 김근태 | |||||||||||
결재일자 | 2004.10.20 | |||||||||||||||||
| ||||||||||||||||||
공개구분 | 공개 | |||||||||||||||||
|
|
| 협조자 |
|
|
|
|
건강보험 요양기관 부정청구 감시를 위한 Data Mining 기법 적용 방안 |
문창진(사회복지정책실장/사회복지정책실) Data Mining 기법을 건강보험 뿐 아니라 의료급여 요양기관에도 적용함이 바람직
보 건 복 지 부 |
보험관리과 |
□ Data Mining의 개념
○ 대용량 데이터를 이용하여 데이터간의 관계, 패턴, 규칙 등을 탐색하고 이를 모형화하여 유용한 정보로 변환하고 의사결정에 활용
⇒ 심평원의 Data Ware House에 축적된 요양기관의 진료명세 등 종합적 정보를 활용, 부정청구 개연성이 높은 기관을 찾아냄
□ 추진배경
○ 지금까지의 부정청구 요양기관 선정 시스템을 보완
- 심사결과 진료비지표 상위기관 및 수진자 조회를 통한 부당청구 개연성이 있는 기관과,
- 민원․언론보도로 사회적 이슈가 된 기관 등을 조사대상으로 선정
○ 최신 분석예측 기법인 Data Mining 기법을 적용, 모든 요양기관을 대상으로 부정청구 가능성을 예측하는 부정청구 상시감시시스템 마련
□ 추진경과
○ 의과의원급에 대한 현지조사 대상기관 선정 모델개발(2003. 8)
○ 모델 시범적용(2003. 9)
- 10개 기관을 대상으로 현지조사한 결과 40%의 적중률로 모델보완 필요성 제기
○ 시범적용 결과 분석 및 모델 보완 개발(2004. 4)
○ 업무적용(2004. 5~7)
- 보완 개발된 모델을 적용하여 45개 부정청구 의심기관을 선정, 현지조사
Ⅱ. Data Mining Model의 주요내용
□ 후보변수의 선정
○ 1단계 : 기존의 업무 경험치를 이용하여 부정의 개연성이 예측되는 항목과 요양기관의 일반적 특성을 후보변수로 선정
(수진자당 요양급여비용총액, 수진자당 내원일수, 행위료비율, 진찰료단독청구비율, 표시과목, 월별건당요양급여비증가율 등)
○ 2단계 : 1단계 후보변수가 가진 데이터의 특성에 따라 다양한 변수 가공 후 통계기법에 의거 유의성이 높은 변수를 채택
(단위기간 동안 여러 병원을 다니는 환자의 비율 등)
○ 3단계 : 2단계 채택 후보변수에 대해 진료 구간별 유의성을 검증하여 모든 진료 구간에서 유의한 변수만 채택
(수진자당 내원일수, 상병 종류수, 진찰료 단독청구건 비율, 표시과목 등)
○ 4단계 : 3단계에서 채택된 후보변수를 적용한 모델 생성 및 검증 결과를 중심으로 후보변수의 적정성 검토(최종 21개 변수 채택)
□ 사용된 주요 모델링 기법
○ 신경망(Neural Network) 기법
- 데이터로 부터의 반복적인 학습과정을 거쳐 데이터에 내재되어있는 패턴을 찾아 분류 및 예측
○ 로지스틱회귀분석(Logistic Regression) 기법
- 각각의 변수들에 의해 부당일 확률값을 나타내는 함수식을 이용, 분류 및 예측
○ 의사결정나무(Decision Tree) 기법
- 부당기관과 정상기관을 분리할 가장 효과적인 변수부터 시작하여 더 이상 분류 효과가 없을 때까지 반복 분류
□ 모델 검증
○ 검증 방법
- 검증의 객관성 보장을 위해 모델생성에 사용하지 않은 자료사용
- 모델생성 시 추출된 부당가능확률 결과를 검증 시 추출된 부당가능 확률과 비교․평가
- 각 모델별 판정결과와 ‘02. 1~03. 8까지 실시한 현지조사 결과와의 일치여부 검증
○ 모델 검증결과
- 부당가능 상위기관(10%)에 대한 구간별 적중률 : 약 77~86%
- 무작위 추출시의 부당점수를 기준으로 비교한 적중률
: 의사결정나무모델 87.1%, 신경망모델 82%, 로짓모델 84.5%
□ 모델의 실제 현지조사 업무 적용
○ 조사개요
- ‘04. 5. 24 ~ 6. 12, 15개 의원을 마이닝에 의해 선정 조사
- ‘04. 6. 23 ~ 7. 1, 30개 의원을 마이닝에 의해 선정 조사
○ 조사결과
- 45개 조사기관중 37개 기관의 부당청구 확인
⇒ 부당기관 적중률 82.2%로 시스템 개발은 성공적인 것으로 판단
* ‘03년도 의과의원급 부당 적중률 : 80%
- 추정 부당금액(196,350천원)과 예상 행정처분은 비교적 낮음
⇒ 시스템 보완과 부당청구 유형의 변화 등에 대비한 적용결과의 지속적인 분석 및 모델 개선 작업 필요
□ 모델 적용에 따른 기대 효과
○ 최신기법을 활용한 지능화 분석으로 업무의 과학화
○ 과학적 기법을 이용한 불특정 다수 요양기관 적용으로 사전적 예방 효과 거양
○ 합리적이고 객관적인 조사 대상기관 선정으로 대외 신뢰도 제고
○ 올바른 청구풍토 확립 및 보험재정보호에 기여
Ⅲ. 향후 추진계획
□ 시스템을 활용한 현지조사 대상기관 선정 방침 전파(‘04. 10)
○ 요양기관의 올바른 진료비 청구를 유도하고 국민의 신뢰도 제고
○ 대한의사협회, 병원협회 등 관련 단체를 통해 회원에 전파
□ 시스템 활용(‘04. 10 ~ )
○ 의과의원급 현지조사 대상기관 선정시 적용(30~50%)
○ 현지조사 적용결과 분석 등 지속적인 유지관리 및 개선
□ 시스템 확대(2005. 1 ~ )
○ 적용 가능성이 높은 분야에 단계적 확대
- 요양기관 종별(치과, 한의원 등) 모델 개발
- 표시과목별 요양기관 특성 또는 상병별 특성이 반영된 모델개발
○ 여건 변화에 따른 리모델링(의과의원급)