프로젝트 동기 및 기획의도
이 프로젝트는 AI와 의료 분야의 융합을 통해 의료 서비스 중에 질병 진단 과정에서 효율과 정확도를 높이려는 목적을 가지고 시작했습니다. 특히 폐렴은 전 세계적으로 높은 발병률과 사망률을 보이는 질병 중 하나로 조기 발견과 정확한 진단이 환자의 생존율에 큰 영향을 미친다는 것을 알게 되었고, AI 기술로 그 정확도를 높일 수 있겠다는 생각이 들었습니다. 이를 위해 우리는 딥러닝 기술을 활용하여 X-ray 이미지를 분석하고 폐렴 여부를 자동으로 진단하여 폐렴 진단의 정확도를 높이는데 도움을 줄 수 있는 AI 모델을 개발하게 되었습니다.
사용 환경
Google Colab
프로젝트 설명
이 프로젝트는 CNN 딥러닝 기술을 활용하여 Kaggle의 폐렴 X-ray 데이터셋으로 폐렴 여부를 판단하는 딥러닝 모델을 개발했습니다. 먼저 필요한 라이브러리를 불러오고 Colab 개발 환경에서 Kaggle 데이터 세트를 불러오기 위해 Kaggle API를 업로드하며, 이 과정에서 Kaggle 계정의 API 키를 Colab에 업로드하여 연결을 설정합니다. 그런 다음 필요한 데이터 세트를 다운로드하고 데이터 세트 압축을 풀어줍니다. 불러온 데이터는 train, val, test 디렉토리로 구분되어 있으며, 이를 전처리 및 데이터 증강 과정을 거쳐 모델 학습에 적합한 형태로 변환합니다. 전처리된 데이터를 모델에 전달하여 validation 및 train을 진행하며, ResNet50 사전 학습 모델을 기반으로 GAP 레이어를 사용하여 폐렴 여부를 분류할 수 있는 최종 모델을 설계했습니다. 모델은 로드된 데이터를 학습하며, 테스트 데이터를 이용해 성능을 평가하여 정확도를 출력합니다. 마지막으로, 사용자가 원하는 새로운 X-ray 이미지를 입력할 경우, 모델이 해당 이미지에 대해 폐렴 여부를 예측하여 결과를 반환합니다.















개선방안 모색
이번 프로젝트에서는 Kaggle에서 제공된 데이터셋을 활용했지만, 해당 데이터셋은 제한된 조건에서 수집되어 모든 종류의 X-ray 사진의 다양한 특징을 충분히 반영하기에는 한계가 있었습니다. 이를 위해 다양한 의료기관에서 제공하는 X-ray 데이터를 통합하여 데이터셋을 확장하고, 다양한 연령대와 성별을 포함한 다각적인 데이터를 확보해야 할 것입니다. 또한, 이를 통해 더 넓은 범위의 환자 데이터를 반영하여 모델의 일반화 성능을 개선할 수 있을 것입니다. 향후 폐렴 진단 지원 AI 모델을 넘어 결핵, 폐암, 심장질환 등 다양한 질병을 동시에 진단할 수 있는 모델로 확장하고자 합니다.
소감
김동환: 이번 프로젝트를 진행하면서 AI와 의료 서비스를 결합하여 딥러닝 기술이 진단 시스템에 큰 도움을 줄 수 있다는 것을 확인했습니다. 데이터를 전처리하고 모델을 학습시키며 품질과 증강의 중요성을 깨달았으며, ResNet50과 같은 사전 학습 모델의 강점 및 전이 학습의 효과를 직접 경험할 수 있었습니다.
허근영: 이번 프로젝트를 통해 딥러닝에 대해 더 깊이 알아볼 수 있었고, 특히 전처리 과정과 학습 과정에서 pooling 등의 기법들이 얼마나 중요한지 깨달았습니다. 또한, ResNet50의 구조와 활용법을 이해하며 딥러닝이 실제 문제 해결에 매우 유용하다는 점을 실감했습니다. 앞으로는 폐렴뿐만 아니라 다른 질환 진단 기능도 추가하여 더욱 발전된 모델을 개발하고 싶습니다.