Skip to content

JHyuk2/MyProjects

Repository files navigation

프로젝트 경험

머신러닝을 이용한 불법 의약품 거래 게시글 탐지

[프로젝트 소개]

  • 머신러닝 기술을 활용하여 불법 의약품 거래 트윗을 분류

[주요 과업]

  • 트위터 크롤링 패키지인 twitterscrapper를 이용한 데이터 수집

  • 수집된 게시글 라벨링

    Text Label
    집에서도 만들 수 있는 나만의 아이스크림 제조법 0
    ㅁㅣ프진 작ㄷㅐㄱㅣ 안전거래 ㅋㅏ톡주세요 ... 1
    #ㅇㅏㅇㅣ스 삽니다 #얼음삽니다 #ㅊㅏㄱㅏ운술... 1

    불법 의약품 판매 게시글인 경우 1, 아닌 경우 0

  • 특문, 링크 제거 및 자소 분리 형태로 전처리 (집 -> ㅈㅣㅂ)

    자소 분리 전 자소 분리 후
    작ㄷㅐ기 떨 ㅇㅏ이스 차가운술
    자세한 내용은 쪽지로 ...
    ㅈㅏㄱㄷㅐㄱㅣ ㄸㅓㄹ ㅇㅏㅇㅣㅅㅡ
    ㅊㅏㄱㅏㅇㅜㄴㅅㅜㄹ ㅈㅏㅅㅔㅎㅏㄴ
    ㄴㅐㅇㅛㅇㅇㅡㄴ ㅉㅗㄱㅈㅣㄹㅗ...
  • 머신러닝 모델 개발 (Naive Bayes)

[프로젝트 성과]

  • 의약처에서 주관한 '빅데이터를 활용한 불법 의약품 관리 공모전' 우수상 수상
  • KCC2020(한국컴퓨터종합학술대회 논문집) 제3저자

[기간]

  • 2019.05 - 2019.08

[사용 기술]

  • Python, scikit-learn, pandas

Releases

No releases published

Packages

No packages published