그간의 논문으로부터의 결론은
잘 정제된 (추출된) 데이터를 활용한 머신러닝의 성능이 이미 매우 우수하다.
머신러닝의 한계는 데이터를 기반으로 예측하기 때문에, 데이터를 기반하지않은 새로운 특성이 입력되었을때
그 성능이 떨어질수있다.
이부분을 극복할수있는 분야가 deep learning 이라 생각하며
이번 프로젝트는 딥러닝을 활용해서 프로젝트를 진행해보고자 한다
* data selection 의 범위나 기준은 어떻게 할것인가?
(1) 특정 알고리즘을 통해 데이터 셀렉을 하지않고 진행 ->
(2) 시간이 너무 오래걸리거나 정확도가 떨어질경우 셀렉션 진행
관련 자료 1 (논문)
https://arxiv.org/pdf/2007.12729.pdf
관련 자료 2 (사이트)
* 아이디어 : BOW , 스팸처리에 사용한 딥러닝 기법 활용
* 각 키워드들의 분포빈도등을 고려해 malicous 인지 benign 인지 구분하는 모델링 진행
* 스팸메일을 구분하듯이 각각의 키워드들을 특성으로 사용한 딥러닝을 진행 후 결과를 도출
728x90
'AI월드 > ⚙️AI BOOTCAMP_Section 6' 카테고리의 다른 글
FINAL PROJECT 2_PDF parser (0) | 2021.06.24 |
---|---|
FINAL PROJECT 2_논문분석 (0) | 2021.06.18 |
FINAL PROJECT 1_프로젝트 FLOW (0) | 2021.06.02 |
댓글