본문 바로가기
728x90

AI월드/⚙️AI BOOTCAMP_Section 64

FINAL PROJECT 2_아이디어(딥러닝활용) 그간의 논문으로부터의 결론은 잘 정제된 (추출된) 데이터를 활용한 머신러닝의 성능이 이미 매우 우수하다. 머신러닝의 한계는 데이터를 기반으로 예측하기 때문에, 데이터를 기반하지않은 새로운 특성이 입력되었을때 그 성능이 떨어질수있다. 이부분을 극복할수있는 분야가 deep learning 이라 생각하며 이번 프로젝트는 딥러닝을 활용해서 프로젝트를 진행해보고자 한다 * data selection 의 범위나 기준은 어떻게 할것인가? (1) 특정 알고리즘을 통해 데이터 셀렉을 하지않고 진행 -> (2) 시간이 너무 오래걸리거나 정확도가 떨어질경우 셀렉션 진행 관련 자료 1 (논문) https://arxiv.org/pdf/2007.12729.pdf 관련 자료 2 (사이트) https://wikidocs.net/22.. 2021. 6. 28.
FINAL PROJECT 2_PDF parser 2번째 단계 적절한 PDF 파서를 찾고, 데이터를 찾는 과정 (0) PyPDF2 https://pythonhosted.org/PyPDF2/ PyPDF2 Documentation — PyPDF2 1.26.0 documentation pythonhosted.org (1) docparser https://docparser.com/ Docparser - Document Parser Software - Extract Data From PDF to Excel, JSON and Webhooks The leading document parser. Extract data from PDF to Excel, JSON or update apps with webhooks via Docparser. docparser.com ht.. 2021. 6. 24.
FINAL PROJECT 2_논문분석 논문리스트 1 : Detection of Malicious PDF based on Document Structure Features and Stream Objects https://www.koreascience.or.kr/article/JAKO201809355933293.pdf 2 : Data Mining Based Strategy for Detecting Malicious PDF Files https://ieeexplore.ieee.org/document/8455965 3 : Hidost: a static machine-learning-based detector of malicious files https://link.springer.com/content/pdf/10.1186/s13635-016-004.. 2021. 6. 18.
FINAL PROJECT 1_프로젝트 FLOW 1. 프로젝트 FLOW Part 01. 기획서 작성, 데이터셋 리서치 Part 02. 프로젝트 진행 Part 03. 발표 자료 및 영상 준비, 녹화 2. 프로젝트 상세 절차 1) 프로젝트 기획안 작성 1-1) 관심 데이터 선정 Plan A, Plan B 1-2) 데이터 선정 이유 (단순 관심이 아닌 향후 커리어와 꼭 연관시키기) 1-3) 데이터를 이용한 가설 (쓸모있는 가설) 2) Pipeline 구축 및 검증 / 해석 / 재구현 / 고찰 2-1) 데이터 전처리 (EDA / Feature Engineering / 정규화 / 노이즈 제거 / 결측치 제거 or 대체 / 데이터 밸런스) 2-2) 머신러닝 방식 적용 2-3) Chance Level이 넘는 지 확인 (if not) Plan B 적용 2-4) CV.. 2021. 6. 2.
728x90