본문 바로가기
IT/파이썬

파이썬(python)을 활용한 데이터 분석 - 데이터 전처리는 왜 필요한가?

by 호유(ho_you) 2022. 12. 7.
반응형

1. 데이터 전처리는 왜 필요할까요?

  : 데이터가 분산되어 있거나,

  : 다양한 포멧으로 형식이 다른 경우가 많음 또는 비정상적인 시간순서의 데이터인 경우도 있음

* 효율적인 분석과, 불필요한 정보를 제거하여 인사이트를 얻는데 도움을 준다.



2. 데이터 전처리를 배워야 하는 이유

: 데이터 분석을 함에 있어 시간을 줄이기 위해서.

: 데이터 분석에 소요되는 시간이 실제로 분석 하는 시간보다 

데이터를 정제하고 준비하는데 더 많은 시간이 소요됨.



3. 데이터 전처리를 잘하기 위해선?

: 최종 결과물이 어떠할지 구조를 먼저 정리한다.

: 구글링 - python pandas(모듈) how to 내용

: 영어로 검색하라 - statckoverflow



 

파이썬을 활용한 데이터 분석 - 파이썬 주요 데이터 구조1 (리스트, 튜플)

1. 리스트와 튜플 1) 리스트 L1 = [1,2,3,4,5] L2 = [‘a’,’b’,’c’,1,2] L3 = [1,2,[3,4]] ​ 2) 튜플 T1 = (1,2,3,4,5) T2 = (‘a’,’b’,’c’,1,2) T3 = (1,2,(3,4)) T4 = 1 T5 = 1, ​ 2. 리스트와 튜플의 공통점 1) 인덱싱

itforest.tistory.com

 

반응형

댓글