본문 바로가기
반응형

IT26

파이썬(python)을 활용한 데이터 분석 pandas 오늘 정리할 내용은 파이썬(python)을 활용하여 데이터를 분석할때 가장 많이 쓰이는 데이터 구조인 pandas의 series와 dataframe입니다. 1. pandas의 자료형 : Series - 1차원 배열 자료형으로 인덱스와 쌍으루 구성 - data의 자료형은 ndarray index data a 1 b 2 c 3 import pandas as pd #리스트 이용하여 정의한 Series S = pd.Series([1,2,3],index=['a','b','c']) #사전을 이용한 정의한 Series S2 = pd.Series({'a':1,'b':2,'c':3}) 2. pandas의 자료형 : DataFrame (1) DataFrame 구조 - 2차원 배열 자료형으로 인덱스와 쌍으루 구성 - Col.. 2022. 12. 13.
파이썬(python)을 활용한 데이터 분석 - numpy 1. numpy 자료형 : numpy의 자료형은 ndarray로 효율적인 배열 연산을 위해 개발됨. : 서로 다른 데이터 타입의 요소를 담을수 없음 (1) np.array 함수 : 위 함수를 이용하여 ndarray를 생성 할 수 있음 import numpy as np #1. np.array() : ndarray 생성 a = np.array([1,2,3,4,5]) print(a) #a의 형태는 ndarray #출력 : [1 2 3 4 5] (2) np.zeros(x) : x 모양의 0행렬 ndarray 반환 # 2. np.zeros() : 2x2 영행렬 ndarray 생성 b= np.zeros((2,2), dtype=int) print(b) # 출력 : #[[0 0] # [0 0]] (3) np.arang.. 2022. 12. 10.
파이썬(python)을 활용한 데이터 분석 - 반복문 주요 함수 1. 반복문 기초 (1) for 문 기초문법 for 요소 in 이터레이터: 반복할 구문 L1 = [1,2,3,4,5] for l in L1: print(l) if l == 2: break; #break를 만났을때 가장 가까운 for문만 빠져나감 # 1 2 출력 (2) 대표적인 이터레이터(iterator) 객체 생성 함수 - 이터레이터 객체 : 값을 차례대로 꺼낼 수 있는 객체를 의미 2-1) range - range(시작 , 끝 , 스텝) - range(x) x인자 하나만 넣을 경우 range(0, x , 1) 와 동일함. 시작 0과 스텝 1이 디폴트 인자가됨. - range(a,b) a,b 인자 두개만 넣을 경우 range(a,b,1)과 동일함. 스텝 1이 디폴트 인자가됨. range(1,10,2) #.. 2022. 12. 8.
파이썬(python)을 활용한 데이터 분석-파이썬 주요 데이터 구조2(사전 dictionary) 1. 사전(dictionary) (1) 사전 : 키(key)와 값(value)쌍으로 이루어진 해시 테이블 : 키(key)는 불변 , 값(value)는 불변or가변 Key value key 1 val 1 key 2 val 2 key 3 val 3 dict = {key 1:val 1, key 2:val 2, key 3:val 3} (2) 사전 요소 # 사전 선언 dict = { 1:1 , 2:4 , 3:3 , 4:20 } # 접근하기 print(dic[1]) # 1출력 # 값 추가 dict[5] = 15 # { 1:1 , 2:4 , 3:3 , 4:20, 5:15 } # 값 변경 dict[5] = 25 # { 1:1 , 2:4 , 3:3 , 4:20 , 5:25 } # 값 삭제 del(dict[5]) # { .. 2022. 12. 8.
파이썬(python)을 활용한 데이터 분석 - 파이썬 주요 데이터 구조1 (리스트, 튜플) 1. 리스트와 튜플 1) 리스트 L1 = [1,2,3,4,5] L2 = [‘a’,’b’,’c’,1,2] L3 = [1,2,[3,4]] ​ 2) 튜플 T1 = (1,2,3,4,5) T2 = (‘a’,’b’,’c’,1,2) T3 = (1,2,(3,4)) T4 = 1 T5 = 1, ​ 2. 리스트와 튜플의 공통점 1) 인덱싱 : 인덱싱은 0부터 시작 : 끝은 -1부터 시작 ​ 2) 슬라이싱 : 아래 예제를 통해 학습 # 튜플 L = [1,2,3,10,5] L[2] # 3 #맨뒤에서 부터 -1 L[-1] # 5 #0에서 부터 3개 L[0:3] # [1,2,3] #위와 동일 L[:3] # [1,2,3] #2에서 부터 끝까지 L[2:] # [3,10,5] #0부터 4까지 2칸씩 L[0:4:2] # [1,3] 3) .. 2022. 12. 7.
파이썬(python)을 활용한 데이터 분석 - 데이터 전처리는 왜 필요한가? ​ 1. 데이터 전처리는 왜 필요할까요? : 데이터가 분산되어 있거나, : 다양한 포멧으로 형식이 다른 경우가 많음 또는 비정상적인 시간순서의 데이터인 경우도 있음 * 효율적인 분석과, 불필요한 정보를 제거하여 인사이트를 얻는데 도움을 준다. ​ 2. 데이터 전처리를 배워야 하는 이유 : 데이터 분석을 함에 있어 시간을 줄이기 위해서. : 데이터 분석에 소요되는 시간이 실제로 분석 하는 시간보다 데이터를 정제하고 준비하는데 더 많은 시간이 소요됨. ​ 3. 데이터 전처리를 잘하기 위해선? : 최종 결과물이 어떠할지 구조를 먼저 정리한다. : 구글링 - python pandas(모듈) how to 내용 : 영어로 검색하라 - statckoverflow 파이썬을 활용한 데이터 분석 - 파이썬 주요 데이터 구.. 2022. 12. 7.
[도커][쿠버네티스] 그 많은 컨테이너는 누가 관리하나? 1. 도커의 등장 - 도커의 등장에 따라 모든것을 컨테이너화하여 사용하기 시작 ( DB , WEB/WAS 등 ) - 서비스가 확장됨에 따라 컨테이너가 점점 많아짐 - 컨테이너가 늘어남에 따라 관리가 힘들어짐... - 그래서 컨테이너를 관리하기 위한 도구가 필요하게됨 다양한 컨테이너 오케스트레이션 도구들이 생겨남 하지만 결국... 살아남은 1인은 "쿠버네티스" 그래서 쿠버네티스가 해주는게 뭔데? "컨테이너화된 어플리케이션을 자동으로 배포, 스케쥴링 상태등을 관리해주는 도구" 2. 컨테이너 오케스트레이션의 기능들 - 클러스터 : 그룹화 - 상태관리 : ex) 최소 3개이상 유지해. - 스케쥴링 : 자원상태에 따른 서비스 관리 - 롤아웃/롤백 : 그룹단위 버전 배포관리 - 서비스 디스커버리 : 자원 등록/조회.. 2022. 4. 15.
[인공지능][딥러닝]딥러닝이란 무엇인가? 안녕하세요 호유입니다. 오늘부터 "인공지능"에 대해서 알게 된 내용을 조금씩 포스팅 해보려 합니다. 오늘은 인공지능중에서도 꼭 알아야하는 필수 기술인 "딥러닝"에 대해 알아보도록 하죠. 1. 딥러닝은 머신러닝(기계학습) 기술중 하나 일반적인 기계학습은 학습데이터로부터 공통점을 뽑아내는 통계학적인 방법이나, 딥러닝은 인간의 뇌구조 중 뉴런을 모방하며 만들어진 기술이다. 2. 이미지 인식을 위한 딥러닝 기술 - 심층뉴럴네트워크(CNN) 심층뉴럴네트워크는 이미지 인식을 위한 대표적인 딥러닝 기술입니다. 아래와 같은 단계를 거쳐 학습이미지가 어떤 이미지인지 분류하게 됩니다. 1) 심층뉴럴네트워크의 선행작업 심층뉴럴네트워크에 데이터를 넣기 전에 아래와 같은 심층,pooling 작업을 반복하여 특징량을 추출한다. .. 2022. 3. 6.
플러터[flutter] 기초 정리 1 ■ 정보 1. 변경 없는 위젯(statelessWidget) vs 변경 있는 위젯(staefuleWidget) 2. 플러터는 모든것이 위젯( 텍스트, 버튼, 화면구성 등 모든 컴포넌트 및 레이아웃이 위젯임!! ) 3. 배경위젯위에 다양한 위젯들을 겹겹히 쌓아올려서 만드는 방식 4. 머터리얼앱 - 구글머터리얼 디자인을 사용하기 위해서 사용 5. 스캐폴드 - 구글 머터리얼 디자인의 구조를 잡아줌 import 'package:flutter/material.dart'; void main() => runApp(MyApp()); //MAIN 실행 class MyApp extends StatelessWidget { // This widget is the root of your application. @override.. 2020. 7. 22.