강의실/머신러닝 24

[딥러닝파이썬] 02-3.파이썬의 Pandas를 다뤄 보자.

map 사용하기 - Series 에서는 map 함수를 사용할 수 있다. from pandas import Series,DataFrame import pandas as pd import numpy as np s1 = Series(np.arange(3),index=["row1","row2","row3"]) print(s1) print(s1.map(lambda x : x*2)) # s1을 2배 한 수 출력 dic = {1:'A',0:'B'} print(s1.map(dic)) #딕셔너리를 이용해서 해당 키값과 같으면 value로 변경 단,없으면 NaN unique 사용하기 : unique 값만 추출하기 from pandas import Series,DataFrame import pandas as pd impor..

강의실/머신러닝 2022.05.19 (6)

[딥러닝파이썬] 02-2.파이썬의 Pandas를 다뤄 보자.

DataFrame DataFrame 이란 시리즈 데이터들의 모음 이며 전체 데이터를 포함하는 테이블이머 기본적으로 2차원 행렬으로 데이터 로딩시 csv 또는 execel 형태를 처리하게 된다. 시리즈에서는 index와 Value 로 이루어져 있는데 비해 DataFrame 은 index 안에 Value가 여러개로 이루어져 있기 때문에 columns 를 가지고 있는 테이블 형태이다. 따라서 하나의 값을 접근하기 위해서는 인덱스와 column을 모두 알아야 접근이 가능 - DataFrame 생성하기 from pandas import Series,DataFrame import pandas as pd data = {"이름":["홍길동","이순신","강감찬","유관순"], "나이":[10,20,30,40], "몸무..

강의실/머신러닝 2022.05.09 (4)

[딥러닝파이썬] 02-1.파이썬의 Pandas를 다뤄 보자.

Pandas는 파이썬 데이터 처리의 표준인 라이브러리입니다. Pandas는 panel data의 줄임말로 데이터를 전처리 하거나 통계처리시 많이 활용하는 피봇테이블 등의 기능을 사용할때 사용하는 라이브러리로 딥러닝 공부할때 기본적으로 알아 두면 유용합니다. 판다스를 엑셀데이터를 처리하는 도구로 이해하면 간편합니다. pandas 의 특징 고성능 array계산 라이브러리인 numpy와 통합하여 스프레드시트 처리기능을 제공 인덱싱,연산용함수,전처리함수 등을 제공 데이터처리,통계분석을 위해 사용 Series(1차원),DataFrame(2차원) 구조를 가지는 데이터 구조 : 딥러닝쪽에서 엑셀자료와 같이 2차원 자료 처리하는 용도로 많이 사용됨 테이블 데이터 형태의 샘플 살펴보기 열(Column) 을 특성(feat..

강의실/머신러닝 2022.05.03 (9)

[딥러닝파이썬] 01-4.파이썬의 numpy를 다뤄 보자.

넘파이 비교 - all : 조건 모두가 만족하면 true - any : 조건 중 하나라도 만족하면 true import numpy as np a = np.arange(10) print(np.any(a>5)) # 하나라도 만족하면 true print(np.any(a>10)) # 하나라도 만족하면 true print(np.all(a>5)) #모두 만족할때 true print(np.all(ab) import numpy as np a = np.array([1,2,3]) b = np.array([3,2,1]) print( (a>b).any()) #하나라도 커지면 true - logical_and : and 조건 import numpy as np a = np.array([1,2,3]) print( np.logica..

강의실/머신러닝 2022.04.25 (5)

[딥러닝파이썬] 01-3.파이썬의 numpy를 다뤄 보자.

diag - diag : 대각선의 값을 추출 import numpy as np arr=np.arange(1,10).reshape(3,3) print(arr) print(np.diag(arr)) 대각선의 1,5,9 만 추출됨 k 값으로 시작위치를 지정할 수 있음 import numpy as np arr=np.arange(1,10).reshape(3,3) print(arr) print(np.diag(arr,k=1)) random 샘플 - np.random.uniform(low,high,size) : 균등 분포로부터 무작위 표본추출 import numpy as np arr = np.random.uniform(low=0.0, high=10.0, size=10) print(arr) - np.random.norma..

강의실/머신러닝 2022.04.18 (11)

[딥러닝파이썬] 01-2.파이썬의 numpy를 다뤄 보자.

Numpy의 Shape 다루기 Shape를 다루는 것이 중요한 이유는 딥러닝을 실습하게 되면서 딥러닝 라이브러리에서 입력받는 모양의 차원이 각각 틀린데 이때 데이터 형태를 맞춰 주는 것이 중요합니다. Numpy 의 reshape reshape 는 Array의 모양을 변경합니다. (데이터 갯수는 동일함) 예) [[1,2],[3,4]] => [1,2,3,4] (2,2) => (4,) import numpy as np arr = np.array([[1,2],[3,4]],float) print(arr.shape) arr = arr.reshape(4,) print(arr) print(arr.shape) arr = arr.reshape(-1) 위와 같이 reshape 안에 (-1) 값을 넣는 경우 size를 기반으..

강의실/머신러닝 2022.04.08 (8)

[딥러닝파이썬] 01-1.파이썬의 numpy를 다뤄 보자

numpy는 파이썬으로 진행되는 모든 데이터분석과 인공지능 학습에 있어서 가장 필수적으로이해해야 되는 도구입니다. numpy는 Numerical Python 의 약자로 선형대수의 계산식을 파이썬으로 구현할 수 있도록 도와주는 라이브러리입니다. 행렬이해하기 행렬은 연립 일차방정식의 해를 구하기 위해서 연구되었습니다. 예를 들면 다음과 같은 연립 일차방정식을 행렬로 표현해 보면 다음과 같습니다. 이러한 행렬은 파이썬의 코드로 표현해 보면 다음과 같이 표현할 수 있습니다. matrix = [[2,1,-3],[1,-2,1],[3,-4,5]] target = [0,-5,1] 이렇게 리스트 형태로 표현을 할 수가 있습니다. 리스트가 아닌 numpy를 사용해야 되는 이유 matrix = [[2,1,-3],[1,-2,..

강의실/머신러닝 2022.04.01 (10)

[딥러닝파이썬]문자열의 유사성 판단하기

목표 문자열을 처리하는 방법에 대해 이해를 하자. 유사한 데이터를 찾아내는 방법에 대해 이해를 하자. 컴퓨터는 모든 데이터를 숫자로 이해 합니다. 문자를 숫자로 변경 숫자의 유사성 판단 ( 숫자를 벡터화 하여 두 점의 거리를 판단 ) 문자열을 벡터로 만드는 원핫인코딩 - 하나의 단어를 벡터의 인덱스로 인식하여 단어가 존재하면 1 없으면 0 으로 테이블 생성 위와 같이 setosa는 0번 인덱스에 1, 나머지 인덱스는 0 과 같이 숫자로 데이터를 마킹 합니다. Bag of Words(BoW) - 단어의 순서는 무시하고 단어의 출현빈도에 집중하는 텍스트 데이터의 수치화 표현 방법 따라서 문자열을 원핫인코딩 후 해당 단어의 인덱스 위치에 단어의 개수를 세어 주면 된다. 예) "철수는 영화를 보는 것을 좋아한다..

강의실/머신러닝 2022.03.28 (6)

[딥러닝파이썬]선형대수의 벡터와 행렬을 파이썬으로 표현

목표 선형대수의 벡터와 행렬을 파이썬으로 처리하는 방법에 대해 살펴 봅니다. 벡터를 파이썬으로 표현 하는 방법 A 벡터 (1,2), B 벡터 (3,1) 이라면 파이썬에서는 다음과 같이 표현이 가능합니다. 튜플로 표현 리스트로 표현 딕셔너리로 표현 벡터의 합 A 벡터 (1,2), B 벡터 (3,1),C 벡터 (1,3) 에서 A + B + C = (5,6) 벡터의 스칼라곱 A벡터 (1,2,3), B벡터(2,2,2) 에서 (A+B)*3 값 => (3,4,5)*3 = (9,12,15) 행렬을 파이썬으로 표현하는 방법 - 위의 행렬 A,B를 파이썬으로 표현하는 방법 리스트로 표현방법 튜플로 표현방법 딕셔너리로 표현방법 방법은 다양하지만 리스트를 사용해서 파이썬으로 다루는 방법을 살펴 보겠습니다. 행렬의 합 일반적..

강의실/머신러닝 2022.03.22 (13)

[파이썬기초] 파이썬 스타일 코드II

Split 함수 String Type의 값을 나눠서 List 형태로 변환 해 주는 함수 Join 함수 String List를 합쳐 하나의 String으로 반환 해 주는 함수 List comprehensions 이란 리스트를 쉽게 생성하기 위한 방법이다. 기존 리스트를 사용하여 간단히 다른 리스트를 만드는 기법 포괄적인 리스트, 포함되는 리스트라는 의미로 사용됨 파이썬에서 가장 많이 사용되는 기법 중 하나 필터를 이용해서 원하는 조건만 만들 수 있다. split + list Comprehension Enumerate 리스트의 값을 추출할때 함께 인덱스를 추출할 수 있는 방법으로 이용된다. List의 element를 추출할 때 번호를 붙여서 추출 i에는 인덱스 v에는 값 start 를 이용하여 시작 인덱스를..

강의실/머신러닝 2022.03.16 (12)