1-1. 넘파이
import numpy as np
#1
a = np.arange(6)
#2
a2 = a[np.newaxis, :]
#3
a2.shape
#4
a = np.array([1, 2, 3, 4, 5, 6])
#5
print(a[0])
#6
a = np.arange(6)
b = a.reshape(3, 2)
#7
c = np.expand_dims(a, axis=0)
#8
data = np.array([1, 2, 3])
data[-2:]
#9
a = np.array([[1 , 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
print(a[a < 5])
#10
a1 = np.array([[1, 1],[2, 2]])
a2 = np.array([[3, 3],[4, 4]])
np.vstack((a1, a2))
1-2. 판다스
#1
import pandas as pd
#2
s = pd.Series([1, 3, 5, np.nan, 6, 8])
#3
dates = pd.date_range('20130101', periods=6)
#4
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
#5
df2 = pd.DataFrame({'A': 1.,'B': pd.Timestamp('20130102'),'C': pd.Series(1, index=list(range(4)), dtype='float32'),'D': np.array([3] * 4, dtype='int32'),'E': pd.Categorical(["test", "train", "test", "train"]),'F': 'foo'})
df2.dtypes
#6
df.head()
#7
df.tail(3)
#8
df.index
#9
df.columns
#10
df.to_numpy()
df
2. 다음과 같은 numpy 개체 mylist를 만드는 프로그램을 작성하시요. 1차원 개체를 먼저 만든 다음 2차원 개체로 변형한다. 행은 spyder 에서 실행하여 결과를 제출한다.
import numpy as np
mylist=np.array(range(2,11))
mylist
mylist=mylist.reshape(3,3)
print(mylist)
3. 다음과 같은 numpy 개체 mylist를 만드는 프로그램을 작성하시요. 2차원 개체를 먼저 만든 다음 2차원 개체 값을 설정한다. 실행은 spyder 에서 실행하여 결과를 제출한다.
import numpy as np
mylist=np.zeros((5,5))
mylist
mylist=mylist+np.arange(5)
4. 다음과 같은 pandas dataframe df를 만드는 프로그램을 작성하시오. 실행은 spyder 에서 실행하여 결과를 제출한다.
import pandas as pd
import numpy as np
exam_data = {'name': ['Anastasia', 'Dima', 'Katherine', 'James', 'Emily', 'Michael', 'Matthew', 'Laura','Kevin', 'Jonas'],'score': [12.5, 9, 16.5, np.nan, 9, 20, 14.5, np.nan, 8, 19],'attempts': [1, 3, 2, 3, 2, 3, 1, 1, 2, 1],'qualify': ['yes', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'no', 'yes']}
labels = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
my_df=pd.DataFrame(exam_data,labels)
my_df
5. 다음과 같은 pandas dataframe df를 만드는 프로그램을 작성하시요. 데이터는 파일에서 읽으며(employee.xlsx), 읽은 후 emp_id가 102 이상인 행을 다시 파일로 저장한다( employeeout.xlsx). employee.xlsx 파일
import pandas as pd
import os
os.getcwd()
os.chdir('C:/Users/백지연/Desktop/school/빅데이터/bigdata-week4-master')
df=pd.read_excel('employee.xlsx',sheet_name='Sheet1')
print(df)
df_102=df[df['emp_id']>=102]
print(df_102)
df_102.to_excel('employeeout.xlsx')
'Dev > 인공지능' 카테고리의 다른 글
#10월 일상&프로젝트 (0) | 2020.10.20 |
---|---|
[파이썬] 웹페이지 가장 많이 사용되는 단어의 빈도 (0) | 2020.04.13 |
데이터를 알아가는 단계-모양, 색깔, 생각 (0) | 2020.04.01 |
[헬로 데이터과학] 엑셀로 데이터 과학 맛보기-자동차 데이터 수집, 모양, 색깔 (0) | 2020.04.01 |
손가락 개수를 이용한 가위바위보 놀이ConvexHull, ConvexityDefect (8) | 2019.05.12 |