티스토리 뷰
0. 지난 포스트
https://dataleader.tistory.com/24
1. 판다스의 기본 데이터 프레임 만들기(dataframe생성하기)
판다스는 데이터프레임을 조작하기 위한 모듈입니다. 그렇다면 먼저 데이터 프레임은 어떻게 만드는 것일까요?
[데이터프레임을 만다는 방법]
1) "컬러명을 명명한다"
2) 아이템들을 작성한다
3) pandas.Dataframe으로 데이터 프레임을 작성한다.
여기서 컬럼명(column)은 '이름'이 됩니다. 그리고 아이템(item)은 '홍길동', '세종대왕', '이순신'이 됩니다.
import pandas
#여기서 반드시 [] 브라켓 처리를 해 주어야 합니다.
#마지막은 {} 브레이스로 마무리
data ={'이름':['홍길동', '세종대왕', '이순신']}
myDataframe = pandas.Dataframe(data)
print(myDataframe)
import pandas
#여기서 반드시 [] 브라켓 처리를 해 주어야 합니다.
#마지막은 {} 브레이스로 마무리
data ={'이름':['홍길동', '세종대왕', '이순신'],
'나이':['20', '30', '40']}
myDataframe = pandas.DataFrame(data)
print(myDataframe)
2. 판다스의 기본 데이터 프레임(dataframe) 인덱싱(Indexing)
그렇다면 데이트프레임에서 인덱싱을 하는 방법에 대해서 살펴보겠습니다.[인덱싱이란?] 인덱싱은 데이터 구조에서 개별 요소에 접근하기 위해서 사용되는 번호나 위치를 나타냅니다.
데이터프레임의 인덱싱은 크게 두 가지 방식으로 구분하여 인덱싱할 수 있습니다. 하나는 위치기반 인덱싱이라하고 다른 하나는 라벨기반의 인덱싱이라고 합니다. 데이트프레임이 생성되면 기본적으로 생성되는 것으로 한줄 한줄에 인덱싱 숫자가 부여되는 것을 의미합니다.
위치기반 인덱싱 iloc는 행과 열을 0부터 시작하는 정수 인덱스를 사용하여 접근하는 방법입니다.
import pandas
data ={'이름':['홍길동', '세종대왕', '이순신'],
'나이':['20', '30', '40']}
myDataframe = pandas.DataFrame(data)
print(myDataframe.iloc[1]) #첫 번째 행에 접근하는 방법
print(myDataframe.iloc[:,0]) # 두번째 열에 접근하는 방법
다음은 라벨기반의 인덱싱에 대해서 알아보겠습니다.
라벨기반 인덱싱은 데이터프레임의 행과 열을 지정된 라벨을 사용하여 접근하는 방식입니다. 라벨인덱싱과 위치기반의 인덱싱의 가장 큰 차이점은 라벨 인덱싱을 사용할 경우, 조건형 검색이 가능하다는 점이고, set_index()를 통해서 사용자 인덱스를 적용할 경우도, 라벨인덱싱을 사용해야만 한다는 점이 가장 큰 차이점 입니다.
다만 이번 포스트에서는 간단한 사용법만 익히고 loc와 iloc, 그리고 set_index 등 좀 더 세부적으로 다시 다루도록 하겠습니다.
import pandas
data ={'이름':['홍길동', '세종대왕', '이순신'],
'나이':['20', '30', '40']}
myDataframe = pandas.DataFrame(data)
print(myDataframe.loc[0])
print(myDataframe.loc[:,'이름'])
3. 데이터프레임을 리스트/튜플로 만드는 방법
마지막으로 데이터프레임을 리스트와 튜플로 변환하는 방법에 대해서 알아보겠습니다. 리스트와 튜플의 차이점을 아래와 같습니다.
아래의 코드는 리스트를 만들기 위해 values.to_list()를, 튜플로 만들기 위해서는 to_record()를 이용합니다
import pandas
data ={'이름':['홍길동', '세종대왕', '이순신'],
'나이':['20', '30', '40']}
myDataframe = pandas.DataFrame(data)
#리스트로 만드는 방법
myDataframe.values.tolist()
#튜플로 만드는 방법
myDataframe.to_records()
4. 맺은말
이번 포스트에서는 데이터프레임(dataframe)의 아주 기초적인 부분을 다뤄보았습니다. 데이터프레임은 많은 기능을 담고 있습니다. 하나에 포스트에 담기는 무척 어렵습니다. 더 많은 내용을 연재를 통해 다뤄보도록 하겠습니다. 많은 관심 부탁드립니다.
'파이썬 기초' 카테고리의 다른 글
[파이썬(Python) 이야기 14화] jar 파일 압축/해제 하는 방법 (0) | 2023.08.14 |
---|---|
[파이썬(Python) 이야기 12화] SQLlite에 SQL쿼리 실행하기 (1) | 2023.06.18 |
[파이썬(python) 이야기 11화] 파이썬도 코드 작성 규칙, PEP STYLE GUID(PEP8), 코드 제대로(전문가처럼) 만들기 (2) | 2023.05.16 |
[파이썬(Python) 이야기 10화] 폴더 파일 정보 검색하는 방법(glob.glob) (1) | 2023.05.08 |
[파이썬(Python) 이야기 9화] SQLite 연결하고 데이터 프레임으로 읽기(Pandas) (1) | 2023.05.08 |
- Total
- Today
- Yesterday
- excel create
- Excel
- 포스트그리
- pythostudy
- 파이참
- SQLite
- 검색엔진
- 엑셀
- 프로세스통신
- 판다스
- pip 의존성
- elastic
- PowerQuery
- pycharm
- 버전다름
- Reforme Code
- 폴더
- excutemany
- pandas
- fetchmany
- 파이썬
- fetchall
- 패키지설치하기
- 엘라스틱
- glob.glob
- 판단스
- python 공부하기
- 파워쿼리
- PYTHON
- 엑셀생성
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |