본문 바로가기

IT Study/Python

[Python] Pandas 03 - Dataframe Pandas에서 가장 많이 사용되는 데이터 구조인 Dataframe에 대해서 좀 더 자세히 알아 보겠습니다. Pandas DataFrame: DataFrame의 구조: DataFrame은 2차원의 테이블 구조를 가지며, 각 열은 서로 다른 유형의 데이터를 포함할 수 있습니다. DataFrame은 열(column)과 행(row)으로 구성됩니다. 각 열은 열 이름을 가지고 있고, 각 행은 인덱스로 식별됩니다. 생성: DataFrame은 주로 Python의 딕셔너리 형태로부터 생성됩니다. 또한 CSV 파일, Excel 파일, 데이터베이스 쿼리 결과 등 다양한 소스에서 데이터를 불러와 DataFrame으로 변환할 수 있습니다. 기능: 데이터 읽기 및 쓰기: 다양한 데이터 형식에서 데이터를 읽고 쓸 수 있습니다... 더보기
[Python] Pandas 02 - 기초 문법 라이브러리 불러오기: Pandas 라이브러리를 사용하기 위해 다음과 같이 불러옵니다: import pandas as pd 데이터 구조 생성: Pandas에서는 Series와 DataFrame이라는 두 가지 주요 데이터 구조를 사용합니다. Series는 1차원 배열로, DataFrame은 2차원 데이터 테이블입니다. Series: 1차원 배열 data = pd.Series([0.25, 0.5, 0.75, 1.0]) DataFrame: 2차원 배열 data = {'Name': ['John', 'Anna', 'Peter', 'Linda'], 'Age': [25, 35, 45, 55]} df = pd.DataFrame(data) 데이터 불러오기: 외부 데이터를 불러올 때는 read_csv(), read_exce.. 더보기
[Python] Pandas 01 - Pandas란? Pandas는 파이썬에서 데이터 조작과 분석을 위한 강력한 라이브러리입니다. 주로 표 형태의 데이터를 다루는 데 사용되며, 데이터를 읽고 쓰고, 정제하고, 변환하고, 집계하는 등 다양한 작업을 지원합니다. Pandas는 NumPy를 기반으로 구현되어 있으며, 데이터를 처리하기 위한 다양한 기능과 도구를 제공합니다. Pandas의 주요 기능과 특징 DataFrame 및 Series: Pandas의 핵심 데이터 구조는 DataFrame과 Series입니다. DataFrame은 엑셀 스프레드시트와 유사한 2차원 데이터 테이블을 나타내며, Series는 1차원 배열을 나타냅니다. 데이터 불러오기 및 저장: Pandas는 다양한 데이터 포맷을 지원하며, CSV, Excel, JSON, SQL, HTML 등 다양한.. 더보기