본문 바로가기

공부/판다스(Pandas)

(4)
[Pandas] 판다스를 활용하여 데이터 분석 하는 방법 1. 판다스란 무엇인가? 판다스(Pandas)는 Python 프로그래밍 언어를 위한 오픈소스 데이터 분석 라이브러리이다. 이 라이브러리는 구조화된 데이터를 쉽고 직관적으로 작업할 수 있도록 설계되었으며, 데이터 과학 및 분석 분야에서 널리 사용된다. 2. 주요 기능 a. 데이터 구조 Series: 1차원 배열과 같은 데이터 구조로, 단일 데이터 타입의 데이터를 담을 수 있다. DataFrame: 가장 많이 사용되는 2차원 데이터 구조로, 서로 다른 데이터 타입의 열을 포함할 수 있다. b. 데이터 읽기 및 쓰기 다양한 파일 형식(CSV, Excel, JSON 등)의 데이터를 읽고 쓸 수 있다. c. 데이터 처리 데이터 필터링, 정렬, 그룹화 등 다양한 데이터 처리 기능을 제공한다. 누락된 데이터 처리를 ..
[Pandas] 판다스를 이용하여 데이터 불러오기/csv 파일 읽기 판다스를 이용해서 확장자가 csv인 파일을 불러오는 코드를 만들어보겠습니다. 간단한 CSV 파일 만들기 먼저 아래와 같이 아주 간단한 csv 파일 하나를 만들어보겠습니다. 1열은 number, 2열은 values라고 명명해보겠습니다. 이 파일은 아래 첨부를 다운로드 하시면 사용하실 수 있습니다. 판다스를 이용하여 CSV 파일을 데이터프레임으로 불러오기 판다스를 이용하여 csv 파일을 불러오려면 판다스 내의 read_csv를 이용하면 됩니다. 아래 코드가 csv 파일을 불러오는 코드인데 첫 번째 줄은 내가 불러오고 싶은 파일의 이름(경로 포함)을 적어주시면 되고, 두 번째 줄은 열의 이름을 지정해주는 코드입니다. dataset = pd.read_csv('simple.csv', names=['number',..
[Pandas] pip를 이용하여 판다스 설치하기 저는 데이터를 다룰 때 판다스를 자주 사용하게 되는데요. 오늘은 pip를 이용하여 판다스를 설치해보도록 하겠습니다. cmd 창을 열어주시고 아래 코드를 입력하면 판다스가 쉽게 설치됩니다. pip install pandas 판다스가 제대로 설치되었는지 확인해보기 위해서는 판다스 모듈을 불러와서 확인해볼 수 있습니다. import pandas as pd
[이진분류] Pandas를 이용하여 DataFrame 다루는 방법 / 데이터 다운받는 방법 이번 포스팅에서는 pandas를 사용하여 Dataframe을 다루는 방법에 대해서 다루어보려고 합니다. DataFrame은 간단하게 엑셀 시트라고 생각하면 됩니다. 데이터 프레임은 행과 열로 구성되는데, 행(row)은 각 데이터, 열(column)은 속성을 의미합니다. 데이터를 시각화하기 위해서는 먼저 파일을 읽어야 하기때문에 csv 파일을 어떻게 읽는지부터 차근차근 알려드리도록 하겠습니다. 또한 데이터를 읽어들이고 데이터가 어떻게 구성되어 있는지 확인하는데 자주 사용하는 함수들도 알려드리도록 하겠습니다. 그 전에 오늘 포스팅에서 사용할 데이터는 아래 링크를 따라가서 다운 받아주시면 됩니다. 이 데이터는 '신용카드 고객의 채무불이행 가능성 예측(default of credit card clients Da..