2021. 8. 20. 10:17
판다스 데이터 프레임 각 셀 별 갯수 구하기, pandas cell length in dataframe Programming/Python2021. 8. 20. 10:17
728x90
반응형
데이터 프레임을 자주 사용하다 보면
각 셀별로 데이터의 길이를 구해서 판단을 해야 하는 경우도 발생하게 된다.
예를 들어 아래와 같은 전화번호 컬럼이 있다고 가정해보자.
import pandas as pd
data = [['John', 45, '010-1234-4589'],['Will', 20, '02-1234-1324'],['Ai', 13, '123']]
df = pd.DataFrame(data,columns=['Name','Age', 'Telephone'])
df
다양한 방법들이 존재하겠지만,
전화번호 영역에 다른 이상한 것이 끼어있다면 아래와 같이 len( ) 함수를 이용해서 간단하게 처리 할 수 있다.
df['Telephone'].apply(len)
len 함수를 사용하게 되면 각 row 별로 리턴해준다.
아래와 같이 조건에 맞게 설정한뒤 다시 데이터프레임으로 저장하면 쓸데없는 값을 쉽게 해결할 수 있다.
df = df[df['Telephone'].apply(len) >= 12]
df
간단하지만 많은 부분에서 사용할 수 있을 것라고 생각해본다.
728x90
반응형
'Programming > Python' 카테고리의 다른 글
키움 API 실시간 데이터 받은 후 체결창 데이터 시각화 해보기 (0) | 2021.09.11 |
---|---|
파이썬 캘린더 다음달 출력, calendar next month (1) | 2021.09.07 |
BeautifulSoup을 이용한 태그의 특정 텍스트, 속성 값 불러오기 (0) | 2021.08.05 |
파이썬 requests로 크롤링 안될 때 해볼 수 있는 방법 (0) | 2021.08.04 |
파이썬 스케쥴(일정) 라이브러리 Schedule (0) | 2021.08.04 |