pandas concat 예제

방금 살펴본 간단한 예제에서는 주로 DataFrame을 공유 열 이름과 연결했습니다. 실제로 다른 소스의 데이터에는 서로 다른 열 이름 집합이 있을 수 있으며 pd.concat는 이 경우 몇 가지 옵션을 제공합니다. 공통의 일부(전부는 아님) 열이 있는 다음 두 DataFrame의 결합을 고려하십시오. 이러한 조인뒤에 있는 논리는 테이블을 조인할 때 SQL에 있는 것과 매우 동일합니다. 동일한 길이의 행이나 열을 추가해야 하는 간단한 작업의 경우 pd.concat() 함수가 완벽합니다. 우리가해야 할 일은 우리가 그들을 연결하고자하는 순서대로 DataFrame 개체의 목록을 전달하는 것입니다. concat() 함수(주 팬더 네임스페이스)는 다른 축에서 인덱스의 선택적 집합 논리(있는 경우)를 수행하는 동안 축을 따라 연결 작업을 수행하는 데 드는 모든 작업을 수행합니다. 시리즈에 대한 연결 축이 하나만 있기 때문에 “있는 경우”라고 말합니다. 직접 배열 연결은 매우 일반적이기 때문에 시리즈 및 DataFrame 개체에는 더 적은 키 입력으로 동일한 작업을 수행할 수 있는 추가 메서드가 있습니다. 예를 들어 pd.concat([df1, df2])을 호출하는 대신 df1.append(df2)를 호출하기만 하면 됩니다. 두 DataFrames는 동일한 엔터티에 대한 서로 다른 종류의 정보를 보유할 수 있으며 일부 공통 기능/열로 연결될 수 있습니다.

이러한 DataFrames를 조인하기 위해 팬더는 concat(), 병합() , join() 등과 같은 여러 기능을 제공합니다. 이 섹션에서는 팬더의 merge() 함수를 사용하는 연습을 합니다. 결과 데이터 프레임은 두 데이터 프레임의 열 수합계와 동일한 행 수nRow 및 열 수를 갖습니다. othe 단어에서 이것은 두 데이터 프레임의 블라인드 컬럼 연결입니다. SQL과 같은 관계형 데이터베이스에서 조인을 수행한 경험이 있는 경우 팬더에 고성능 메모리 병합 및 조인 옵션이 있다는 좋은 소식이 있습니다. 매우 큰 DataFrame을 결합해야 하는 경우 조인은 이러한 작업을 신속하게 수행할 수 있는 강력한 방법입니다. concat을 호출하고 param 축=1을 전달하여 열을 연결합니다: 열을 따라 DataFrame을 연결하려면 축 매개변수를 1로 지정할 수 있습니다. 기본적으로 how=`inner`이 있기 때문에 왼쪽과 오른쪽에 나타나는 키만 존재합니다(교차점).

우리가 함께 일한 기술에 대한 자세한 내용은 팬더 병합, 가입 및 연결 가이드를 살펴보십시오. 또한 연결 축에 계층 적 인덱싱 레이어를 추가할 수 있습니다.이 레이블이 통과된 축 번호에서 동일하거나 겹치는 경우 유용할 수 있습니다. ignore_index – 부울, 기본 거짓.

Spread the love