처음 보는 데이터에 쫄지 마세요

기획팀에 새로 입사한 김사원. 이제 입사 한 달 차인 김사원은 아직 열심히 배우는 중이라 제대로 된 업무를 맡아본 경험이 없다.

🙋🏻김사원: (나도 엄연한 내 몫의 1인분을 해낼 수 있으면 좋겠는데...)

딩동! 그때 메신저가 하나 도착했다. 최팀장님이 김사원의 생각을 읽기라도 한 듯 업무 하나를 맡긴 것이다.

💁🏻‍♂️최팀장: 김사원, 이번 주에 영업부 회의 있는 거 알지? 영업관리팀에서 지난달 영업실적을 줘야 하는데 아직 정리가 덜 끝났다네. 급한 대로 우리가 뽑아서 써야 할 것 같으니까 오전 중에 데이터 받아서 현황 파악해 봐.

김사원은 새로 주어진 일을 잘 해내고 싶었다. 하지만 설레는 마음도 잠시, 숫자가 빼곡히 채워진 격자형 엑셀 파일을 보니 머리가 빙글 돌고 너무나 당황스럽다.

🙋🏻김사원: (뭘 어떻게 해야 하지? 대체 이 수많은 낱개의 데이터들은 뭘 말하고자 하는 것일까…?)

도륵도륵 눈알만 굴리던 김사원. 누군가의 도움이 절실하던 그때! 옆자리 👩🏻‍💻공과장과 눈이 마주쳤다. 평소 손이 빠르고 일 잘하기로 소문이 자자한 공과장. 김사원은 공과장에게 도움을 요청하기로 마음먹는다.

저자 공여사들

공대 나온 여자 사람. 전자공학을 전공했고, 현재 국내 대기업에 근무 중이다. 감성은 없어도 로직 끝판왕이라 자부하며, 회사에서는 '일잘러+프로 엑셀러'로 통한다. 경제적 자유를 달성하기 위해 시작한 유튜브 <공여사들> 은 직장생활 팁, 직장인 엑셀 영상 등으로 폭발적인 반응을 얻으면서 개설 1년도 채 되지 않아 10만 구독자를 달성했다. 일 잘하고 싶지만 배울 곳 없는 직장인들을 위해 '모두의 랜선 선배', '옆자리 친절한 과장님'이 되기를 자처한다. 저서로는 <눈치껏 못 배웁니다, 일센스>가 있다.

여러분도 김사원처럼 처음 보는 엑셀 파일에 당황한 경험이 있으실 텐데요. 김사원은 어떤 엑셀 파일을 받았길래 그렇게 당황했던 걸까요? 먼저 김사원이 받은 영업관리팀의 엑셀 파일을 확인해보겠습니다.

김사원이 굉장히 당황했을 것 같네요. 생판 다른 부서의 데이터를 처음 보면 당혹스럽기 마련입니다. 게다가 신입사원이라면 다른 부서의 데이터뿐만 아니라 우리 팀의 데이터를 파악하기도 쉽지 않습니다. 가뜩이나 급해 죽겠는데, 행과 열도 너무 많아 보이네요.

 

팀장님께서 요청하신 '현황 파악'을 하려면 이 데이터를 알아보기 쉽게 가공해야 합니다. 여기서 '현황'은 영업팀별 매출 현황이 될 수도 있고, 상품별 판매 순위, 매장별 매출 현황 등이 될 수도 있습니다. 이 중 무엇을 파악하든 다음과 같은 사전작업이 필요합니다.

  • 나중에 표로 가공하기 쉽게 시트 정리하기
  • 데이터 양은 얼마나 되는지 파악하기
  • 필요한 데이터가 모두 있는지, 쓸모 없는 데이터는 없는지 확인하기
  • 나중에 함수를 적용할 수 있도록, 데이터를 숫자 혹은 텍스트로 통일시키기
  • 필터 걸어 정렬하기

이번 아티클에서는 처음 보는 데이터에도 당황하지 않고, 이러한 사전작업을 빠르게 처리할 수 있는 방법을 알려드리도록 하겠습니다.

 

자, 파일을 열어서 살펴볼게요. 하나의 파일에 'data' 시트와 '상품리스트' 시트가 있네요.

이 두 개의 시트 중 우리가 봐야 할 건 더 많은 세부 데이터가 들어 있는 'data' 시트인 것 같습니다. 아직 가공을 하지 않아 원본 그대로 존재하죠. 직장에서는 보통 'raw data'라고 부르는데, 말 그대로 날것의 데이터라는 뜻입니다. 

 

그런데 이 raw data가 항상 우리 입맛에 맞게 주어지는 건 아니에요. 내 식대로, 원하는 데이터를 얻어내기 위해서는 가공하는 작업을 거쳐야 합니다. 생존형 엑셀 1탄에서는 raw data를 본격적으로 가공하기 전에, 처음 보는 데이터를 빠르고 쉽게 파악하는 법을 전수해 드립니다.

 

자, 그럼 정제되지 않은 원본 데이터를 가공하기 위한 첫 단추는 무엇일까요? 1단계부터 차근차근 알아봅시다.

🛎 >엑셀 실습 파일<을 다운받은 후 글을 보며 직접 실습해 보세요!

[1단계] 첫 행에 컬럼명으로 채워주기

raw data를 받았을 때 가장 먼저 해야 할 일은 첫 행에 이상한 데이터가 끼어 있진 않은지 살펴보는 겁니다. 왜냐하면 첫 행에는 무조건 컬럼명이 와야 하기 때문이에요. 첫 행에 컬럼명이 아닌 다른 값을 두게 되면, 앞으로 raw data를 가공하는 데 있어서 난항을 겪게 될 겁니다.

 

영업관리팀에서 받은 파일을 함께 살펴볼까요? 'data' 시트의 첫 행을 봤더니 이상한 값이 들어가 있네요. "Data"라는 값이 별 뜻 없이 채워져 있죠? 이렇게 의미 없는 값이 든 셀이나 비어 있는 행은 삭제해 주세요.

① 비어 있거나 의미 없는 값이 채워져 있는 첫 행을 전체 선택하고

② 오른쪽 버튼 눌러 '삭제'를 선택합니다. 단축키인 'Ctrl+ (-)'키를 눌러도 됩니다.

이렇게 불필요한 행을 삭제해주면 첫 행에 기준년원, 영업팀코드, 영업팀명과 같은 컬럼명이 오는데요. 이렇게 첫 행에 컬럼명이 오면 raw data를 가공하기가 수월해집니다.

 

가령 수식을 입력할 때 첫 행이 병합되어 있으면(ex. A1:J1), 특정 열(ex. C열)을 참조하는 수식을 뜻대로 적용하기가 어렵습니다. 그래서 C열을 선택하지 못하고 C2:C100과 같은 형태로 정확한 범위를 지정해주어야 하죠. 반면, 첫 행에 병합되지 않은 개별 컬럼명이 있으면 열 자체를 단위로 하여 쉽게 범위를 선택할 수 있습니다.

 

또, 엑셀에서 방대한 양의 데이터를 마우스 드래그앤드랍(drag and drop)만으로 보기 좋게 요약/집계해주는 피벗 테이블을 다룰 때는 더 그렇습니다. 피벗 테이블은 요약/집계하고 싶은 대상을 선택하여 만드는데, 이때 행과 열(ex. A2:J100)을 범위로 선택해도 당장은 괜찮습니다.

 

그런데 만일 데이터가 추가로 쌓여서 101행, 102행, 103행까지 점점 늘어난다고 해봅시다. 그러면 매번 피벗 테이블이 참조하는 범위를 A2:J100에서 A2:J101로, 다시 A2:J102로, A2:J103으로 매번 수정해줘야 합니다. 귀찮고 번거롭죠. 그렇다고 A:J로 범위를 선택하게 되면, 피벗 테이블을 만들 수 없다는 에러가 뜹니다. 첫 행에 개별 컬럼명이 들어 있지 않기 때문이에요.

 

즉, 엑셀 업무를 획기적으로 줄여줄 피벗 테이블을 활용하려면 첫 행을 비어 있지 않은 컬럼명으로 채워줘야 합니다.

[첫 행을 제외하고 피벗 테이블을 만드는 경우]

 

① A2에서

② 'Ctrl+Shift+ →'를 눌러 열을 선택하고

③ 'Ctrl+Shift+ ↓' 눌러 행을 선택해

④ A2부터 P40250행까지 범위를 지정합니다.

⑤ 이 상태에서 '삽입' 탭에

⑥ '피벗 테이블'을 클릭하고

⑦ '확인' 버튼을 누르면 피벗 테이블이 완성되죠.

하지만 첫 행에 개별 컬럼명이 위치한다면 더욱 쉽고 간편하게 피벗 테이블을 만들어낼 수 있습니다.

[첫 행에 개별 컬럼명을 위치시킨 후 피벗 테이블을 만드는 경우]

① A열을 선택한 상태에서   

② 'Ctrl+Shift+ →'를 누르면 범위가 P열까지 알아서 지정됩니다.

③ 이제 '삽입' 탭에 

④ '피벗 테이블'을 클릭하고 

⑤ '확인' 버튼을 누르면 됩니다.

훨씬 수월하게 끝났죠? '행과 열'이 아니라 '열 대 열'로 범위를 지정하면 클릭하기도 쉽습니다. 또 앞서 설명한 것처럼 아래쪽에 새로운 데이터가 추가될 때마다 범위를 바꿔줄 필요도 없죠. 열로 범위를 지정했기 때문에 추가된 행(ex. 40251행, 40252행, 40253행, ...)에 이미 들어가 있습니다.

새로운 행은 포함되지 않는 '행과 열' 범위(좌)와 새로운 데이터도 이미 범위에 포함되어 있는 '열 대 열' 범위 설정(우) 

회사 데이터는 보통 새로운 행으로 추가되기 때문에 열 단위로 범위를 지정하면 매번 대상 범위를 고쳐줘야 하는 수고를 덜 수 있습니다. 새로운 행은 이미 범위에 포함되어 있으니까요.

 

피벗 테이블에 대해서는 마지막 단계에서 더 자세히 이야기할 예정이니, 지금은 첫 행을 개별 컬럼명으로 채워주어야 raw data를 가공하기 쉬워진다는 점만 기억하면 됩니다. 앞으로는 습관처럼 첫 행을 컬럼명으로 채워주세요.

[2단계] 마지막 행 보고 데이터 크기 가늠하기

다음 단계는 이 데이터가 몇 행짜리인지 파악하는 건데요. 이미 우리가 앞 단계에서 시험 삼아 피벗 테이블을 만들어 보면서 마지막 행을 얼핏 보긴 했죠? 실제로 업무를 할 땐 1단계에서 첫 행을 채우고 난 다음, 2단계에서 마지막 행을 확인해주게 될 겁니다. (피벗 테이블은 마지막에 다른 방식으로 응용하게 될 테니 잠시 잊어주세요!)

① 우선 최대한 빈값이 없을 만한 A열에서

② 'Ctrl+ ↓'를 눌러 가장 끝으로 이동합니다.

40249행으로 이동했죠? 4만 개가 조금 넘는 데이터네요. 이 사실을 아는 것과 모르는 것은 엑셀 작업을 계획할 때 큰 영향을 줍니다. 예를 들어 20행 미만인 데이터라면 눈과 손으로 세는 게 더 빠를 수 있지만, 이 데이터처럼 만 개 이상일 때는 '가공 작업에 공을 들여야 시간을 획기적으로 단축할 수 있겠구나'라는 사실을 인지하고 작업에 임할 수 있겠죠?

 

그럼 최대한 빈값이 없을 만한 열을 골라야 하는 이유는 무엇일까요? '판매수량'을 보여주는 O열의 경우 'Ctrl+ ↓'를 누르면 중간에서 멈춥니다. 'Ctrl+방향키'를 쓰면 그 방향으로, 데이터가 연달아 채워져 있는 마지막 셀에서 멈추기 때문이죠.

그래서 웬만하면 컬럼명을 눈대중으로 보고 빈 셀이 없을 것만 같은 열을 골라야 합니다. 물론 그래도 비어 있는 값이 있을 수 있는데요. 그럴 때는 당황하지 말고 'Ctrl+ ↓'를 여러 번 눌러주면 끝으로, 끝으로 이동하다가 결국은 마지막 행에 닿을 수 있습니다.

[3단계] 각 열의 성분값 확인하기

데이터의 크기를 확인했다면 'Ctrl+ ↑'를 눌러 첫 행으로 돌아옵니다. 이번에는 각 컬럼마다 어떤 성분을 가지고 있는지 개략적으로 확인해볼 차례인데요. 값이 채워진 첫 번째 셀에서 'Alt+ ↓'를 눌러보면 열마다 어떤 값이 들어 있는지 알 수 있습니다.

① 컬럼명에서

② 'Alt+ ↓'를 누릅니다.

'기준년월' 컬럼에서 'Alt+ ↓'를 누르면 2021년 1월부터 6월까지의 데이터라는 사실을 알 수 있습니다. 4만 개를 다 보여주는 게 아니라, 고유값만 간략하게 표현해줍니다. 아주 편리하죠. 이렇게 간편한데도 이런 습관을 들이지 않은 대부분의 사람들은 첫 화면만 보고 2021년 1월 데이터가 들어 있는 파일이라고 착각을 하게 됩니다. 1초도 안 걸리는 일이니까, 여러분은 꼭 습관 들이시길 바라요!

 

이번엔 '영업팀명' 컬럼도 확인해볼까요?

이 컬럼에서는 우리 회사의 모든 영업팀이 들어가 있는지 금방 알아챌 수 있겠네요. 모든 값을 정확하게 파악한다기보다는 이 데이터가 쓸모 있는 데이터인지, 필요한 데이터가 다 들어 있는지, 일부만 포함된 건 아닌지 개략적으로 알아보는 겁니다. 그래야 시작부터 데이터 기획을 제대로 해나갈 수 있으니까요.

[4단계] 텍스트 나누기로 진짜 숫자 만들기

시스템에서 내려받은 엑셀 시트에는 종종 숫자처럼 보이지만 실제로는 텍스트인 셀이 있어요. 이에 대해 경고를 주기 위해 셀 모퉁이에 녹색 딱지가 붙죠. 그런데 문제는 이런 셀들은 텍스트이기 때문에 덧셈, 뺄셈 같은 계산식에서 정상적으로 작동하지 않아요. 그래서 진짜 숫자로 바꿔주는 작업이 필요합니다. 텍스트끼리 더할 순 없잖아요?

 

이번 단계에서는 녹색 딱지가 붙은 컬럼 중, 숫자로 쓰고 싶은 데이터를 골라 '텍스트 나누기'라는 기능을 사용해 진짜 숫자로 바꿔줄 건데요. 뒤에서 raw data를 요약/집계하기 전에 꼭 거쳐야 하는 과정입니다.

 

녹색 딱지에 마우스 포인터를 가져다 댔더니 "이 셀의 숫자는 텍스트로 서식이 지정되었거나 아포스트로피가 앞에 옵니다"라고 뜨는데요. 우리 눈에는 숫자로 보이지만, 엑셀이 인식하기에는 텍스트라는 뜻입니다. 물론 이 값을 텍스트로 사용한다면 전혀 문제 될 게 없지만, 숫자로 쓰고 싶을 때는 문제가 생깁니다.

숫자로 보이는 '판매가'나 '할인적용가'가 텍스트로 설정되어 있으면 덧셈, 뺄셈, 곱셈, 나눗셈 같은 사칙 연산이 불가능하거든요. 이럴 경우 아래 그림과 같이 '개수'만 하단에 표시됩니다.

그런데 만약 이 값이 숫자로 설정되어 있다면, 아래 그림처럼 합계와 평균값이 나옵니다.

따라서 숫자로 사용하고 싶은 컬럼에 녹색 딱지가 붙어 있다면 데이터 유형을 '텍스트'에서 '숫자'로 바꿔줘야 합니다.

① 숫자로 쓰고 싶은 열을 선택하고 

② '홈' 탭에서 

③ '텍스트' 유형을 선택해    

④ '숫자'로 바꿔주는 겁니다. 

하지만 데이터 형식을 숫자로 바꿨는데도, 여전히 합계가 아니라 개수가 보이네요. 녹색 딱지도 아직 붙어 있고요. 이럴 때는 각 셀에서 'F2키'를 누르고 'Enter'를 쳐주면 됩니다. 그럼 엑셀이 드디어 이 값을 숫자로 인식하면서 자동으로 오른쪽 정렬을 해줍니다.

하지만 이 수많은 셀에서 일일이 'F2+Enter'를 해줄 수는 없잖아요? (행수가 4만 개라는 거, 기억하시죠? ^^;) 이럴 때 써먹을 수 있는 기능이 바로 '텍스트 나누기'입니다. 사실 '텍스트 나누기'는 하나의 컬럼에 들어 있는 값들이 " "(띄어쓰기), "_"(언더바), ","(콤마)와 같은 규칙이 등장할 때, 동일한 규칙으로 텍스트를 쪼개주는 기능입니다.

 

예를 들어 A열에 "서울시 강남구", "서울시 서초구", "서울시 마포구", ...와 같은 값들이 들어 있다고 해봅시다. 이때 " "(띄어쓰기)를 기준으로 텍스트 나누기를 해주면, A열에는 "서울시", "서울시", "서울시", ...가 남고 B열에는 "강남구", "서초구", "마포구", ...가 생겨납니다.

 

뜬금없지만 이 기능을 응용하면, 숫자처럼 보이는 텍스트를 진짜 숫자로 바꿔줄 수 있답니다. (굳이 여기까지 알 필요는 없지만) '텍스트 나누기'에서는 쪼개진 텍스트의 서식을 정해줄 수 있는데, 따로 정해주지 않으면 기본적으로 '일반 서식'이 적용되기 때문이에요. 아래 그림을 보면 '[일반]을 선택하면 숫자 값은 숫자로, 날짜 값은 날짜로, 모든 나머지 값은 텍스트로 변환됩니다'라고 나와 있죠?

다시, 녹색 딱지가 붙은 컬럼 중 숫자로 쓰고 싶은 열을 선택하고,

① '데이터' 탭에서

② '텍스트 나누기'를 누르고  

③ 바로 '마침'을 클릭합니다. 

한 번에 녹색 딱지가 사라지고 오른쪽 정렬이 됐습니다. 개수 대신 평균과 합계가 완벽하게 표시되는 걸 보면 숫자로 설정되어 있다는 걸 알 수 있겠죠? 숫자로 쓰고 싶은 텍스트 컬럼은 이렇게 텍스트 나누기를 활용하면 쉽게 숫자로 바꿔줄 수 있습니다.

이렇게 숫자로 바뀐 후에는 보통 '홈' 탭의 표시 형식을 '쉼표'로 바꿔 설정하는 분들이 많은데, 저는 이 방법을 추천하지 않아요. 쉼표를 적용하면 숫자 맨 끝에 공란이 붙어서 파워포인트 같은 외부 문서에 붙여넣을 때 띄어쓰기 형태로 남아 있어 거추장스럽거든요.

따라서 쉼표 표시 대신, 

① 선택한 열에서 'Ctrl+1'을 눌러

② '표시 형식' 탭의 

③ '사용자 지정'을 클릭하고

④ '#,##0'을 선택해줍니다. 

세 자리씩 끊어 읽게 해주겠다는 뜻인데요. 이 방법을 사용하면 공란 없이 깔끔하게 숫자와 콤마로만 데이터가 표현됩니다. 열을 선택했을 때 나오는 평균과 합계 역시 세 자리로 끊어 읽을 수 있어 숫자를 읽기가 훨씬 수월해집니다. 차이가 보이시죠?

쉼표 형식을 적용했을 때 보이는 공란(좌), #,##0 형식을 적용했을 때 사라진 공란(우)

녹색 딱지가 붙은 컬럼 중에는 '상품코드'도 있는데요. 기억하실지 모르겠지만, 이 '상품코드'는 '상품리스트 시트'에도 있었습니다. 

녹색 딱지가 붙은 메인 시트의 상품코드(좌)와 녹색 딱지가 없는 상품리스트 시트의 상품코드(우) 

이렇게 서로 다른 테이블에서 양쪽에 동일하게 들어 있는 값(Key 값)을 기준으로 그 값에 맞는 다른 값을 불러올 때 쓰는 기능이 브이룩업(VLOOKUP) 함수입니다.

 

'data' 시트에는 '판매가격'이 들어 있지 않지만, '상품리스트' 시트에는 '판매가격'이 들어 있어요. 그런데 '상품리스트' 시트를 얼핏 봐도 '상품코드'와 '상품명'마다 '판매가격'이 정해져 있다는 걸 알 수 있죠. 그러면 우리는 양쪽에 동일하게 들어 있는 '상품리스트' 시트의 '판매가격'을 '상품코드'를 기준으로 'data' 시트로 불러다가 쓰면 되는 겁니다. 

 

이게 바로 VLOOKUP이에요. 여기저기 흩어져 있는 데이터를 한데 모아놓고 써야 하는 직장인에게는 뗄레야 뗄 수 없는 기능입니다. (VLOOKUP이 궁금하신 분들은 2탄에서 만나요!)

 

브이룩업 함수를 사용하려면 비교할 두 개의 키 값의 형식이 완벽하게 일치해야 하는데요. 메인 시트의 상품코드에는 녹색 딱지가 붙어 있지만, 상품리스트 시트의 상품코드에는 녹색 딱지가 붙어 있지 않죠? 즉, 두 개의 데이터 형식이 서로 다를 수 있다는 겁니다. 

 

앞서 엑셀에서 숫자처럼 보이는데 사실은 텍스트 형식이라고 경고를 줬던 것처럼, 데이터 형식이 다르면 엑셀은 다른 값으로 인식합니다. 이렇게 키 값이 일치하지 않는 상태에서는 브이룩업 함수를 사용할 수 없답니다.

 

브이룩업 함수처럼 키 값으로 사용할 데이터는 형식을 동일하게 만들어줘야 해요. 형식은 어느 쪽으로 맞춰줘도 상관없지만, 우리는 '텍스트 나누기'라고 하는 강력한 기능을 알고 있죠? 클릭 한 방이면 숫자 형식으로 쉽게 통일시킬 수 있으니, 숫자로 맞춰줍시다.

 

만약 브이룩업 함수를 적용하기 위해 숫자로 변경했던 컬럼을 다시 녹색 딱지가 붙은 텍스트 컬럼으로 바꿔야 한다면, ("나는 꼭 텍스트로 사용할 거야!"라고 한다면)

① '데이터' 탭에서

② '텍스트 나누기'를 누르고

③ 맨 아래쪽의 '다음'을 두 번 클릭해서

④ 열 데이터 서식을 '텍스트'로 설정하면 됩니다.

그러면 해당 열의 컬럼에 다시 녹색 딱지가 붙는데요. 숫자처럼 보이지만, 텍스트로 돌아왔다는 뜻입니다. 브이룩업 함수는 생존형 엑셀 2탄에서 더 자세히 다룰 예정이니, 오늘은 브이룩업 함수 적용을 위해서는 비교할 키 값의 유형이 일치해야 한다는 점만 기억해주세요.

[5단계] 필터 걸고 데이터 정렬하기

자, 다음은 필터를 걸어주는 단계입니다. 아무 데이터에서나 'Ctrl+Shift+L'을 눌러주면 필터 기능이 적용됩니다. 각 컬럼의 최상단에 드롭 다운을 내릴 수 있는 역삼각형 모양의 필터가 생겨나죠. 아래와 같이 필터를 적용했다면 데이터를 보기 좋게 정렬해 봅시다. (데이터를 정렬해놓고 보면 어떤 새로운 인사이트를 얻게 될지 몰라요!)

그런데 정렬을 마구 해주게 되면, 원본 순서로 되돌리기가 어려워집니다. 물론 원본 순서가 그대로 필요한 경우는 드물지만, 그럼에도 불구하고 가끔, 이미 정렬을 여러 번 적용했는데 원본 데이터의 순서가 필요할 때가 있어요. 그럴 때를 대비하고 싶다면,

① 첫 번째 열에서 오른쪽 버튼을 눌러 '삽입'을 선택합니다.

② 컬럼명에 '순번'을 입력하고

③ 첫 번째 셀에 1을 넣은 뒤, 커서를 셀 모서리에 대고 십자 모양이 됐을 때 더블 클릭해줍니다.

④ 그러면 숫자 1이 쭉 뜨는데요. 이때 맨 아래 자동 채우기 속성을 '연속 데이터 채우기'로 바꿔주면 맨 아래 셀까지 순서대로 번호가 매겨집니다.

원본 데이터의 순서를 기억하기 위한 보조 장치가 설치됐으니, 다시 'Ctrl+Shift+L'을 눌러 데이터를 보기 쉽게 정렬해보겠습니다.

 

예를 들어, 상단에는 떡볶이만 보이는데, '창동점에서 과연 떡볶이만 팔렸을까?' 하는 궁금증이 생길 수 있어요. 이럴 땐 매장명 순으로 정렬만 해줘도, 동일한 값끼리 뭉쳐 있으니까 하나의 매장에 여러 상품이 팔렸다는 걸 한눈에 알 수 있죠.

이렇게 정렬해주면 가락점에서 어떤 제품들을 팔았고, 각각의 실적은 어땠는지도 확인할 수 있겠죠. 이 상태에서 '영업팀' 항목도 정렬해주면 두 항목이 동시에 정렬되면서 영업팀별 매장과 실적을 이름순으로 볼 수 있습니다.

[6단계] 피벗 테이블로 요약/집계하기

 

마지막 단계는 피벗 테이블이라는 끝내주는 도구를 활용해 순식간에 방대한 양의 데이터를 자그마한 표 하나짜리로 요약/집계해보는 겁니다. (물론 생존형 엑셀 1탄의 목적은 상사에게 가져갈 보고양식을 만드는 게 아니라, 처음 보는 데이터를 순식간에 '간략히' 파악하는 것이에요. 말 그대로 '대충' 확인하는 단계니까 진짜 피벗 테이블을 알고 싶다면 3탄에서 다시 만나요!)

 

앞에서 잠깐 설명했지만, 피벗 테이블을 만들 때는 첫 번째 열을 선택한 상태에서 'Ctrl+Shift+ →'를 눌러 열 단위로 범위를 지정한 후,

① '삽입' 탭에

② '피벗 테이블'을 클릭하고

③ '새 워크시트'를 체크한 후,

④ '확인'을 눌러줍니다.

이렇게 피벗 테이블이 생성됐는데요. 피벗 테이블에 대해서는 생존형 엑셀 3탄에서 제대로 배워보고, 오늘은 '피벗 테이블이라는 기능을 이런 식으로도 활용할 수 있구나!' 하는 관점에서 들여다봐주세요.

 

우선, 새로 만들어진 시트의 오른쪽 상단을 보면 '피벗 테이블 필드'가 있죠? 자, 이제 묻지도 따지지도 말고 따라해주세요! 순식간에 데이터를 파악하기 위해, 틀려도 좋으니 습관적으로 이렇게 해주세요.

 

먼저 '매장명'처럼 텍스트로 된 컬럼은 오른쪽 하단에 '행'이나 '열' 영역에 드래그해서 넣어주세요. 그다음 합계나 평균처럼 숫자로 집계하고 싶은 컬럼은 맨 마지막 '값' 영역에 마찬가지로 드래그해서 넣어주세요.

만약 저라면, 가장 먼저 '기준년월' 컬럼을 '열' 영역에 놓을 것 같아요. 1년짜리 데이터인지, 지난달 실적만 들어 있는 데이터인지 궁금하거든요. 그러려면,

① 피벗 테이블 필드에서 '기준년월'을 드래그해, 

② 아래 '열' 영역에 놓습니다. 

이때 나오는 '(비어 있음)'은 새로운 행의 데이터가 자동으로 추가되도록 열 단위로 범위를 지정했기 때문에 등장하는 항목인데요. 그대로 두셔도 데이터를 파악하는 데는 문제 될 게 없으니 그냥 넘어가셔도 괜찮습니다.

 

자, 이번에는 모든 영업팀의 실적이 포함된 데이터인지 궁금한데요. 만약 영업팀 중 일부 팀의 실적이 빠져있다면 해당 데이터를 어디선가 찾아다가 억지로 추가해줘야겠죠? 어떤 영업팀들이 들어가 있나 확인하기 위해 동일한 방법으로 우측 상단의 '영업팀명'을 끌어다 '행' 영역에 갖다놔주세요.

행 레이블에 영업팀 명이 모였죠? 모든 영업팀이 포함된 완전한 데이터임을 확인했습니다. 이번에는 여기에 '지역구' 데이터를 추가해볼게요.  

영업팀마다 지역구 하나가 포함된 걸 보니 팀에서 담당하는 구가 하나로 정해져 있는 것 같죠? 이번에는 '매장위치'를 지역구 항목 아래에 추가해보겠습니다. 지역구에 해당하는 매장 위치가 펼쳐질 거라 예상했는데, 이상하게 강북구에 노원구 매장이 포함되어 있네요? (물론 지금은 눈치 못 채도 상관없습니다. 나중에 본격적으로 데이터를 가공하다 보면 뭔가 틀렸다는 걸 자연히 알게 될 거예요.)

데이터가 뭔가 잘못되었다는 게 감지됐을 때는 다시 Raw 데이터 시트로 돌아가 확인해봅니다. 중요한 문제가 아니라면 넘어가고요.

 

이 경우는 확인해보니 매장 위치와 지역구가 매칭되지 않네요. 잘못 가져온 정보일 수도 있고, 다른 의미의 지역구일 수도 있지만, 적어도 매장 위치에 대한 지역구 정보는 아니라는 건 알 수 있겠네요. '지역구'와 '매장 위치' 항목은 빼는 게 좋겠습니다.

 

자, 이번에는 숫자 데이터를 활용해보겠습니다. 예를 들어, 영업팀별 총 판매수량이 알고 싶다면 '판매수량'을 맨 아래 '값' 영역에 두는 거예요. 그럼 '판매수량'이 '숫자 형식'의 컬럼이기 때문에 합계가 자동으로 집계됩니다. (숫자는 기본적으로 합계로 잡힙니다. 텍스트는 개수로 먼저 잡히고요.)

여기서 상품별 판매수량을 알고 싶다면 '상품명' 항목을 끌어서 '행' 영역의 '영업팀명' 아래에 놓아주면 됩니다. 그러면 고구마튀김, 국물떡볶이 등 각 상품의 판매수량 합계가 월별로 뿌려집니다.

이때 '판매금액'도 '값' 영역에 넣어주면 1월 특정 메뉴의 판매수량과 판매금액 합계를 파악할 수 있습니다. 각 상품의 월별 판매수량과 판매금액 합계를 쉽게 확인할 수 있죠.

여기서 판매수량의 합계가 아닌 개수를 보고 싶다면, 값 영역 '합계:판매수량'을 클릭해 '값 필드 설정'을 통해 '합계'를 '개수'나 '최대' 또는 '최소'로 바꿀 수 있습니다. 그러면 판매 가격 중 가장 비싼 게 어떤 것인지도 알 수 있겠죠? (물론 안 궁금할 수 있어요. ^^)

만약 월별 구분이 필요하지 않다면 '기준년월' 항목을 빼주면 됩니다. 반대로 특정한 달의 판매 실적만 보고 싶을 때는,

① '기준년월' 항목을

② '필터' 영역에 두고

③ 생성된 필터 중에서

④ 원하는 달을 선택합니다.

그러면 가장 최근인 6월의 판매수량 합계와 판매금액 합계를 상품명별로, 영업팀별로 볼 수 있게 됩니다. 앞서 팀장님이 지시한 '지난달 영업 실적 현황 파악'은 이 데이터만 있으면 충분할 것 같죠? 맞든 틀리든, 적어도 '6월'의 '영업팀별', '판매실적' 데이터가 다 갖춰져 있으니까요!

이제부터는 디테일이 필요한 때입니다. 앞에서 '지역구' 정보와 '매장 위치' 정보 사이에 문제가 있음을 파악했던 것처럼 틀린 데이터는 없는지 하나씩 뜯어보면서 정밀하게 데이터를 분석해나가면 됩니다.

 

설명이 길었지만, 지금까지 말씀드린 6단계가 3분이면 가능합니다. 연습해볼 수 있는 파일이 상단에 주어져 있으니, 겁먹지 말고 시도해보세요! 이제는 처음 보는 데이터도 3분이면 파악할 수 있겠죠? 다음 주에 발행될 생존형 엑셀 2탄에서는 오늘 짧게 설명하고 넘어간 브이룩업 함수를 배워볼 텐데요. 10년 짬바 👩🏻‍💻공과장이 브이룩업 없이는 일을 못 하는 이유가 공개됩니다!

🛎>실습 풀이 파일<을 다운받아 배운 내용을 확인해 보세요!

[요약] 처음 보는 데이터 3분 만에 파악하기

  • [1단계] 첫 행을 컬럼명으로 채워주기: 첫 행에는 컬럼명이 오도록 가공합니다.
  • [2단계] 마지막 행 보고 데이터 크기 가늠하기: 빈값이 없을 만한 열에서 Ctrl+ ↓를 눌러 몇 행짜리 데이터인지 파악합니다.
  • [3단계] 각 열의 성분값 확인하기: 컬럼마다 'Alt+ ↓'를 눌러 어떤 값으로 구성되어 있는지 파악합니다.
  • [4단계] '텍스트 나누기'로 진짜 숫자 만들기: 녹색 딱지가 붙은 컬럼 중 숫자로 쓰고 싶은 데이터는 텍스트 나누기를 통해 숫자로 바꿔줍니다.
  • [5단계] 필터 걸고 데이터 정렬하기: 'Ctrl+Shift+L'로 필터를 걸어서 데이터가 눈에 잘 들어오도록 정렬해줍니다. 원본 순서가 필요할 때를 대비해 첫 번째 열에 순번을 넣어줍니다.
  • [6단계] 피벗 테이블로 요약/집계하기: 열 대 열로 범위를 선택해, 피벗 테이블을 만들어줍니다. 텍스트 데이터는 행이나 열 영역에 놓아 고유값을 펼쳐주고, 숫자 데이터는 값 영역에 배치해 합계 또는 개수를 집계해줍니다.

[안내]

아래와 같이 스크롤을 내려 '알림 받기' 버튼을 누르면 앞으로 해당 시리즈의 새 콘텐츠가 발행됐을 때 알림을 받으실 수 있습니다! 독자 여러분을 위해 만든 맞춤형 콘텐츠를 놓치지 마세요!