레슨 3 40분

데이터를 체계적으로 정리하는 법

한국 회사의 복잡한 데이터를 체계적으로 정렬하고 정제하는 기술을 배웁니다.

엑셀을 배웠는데 현실은 충격이에요. 데이터가 정말 엉망이거든요!

한국 회사에서는 몇 년간 쌓인 데이터가 있어요. 영업이 입력한 고객 정보, 마케팅이 다운로드한 리드 데이터, HR이 관리하는 직원 정보… 근데 이게 다 정렬되어 있을까요? 아니에요. 정말 엉망인 경우가 대부분이거든요.

이 강의에서는 엉망인 데이터를 깔끔하게 정리하는 법을 배울 거예요. 이게 없으면 아무리 좋은 함수도 소용없어요.

데이터 문제의 종류들

1. 중복 데이터

한국 회사의 고객 명부를 봤어요. 김철수라는 고객이 15번 나타나 있었어요. 왜? 영업사원마다 따로 고객을 입력했거든요.

만약 이 상태에서 “총 고객 수"를 센다면? 틀린 숫자가 나와요. COUNT 함수가 중복까지 세니까요.

중복을 제거하려면:

엑셀에서:

  • 데이터 탭 → 중복 제거
  • 또는 수동으로 정렬한 후에 눈으로 확인하고 삭제

구글 시트에서:

  • 데이터 탭 → 중복 제거
  • 또는 고급 필터 사용

2. 형식이 다른 데이터

고객 명부를 봤어요:

김철수
Kim Chul Soo
김 철수
김철수

이건 다 같은 사람인데 형식이 다르다고 생각하면 돼요. 또는 전화번호:

010-1234-5678
01012345678
010 1234 5678

전화번호도 마찬가지예요. 이렇게 다르면 데이터를 찾기도 어렵고 분석도 못 해요.

해결책:

  • TRIM 함수로 앞뒤 공백 제거
  • 항상 같은 형식으로 통일
  • 한국 회사는 특히 영문 이름, 한글 이름 혼용하지 말 것

3. 빈 칸(공백)

어떤 고객의 전화번호가 없어요. 어떤 지역 데이터가 비어있어요. 이런 빈 칸들이 분석을 방해해요.

먼저 빈 칸을 찾아봐야 해요:

=COUNTBLANK(A2:A100)  → 빈 칸이 몇 개인지 센다

그 다음에:

  • 그 데이터를 삭제할 건지
  • 채워넣을 건지
  • 특별히 표시할 건지

결정해야 해요.

정렬(Sort) 기능

데이터를 정렬한다는 건, 순서대로 배열한다는 뜻이에요.

단순 정렬

영업 데이터가 있어요. 담당자 이름순으로 정렬하고 싶다면?

  1. 데이터 범위를 선택 (A1:D100)
  2. 데이터 탭 → 정렬
  3. “담당자” 열을 기준으로 선택
  4. 오름차순 또는 내림차순 선택

복합 정렬

더 복잡하게 해볼까요. 한국 회사의 팀별 실적을 본다고 해봐요.

팀     담당자     실적
영업1  김철수     25000
영업1  이영희     30000
영업2  박준호     22000
영업2  최민지     28000

이걸 팀별로, 팀 안에서 실적순으로 정렬하고 싶다면?

  1. 첫 번째 정렬 기준: “팀” (오름차순)
  2. 두 번째 정렬 기준: “실적” (내림차순)

그러면:

팀     담당자     실적
영업1  이영희     30000
영업1  김철수     25000
영업2  최민지     28000
영업2  박준호     22000

이렇게 깔끔하게 정렬돼요. 한눈에 누가 잘하고 있는지 보이죠?

필터(Filter) 기능

필터는 정렬과 달라요. 원본 데이터를 건드리지 않고, 특정 조건에 맞는 행만 보는 거예요.

기본 필터 사용

마케팅팀이 “구글 광고의 데이터만 보고 싶다"고 한다면?

  1. 데이터 범위 선택
  2. 데이터 탭 → 필터
  3. 각 열의 헤더에 작은 화살표가 생겨요
  4. “광고채널” 열의 화살표 클릭
  5. “구글"만 체크하고 다른 건 체크 해제

그러면 구글 광고 행만 보여요. 나머지 데이터는 숨겨져 있는 거지 삭제된 게 아니에요.

필터가 유용한 상황

  • 특정 지역의 고객만 보고 싶을 때
  • 목표를 달성한 직원만 보고 싶을 때
  • 특정 날짜 이후의 데이터만 보고 싶을 때
  • 신규 고객만 추려내고 싶을 때

한국 회사의 보고서는 필터를 많이 써요. 임원진이 “서울 지역의 신규 고객만 보여줄래?“라고 할 때, 필터를 쓰면 1초면 완성이거든요.

실전: 고객 명부 정리하기

한국 IT 회사의 영업팀에서 가져온 고객 명부가 있어요. 엉망이에요.

고객명     전화        지역     직급
Kim Iron  010-1234   Seoul   부장
김철수    01056789   서울    과장
Kim Iron  010-1234   SEO     부장
이영희     010-9999   서울    대리
김철수    010-56789  서울    과장

문제들:

  1. 같은 사람이 여러 번 나타남 (김철수, Kim Iron)
  2. 형식이 다름 (Kim Iron vs 김철수, Seoul vs 서울)
  3. 전화번호 형식이 다름 (010-1234 vs 01056789)
  4. 직급 표기가 다를 수 있음

정리 순서:

1단계: 형식 통일하기

  • 이름: 한글로 통일 (또는 영문으로 통일)
  • 지역: 한글 지역명으로 통일
  • 전화: 010-XXXX-XXXX 형식으로 통일
  • 직급: 정해진 표준에 맞게 통일

2단계: 중복 제거하기

  • 데이터 탭 → 중복 제거
  • 또는 수동으로 확인하고 삭제

3단계: 정렬하기

  • 지역별로 정렬
  • 지역 내에서 직급순으로 정렬

4단계: 필터 적용하기

  • 이제 필요한 데이터만 빠르게 찾을 수 있어요

한국 회사의 데이터 정리 문화

한국에서는 데이터 정리를 정말 중요하게 봐요. 보통:

  • 신입사원: 원시 데이터를 정리하는 일
  • 과장급: 정리된 데이터로 분석하는 일
  • 부장급: 분석 결과를 해석하고 의사결정하는 일

이래요. 만약 당신이 데이터를 잘 정리하면, “저 사람은 꼼꼼하네"라는 평가를 받아요.

팁과 주의사항

원본 보호하기

원본 데이터를 건드리기 전에, 시트를 복사해두세요. Sheet “원본"과 Sheet “작업"으로 나누는 거예요.

실수 되돌리기

Ctrl+Z (또는 Cmd+Z)를 자주 누르세요. 뭔가 잘못되면 바로 실행 취소할 수 있어요.

큰 데이터 작업할 때

만약 데이터가 10만 건이라면? 그럼 필터를 쓰거나, 특정 범위만 선택해서 작업하세요. 한 번에 모든 데이터를 정렬하려다가 컴퓨터가 느려질 수 있어요.

다음으로

이제 데이터가 정렬되고 깔끔해졌어요. 다음 강의에서는 정렬된 데이터를 분석하는 법을 배워요. VLOOKUP이라는 정말 강력한 함수를 쓸 거거든요!

이해도 체크

1. 고객 명부에서 같은 이름의 고객이 여러 번 나타날 때 해야 할 일은?

2. 필터(Filter) 기능을 쓸 때의 장점은?

3. 한국 회사에서 데이터 정렬할 때 가장 먼저 확인해야 할 것은?

모든 문제에 답해야 확인할 수 있어요

먼저 위의 퀴즈를 완료하세요

관련 스킬