코드스테이츠 PMB 부트캠프 6주 차 회고 (데이터 분석)

2021. 11. 14. 10:50PM 성장 스토리/Story

출처 - 나무위키

데이터 분석

 

코드스테이츠 6주 차가 끝났다. 글을 쓰는 현시점 기준으로 부트캠프 반 이상이 지났다. 시간이 정말 빠르게 가서 무서울 정도다. 

 

6주 차에는 가장 관심있었던 '데이터 분석'을 학습했다. PM은 모든 기획과 사고를 '데이터 기반'으로 해야 된다는 이야기를 정말 많이 들었기에 더욱 관심이 갔다. 자신의 직감이나 사견(私見)으로 고객을 이해하고 추측한다면 틀릴 가능성이 매우 높다는 것이다. 그렇다면 데이터 분석을 어떻게 해야 하고 어떤 방법으로 해야 하는 것인가?  

 

본인은 처음 6주 차에서 '데이터 분석'을 학습하다고 했을 때 데이터 분석을 위한 툴 사용 방법이나 스킬셋을 배울 수 있다고 생각했다. 예전부터 데이터 분석을 개인적으로 공부해 오면서 다양한 툴이 존재한다는 것을 알고 있었고 더욱 자세히 배워볼 수 있는 기회가 될 거라고 생각했다. 

 

I AM A Product Manager

데이터 분석이라 하면 SQL, Google Analytics, Amplitude, 관계형 데이터 베이스 등 다양한 키워드가 떠오른다. 그럼 PM이라면 앞서 언급한 모든 툴을 사용할 줄 알아야 하고 데이터 분석가처럼 데이터를 직접 뽑아서 분석할 줄 알아야 할까? 본인은 6주 차를 시작하기 전에는 모든 툴을 사용할 줄 알아야 하고 분석도 척척할 수 있는 사람이 돼야 한다고 생각했다. 

 

하지만 6주 차를 시작하고 학습, 데일리 과제를 하면서 느낀 점은 과연 코드스테이츠가 나에게 원하는 역량이 이게 맞는 건가?라는 생각이 들었다. 나는 데이터 분석 툴을 보다 전문적으로 다루고 마치 데이터 분석가처럼 수많은 데이터 속에서 업무 하는 나를 상상했지만 코드스테이츠가 원하는 모습은 분석가가 아니었다. 코드스테이츠 PMB는 말 그대로 프로덕트 매니저를 키우기 위한 부트캠프다. 우리는 PM이고, PM은 데이터 분석가가 아니기에 데이터 툴을 다루는 능력이 아닌, 데이터를 볼 줄 아는 능력이 필요했다. 코드스테이츠가 6주 차 과제를 통해 우리가 얻고자 했던 것은 '데이터를 보고 인사이트를 도출하는 방법'이었던 것이다. 

 

지금도 본인처럼 PM을 희망하는 수많은 예비 기획자들이나 취준생들이 단골로 질문하는 것 중 하나가 'PM은 무슨 데이터 분석 툴을 다뤄야 하나요?"라는 것이 정말 많다. 물론 본인도 자주 질문했었고 궁금했었다. 하지만 내가 코드스테이츠를 통해 깨달은 것은 분석 툴 사용 능력은 있으면 정말 좋지만, 분석 툴 사용 능력이 PM으로서 본질을 채워주지는 않는다는 것이다. 우리는 PM이기에 먼저 데이터를 볼 줄 아는 능력에 집중해야 한다. 데이터 분석 도구를 사용해서 얻고자 하는 '목적'을 잊어서 툴 사용 능력 매너리즘에 빠지지 말자. 툴을 정말 금방 익힐 수 있고, 현재 본인은 배우는 입장이기에 보다 본질적인 것에 집중해야 된다는 결론을 도출했다.

 

 

6주 차 핵심 키워드 & 요약 정리


  • 데이터베이스 (스키마)
  • 데이터베이스 구성 (DBMS / SQL / 데이터 서버)
  • 관계형 데이터 베이스
  • 스키마
  • SQL / NoSQL
  • GA & 엠플리튜드
  • 린분석 (각 단계 설명)
  • 데이터 시각화

 

1. 데이터베이스

스키마란?

스키마란 앞서 살펴본 데이터베이스의 구조와 제약조건에 관해 전반적인 명세를 기술한 것입니다. 스키마는 다음 네 가지 정보를 정의하고 있으며, 데이터 베이스를 이해하기 위해서는 먼저 스키마를 살펴보아야 합니다.

스키마에는 개체의 특성을 나타내는 속성(Attribute)과  속성들의 집합으로 이루어진 개체(Entity),  개체 사이에 존재하는 관계(Relation)에 대한 정의와  이들이 유지해야 할 제약조건을 기술합니다.

 

SQL이란?

관계형 데이터베이스 관리 시스템(RDBMS)에서 자료의 검색과 관리, 데이터베이스 스키마 생성과 수정, 데이터베이스 객체 접근 조정 관리를 위해 고안되었습니다. 많은 수의 데이터베이스 관련 프로그램들이 SQL을 표준으로 채택하고 있습니다.

그런데 다양한 DBMS가 각각의 독자적인 SQL 문법을 사용하고 있으면 혼란이 발생할 수 있습니다. 이런 문제를 해결하기 위해 미국의 표준 규격 관리 기관인 ANSI에서 SQL 명령의 기본 규격을 만들어 놓았습니다. 모든 DBMS의 기본적인 SQL 문법은 모두 ANSI를 따르고 있기 때문에, 이것만 배우더라도 다양한 종류의 DBMS를 사용하는 데 문제가 없습니다.

 

DB 스키마는 한번 정하면 바꾸는 것이 거의 불가능하다

RDBMS의 데이터는 서로 연결되어 있기 때문에 한번 만든 이후에 칼럼을 추가하거나 구조를 변경하는 것 등이 어렵습니다. 데이터베이스의 구조를 처음 만들 때부터 사용되는 데이터의 종류와 관계, 확장성 등을 고려해 설계해야 합니다.

 


2. 고객 분석

고객 분석 도구의 차이점

이런 서비스의 특색에 맞게 고객 분석 도구들도 기능들이 특화되어 있습니다.

웹에 적합한 페이지 중심 고객 데이터 분석의 대표적인 예– Google Analytics 앱에 적합한 이벤트 중심 고객 데이터 분석의 대표적인 예 – Amplitude

반드시 GA는 웹에 Amplitude는 웹에서 사용해야만 하는 것은 아니다 두 서비스 보두 웹과 앱 둘다 사용 가능합니다. 그리고 필요한 목적에 따라 다양한 다른 추가 도구를 선택하기도 합니다.

고객 분석 도구를 선택할 때 중요한 점

현재 사용하는 도구가 없는 경우: 서비스에 맞는 도구를 어떻게 선택할 것인가를 고민해야 합니다. 현재 사용하는 도구가 있는 경우: 해당 도구에서 필요한 기능을 어떻게 적용할 수 있는가를 파악해야 합니다.


3. 린 분석

데이터에서 제품 인사이트를 찾아내기 위해 해야할 일

'데이터'를 통해 '고객'의 행동을 분석해 '제품 인사이트'를 발견하기 위해 해야 할 질문들은 무엇이 있을까요?

  • 해당 제품에 맞는 고객 유입은 무엇인가?
  • 제품 성장을 위해 우리는 고객에게 어떤 행동을 원하는가?
  • 어떤 지표를 통해 이 행동을 측정할 수 있는가?
  • 해당 제품을 구매하려는 고객은 어떤 가치를 원하는가?
  • 해당 가치를 얻기 위해 고객은 어떤 점들을 고려하는가? 등등등...

린 분석이란

'린 분석'은 이런 어려움을 구체적인 제품의 실례를 바탕으로 이해하기 쉽도록 정리한 책입니다. 실무 중심으로 쓰여진 전문가를 위한 데이터 기반 제품 분석 가이드와 다양한 케이스와 원칙들을 체계적으로 정리해 놓았습니다. 제품 분석의 실제를 이해하기 위해 이 책에서 다루는 내용 중 '제품의 성장 단계'와 '서비스 유형별'에 맞는 제품 분석 방법론을 살펴 보도록 하겠습니다.

외식 산업으로 보는 제품의 성장 단계

공감 - 흡인력 - 바이럴 - 매출 - 확장

외식 사업의 예)

  • 공감: 사업주는 식당을 열기 전에 먼저 해당 지역에서 외식하는 사람들, 이들의 욕구, 그 지역에서 팔지 않는 음식, 외식 트렌드에 대해 알아야 합니다.
  • 흡인력: 그런 다음 메뉴를 개발하고 고객을 대상으로 이 메뉴를 테스트한다. 테이블이 꽉 차고 단골 손님들이 정기적으로 재방문하게 될 때까지 메뉴를 자주 바꾸면서 테스트해야 합니다.. 무료 시식을 제공하고 이것저것 테스트해보면서 손님들의 의견을 물어야 한다. 사업의 변동성과 불확실한 재고 때문에 이 단계에서 비용이 높습니다.
  • 바이럴 효과: 사업주는 손님들이 자주 방문하도록 포인트 제도를 실시하거나 손님들이 친구들에게 식당 이야기를 하도록 만들어야 합니다. 식당 리뷰 서비스에 등록되는 리뷰와 추천의 관리가 필요합니다.
  • 매출: 바이럴 효과가 나타나면 수익을 올리는 데 주력합니다. 무료 시식을 줄이고 비용을 더 엄격히 통제하며 운영을 표준화합니다.
  • 확장: 마지막으로 사업의 수익성이 확인되면 매출의 일부를 마케팅과 홍보에 투자합니다. 음식평론가, 여행 잡기, 라디오 방송국과 접촉합니다. 두번째 식당을 열거나 첫 식당을 기반으로 프랜차이즈 사업을 시작합니다.

유형 1. 전자상거래

여러분의 사업이 고객 충성도 유형인지 신규 고객 확보 유형인지 반드시 알고 있어야 합니다. 이것을 바탕으로 전체 마케팅 전략과 많은 기능이 결정됩니다. 웹사이트 안에서든 밖에서든 검색은 구매할 제품을 찾는 수단으로 점점 더 많이 사용될 것입니다. 전환율과 재구매율, 구매액도 중요하지만 가장 중요한 지표는 지 세 지표를 종합한 고객당 매출입니다. 배송, 물류, 재고 관리와 같은 오프라인 이슈를 간과하면 안됩니다.

유형 2. SaaS(주문형 소프트웨어)

부분유료화 모델은 눈에는 잘 띄겠지만 실제로는 일종의 판매 기법이며 신중하게 사용해야 합니다. SaaS에서 이탈률은 매우 중요합니다. 사용자 이탈 속도보다 빠르게 충성도 높은 사용자를 확보할 수 있다면 사업은 성공할 것입니다. 사용자가 고객이 되기 훨씬 전부터 사용자 인게이지먼트를 측정하고 고객이 이탈하기 훨씬 전부터 고객 활동을 측정해야 합니다. 많은 사람이 SaaS 모델을 월정액 서비스 가입 모델과 동일시하지만 다른 가격 모델도 사용할 수 있으며 이 중 일부 모델은 큰 성공을 거두기도 합니다.

유형 3. 무료 모바일 앱

모바일 앱은 다양한 방식으로 돈을 벌 수 있습니다. 대부분의 돈은 소수의 사용자에서 나옵니다. 따라서 이런 사용자들을 별도의 고객군으로 분류하고 분석해야 합니다. 핵심 지표는 사용자당 평균 매출이지만 돈을 쓰는 사용자당 평균 매출도 추적해야 합니다. 왜냐하면 ‘고래’라고 불리는 이런 사용자들은 다른 사용자들과 행동패턴이 매우 다르기 때문입니다.

유형 4. 미디어 사이트

광고 매출은 미디어 사이트에 매우 중요하지만 광고에는 디스플레이 광고, 노출 광고, PPC 광고, 제휴 모델 등이 있어 매출을 추적하기가 복잡합니다 미디어 사이트는 광고 재고(방문자 시선의 형태)와 바람직한 광고 매체라는 평판이 필요한데, 후자는 광고주가 원하는 인구 통계학적 특징을 가진 사람들의 방문을 유도하는 콘텐츠에서 비롯됩니다. 좋은 콘텐츠를 제공하는 일과 매출을 일으키는 광고를 충분히 싣는 일 사이에 균형을 잡기란 쉽지 않습니다.

유형 5. 유저 컨텐츠 서비스

방문자 참여는 UGC에서 가장 중요하다. 인게이지먼트 퍼널에서 방문자 참여도를 추적해야 합니다. 사용자 대다수가 콘텐츠를 보기만 할 뿐 생성하지는 않고 일부 사용자는 약간의 콘텐츠를 생성하며 그 나머지 소수 사용자만이 열성적으로 콘텐츠를 생성합니다. 이 80/20 규칙은 모든 사용자 활동에 적용됩니다. 사용자들이 계속 재방문해서 참여하게 하려면 이메일이나 다른 형태의 ‘알림’기능을 사용해 활동을 알려야 합니다.

유형 6. 마켓 플레이스

양면 마켓플레이스는 형태와 규모가 매우 다양합니다. 초기에 가장 큰 어려움은 구매자와 판매자를 충분히 확보하는, 닭이 먼저냐 달걀이 먼저냐의 문제를 해결하는 것입니다. 보통은 지출할 돈을 가진 사람에게 먼저 초점을 맞추는 것이 좋습니다. 판매자가 곧 상품재고이므로 상품 재고 증가율과 등록된 상품들이 구매자가 찾는 상품과 얼마나 일치하는지 추적해야 합니다. 많은 마켓플레이스가 거래 금액의 일정 비율을 수수료로 받긴 하지만 판매자의 상품 홍보를 돕거나 상품 등록 건당 수수료를 받는 등 다른 방식으로도 돈을 벌 수 있습니다.

 


4. 데이터 시각화

데이터 시각화 도구의 종류

  • Google Analytics, Amplitude등 분석 도구의 내장 대시보드
  • 시각화 전문 도구 - Tableau 등
  • 파이썬 용 시각화 라이브러리 - Matplotlib, seaborn 등

빅데이터 시각화 툴

● Tableau : 차트, 그래프, 지도를 포함한 다양한 그래픽 기능을 제공하며 기업용, 사무용으로 적합한 빅데이터 시각화 툴이다. 클라우드 기반으로 데이터를 클라우드에 저장하여 데이터의 크기에 상관없이 언제 어디서나 사용할 수 있다.

●  Infogram : 실시간으로 빅데이터와 인포그래픽 비주얼라이제이션을 연동해주는 것이 가장 특징 적인 툴이다. 저널리스트, 기자 등 미디어 종사자나 강의, 과제 등 교육 목적의 자료를 제잘할 때 유용하다.

● ChartBlocks : 코딩없이 스프래드시트, 데이터베이스 형태의 데이터를 쉽게 시각화 할수 있는 대표적인 툴이다. 어떤 웹에서든지 차트를 구현할 수 있으며 트위터와 페이스북 등의 공유도 가능하다.

● Datawrapper : 쉽게 데이터를 업로드하고 이를 차트나 맵으로 변환해주며 사용자의 목적에 따라 맞춤화하여 제작할 수 있는 레이아웃을 제공한다. 워싱턴 포스트, 월스트리트저널 등에서 사용하고 있다.

데이터 베이스를 쉽게 구현하게 해주는 서비스 – 구글 빅쿼리(Big Query)

  • Google Cloud에서 돌아가는 데이터 웨어 하우스입니다.
  • 빅쿼리에 저장한 후 SQL을 사용하여 쿼리할 수 있습니다.
  • Data Engineering을 몰라도 DB를 구성해 SQL을 사용할 수 있습니다.

데이터를 무료로 구할 수 있는 사이트

Kaggle – 공개 데이터를 바탕으로 데이터 분석을 연습해 보고 서로 공유하는 포럼 형식의 사이트 Dacon – 캐글과 유사한 형태의 국내 사이트 공공데이터포털 – 국가에서 제공하는 무료 데이터 포털 사이트로써, 주로 공공정보 관련 데이터를 제공합니다.

데이터 분석 포트폴리오를 만드는 4가지 방법

  • 엑셀을 사용한 분석
  • 빅쿼리 & SQL을 사용한 분석
  • 데이터 시각화 도구를 사용해 분석
  • Python과 라이브러리를 사용해 분석