데이터 분석가 일의 일기(1)
찬비 "새해엔 기필코 레터를 미리 쓰고 숙면을 취하겠습니다 -이번엔 실패한 사람-"
|
|
|
안녕하세요. 에디터 찬비입니다.
올해부터는 일의 일기라는 이름으로 매월 일에 대한 레터를 한 편씩 보내드리려고 해요. 첫 시작은 제가 맡게 되었습니다. 처음 3개월간은 제 본업인 데이터 분석가 이야기를 해보려고 합니다.
저는 IT 스타트업에서 데이터 분석가로 일하고 있는데, 제가 데이터 분석가라고 말하면 보통 두 가지 반응을 보이세요.
- 우와, 멋있다.
- 그게 뭐 하는 일이에요?
아무래도 데이터 분석가가 어떤 일을 하는지 잘 와닿지 않기 때문일 거예요. 실제로 경력지직이 아니라면 데이터 분석가의 실제 업무를 파악하기는 쉽지 않을 거예요. 아무래도 직접 분석을 해보거나 분석가와 일해보기 전까지는 꽤 모호하기 때문이죠. 오늘은 데이터 분석가가 하는 일에 관해 이야기해 봅니다. |
|
|
1. 이젠 섹시한 직업은 아니지만
2. 이 분석이 왜 필요하신가요?
3. 맨날 아니라고 하는 사람 |
|
|
© Andrew J Buboltz, silk screen on a page from a high school yearbook, 8.5″ x 12″, 2011 Tamar Cohen |
|
|
데이터 분석가라는 직업이 ‘21세기의 가장 섹시한 직업’으로 불리던 때가 있었다는 것을 아시나요? 우리가 기획자나 개발자를 섹시한 직업이라는 새삼스러운 이름으로 부르진 않는다는 걸 생각해 보면 아무래도 ‘새롭다’는 점이 가장 높게 평가되어, 이렇게 명명되지 않았을까 싶습니다.
그렇다면 데이터 분석가가 등장하면서 처음으로 데이터를 분석하게 된 것일까요? 당연히 아닙니다. 분석가라는 직군이 없었을 때도 회사에서는 각자 필요한 데이터를 확보해 분석하고 이를 바탕으로 의사결정을 내려왔습니다. 엑셀이 회사원에게 없어서는 안 되는 툴인 이유도, 엑셀 사용법을 익히는 것이 회사원의 소양처럼 여겨지는 이유도, 기본적인 데이터를 분석하고 이를 시각화하는 데에 유용한 툴이기 때문입니다.
그런데 2000년대에 들어서면서 상황이 바뀌었습니다. 일단, 데이터의 종류는 다양해지고 양은 폭증했습니다. 온라인에서의 활동이 늘어나고, 또 모바일 기기를 이용하기 시작하면서 사람들이 남기는 모든 흔적이 데이터로 남기 시작했어요. 이때부터 ‘빅데이터’라는 용어가 자주 쓰이기 시작했습니다. 수집되는 데이터의 양이 늘어나면서 데이터로 알 수 있는 내용도 많아졌습니다. 유저가 접속해서 어떤 페이지를 방문했고, 어떤 활동을 했는지, 어떤 상품을 구매했는지까지, 유저의 흔적이 디지털 발자국으로 남게 되었거든요. 남는 데이터를 잘 활용하면 적합한 디자인, 과제의 방향성뿐 아니라 회사의 전략까지도 개선할 수 있게 되었습니다. 그래서 데이터를 잘 이해하고, 어떻게 활용하면 좋을지 판단하여 해석해 주는 데에 특화된 데이터 분석가가 등장합니다.
데이터 분석가가 하는 일을 한마디로 정의하자면 ‘데이터 속에서 의미 있는 결과를 찾아 의사결정을 지원하는 것’이라고 할 수 있어요. 뒤에서부터 짚어봅시다. 어떤 의사결정을 지원할 수 있을까요? ‘이 버튼명으로는 A와 B 중 뭐가 더 적절할까요?’, ‘이 화면 UI를 이렇게 하는 게 최선일까요?’ 같은 디자인적인 문제부터 ‘유저가 이 기능을 더 잘 쓰게 하려면 어떻게 바꿔야 할까요?’와 같은 사용성 개선, ‘오늘 배포한 이 기능은 성공적인가요?’, ‘어떻게 하면 유저들이 더 오래 접속하게 만들 수 있을까요?’, ‘우리 앱은 건강하게 성장하고 있을까요?’와 같은 큰 단위의 방향성까지도 지원해야 할 의사결정에 포함될 수 있습니다.
답해야 하는 질문이 정해졌다면(혹은 어떤 질문에 답해야 할지 정하는 것부터) 이제부터 분석가의 업무는 시작입니다. 데이터 속에서 의미 있는 결과를 찾아야죠. 그리고 요청자가 이해할 수 있는 형태로 데이터를 정리해 자신이 내린 답을 전달해야 합니다. 이를 위해 아래의 순서로 일을 진행하게 돼요.
- 핵심 문제를 정의하고, 데이터를 어떻게 볼지 기획한다
- 데이터를 추출하고, 적합한 분석 기법을 통해 결과를 정리한다
- 데이터를 해석하고, 비즈니스에 적용할 수 있도록 커뮤니케이션한다
보통 데이터 분석가가 하는 일이라고 생각하면 2번의 업무가 대부분이라고 생각하기 쉽습니다. SQL을 활용해 데이터베이스에서 데이터를 추출·가공하는 일이요. 한발 더 나아간다면, 통계적 기법을 이용해 분석한 후 화려한 차트를 포함한 결과를 보여주는 것까지요. 실제로 2번에 대해서는 잘하는 법에 관한 책도, 아티클도 많습니다. 겉으로 보았을 때 분석가와 분석가 아닌 사람의 업무 중 가장 차별적인 부분도 이 부분일테고요.
그런데 분석가의 업무 중 1번과 3번이 차지하는 비중이 적지 않아요. 연차가 높아질수록 비중이 더 높아지기도 합니다. 특히, 1번에서 기획이 잘 되었다면 2번은 심플하게 끝나는 경우도 많습니다. 중요도가 높은 만큼 1번, 분석 기획 과정에 대해 더 상세히 설명해 보려 합니다. |
|
|
위에서 분석가는 데이터로 의사결정을 지원하는 일을 한다고 했죠. 의사결정이 필요한 곳은 곳곳에 있다 보니 정말 다양한 사람들과 일하게 됩니다. 필연적으로, 데이터에 대한 이해도가 높지 않은 사람들과도 협업하게 됩니다. 이럴 때 가장 중요한 것은 이해하고 소통하는 능력, 커뮤니케이션입니다.
정석적인 데이터 분석 요청을 아래와 같은 형태일 거예요.
- 배경과 목적: 현재 이러한 니즈로 데이터 분석이 필요하다
- 요건: 어떤 데이터가 있으면 좋을 것 같다
- 기한: 언제까지 필요한데 혹시 가능하냐
여기에서 가장 중요한 것은 배경과 목적입니다. 맥락은 풍부할수록 좋습니다. 어떤 배경에서 어떤 의사결정이 필요한 것인지 분석가가 정확히 파악해야 어떤 분석을 할지 정할 수 있거든요.
마케터가 프로모션 성과 확인 요청을 했다고 해봅시다. 프로모션의 목적에 따라 어떤 데이터를 제공하는 것이 적절할지 달라집니다. 프로모션의 목적이 유입을 늘리는 것이었다면, 프로모션으로 인해 얼마나 많은 사람들이 접속했고 가입했는지가 가장 중요합니다. 그렇다면 프로모션 전후로 DAU와 신규 가입자 추이를 비교하는 식으로 확인하는 것이 적합합니다.
하지만 프로모션 목적이 결제를 늘리는 것이라면 트래픽은 부차적인 성과에 불과합니다. 아무리 사람들이 많이 들어왔더라도 결제가 발생하지 않았다면 목적 달성에 실패한 것이 되니까요. 이 경우에는 프로모션 전후로 결제 건수와 금액이 얼마나 증가했는지, 프로모션에 참여한 유저들이 이후에도 많이 결제하는지 추적하는 식으로 구성할 수 있겠습니다. 이렇게 목적에 따라 어떤 데이터를 보는지 정하는 것을 '지표를 설계한다'고 이야기해요.
그런데 생각보다 이 데이터 분석이 왜 필요한지 답하기 어려워하시는 요청자분들이 많습니다. (“데이터가 왜 필요하냐면, 데이터가 필요하니까요.”) 분석가는 자신의 업무를 다른 직무에 설명하는 것이 익숙한데, 다른 팀과 협업을 잘 안 하는 조직일수록 어디까지 설명해야 하는지 잘 모르시는 경우가 많더라고요. 요청자로서는 매일 하는 업무고, 너무 당연하기 때문일 거예요. 그러니 분석가는 원하는 답을 얻으려면 다양한 질문을 하고, 그렇게 받은 답변을 찰떡같이 이해할 수 있어야 합니다. 굳이 필요하다는 언급이 없더라도 요청자에게 필요하겠다 싶으면 알아서 분석 요건에 추가하기도 하고요.
가장 손이 많이 가는 동시에 피하고 싶은 요청은 ‘급합니다. 이러이러한 데이터를 언제까지 주세요.’와 같이 요건과 기한만 오는 경우예요. 이럴 경우 높은 확률로 지난한 데이터 분석 수정 요청이 들어옵니다. 정확하게 전달해도 막상 데이터를 받고 보니 요청자 입장에서 원하는 목적에 부합하지 않았던 거예요. 그러다보니 이것도 봐야겠고, 저건 아닌 것 같고, 그건 이렇게 고치고 싶으니 다시 수정해달라고 요청하십니다. 이렇게 연이어 오는 요청에 대응하다 보면 잔뜩 지친 채로 하루를 마무리하게 됩니다. 분석을 하는 게 아니라 그냥 데이터를 추출하는 계산기가 된 것 같다는 마음에 동기부여도 안 되고요.
그러니 이왕이면 초장에 목적을 명확히 이해하고 그에 맞는 분석을 기획하는 것이 모두에게 이롭습니다. 요청자를 붙잡고 맥락을 끌어내다 보면 숨어있는 추가 목적을 더 발견하게 되는 경우도 있습니다. 좀 돌아가는 것 같더라도 요청자와 30분이라도 미팅을 잡거나, 배경 설명을 재차 요청하다 보면 목적을 확실하게 이해하기 쉬워요. 여러 번 할 작업을 단번에 해결할 수 있게 됩니다.
목적과 맥락을 충분히 이해했다면 이제 그에 맞는 분석 기획을 해야 하는데요, 분석가가 담당한 도메인에 대해 아는 내용을 총동원해야 하는 단계입니다. 이를 도메인 지식이라고 부르는데, 이 안에는 서비스의 히스토리, 비즈니스 모델, 주로 사용하는 유저의 특징 같은 정보들이 모두 포함됩니다. 내가 담당하는 도메인에 대해 상세히 알고 있을수록 기획의 방향도 뚜렷해질 수 있어요. 같은 데이터를 보더라도 읽어낼 수 있는 정보도 풍부해지고요.
예를 들어, 앱을 함께 만드는 기획자가 ‘유저가 이 기능을 더 잘 쓰게 하려면 어떻게 바꿔야 할까요?’라고 질문했다고 할게요. 같은 질문에 대한 데이터 분석이라도 이 앱의 주요 사용 시간이 출퇴근 시간인지, 주요 타깃 유저가 20대인지, 국내뿐 아니라 해외 유저도 사용하는지에 따라 완전히 달라질 수 있습니다. 출퇴근 시간에 주로 쓰는 앱이라면 피크 타임 여부에 따른 사용률 비교부터 시작할 수 있겠죠. 데이터를 뽑았는데 이 기능을 피크타임이 아닌 주말에 더 많이 사용한다면, 주 사용 시간대를 잘 타깃하지 못했기 때문에 사용률이 낮을 것이라는 가설을 세워볼 수도 있겠고요.
이런 도메인 지식은 입사하기 전에 많이 알고 가면 물론 좋겠지만, 일하면서 익히게 되는 것들이 훨씬 많은 것 같아요. 데이터를 들여다보고, 서비스에 대한 관심을 가지고 많이 써보고, 동료들과 커피챗을 하고 하다 보면 자연스럽게 익히게 되는 게 많아지더라고요. 그렇게 이해도가 높아지면 요청자가 생각지 못한 데이터를 추가로 제안하기도 하고, 같은 데이터를 보더라도 읽어낼 수 있는 정보가 많아져요. 그래서 기술이나 통계적 지식이 데이터 분석가의 기본 역량이라면, 커뮤니케이션과 도메인 지식은 성과에 직결되는 중요한 역량이라고 생각해요. |
|
|
지금까지 분석가가 하는 일을 설명했는데, 사실 일하면서 느끼는 건 기술적 분석 외에도 정말 다양한 역할이 있다는 거예요. 예를 들어, 앞서 언급한 3번, 분석 결과를 잘 전달하는 것도 중요합니다. 어떤 흐름으로 분석 결과를 해석해 공유하느냐(스토리텔링)에 따라 사람들의 기억에 오래 머무를 수도 있어요. 기억에 남는 키워드를 활용하면 유행어처럼 내부 구성원 사이에서 오래도록 회자되기도 하고요. 또 어떤 타이밍에 공유하느냐에 따라 같은 결과도 활용 정도가 달라지기도 해요. 전달하려는 조직의 상황, 우선순위 등을 보았을 때 적절한 타이밍에 공유해야 바로 활용될 수 있고요. 이런 부분은 사실 분석가만의 고민이 아니라, 어떤 직무든 일을 할 때 마주하는 커뮤니케이션의 문제죠.
또 다른 중요한 역할은 바로 게이트키퍼로서의 역할이에요. 데이터의 정확성과 분석의 타당성을 지키는 일이죠. 이 역할을 하다보면 구조적으로 'No'를 말할 수밖에 없는 순간이 많아요. 조직의 데이터 이해도가 아직 높지 않다면 더욱요. 저는 이 역할을 수행하면서 다른 사람들의 분석을 지적하고 안된다고 이야기하는 것이 여전히 너무 어렵습니다.
다른 조직에서 자체적으로 분석해서 공유한 내용에 대해 분석 설계나 데이터 해석이 잘못 되었다고 이야기할 때가 있어요. 예를 들어, 어떤 실험 결과에 대해 임팩트를 고려하지 않고 통계적 유의성만으로 결론을 내리는 경우요. 통계적 유의성이 만병통치약은 아닌데, 그걸 지적하고 설명하는 과정이 쉽지 않더라고요.
지표를 너무 좋게만 해석하는 분들께 그렇게 좋은 지표는 아니라고 정정할 때도 있습니다. 한 번은 큰 회의에서 어떤 분이 이 지표가 올랐으니 너무 좋은 일이라고 말씀하셨는데, 잘못된 해석이어서 회의 끝나고 찾아가 조용히 정정해 드린 적이 있어요. 이럴 때마다 즐거운 분위기에 찬물을 끼얹는 사람이 된 것 같아 마음이 답답해져요. 이걸 말하지 않으면 의사결정에 큰 지장을 줄까?를 여러 번 생각하고 정말 안 되겠다 싶을 때에만 이야기하곤 했어요.
업의 특성상 다른 조직에서 요청을 자주 받다 보니 모든 요청에 친절하게 답변을 못 하게 되기도 해요. 분석가는 적은데 요청하는 사람은 많다보니, 우선순위를 조율하며 "지금은 어렵습니다", "먼저 처리할 업무가 있습니다"를 말해야 하는 순간이 많거든요. 업무가 턱끝까지 올라와 있는 상황에 급한데 빨리 가능하냐는 말을 듣거나, 했던 질문을 다른 사람에게 계속 해야 할 때는 어쩔 수 없이 지치게 되더라고요. 위의 세 가지 사항이 한꺼번에 겹쳐서 하루 종일 안된다고 한 날은 마치 제가 빌런인 것처럼 느껴져 현타가 왔던 적도 있었네요.
그럼에도 이 일에서 보람을 느낄 때는 제가 한 분석 내용이 회사 안에서 지식처럼 쓰이는 것을 발견할 때예요. 2년 전, 앱의 사용 행태를 분석하면서 헤비 유저를 정량적으로 정의했던 적이 있어요. 벌써 그 이후로 시간이 많이 흘렀는데도 여전히 기획 단계에서 헤비 유저가 필요하면 제가 만든 정의가 인용되더라고요! 사람들이 모두 필요하다고 생각하는 것을 정량적으로 정리해 프레임워크를 만들어두면, 그렇게 공통으로 이야기할 수 있는 지식을 만들고 있다고 생각하면 뿌듯해집니다. 작업하면서 야근했던 것을 충분히 보상받는 기분이에요. 이외에도 팀원들과 분석을 논의하면서 새로운 돌파구를 찾아낼 때, 같은 도메인을 맡는데도 시간이 지나면서 점점 더 이해도가 높아지는 것을 느낄 때 성장하고 있구나 싶어 좋습니다.
데이터 분석가의 업무가 잘 와닿지 않으셨거나, 또는 막연히 '숫자를 다루는 사람' 정도로 이해하셨다면, 실제로는 숫자 너머의 맥락을 읽고, 사람들과 소통하며, 조직의 의사결정을 함께 만들어나가는 사람들이라는 것을 알아주셨으면 좋겠어요. 멋진 것은 순간이고, 매일매일은 다른 직장인들처럼 지난한 작업의 연속이랍니다.
물론, 제가 여기에 쓴 모든 상황들은 꽤 데이터를 잘 사용하는 문화를 전제로 하고 있긴 합니다. 아무리 분석가가 뛰어나더라도 분석가에 대한 존중이나 신뢰, 확신이 없다면 의사결정에 반영되긴 어렵겠죠. 그런 점에서 분석가는 다른 직무보다 어떤 조직에서 일하느냐가 업무 환경과 성과를 크게 좌우하는 것 같아요. 다음에는 분석가가 잘 일할 수 있는 환경의 중요성에 관해 이야기 해보려고 합니다.
데이터 분석가로 일하시는 분들, 혹은 분석가와 함께 일하시는 분들의 이야기도 궁금하네요. 분석가가 하는 일을 처음 알게 되신 분들도 질문이나 생각나는 이야기가 있다면 피드백으로 남겨주세요. 😊 |
|
|
에디터 <찬비>의 코멘트
레터가 발행되는 1월 15일(오늘) 모동숲 3.0 무료 업데이트가 배포되는 줄 알았는데, 어제 이미 배포가 되었더라고요? 🌞 (저는 이미 업데이트를 완료했습니다 호호) 2021년 10월 2.0 버전 업데이트 이후 4년만이네요. 한창 핫했던 코로나 시절을 지나 이제는 소소한 게임이 되어버린 것 같지만, 여전히 플레이하고 계신 분들이 있겠죠? 스위치1도 무료 업데이트가 가능하니 오랜만에 게임기를 꺼내보셔요! 이번 주말은 오랜만에 모동숲에서 새로운 콘텐츠를 즐겨봐야겠어요.
|
|
|
💌 협업문의 augustletter08@gmail.com
|
|
|
Written by Zoe • 구현모 • 찬비 • 오리진 • 요니 •숭이
|
|
|
Copyright © AUGUST All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지.
|
|
|
|
|