본문 바로가기

분류 전체보기

[데이터 분석] 쇼핑몰 웹 로그 분석 - 3. Funnel 분석 퍼널 분석이란 https://blog.adobe.com/ko/publish/2017/05/02/funnels-analysis#gs.hi23cm 떠난 고객도 다시 보자 – 퍼널 분석 고객이 제품을 구매하는 프로세스는 여러 단계로 이루어 집니다. 제품을 인지하고 관심을 가지게된 후 구매하기 적합한 제품인지 고민을 거쳐 실제로 제품을 구매하기까지의 여정에서 고객은 blog.adobe.com 이번엔 해당 자료를 가지고 사용자들에 대해 view → cart → purchase로 이어지는 funnel 수치를 구해보고자 한다. ◆ Funnel 분석 funnel은 깔때기란 뜻으로 funnel 분석은 깔때기의 원리와 유사하다 깔때기가 단계가 진행될 수록 좁아지면서 걸러지듯이 funnel 분석에서도 funnel 스탭에 따.. 더보기
[프로그래머스] 타겟넘버 - BFS로 풀기 문제 링크 https://programmers.co.kr/learn/courses/30/lessons/43165 코딩테스트 연습 - 타겟 넘버 n개의 음이 아닌 정수가 있습니다. 이 수를 적절히 더하거나 빼서 타겟 넘버를 만들려고 합니다. 예를 들어 [1, 1, 1, 1, 1]로 숫자 3을 만들려면 다음 다섯 방법을 쓸 수 있습니다. -1+1+1+1+1 = 3 +1-1+1+1+ programmers.co.kr 문제 설명 n개의 음이 아닌 정수가 있습니다. 이 수를 적절히 더하거나 빼서 타겟 넘버를 만들려고 합니다. 예를 들어 [1, 1, 1, 1, 1]로 숫자 3을 만들려면 다음 다섯 방법을 쓸 수 있습니다. -1+1+1+1+1 = 3 +1-1+1+1+1 = 3 +1+1-1+1+1 = 3 +1+1+1-1.. 더보기
[데이터 분석] 쇼핑몰 웹 로그 분석 - 2. 사이트 체류 시간 이번에는 이전 데이터 셋을 사용하여 사용자들의 사이트 체류 시간을 구하는 방법을 알아보자. 이전 글: https://bigsong.tistory.com/35 [데이터 분석] 쇼핑몰 웹 로그 분석 - 1. Active User(활성 사용자) 캐글에서 제공하는 쇼핑몰 웹 로그 데이터셋을 이용하여 데이터 분석을 진행해보려 한다. 사용 데이터셋 정보 https://www.kaggle.com/mkechinov/ecommerce-behavior-data-from-multi-category-store eCommerce b.. bigsong.tistory.com ◆ 사이트 체류 시간과 페이지 체류 시간 참고 사이트: https://clicknote.tistory.com/3 사이트 체류 시간은 말 그대로 사용자가 해당 .. 더보기
[데이터 분석] 쇼핑몰 웹 로그 분석 - 1. Active User(활성 사용자) 캐글에서 제공하는 쇼핑몰 웹 로그 데이터셋을 이용하여 데이터 분석을 진행해보려 한다. 사용 데이터셋 정보 https://www.kaggle.com/mkechinov/ecommerce-behavior-data-from-multi-category-store eCommerce behavior data from multi category store This dataset contains 285 million users' events from eCommerce website www.kaggle.com ◆ 일별 활성 사용자(Active User) 수 구하기 활성 사용자 수는 방문수, 방문자수의 개념과는 달리 '정해진 기간동안 접속한 사용자의 수'이다. 흔히 방문수를 구할때 사용하는 세션을 이용해 방문 횟수를 구하지.. 더보기
[알고리즘] if, elif, else 와 if, if, if의 차이 IF~ ELSE~ / IF~ IF~ 나만 몰랐을 수도 있고 단순해서 무시할 수도 있는 부분이지만 if~elif~else~ 구문과 if~if~if~ 구문의 용도와 실행 속도에 대한 이야기이다. 너무나도 당연히 자연스럽게 if~ else~를 사용하고 있지만 짧은 코드, 짧은 실행속도를 고려하면서 든 의문인데 조건문에서 단순히 확인해야 할 조건이 2가지나 3가지라면 if~ elif~ else 보다 if~ if~ if~ 혹은 if~ if~ else~가 빠르고 코드도 더 짧지 않을까 라는 생각이 들었다. 궁금한 건 눈으로 찍어봐야 직성이 풀리기 때문에 간단한 코드로 실행 시간을 비교해 보았다. 테스트 if~ elif~ 구문의 elif에서 조건이 걸리도록 테스트 했을때를 보면 if~ if~를 사용했을때의 시간보다 .. 더보기
[자료구조] 그래프와 트리(Graph, Tree) 트리와 그래프 그래프(Graph) 그래프란 그래프는 노드(하나의 점)와 노드 간을 연결하는 간선으로 구성된 자료 구조이다. 이를 통해 연결된 노드 간의 관계를 표현할 수 있는 자료구조이다. 그래프의 특징 - 그래프는 순환 혹은 비순환 구조를 이룬다 - 그래프는 방향이 있는 그래프와 방향이 없는 그래프가 있다. - 루트 노드의 개념이 없다 / 부모-자식 관계라는 개념이 없다. - 2개 이상의 경로가 가능하다.(무방향, 방향, 양방향 가능) - 그래프는 네트워크 모델이다. 트리(Tree) 트리란 트리는 그래프와 같이 노드와 노드간을 연결하는 간선으로 구성된 자료구조이다. 그러나 트리는 그래프 중에서도 특수한 케이스에 해당하는 자료구조이다. 트리는 두 개의 노드 사이에 반드시 1개의 경로만을 가지며 사이클이 .. 더보기
[자료구조] 스택과 큐, 데크(Stack, Queue, Deque) 스택(Stack) 스택이란 스택은 쉽게 생각하면 박스에 차곡차곡 물건을 정리하는 형태이다. 먼저 들어간 것이 밑에 위치하기 때문에 나중에 나오게 되고 나중에 들어간 것이 위에 위치하기 때문에 먼저 나오는 형태의 자료구조이다. 그렇기 때문에 스택의 모든 연산은 스택의 최상단에서 일어난다. ※LIFO(Last In First Out, 후입선출) 그럼 이렇게 처음 들어간 값을 쉽게 빼서 쓰지도 못하는 불편한 형태의 자료구조를 쓰는 이유는 무엇이며 어디에 쓰이는가 스택은 주로 컴퓨터 연산에 사용하는 자료구조로 연산의 우선 순위에 따라 쉽게 연산할 수 있도록 도와준다. 숫자와 연산자가 들어오면 연산자의 우선 순위에 따라 스택에 쌓아 두거나 스택의 위에서 나오면서 연산이 이루어 지는 것이다. 스택 관련 용어 - T.. 더보기
[자료구조] 배열과 리스트(Array & List) 배열 배열이란 연관된 데이터를 하나의 변수에 그룹핑해서 관리하기 위한 선형 자료구조로 배열을 이용하면 하나의 변수에 여러 정보를 담을 수 있으며, 반복문과 결합하여 효율적으로 데이터를 처리할 수 있다. 주로 데이터의 개수가 정해져 있는 경우나 데이터의 수정이 적은 경우, 혹은 데이터의 검색이 빈번한 경우에 사용하는 선형 자료구조형이다. 배열의 특징으로는 배열안의 데이터들은 같은 자료형으로 나열되있다는 것, 그리고 데이터가 연속된 메모리 공간에 순차적으로 저장 된다는 것, 그래서 배열의 논리적 순서(인덱스)와 원소값의 물리적인 순서(메모리 주소) 두가지가 동일하다는 것 등을 꼽을 수 있다. 배열에서의 시간 복잡도 삽입/삭제 -배열의 맨 앞에 삽입/삭제: O(n) -배열의 맨 뒤에 삽입/삭제: O(1) -배.. 더보기