728x90

인공지능 16

[데이터 분석] 쇼핑몰 웹 로그 분석 - 2. 사이트 체류 시간

이번에는 이전 데이터 셋을 사용하여 사용자들의 사이트 체류 시간을 구하는 방법을 알아보자. 이전 글: https://bigsong.tistory.com/35 [데이터 분석] 쇼핑몰 웹 로그 분석 - 1. Active User(활성 사용자) 캐글에서 제공하는 쇼핑몰 웹 로그 데이터셋을 이용하여 데이터 분석을 진행해보려 한다. 사용 데이터셋 정보 https://www.kaggle.com/mkechinov/ecommerce-behavior-data-from-multi-category-store eCommerce b.. bigsong.tistory.com ◆ 사이트 체류 시간과 페이지 체류 시간 참고 사이트: https://clicknote.tistory.com/3 사이트 체류 시간은 말 그대로 사용자가 해당 ..

[데이터 분석] 쇼핑몰 웹 로그 분석 - 1. Active User(활성 사용자)

캐글에서 제공하는 쇼핑몰 웹 로그 데이터셋을 이용하여 데이터 분석을 진행해보려 한다. 사용 데이터셋 정보 https://www.kaggle.com/mkechinov/ecommerce-behavior-data-from-multi-category-store eCommerce behavior data from multi category store This dataset contains 285 million users' events from eCommerce website www.kaggle.com ◆ 일별 활성 사용자(Active User) 수 구하기 활성 사용자 수는 방문수, 방문자수의 개념과는 달리 '정해진 기간동안 접속한 사용자의 수'이다. 흔히 방문수를 구할때 사용하는 세션을 이용해 방문 횟수를 구하지..

[머신러닝] 머신러닝의 3가지 학습 방법

머신러닝의 3가지 학습 방법 머신러닝의 학습 방법은 학습 형태에 따라 '지도학습(Supervised Learning)', '비지도학습(Unsupervised Learning)', '강화학습(Reinforcement Learning)' 3가지로 나눌 수 있다. 지도학습(Supervised Learning) 지도학습은 정답이 무엇인지 알고 있는 데이터(Labled data)를 컴퓨터에게 학습시켜 새롭게 들어오는 데이터에 대한 결과를 예측하는 학습 방법이다 위의 그림처럼 오리라고 표기된 사진(Labeled data)를 학습시켜 모델을 만들고 만들어진 모델에 새로운 사진을 넣으면 오리인지 아닌지 예측하는 방법이다. 비지도학습(Unsupervised Learning) 비지도학습은 지도학습과 달리 정답을 알려주지 ..

[머신러닝] 선형회귀모델을 이용한 로또 번호 예측하기 - 3(모델링)

선형회귀 모델링 코랩에서 작업하던걸 잠시 쥬피터 노트북으로 옮겨서 작업했다. (여튼저튼쨋든 같은 노트북이니까 뭐) 로또 홈페이지에서 당첨번호를 받아서 필요한 컬럼만 남기고 원하는 형태로 만들어서 따로 CSV 파일로 저장해 두었다. (매주 이 파일은 새롭게 갱신이 필요하겠지) 그 이후 이전에 설명했던 대로 당첨 번호 6자리 각각 선형회귀 모델을 만들어 예측을 진행해 보았다. 간단하고 빠르게 선형회귀 모델을 만들기 위해 사이킷런의 Linear Regression을 이용하였다. 각 모델보다 오차의 범위가 더 크겠지만은 보너스 당첨 번호의 선형회귀 모델도 만들어 보았다. 그리고 각 모델의 예측 결과를 뽑아서 확인해 보았다!! 그리고 실제 그 주의 당첨결과와 비교해 보면?! (현업이 바쁘다보니 만들어 놓고 2주정..

[머신러닝] 선형회귀모델을 이용한 로또 번호 예측하기 - 2(데이터)

데이터 전처리, CSV파일 생성 dhlottery.co.kr/gameResult.do?method=byWin 로또6/45 - 회차별 당첨번호 956회 당첨결과 (2021년 03월 27일 추첨) 당첨번호 10 11 20 21 25 41 956회 순위별 등위별 총 당첨금액, 당첨게임 수, 1게임당 당첨금액, 당첨기준, 비고 안내 순위 등위별 총 당첨금액 당첨게임 수 1게임 dhlottery.co.kr 위 링크에서 회차별 당첨 번호를 엑셀 파일로 다운 받을수 있다. 다운 받아서 열어보면은 아래와 같이 정리된 당첨번호를 확인할 수 있다. 우리가 필요한건 당첨금액이 아니라 당첨번호이기 때문에 일단 엑셀에서 당첨금액 데이터들은 삭제 그리고 나는 이번 프로젝트는 코랩에서 진행할 계획이기 때문에 해당 파일을 구글 드라..

[머신러닝] 선형회귀모델을 이용한 로또 번호 예측하기 - 1

이 글을 보시는 분들 모두에게 먼저 정말 미리미리 당부 드립니다. 로또 당첨번호는 정말 무작위의 번호 추첨이기 때문에 규칙이란게 없습니다. 한번 뽑은 숫자공이 제외되는 것도 아니고 매번 뽑을때마다 매번 새로운 경우의 수이기 때문에 규칙을 찾거나 예측을 한다는거 자체가 불가능한 영역입니다. 만약 정말 만약 우리가 모르는 어떠한 힘에 의해 규칙이 있다고 해도 이제 겨우 950회가 넘는 로또 회차로는 표본이 너무 적어 정확한 데이터 모델링도 예측을 하기도 어렵습니다. 그러니 부디!! 이 글은 그저 선형회귀라는게 이런거구나 정도로만 봐주시고 얘는 어떤 뻘짓을 이렇게 정성들여서 하나 재미로 봐주시기 바랍니다. 물론 모델을 만들어서 진짜 로또 당첨되면 저야 좋지만 그럴 확률은 길가다가 당첨 복권을 줍는거랑 똑같은 ..

728x90