2024 NH투자증권 빅데이터 경진대회 후기
일단 결과부터… 입선!! 이라는 첫 대회 퀘거를 이뤘다. 프로젝트 내용 🌟 서비스 개요 이 서비스는 사용자가 블로그에 작성한 내용을 분석해 관심사와 연관된 미국 ETF를 추천해주는 시스템입니다. 주식에 대한 지식이 부족하더라도, 관심 있는 분야와 맞는 투자 기회를 자연스럽게 발견할 수 있도록 설계되었습니다. 🔑 핵심 기능 ...
일단 결과부터… 입선!! 이라는 첫 대회 퀘거를 이뤘다. 프로젝트 내용 🌟 서비스 개요 이 서비스는 사용자가 블로그에 작성한 내용을 분석해 관심사와 연관된 미국 ETF를 추천해주는 시스템입니다. 주식에 대한 지식이 부족하더라도, 관심 있는 분야와 맞는 투자 기회를 자연스럽게 발견할 수 있도록 설계되었습니다. 🔑 핵심 기능 ...
암묵지와 형식지의 상호작용 관계 -> 공통화, 표출화, 연결화,내면화 (공통으로 만들고 표출하게 하고 연결한다음 내면화한다 라는 느낌인가?) 데이터마스킹 : 식과 같은 속성을 유지한 채, 새롭고 읽기 쉬운 데이터를 익명으로 생성하는 기술( xx대학 이런식으로) 비정형데이터의 경우 데이터 내부에 메타데이터를 가...
최근 스타트업 마케팅 영역에서 가장 많이 핫한( 채용공고에도 많이 올라옴 ) 두가지 마케팅에 대해 알아보도록 하자. Growth Marketing 채용이 진짜 많이 올라는 것 같다. 두 직종의 역량을 보면 데이터 분석능력을 요구하는 것같아서 좀 알아보고 싶었기에 이런 글을 작성한다. 그래서 이 직종이뭐지? Growth Marketing 1. ...
01. 데이터 전처리 01-1. 서울시 스타벅스 매장목록, 인구, 사업체 데이터에 시군구명, 시군구코드 추가 # 서울시 스타벅스 매장 목록 import pandas as pd seoul_starbucks = pd.read_excel('./files/seoul_starbucks.xlsx', header=0) seoul_starbucks.head()
01. 서울시 통계 정보 : 공공 데이터 수집 및 EDA 1. 소개 이 포스트에서는 서울시 공공 데이터를 수집하고, 이를 바탕으로 데이터 탐색적 분석(EDA)을 수행한다. 특히, 서울시의 주민등록 인구 통계와 사업체 현황 통계를 수집하여 이를 분석하는 과정을 보여준다. (작년에 한 프로젝트라서 작년데이터긴 하다 ㅎㅎ;) 2. 데이터 링크 ...
개요 작년에 했던 학교프로젝트 중 생각나서 업로드 해볼까 한다 스타벅스는 어떤 전략으로 매장 입지를 선택할까? 이런 궁금증이 들었다. (사실은 친구가 아이디어를 줘서 해보기로 했다.) 그래서 두 가지 가설을 세웠다: 가설 1: 동네 인구가 많은 지역에 스타벅스 매장이 많을 것이다. 가설 2: 직장인이 많은 지역에 스타벅스 매장이 집중되어 ...
일단 우리가 수학을 배울때 더하기 빼기를 배우는 것과 같이 통계, 그러니까 확률에서도 더하기 때기한게 존재는 한다. 일단 토대가 되는 것이 합집합과 교집합이다. 일단 합집합과 교집합에 대해 알아보고 확률은 어떻게 이루워지는가 에 대해 알아보자. 합집합(union) 합집합은 두 개 이상의 집합에서 원소들을 중복을 제거하고 합쳐놓은 것을...
수리통계를 하기 전에 중요한 확률 변수가 무엇인지에 대해 알아보자. 확률변수의 개념 확률 변수(random variable)란, 확률 실험에서 얻은 결과를 수학적으로 표현한 변수를 말합니다. 표본 공간 $ C $ 에서의 확률 실험이 주어졌다면, 각 원소에 오직 하나의 실수 값을 대응 시키는 함수를 확률 변수라고 한다. 자 그럼 여기에...
조건부 확률 조건부 확률 (conditional probability)이란, 사건 B가 일어난 조건에서 사건 A가 일어날 확률을 의미합니다. 조건부 확률은 $P(A \mid B)$ 로 표현하며, “B가 일어났을 때 A가 일어날 확률”로 읽을 수 있습니다. \begin{align} P(A|B) = \dfrac{P(A,B)}{P(B)} \en...
0. 최종코드 python n = int(input()) input_list = list(map(int, input().split())) total_max = input_list[0] current_max = input_list[0] for i in range(1, len(input_list)): current_max = max(input_l...