Posts by Category

mySQL

[SQL] 서브쿼리(SubQuery)

April 06 2022

최대 1 분 소요

서브쿼리의 정의와 특징 1. 정의 하나의 SQL문에 포함된 또 다른 SQL문 2. 특징 서브쿼리 사용 시 반드시 () 로 묶어야 한다. 서브쿼리 내에서는 ORDER BY를 사용할 수 없다. SELECT, FROM, WHERE, ORDER BY, HAVING 절...

[TIL] MySQL TIL Day 7

March 03 2022

최대 1 분 소요

🟡 [HackerRank] SQL Project Planning https://www.hackerrank.com/challenges/sql-projects/problem?isFullScreen=true

[TIL] MySQL TIL Day 6

February 24 2022

2 분 소요

🟡 [HackerRank] Occupations https://www.hackerrank.com/challenges/occupations/problem?isFullScreen=true

[TIL] MySQL TIL Day 5

February 16 2022

1 분 소요

🟡 [HackerRank] Weather Observation Station 20 https://www.hackerrank.com/challenges/weather-observation-station-20/problem?isFullScreen=true

[TIL] MySQL TIL Day 4

February 09 2022

최대 1 분 소요

🟡 [HackerRank] New Companies https://www.hackerrank.com/challenges/the-company/problem?isFullScreen=true

[TIL] MySQL TIL Day 3

February 02 2022

1 분 소요

🟡 [HackerRank] Contest Leaderboard https://www.hackerrank.com/challenges/contest-leaderboard/problem?isFullScreen=true

[TIL] MySQL TIL Day 2

January 26 2022

최대 1 분 소요

🟢 [HackerRank] The Blunder https://www.hackerrank.com/challenges/the-blunder/problem?isFullScreen=true

[TIL] MySQL TIL Day 1

January 24 2022

최대 1 분 소요

mySQL을 오랫동안 쉬다가 다시 문제를 해결하려고 하니 잊은 부분이 많아서 블로그에 TIL로 하나씩 정리를 하려고 한다. 오늘부터 Day 1 스타뚜!

[mySQL] #1. 프로그래머스 SQL Kit

November 12 2021

2 분 소요

프로그래머스 SQL 고득점 Kit TIL 정리

[SQL] #3. INNER JOIN

September 06 2021

3 분 소요

오늘은 SQL 문법 중 가장 많이 쓰이고, 코딩테스트 난이도도 어렵게 출제되는 INNER JOIN 문에 대해 간략히 알아보고 이를 활용한 예제들을 포스팅 해보려고 합니다.

[SQL] #2. CASE WHEN

August 18 2021

4 분 소요

안녕하세요! 오늘은 mySQL의 필수적인 함수 CASE WHEN에 대해 알아보고 관련 문제를 풀어보는 포스팅을 하고자 합니다. (집계, 정렬과 같은 mySQL의 매우 기초적인 내용은 다루지 않을 예정입니다.)

[SQL] #1. 데이터베이스(DB)와 DBMS

August 15 2021

2 분 소요

안녕하세요! 저는 얼마 전부터 모 대기업 데이터분석 직무 인턴을 시작했는데, 첫 업무로 Hadoop 베이스의 데이터베이스 관련 업무를 받게 되었습니다. 그리고 얼마 전부터 sql에 대한 공부는 해서 sql 코딩은 기본적인 것은 할 수 있지만, sql을 쓰기 전에 데이터베이스에 대...

맨 위로 이동 ↑

Time Series Analysis

[Time Series Analysis] #5. Simple Prophet Model: 주식데이터 적용

January 11 2021

4 분 소요

내 깃허브 블로그 첫 포스팅은 주식데이터의 탐색에 관한 내용이었다. 오늘은 첫 포스팅에서 썼던 미래에셋 주식 데이터 중 ‘삼성전자’의 주가를 Prophet 이라는 시계열분석 모델을 이용해 fit 하고 prediction도 해보는 포스팅을 해볼까 한다.

[Time Series Analysis] #4. Simple Web Traffic Data Analysis - Part 2

January 08 2021

4 분 소요

Kaggle data에 시계열분석 적용해보기 Part 2: ARIMA application

[Time Series Analysis] #3. Simple Web Traffic Data Analysis - Part 1

January 06 2021

5 분 소요

Kaggle data에 시계열분석 적용해보기 Part 1. Data Cleansing & EDA

[Time Series Analysis] #2 ARMA/ARIMA를 위한 개념 Build-up

January 02 2021

2 분 소요

이제 시계열분석의 핵심 모델인 ARMA/ARIMA를 위한 개념을 잡는 마지막 관문이다! 앞선 두 포스팅에서는 시계열 평활기법에 대해 살펴보았다. 이번 포스팅에서 다룰 내용은 다음과 같다. 정상성 시계열 자기상관함수(ACF)/편자기상관함수(PACF) AR 모델/MA 모델

[Time Series Analysis] #1 시계열 평활기법(2)

January 01 2021

3 분 소요

이번 포스팅에서는 저번 포스팅에 이어 평활기법 중 Holt 및 Holt-winters 에 대해 다루도록 하겠다. 지난 포스트처럼 이론에 대해 설명한 후, Python code로 실습을 하는 흐름으로 진행하겠다.

[Time Series Analysis] #1 시계열 평활기법(1)

December 30 2020

3 분 소요

시계열분석(Time Series Analysis) 은 하나의 변수에 대한 시간에 따른 관측치인 시계열데이터를 분석하는 것이다.

맨 위로 이동 ↑

ML

[Interpretable ML] #1. Partial Dependence Plot(PDP)

February 16 2021

4 분 소요

최근에 마친 포스팅 시리즈인 Feature Selection 파트를 준비하면서 자연스럽게 머신러닝의 해석에 관한 이론들도 접하게 되었다. 머신러닝 모델링을 할 때 중요한 feature만을 선택해 모델의 성능을 높이는 것도 중요하지만, 더 나아가 완성된 모델을 어떻게 해석할 것인지가...

[Feature Selection] #3. SHAP

February 05 2021

5 분 소요

Feature selection 시리즈 포스팅의 마지막! 이번 포스팅에서는 Kaggle과 같은 데이터분석 플랫폼에서도 많이 쓰이는 SHAP에 대해 다룬다.

[Feature Selection] #2. Permutation Importance

February 02 2021

2 분 소요

※ 이 포스팅은 Interpretable machine learning 을 요약 및 참고를 주로 하였습니다.

[Feature Selection] #1. 다양한 Feature Selection method 소개

January 29 2021

4 분 소요

Feature Selection Methods 오랜만에 블로그 포스팅이다! Kaggle이나 공모전, 대학원 프로젝트에서 모델링을 할 때 가장 막막했던 부분은 feature engineering 파트이다. 모델의 성능 향상에 기여하는 feature를 생성하는 것도 중요하지만, 이와 ...

맨 위로 이동 ↑

Theory

[Theory] 손실함수(Loss function)의 통계적 분석

July 05 2021

3 분 소요

오늘은 머신러닝/딥러닝의 기본기를 다시 한 번 다지기 위해 손실함수(Loss function) 에 대해 낱낱이 다루는 내용을 준비했습니다.

[데이터분석이론] #2 Bootstrap

November 28 2020

2 분 소요

오늘은 Bootstrap 에 대하여 공부해볼 것이다. 이 포스트에서는 모델링에서의 bootstrap이 아닌, 모수 $\theta$ 를 추정할 때 사용하는 bootstrap에 대해서 다룬다. 사용언어: R Code link: https://github.com/hyewonlees...

[데이터분석이론] #1 Missing data Mechanism

November 09 2020

5 분 소요

오늘은 통계학과 석사 첫학기 수업에서 배운 ‘결측자료분석’의 missing data mechanism 이론에 대해 다뤄보려고 합니다. 데이터분석에서 missing을 다루는 것은 매우 중요한 작업입니다. Missing data를 어떻게 다루느냐에 따라 model의 performan...

맨 위로 이동 ↑

CNN

[CNN] #2. CNN model - Dropout Layer

March 26 2021

2 분 소요

이전 포스팅에서는 가장 basic한 CNN 모델을 구현하는 방법에 대해 다루었다. 이번 포스팅에서는 CNN 모델을 보다 더 구체적으로 만드는 옵션들에 대해 살펴볼 것이다. 여러가지 옵션이 있겠지만, 이번 포스팅의 주제는 CNN 모델에서의 Dropout layer, batch s...

[CNN] #1. CNN의 기본 및 간단한 구현하기

March 22 2021

5 분 소요

이제부터 약 한 학기(6개월정도?) 동안은 딥러닝 관련 포스팅을 주로 해보려고 한다. 이번 학기에 딥러닝 강의를 듣기도 하고, 스스로 더 찾아보고 공부해보고 기록을 남기고 싶어서 시작하게된 딥러닝 포스팅! 첫번째 주제는 이미지 분류에 주로 이용되는 CNN(Convolutional ...

맨 위로 이동 ↑

Algorithm

[TIL] 알고리즘 TIL Day 2

January 27 2022

최대 1 분 소요

아래 프로그래머스 문제를 for, while문을 이용해서 그냥 풀었는데 계속 효율성 0점이 나와서 이유가 뭔가 하고 찾아보았다. 자료구조를 공부하지 않아서 몰랐는데 이 문제에서 힙(Heap)을 쓰면 효율성이 확 올라간다! 그래서 오늘 TIL에서는 힙에 대해 간단히 정리하려고 한다.

[TIL] 알고리즘 TIL Day 1

January 24 2022

1 분 소요

🟢 전화번호 목록 https://programmers.co.kr/learn/courses/30/lessons/42577

맨 위로 이동 ↑

Data Analysis

[데이터분석실습] #1 주식데이터 탐색 - 1편

November 05 2020

4 분 소요

안녕하세요! 요즘에 저는 주식 투자에 관심이 생겼습니다. 그래서 주식 데이터를 통해 주식 상황을 더 잘 이해해보려고 합니다. 그래서 오늘부터는 미래에셋 주식 데이터를 가지고 여러가지 분석을 해보고 주식에 대한 기본적인 개념과 주식시장에서의 현상을 이해하는 포스팅을 하고자 합니다. ...

맨 위로 이동 ↑

Daily

2020 리뷰 및 앞으로의 다짐

January 01 2021

1 분 소요

벌써 2020년이 가고 2021년이 왔다. 2020년은 코로나 등으로 학교 수업도 모두 집에서 온라인으로 들었던 한 해였다. 2020년에는 뭔가를 많이 못했다고 생각했는데, 돌이켜보면 뭔가를 하긴 했더라ㅎㅎ 이 블로그는 데이터분석 블로그이니 데이터분석에 관련된 활동을 간단하게 돌아...

맨 위로 이동 ↑

NLP

[NLP] #1. 워드 임베딩(Word Embedding)

May 09 2021

4 분 소요

Prologue 자연어처리(Natural Language Preprocessing) 은 문장, 텍스트 등 인간의 언어를 컴퓨터 언어로 구현하는 AI 알고리즘이다. NLP는 현 시대를 대표는 AI 알고리즘 중 하나로, 가장 대표적인 것이 텍스트분석인데, 예를 들면 영화 감상평 분...

맨 위로 이동 ↑

Hyewon Lee

Posts by Category

mySQL

Time Series Analysis

ML

Theory

CNN

Algorithm

Data Analysis

Daily

NLP