[SQL] 서브쿼리(SubQuery)
서브쿼리의 정의와 특징 1. 정의 하나의 SQL문에 포함된 또 다른 SQL문 2. 특징 서브쿼리 사용 시 반드시 () 로 묶어야 한다. 서브쿼리 내에서는 ORDER BY를 사용할 수 없다. SELECT, FROM, WHERE, ORDER BY, HAVING 절...
서브쿼리의 정의와 특징 1. 정의 하나의 SQL문에 포함된 또 다른 SQL문 2. 특징 서브쿼리 사용 시 반드시 () 로 묶어야 한다. 서브쿼리 내에서는 ORDER BY를 사용할 수 없다. SELECT, FROM, WHERE, ORDER BY, HAVING 절...
🟡 [HackerRank] SQL Project Planning https://www.hackerrank.com/challenges/sql-projects/problem?isFullScreen=true
🟡 [HackerRank] Occupations https://www.hackerrank.com/challenges/occupations/problem?isFullScreen=true
🟡 [HackerRank] Weather Observation Station 20 https://www.hackerrank.com/challenges/weather-observation-station-20/problem?isFullScreen=true
🟡 [HackerRank] New Companies https://www.hackerrank.com/challenges/the-company/problem?isFullScreen=true
🟡 [HackerRank] Contest Leaderboard https://www.hackerrank.com/challenges/contest-leaderboard/problem?isFullScreen=true
🟢 [HackerRank] The Blunder https://www.hackerrank.com/challenges/the-blunder/problem?isFullScreen=true
mySQL을 오랫동안 쉬다가 다시 문제를 해결하려고 하니 잊은 부분이 많아서 블로그에 TIL로 하나씩 정리를 하려고 한다. 오늘부터 Day 1 스타뚜!
프로그래머스 SQL 고득점 Kit TIL 정리
오늘은 SQL 문법 중 가장 많이 쓰이고, 코딩테스트 난이도도 어렵게 출제되는 INNER JOIN 문에 대해 간략히 알아보고 이를 활용한 예제들을 포스팅 해보려고 합니다.
안녕하세요! 오늘은 mySQL의 필수적인 함수 CASE WHEN에 대해 알아보고 관련 문제를 풀어보는 포스팅을 하고자 합니다. (집계, 정렬과 같은 mySQL의 매우 기초적인 내용은 다루지 않을 예정입니다.)
안녕하세요! 저는 얼마 전부터 모 대기업 데이터분석 직무 인턴을 시작했는데, 첫 업무로 Hadoop 베이스의 데이터베이스 관련 업무를 받게 되었습니다. 그리고 얼마 전부터 sql에 대한 공부는 해서 sql 코딩은 기본적인 것은 할 수 있지만, sql을 쓰기 전에 데이터베이스에 대...
내 깃허브 블로그 첫 포스팅은 주식데이터의 탐색에 관한 내용이었다. 오늘은 첫 포스팅에서 썼던 미래에셋 주식 데이터 중 ‘삼성전자’의 주가를 Prophet 이라는 시계열분석 모델을 이용해 fit 하고 prediction도 해보는 포스팅을 해볼까 한다.
Kaggle data에 시계열분석 적용해보기 Part 2: ARIMA application
Kaggle data에 시계열분석 적용해보기 Part 1. Data Cleansing & EDA
이제 시계열분석의 핵심 모델인 ARMA/ARIMA를 위한 개념을 잡는 마지막 관문이다! 앞선 두 포스팅에서는 시계열 평활기법에 대해 살펴보았다. 이번 포스팅에서 다룰 내용은 다음과 같다. 정상성 시계열 자기상관함수(ACF)/편자기상관함수(PACF) AR 모델/MA 모델
이번 포스팅에서는 저번 포스팅에 이어 평활기법 중 Holt 및 Holt-winters 에 대해 다루도록 하겠다. 지난 포스트처럼 이론에 대해 설명한 후, Python code로 실습을 하는 흐름으로 진행하겠다.
시계열분석(Time Series Analysis) 은 하나의 변수에 대한 시간에 따른 관측치인 시계열데이터를 분석하는 것이다.
최근에 마친 포스팅 시리즈인 Feature Selection 파트를 준비하면서 자연스럽게 머신러닝의 해석에 관한 이론들도 접하게 되었다. 머신러닝 모델링을 할 때 중요한 feature만을 선택해 모델의 성능을 높이는 것도 중요하지만, 더 나아가 완성된 모델을 어떻게 해석할 것인지가...
Feature selection 시리즈 포스팅의 마지막! 이번 포스팅에서는 Kaggle과 같은 데이터분석 플랫폼에서도 많이 쓰이는 SHAP에 대해 다룬다.
※ 이 포스팅은 Interpretable machine learning 을 요약 및 참고를 주로 하였습니다.
Feature Selection Methods 오랜만에 블로그 포스팅이다! Kaggle이나 공모전, 대학원 프로젝트에서 모델링을 할 때 가장 막막했던 부분은 feature engineering 파트이다. 모델의 성능 향상에 기여하는 feature를 생성하는 것도 중요하지만, 이와 ...
오늘은 머신러닝/딥러닝의 기본기를 다시 한 번 다지기 위해 손실함수(Loss function) 에 대해 낱낱이 다루는 내용을 준비했습니다.
오늘은 Bootstrap 에 대하여 공부해볼 것이다. 이 포스트에서는 모델링에서의 bootstrap이 아닌, 모수 $\theta$ 를 추정할 때 사용하는 bootstrap에 대해서 다룬다. 사용언어: R Code link: https://github.com/hyewonlees...
오늘은 통계학과 석사 첫학기 수업에서 배운 ‘결측자료분석’의 missing data mechanism 이론에 대해 다뤄보려고 합니다. 데이터분석에서 missing을 다루는 것은 매우 중요한 작업입니다. Missing data를 어떻게 다루느냐에 따라 model의 performan...
이전 포스팅에서는 가장 basic한 CNN 모델을 구현하는 방법에 대해 다루었다. 이번 포스팅에서는 CNN 모델을 보다 더 구체적으로 만드는 옵션들에 대해 살펴볼 것이다. 여러가지 옵션이 있겠지만, 이번 포스팅의 주제는 CNN 모델에서의 Dropout layer, batch s...
이제부터 약 한 학기(6개월정도?) 동안은 딥러닝 관련 포스팅을 주로 해보려고 한다. 이번 학기에 딥러닝 강의를 듣기도 하고, 스스로 더 찾아보고 공부해보고 기록을 남기고 싶어서 시작하게된 딥러닝 포스팅! 첫번째 주제는 이미지 분류에 주로 이용되는 CNN(Convolutional ...
아래 프로그래머스 문제를 for, while문을 이용해서 그냥 풀었는데 계속 효율성 0점이 나와서 이유가 뭔가 하고 찾아보았다. 자료구조를 공부하지 않아서 몰랐는데 이 문제에서 힙(Heap)을 쓰면 효율성이 확 올라간다! 그래서 오늘 TIL에서는 힙에 대해 간단히 정리하려고 한다.
🟢 전화번호 목록 https://programmers.co.kr/learn/courses/30/lessons/42577
안녕하세요! 요즘에 저는 주식 투자에 관심이 생겼습니다. 그래서 주식 데이터를 통해 주식 상황을 더 잘 이해해보려고 합니다. 그래서 오늘부터는 미래에셋 주식 데이터를 가지고 여러가지 분석을 해보고 주식에 대한 기본적인 개념과 주식시장에서의 현상을 이해하는 포스팅을 하고자 합니다. ...
벌써 2020년이 가고 2021년이 왔다. 2020년은 코로나 등으로 학교 수업도 모두 집에서 온라인으로 들었던 한 해였다. 2020년에는 뭔가를 많이 못했다고 생각했는데, 돌이켜보면 뭔가를 하긴 했더라ㅎㅎ 이 블로그는 데이터분석 블로그이니 데이터분석에 관련된 활동을 간단하게 돌아...
Prologue 자연어처리(Natural Language Preprocessing) 은 문장, 텍스트 등 인간의 언어를 컴퓨터 언어로 구현하는 AI 알고리즘이다. NLP는 현 시대를 대표는 AI 알고리즘 중 하나로, 가장 대표적인 것이 텍스트분석인데, 예를 들면 영화 감상평 분...