[BoostCourse] 3. 머신러닝 기본 개념
1. Underfitting & Overfitting fit 데이터를 잘 설명할 수 있는 능력 Underfitting: 데이터를 설명하지 못함 Overfitting: 데이터를 과하게 설명함 under - 적절 - over overfitting 우리의 데이터셋은 전체의 일부분 확보한...
1. Underfitting & Overfitting fit 데이터를 잘 설명할 수 있는 능력 Underfitting: 데이터를 설명하지 못함 Overfitting: 데이터를 과하게 설명함 under - 적절 - over overfitting 우리의 데이터셋은 전체의 일부분 확보한...
1. 정형 데이터 structured, tabular data 엑셀 파일 형식이나 RDB 테이블에 담을 수 있는 데이터로, 행과 열로 표현 가능한 데이터 하나의 행은 데이터 인스턴스 각 열은 데이터의 피처(속성)을 나타냄 비정형 데이터 이미지, 비디오, 음성 자연어 등 정제되지 않고 테이블 형태로 표현될 수 없는 데이터 ...
https://www.acmicpc.net/problem/1546 문제 세준이는 기말고사를 망쳤다. 세준이는 점수를 조작해서 집에 가져가기로 했다. 일단 세준이는 자기 점수 중에 최댓값을 골랐다. 이 값을 M이라고 한다. 그리고 나서 모든 점수를 점수/M*100으로 고쳤다. 예를 들어, 세준이의 최고점이 70이고, 수학점수가 50이었으면 수학...
https://www.acmicpc.net/problem/1268 문제 오민식 선생님은 올해 형택초등학교 6학년 1반 담임을 맡게 되었다. 오민식 선생님은 우선 임시로 반장을 정하고 학생들이 서로 친숙해진 후에 정식으로 선거를 통해 반장을 선출하려고 한다. 그는 자기반 학생 중에서 1학년부터 5학년까지 지내오면서 한번이라도 같은 반이었던 사람이...
https://www.acmicpc.net/problem/1834 문제 N으로 나누었을 때 나머지와 몫이 같은 모든 자연수의 합을 구하는 프로그램을 작성하시오. 예를 들어 N=3일 때, 나머지와 몫이 모두 같은 자연수는 4와 8 두 개가 있으므로, 그 합은 12이다. 입력 첫째 줄에 2,000,000 이하의 자연수 N이 주어진다. ...
https://www.acmicpc.net/problem/1924 문제 오늘은 2007년 1월 1일 월요일이다. 그렇다면 2007년 x월 y일은 무슨 요일일까? 이를 알아내는 프로그램을 작성하시오. 입력 첫째 줄에 빈 칸을 사이에 두고 x(1 ≤ x ≤ 12)와 y(1 ≤ y ≤ 31)이 주어진다. 참고로 2007년에는 1, 3, 5, ...
SparkSession from pyspark.sql import SparkSession spark = SparkSession.builder.appName('Test').getOrCreate() spark.conf.sest('spark.sql.execution.arrow.pyspark.enabled', 'true') # 메모리 관련 re...
https://www.acmicpc.net/problem/1236 문제 영식이는 직사각형 모양의 성을 가지고 있다. 성의 1층은 몇 명의 경비원에 의해서 보호되고 있다. 영식이는 모든 행과 모든 열에 한 명 이상의 경비원이 있으면 좋겠다고 생각했다. 성의 크기와 경비원이 어디있는지 주어졌을 때, 몇 명의 경비원을 최소로 추가해야 영식이를 만족...
다중 선형 회귀 1. 기존 단순회귀모형의 문제점 종속변수를 설명하는 독립변수가 2개일 때 단순회귀모형을 사용하면 모형 설정이 부정확하고, 종속변수에 대한 중요한 설명변수가 누락될 수 있음 즉, 계수추정량에 대해 bias가 발생 2. 편향(Bias) & 분산(Variance) 편향-분산 트레이드 오프 ...
1. 회귀 분석 독립변수 x에 대응하는 종속변수 y와 가장 유사한 값을 갖는 함수 f(x)를 찾는 과정 → f(x)를 통해 미래 사건 예측 ^y = f(x) ≈ y 회귀 분석을 통해 구한 함수 f(x)가 선형 함수일 때 f(x) = 회귀 직선 선형 회귀 분석 특성과 타겟 사이의 관계를 잘 나타내는 ...