Python 6

[파이썬] 데이터 분석 - 연봉 예측 분석 (회귀 분석)

연봉 예측 분석 회귀 분석 연봉 예측 분석을 시작하기 전에 회귀 분석이 무엇인지에 대해 알아보자. 아래의 그래프에서 빨간 점들은 실제 데이터를 나타낸다. 실제 데이터와 거리가 최소가 되는 방정식인 Y = wX + b를 찾아내는 과정을 회귀 분석이라고 한다. 즉, 회귀분석은 방적식의 계수인 w와 b를 잘 찾아내는 것이다. 그럼 이를 데이터 분석에 어떻게 적용할 수 있을까? 이 표를 보면 나이와 몸무게를 방정식의 X1, X2로 나타낼 수 있고, 키를 방정식의 Y로 정의할 수 있다. 즉, Y = w1X1 + w2X2 + b로 나타낼 수 있다. 회귀 분석은 해당 방정식에서 1, 2, 3번 데이터로 w1, w2, b라는 세 개의 계수를 추정하고, 마지막 4번 데이터를 가지고 계수가 잘 추정이 됐는지 테스트한다. ..

Programming/Python 2023.08.23

[파이썬] 데이터 분석 - 2.1 pandas 기초 익히기

pandas 기초 익히기 pandas pandas는 수식으로 계산할 수 있고 시각화도 할 수 있는 데이터 분석도구이다. 행과 열로 된 데이터를 다룰 때 사용한다. 엑셀로도 데이터를 분석할 수 있는데 pandas를 사용하는 이유가 무엇일까? 엑셀로는 힘든 대용량의 데이터를 pandas가 분석할 수 있기 때문이다. pandas와 관련된 문서로 여러 문서들이 있는데, 그중 '10 minutes to pandas' 문서를 참고하여 실습을 진행하면 pandas의 전반적인 것을 익힐 수 있다고 하니 제대로 실습해 보길 추천한다. https://pandas.pydata.org/pandas-docs/version/1.0.0/getting_started/10min.html 10 minutes to pandas — pan..

Programming/Python 2023.08.16

[알고리즘] 구현

이 글은 유튜버 '동빈나'의 "이것이 취업을 위한 코딩 테스트다 with 파이썬" 강의를 보고 작성한 글이며, 강의 링크는 아래를 참고하면 된다. https://www.youtube.com/watch?v=m-9pAwq1o3w&list=PLRx0vPvlEmdAghTr5mXQxGpHjWqSz0dgC 구현 구현이란, 머릿속에 있는 알고리즘을 소스코드로 바꾸는 과정을 말한다. 흔히 알고리즘 대회에서 구현 유형의 문제는 풀이는 떠올리는 것은 쉽지만, 소스코드로 옮기기 어려운 문제를 의미한다. 구현 유형의 예시 알고리즘은 간단한데, 코드가 지나칠 만큼 길어지는 문제 실수 연산을 다루고, 특정 소수점 자리까지 출력해야 하는 문제 문자열을 특정한 기준에 따라서 끊어 처리해야 하는 문제 적절한 라이브러리를 찾아서 사용해..

Algorithm 2023.07.16

[알고리즘] 그리디 알고리즘 (Greedy Algorithm)

이 글은 유튜버 '동빈나'의 "이것이 취업을 위한 코딩 테스트다 with 파이썬" 강의를 보고 작성한 글이며, 강의 링크는 아래를 참고하면 된다. https://www.youtube.com/watch?v=m-9pAwq1o3w&list=PLRx0vPvlEmdAghTr5mXQxGpHjWqSz0dgC 그리디 알고리즘 (Greedy Algorithm) 그리디 알고리즘(탐욕적인 방법)은 현재 상황에서 지금 당장 좋은 것만 고르는 방법을 의미한다. 일반적인 그리디 알고리즘은 문제를 풀기 위한 최소한의 아이디어를 떠올릴 수 있는 능력을 요구한다. 그리디 해법은 그 정당성 분석이 중요하며, 단순히 가장 좋아 보이는 것을 반복적으로 선택해도 최적의 해를 구할 수 있는지 검토하는 과정이 필요하다. 예시 [문제 상황] 루트..

Algorithm 2023.07.13

[파이썬] 문법 정리 - 리스트 자료형

이 글은 유튜버 '동빈나'의 "이것의 취업을 위한 코딩 테스트다 with 파이썬" 강의를 보며 정리한 내용이다. https://www.youtube.com/watch?v=m-9pAwq1o3w&list=PLRx0vPvlEmdAghTr5mXQxGpHjWqSz0dgC 강의 출처 리스트 자료형 리스트 자료형이란 여러 개의 데이터를 연속적으로 담아 처리하기 위해 사용하는 자료형이다. 사용자 입장에서 C나 자바에서의 배열(Array)의 기능 및 연결 리스트와 유사한 기능을 지원한다. C++의 STL vector와 기능적으로 유사하다. 리스트 대신에 배열 혹은, 테이블이라고 부르기도 한다. 리스트 초기화 리스트는 대괄호([])안에 원소를 넣어 초기화하며, 쉼표(,)로 원소를 구분한다. 비어 있는 리스트를 선언하고자 ..

Programming/Python 2023.07.11

[파이썬] 문법 정리 - 수 자료형

지난 학기에 알고리즘 스터디를 진행하게 되었는데, 파이썬으로 코딩 테스트 문제를 풀기 위해 파이썬 간단 문법에 대해 정리한 내용을 올려보려고 한다. 유튜버 '동빈나'의 "이것이 취업을 위한 코딩 테스트다 with 파이썬" 강의를 보고 작성한 글이며, 강의 링크는 아래를 참고하면 된다. https://www.youtube.com/watch?v=m-9pAwq1o3w&list=PLRx0vPvlEmdAghTr5mXQxGpHjWqSz0dgC 수 자료형에 대한 개념에 대해 알아보기 전에, 먼저 자료형엔 무엇이 있는지에 대해 알아보자. 자료형 모든 프로그래밍은 결국 데이터를 다루는 행위이다. 자료형에 대한 이해는 프로그래밍의 길에 있어서의 첫 걸음이다. 파이썬의 자료형에는 여러 가지가 있는데, 그 종류는 다음과 같다..

Programming/Python 2023.06.25