반응형 programming/AI32 머신러닝 백분위수 구하기 백분율도 알아야 이해가 되더라. 어쩌다 백분위까지 공부하다보니 머신러닝이 통계에 가장 가깝다는 것을 느끼고 있다. 백분위는 나열된 전체 표본 수에서 비율로써 나온 수가 어떤 것인지 파악하는 것이다. 개념적으로 난해하다. 이쯤되니 통계와 확률을 잘해야 머신러닝의 수학적개념을 익히는 것에 빠를 것이란 생각이다. 백분위수 백분율 백분위의 뜻은 전체 나열된 값들 중 백분율에 해당하는 수가 어떤 것인지 찾는 것이다. 개념만 알도록 하자. 백분율은 전체 나열된 수나 표본을 100이라고 했을 때 비율에 100을 곱한 %의 값이다. 뭔 소린지 알다가도 모르겠다. ㅋ 우선 백분율부터 알고 넘어가는 것이 편하다. 백분율은 %이다. 100 중에 20은 몇 %인가? 라고 했을 때 20%라는 것을 알 수 있다. 이것이 백분율이다. 백분위수는 전체 표본 100.. 2021. 8. 6. 머신러닝 평균, 분산과 표준편차 Variance, Standard Deviation 머신러닝과 관련된 것중 분산과 표준편차는 값이 얼마나 많이 퍼져 있는지를 알 수 있는 것이다. 수학적으로 분산과 표준편차는 관계가 깊고 분산의 제곱근이 표준편차이다. 머신러닝을 공부함에 있어 분산과 표준편차를 아는 것은 주어진 값의 분포를 찾아내는 것이다. 분산과 표준편차 분산과 표준편차는 값의 분포도를 알 수 있다. 여기서 한가지 연관되는 것은 평균이다. 즉, 평균, 분산, 표준편차란 이 세가지는 항상 연관되어 있다. 개요만 간단히 살펴보자 평균 Mean 표본을 모두 더한 후 표본의 수로 나눈 값 나열된 모든 숫자를 더한 후 나열된 모든 수의 갯수로 나눈 값 변량 표본으로 정의된 값들, 즉 나열된 모든 값들의 하나하나 개별 값 분산 Variance 분산은 편차 제곱의 평균이다. 편차는 표본으로 제시된 .. 2021. 8. 4. 머신러닝 평균값 중앙값 최빈값 구하기 mean median mode 머신러닝에는 3가지의 수학적 관심사가 있다. 평균값 중앙값 최빈값이다. 이것은 평균값을 나타내는 지표이고 통계학과 관련이 있다. 머신러닝이 데이터 기반의 프로그램이라는 것을 생각하면 납득이 된다. 수많은 데이터에서 공통되는 지표를 찾기란 어렵다. 이것을 구분짓는 것이 수학적으로 가장 가까운 것이 평균이기도 하다. 머신러닝의 수학적 3가지 지표 방대한 데이터 속에서 특정값을 찾기란 어렵다. 그렇기에 수학적으로 접근하는 시도가 있었다. 컴퓨터도 수학을 위해 발명된 것이 아닌가. 머신러닝을 위해 접하는 첫번째 수학은 통계이기도 하다. 그 중 대표적인 3가지는 평균값, 중앙값, 최빈값이다. 머리가 아프다. 정리만 하고 넘어가자 평균값 Mean - 표본을 모두 더한 후 표본의 수로 나눈 값 - 나열된 모든 숫자를.. 2021. 8. 3. 파이썬 머신러닝 딥러닝 시작하기 머신러닝을 위해 파이썬을 공부하는 사람은 많다. 머신러닝과 딥러닝의 개념은 많은 자료들이 있으니 참고하면 된다. 실제로 연구하고 공부하는 분야는 다른 얘기일 수 있다. 너무도 복잡하기 때문이다. 하지만 단순히 어떤 용도로 무엇을 사용하면 되는지 간단히 학습할 수 있는 것이 있다. 공부할 것들 머신러닝에 대해 본격적인 학습을 필요로 한다면 머리가 아플 수 있다. 수학, 확률, 통계, 선형대수 등 데이터 집합을 분석할 수 있는 수학적 공부가 필요하다. 코딩과 언어는 부수적인 도구일 뿐이다. 하지만, 개념부터 천천히 파헤쳐 보자. 수학이나 확률 통계를 모르더라도 라이브러리는 많다. 간단한 코딩을 하면서 쉬운 것부터 하면 그만이다. 데이터 집합 머신러닝이나 딥러닝이나 기본은 축적된 데이터이다. 축적된 데이터가 .. 2021. 7. 31. 이전 1 ··· 4 5 6 7 8 다음 반응형