본문 바로가기
programming/AI

머신러닝 독립변수 종속변수 원인과 결과의 상관관계

by 개코 - 개발과 코딩 2021. 8. 18.

머신 러닝에는 독립변수와 종속변수라는 개념이 존재한다. 독립변수는 원인, 종속변수는 결과에 해당한다. 결과는 원인이란 사건에 영향을 받기 때문에 변하는 값들은 종속된다. 이들은 원인과 결과의 인과관계에 따라 값을 파악하고 이런 인과관계들이 수치적으로 관련있는 것들의 상관관계로 나타낼 수 있다.

머신러닝 독립변수 종속변수
머신러닝 독립변수 종속변수

인과관계

인과관계는 원인과 결과의 관계이며, 원인에 대한 어떤 사건에 대해 결과로써 발생한 일의 관계를 뜻한다.

다시 말해 어떤 사건이 발생하고 이것으로 어떤 사건이 발생했을 경우 이 둘의 관계가 원인과 결과로써의 관계가 맺어진다.

인과관계 뜻은 원인과 결과를 의미한다.

상관관계

수치적으로 어떤 값들을 표시했을 때 어떤 값이 변화를 하면 다른 어떤 값도 변화를 하게 된다.

이것을 수학적인 의미로 표현하면 두 수에서 한쪽의 증감이 발생하면 다른 한쪽 또한 증감이 발생한다.

이런 관계를 상관관계라고 한다.

독립변수 종속변수

독립변수와 종속변수는 통계나 사회전반적으로 사용되는 단어이기도 하며 함수와 연관이 있다.

결론부터 말하기 전에 수식부터 만들어 보면 아래와 같다.

y = f(x) 라고 할 때 이것을 함수라고 한다.

함수는 어떤 수식에 어떤 값을 넣었을 때 결과로써 값이 나온다.

독립변수는 어떠한 계기로 발생한 원인이 되는 것을 말한다. 주로 관찰의 대상이 되는 데이터가 될 수 있고, 이 데이터로써 변화되는 값이 종속변수이다.

  • y = f(x)
  • y / 결과가 되는 값이 종속변수
  • f(x) / 원인이 되는 값이 독립변수
  • y = f(x) / 원인, 결과 독립변수, 종속변수

함수는 상관관계로 이루기도 한다.

관찰되는 원인 데이터들이 일정한 변화를 거치면서 결과 데이터들은 변화를 하면서 상관관계를 이룬다.

그렇다면 상관관계를 알 수 있고, 일정한 수식에 의한 패턴이 존재할 것이며, 함수로써 표현을 할 수 있다.

위의 언급된 수식으로 돌아가 보자.

y = f(x) 라고 했을 때, 위의 구문을 대입하면 아래와 같다.

결과 = f(원인) 이 될 수 있고, 종속변수 = f(독립변수) 로써 나타낼 수 있다.

머신 러닝과의 관계

이런 함수의 관계를 표현하는 독립변수와 종속변수가 머신 러닝과 무슨 관계가 있을까

머신 러닝의 개요부분을 읽어보면 조금은 이해할 수 있다. ai 가 학습을 하는 머신 러닝은 어떠한 지식의 표본을 이용한 통계적 데이터를 찾으려고 시도할 것이며, 가장 근접적 데이터를 답으로 인식할 것이다.

원인이란 데이터가 여러개 있다면 학습을 통해 가장 근접한 데이터를 찾고 결과 데이터를 출력하게 될 것이다.

이 과정은 f(x) 수식으로 표현할 수 있으며, 머신 러닝의 라이브러리가 정밀할 수록 학습되는 데이터들은 정확도가 높아질 것이다.

함수로 표현하기

독립변수와 종속변수가 함수로써 표현이 가능하다는 것은 원인과 결과가 뚜렷하고 수치로써 관찰이 가능하고, 발생하는 사건에 대해 일정 패턴이 존재한다는 것이다.

수식이 어떻게 나올지는 사건마다 다르겠지만, 어떤 사건들의 평균값을 위한 식이 존재할 수 있다는 것을 의미한다.

  • 독립변수, 종속변수
  • 원인, 결과
  • f(x) = y
반응형

댓글