전체 글 44

[Stat] 추측 통계학의 꽃 '가설 검정'(귀무가설, 대립가설)

어떻게 선택하더라도 우연의 일치에 의해 일어나는 효과를 모두 제거할 수는 없다, 로널드 A.피셔 귀무가설, 대립가설?가설검정(hypothesis test)은 처음 접할 땐 사고과정이 난해하여 통계학 중에서도 어렵다는 평가를 많이 받는 방식이다. 가설검정의 대략적인 방식은 다음과 같다. 먼저 가설을 세우고, 해당 가설이 옳다고 가정한 뒤 '확률적으로는 거의 일어나지 않을 일'이 일어나면 그 가설을 부정하고 반대의 가설을 채택한다. 즉, 가설 A가 올바르다고 가정했을 때, 확률적으로 아주 희귀한 일이 발생한다면 가설 A 자체가 잘못되었을 가능성이 크다는 것으로, 최초의 가설 A를 부정하고 그 대안으로 다른 가설 B를 채택한다는 원리다. 쉬운 예를 통해 이해해보자.동전 앞면이 나올지 뒷면이 나올지에 따라 돈을..

Product Analytics 2024.12.24

[Stat] 회귀모형 평가하기 - RMSE(평균 제곱근 오차)

입력변수가 하나일 땐 최소제곱법의 공식을 통해 기울기(a)와 회귀상수(b)를 구할 수 있지만, 입력변수가 여러 개일 때는 최소제곱법으로는 무리가 있다. 그리고 대부분의 데이터셋은 절대적으로 입력변수가 여러 개이다. 이런 경우, 오차를 가장 최소화하는 최적선을 그리기 위해 평균 제곱근 오차(Root mean square error)를 사용한다.  평균 제곱근 오차...이전에 오차는 뭐야?선형회귀에서의 가장 중요한 이슈는 결국 오차가 가장 최소화되는 가장 적합한 '예측선'을 찾는 것이다.여기서의 오차는 결국, '실제 값'과 '예측 값'의 차이를 말한다.운동 시간이 인풋(입력변수, 독립변수)인 x, 푸쉬업 개수가 우리가 예측해야 하는 종속변수, 결과변수인 y이다. 예측값은 y햇이다. 이게 y햇 오차는 y(실제..

Product Analytics 2024.12.24

[Stat] 선형회귀(linear regression), 최소제곱법

1. 선형회귀 (Linear regression)딥러닝의 가장 기본이 되는 Linear regression은 쉽게 말해 '예측선 긋기'입니다. 예를 하나 들자면, 운동 연습시간에 따라 할 수 있는 푸쉬업 개수가 다르다. 라는 문장이 있다고 해봅시다. 이 경우, 운동 연습시간은 독립변수 x이고 푸쉬업 개수는 종속변수 y입니다. 종속변수 y는 독립변수 x에 따라서 종속적으로 변하는 (자유롭지 못한) 변수를 의미하는데, 선형회귀는 독립변수를 이용하여 종속변수의 움직임을 예측하는 방법 중 하나입니다.독립변수가 하나일 경우 단순선형회귀(simple linear regression), 여러 개일 경우 다중선형회귀(multiple linear regression)이라 합니다. "운동 연습시간에 따라 할 수 있는 푸쉬..

Product Analytics 2024.12.24

[레퍼런스 분석] 링크드인(Linkedin)

0. 대상 서비스 링크드인은 비즈니스와 취업 중심의 소셜 미디어 플랫폼으로 쉽게 말하면 직장인들을 위한 SNS다. 2016년에 마이크로소프트에 인수되었으며 2023년 상반기 기준 전세계 9억 5천만 명의 유저를 보유하고 있는 링크드인은 그 어느 서비스보다도 채용을 위한 리크루터들과 헤드헌터들의 활동이 활발하고 경력자들의 활동 역시 왕성한 플랫폼이다. 나는 대학교 2학년 때부터 현직자들에게 여러 정보들을 얻고자 링크드인을 많이 활용해왔는데 분석가로 첫 커리어를 이어가기 시작하게 된 계기 역시 링크드인을 통한 인사팀의 연락이었다. 또, 전세계 현직자들이 업계의 다양한 이야기들을 공유하기 때문에 유용한 정보를 얻을 수 있는 서비스다. 오늘은 링크드인을 분석해보고자 한다. 웹과 앱 둘 다 있지만 앱을 기준으로 ..

[아티클 스터디] 데이터 드리븐 디자인의 중요성

설득력을 가진 디자인, 데이터 드리븐 디자인이 필요해요데이터 활용 능력은 이제 디자이너에게도 필수가 되고 있어요. 데이터가 뒷받침 되는 디자인은 설득력이 있으니까요.datarian.io  프로덕트 디자이너는 데이터를 분석이 아닌, '해석' 할 줄 알아야 합니다.데이터의 종류는 정성적 데이터와 정량적 데이터로 나뉩니다. 정성적 데이터는 언어 혹은 문자 등으로 이루어진 부가적인 설명이 필요한 데이터를 말하며, 사용자 경험에 대한 비수치적인 데이chaeyeon-chaeyeon.tistory.com 현재 내 상황에서 얻을 수 있는 인사이트들이 있어서 아카이빙 목적으로 가져왔다. 첫 번째 링크는 분석가로 일할 때 링크드인 팔로우도 해놓고 여러 유용한 정보들을 받아보곤 했던 데이터리안의 수강생 인터뷰 글이고 두 번..

[UI] 용어 정리

https://brunch.co.kr/@tigrisdesign/2 UI 용어를 정리해야 하는 이유한눈에 보는 UI 용어 A to Z(1) | 배경 일을 하다 보면 비슷한 UI 용어들이 생각보다 많이 보이는데요.이 용어들을 각자 쓰고 싶은 대로 쓰다 보면 서로 의미를 잘못 이해하거나 정확히 파악하기 어brunch.co.krhttps://brunch.co.kr/@tigrisdesign/3 모달과 팝업, 정확히 알아야 하는 이유한눈에 보는 UI 용어 A to Z(2) | 배경 대부분의 디자이너가 가장 많이 헷갈리는 (UX) 개념 중 하나는 모달과 팝업입니다. 팀에서도 이 개념 하나로 뜨거운 토론? 이 벌어졌는데요. 실제로 기업마다brunch.co.kr