https://gall.dcinside.com/mgallery/board/view/?id=statistics&no=2326&page=1
데싸 재직 중인 통피다
울 회사 데싸들은 각자 잘 하는 게 다 달라. 난 그 중에서도 도메인이랑 통계 파트를 맡고 있고.
개발 잘 하시는 분도 있고, 컴공출신 분, DB 설계 잘 하시는 분, 도메인 출중하신 분 등 서로 도와가며 열심히 일함
분석, 모델링, 알고리즘은 확실히 통계 기반이 있어야 한다고 생각함. 근데 데싸 업무 커버리지가 방대해서 이외 나머지 분야는 굳이 통계가 하드하게 필요하냐?라고 하면 아닌 것 같아. 기초 정도는 알면 좋지만 통계를 막 전공생 수준으로 해야되냐는 아닌 것 같아. 오히려 다른 영역에서는 이런 분들이 더 잘하고 도움도 주시니까.
그래서 우리가 타 분야라고 무시할 것도 아니고, 넓게 봐서 열심히 공부하고 도움 받으면서 잘 지내면 됨. 반대로 데싸 중에서도 분석 모델링 알고리즘쪽으로 한정했을 때, 통계 공부 안 하고 모델 갖다쓰는 라이브러리 코더들은 욕먹고 반성해야한다 생각한다.
우리는 팀장님이 면접 지원자가 이력서랑 포트폴리오를 내면 어떤 강점이 있는지 보고, 그 분야 잘 아는 팀원을 같이 데려가는데 난 통계 전공생들이나 이 쪽으로 어필한 친구들 면접에 들어간다
보통은 포트폴리오나 석사 주제 연관 질문들 위주로 진행되고, 전투력 측정 겸 내가 공통으로 하는 질문들이 몇 개 있는데 의외로 많이 대답을 못 해. 심지어 대답 못하는 통계 석사들도 봤으니 말 다 했지.
여기 형들은 굇수들이니 잘 알겠지만 그래도 참고차 생각나는 거 몇 개 공유해봐 두서없이 써서 미안
[선형대수]
1. 행렬의 대각화가 왜 중요할까?
2. 고윳값과 고유벡터의 정의는? 비전공생들에게 왜 중요한지 설명해줄 수 있을까?
3. 벡터의 내적을 활용하는 사례를 한 가지만 설명해달라
[미적, 해석]
1. 미적분의 기본정리를 아는가? 미적분은 선형변환인가?
2. 테일러 급수가 무엇인가? 활용 사례를 한 가지만 설명해달라
[통계]
1. 제1/2종오류, p값, 기각역
2. OLS 공식과 의미
3. 가능도, MLE
4. 프리퀀티스트 vs 베이지안, 개인적으로 어느 쪽인가
5. 회귀분석의 기본가정, 깨졌을 때 각각 어떻게 대처할까?
6. CLT의 의미
7. 다중공선성이란? 어떻게 탐지 가능할까?
8. PCA와 FA의 차이점?
9. GLM을 해 본 적이 있는가? 각 link function별 특징을 얘기해줄 수 있는가?
10. Wald test vs LR test vs Score test의 차이
11. 시계열에서 stationary의 의미
12. linear model이 왜 중요할까?
[분석, 머신러닝 등]
1. 로지스틱 회귀와 SVM의 차이를 얘기해달라
2. strafitied data면 어떻게 대응할 것인가?
3. 정규화가 무엇인가? 왜 하는가?
4. 데이터 스케일링이 무엇인가? 왜 하는가?
5. MCMC가 무엇인가?
6. EDA가 무엇인가? 어떻게 했는지 경험을 알려달라
7. 딥러닝이 항상 좋은가? 언제 쓰고 언제 쓰지 말아야 할까?
8. 배깅과 부스팅의 차이?
9. 개인적으로 좋아하는 모델이 있는가? 이유는?
10. 개인적으로 데이터 분석 시 가장 힘든 점은?
'끄적끄적' 카테고리의 다른 글
Data-centric AI (0) | 2022.04.20 |
---|---|
pytorch lightning 기초 형태 정리 (0) | 2022.03.19 |
경북대학교 데이터사이언스 대학원 합격 후기 (50) | 2022.02.05 |
엄청난 사이트 정리 (0) | 2021.12.02 |
einops 튜토리얼 (0) | 2021.07.14 |