https://www.samsungsds.com/kr/insights/data_centric_ai.html
나의 블로그 이름을 짓는데 지대한 영향을 끼친 오픈 카톡방이 있다.
이름하여 데분데분(데이터분석 QnA&네트워킹) 카톡방이다(ㅋㅋㅋㅋㅋ).
그 카톡방에 매우 흥미로운 블로그 글이 올라와 정독해보았다.
위 블로그 글은 머신러닝의 아버지 Andrew Ng의 세미나 내용을 정리한 것으로 링크는 아래에 있다.
https://www.youtube.com/watch?v=06-AZXmwHjo
내가 이해한 바로는 현재까지의 AI 모델은 시스템1인지 기술(개/고양이 구분)일 뿐, 시스템2인지 기술(인간의 의식 흐름-conscious process)랑은 거리가 멀고, 이는 결국 아무리 복잡한 AI 모델이라도 garbage in garbage out이라는 것.
즉, 예쁜 모델보다 예쁜 전처리가 더욱 필요하단 뜻으로 이해되었다.
위 삼성 SDS블로그에도 잘 나와있다.
" 딥러닝은 입력공간을 표적공간에 사상(寫像, mapping)시키기 위해 연쇄적 기하 변환을 하는 계층적 표현 학습에 불과하다 " - Keras 창시자 François Chollet -
그 핫했던 GPT-3도 결국
" 주어진 단어에 대해 통계적으로 가장 잘 어울리는 다음 단어를 추론하는, 대규모 언어 모델 기반 시스템1인지 기술일 뿐이다. "
이라고 꼬집고 있다. 예전부터 느끼고 있던 그대로다.
결국은 수학으로 이루어진(행렬..?) 세상인걸, AI는 만능이 아니야!
모든 것들이 자동화된 인공지능은 결국 내가 죽을 때 까지 만들어지진 않을 것 같다.
Data-centric AI를 바꿔말하면 예쁜 전처리가 아닐까?
데이터 사이언티스트는 결국 수학과 통계로 생각하고 프로그래밍 언어로 말을 할 뿐이다.
생각을 깊게 하고, 그 생각을 예쁘게 표현할 수 있는 데이터 사이언티스트가 되고 싶다.
'끄적끄적' 카테고리의 다른 글
(22.08.) 중앙교육연수원 신임 장학사/교육연구사 대상 강의 후기 (1) | 2022.12.29 |
---|---|
계량경제학은 어떨까?(Feat. Causal inference) (2) | 2022.05.19 |
pytorch lightning 기초 형태 정리 (0) | 2022.03.19 |
데싸 얘기, 면접질문 등 (0) | 2022.02.18 |
경북대학교 데이터사이언스 대학원 합격 후기 (50) | 2022.02.05 |