Data-centric AI

끄적끄적

H_erb Salt 2022. 4. 20. 15:51

인공지능의 한계 3 - AI 응용 상용화 85% 실패, 그리고 Data-Centric AI로의 이동

www.samsungsds.com

나의 블로그 이름을 짓는데 지대한 영향을 끼친 오픈 카톡방이 있다.

이름하여 데분데분(데이터분석 QnA&네트워킹) 카톡방이다(ㅋㅋㅋㅋㅋ).

그 카톡방에 매우 흥미로운 블로그 글이 올라와 정독해보았다.

위 블로그 글은 머신러닝의 아버지 Andrew Ng의 세미나 내용을 정리한 것으로 링크는 아래에 있다.

내가 이해한 바로는 현재까지의 AI 모델은 시스템1인지 기술(개/고양이 구분)일 뿐, 시스템2인지 기술(인간의 의식 흐름-conscious process)랑은 거리가 멀고, 이는 결국 아무리 복잡한 AI 모델이라도 garbage in garbage out이라는 것.

즉, 예쁜 모델보다 예쁜 전처리가 더욱 필요하단 뜻으로 이해되었다.

위 삼성 SDS블로그에도 잘 나와있다.

" 딥러닝은 입력공간을 표적공간에 사상(寫像, mapping)시키기 위해 연쇄적 기하 변환을 하는 계층적 표현 학습에 불과하다 " - Keras 창시자 François Chollet -

그 핫했던 GPT-3도 결국

" 주어진 단어에 대해 통계적으로 가장 잘 어울리는 다음 단어를 추론하는, 대규모 언어 모델 기반 시스템1인지 기술일 뿐이다. "

이라고 꼬집고 있다. 예전부터 느끼고 있던 그대로다.

결국은 수학으로 이루어진(행렬..?) 세상인걸, AI는 만능이 아니야!

모든 것들이 자동화된 인공지능은 결국 내가 죽을 때 까지 만들어지진 않을 것 같다.

Data-centric AI를 바꿔말하면 예쁜 전처리가 아닐까?

데이터 사이언티스트는 결국 수학과 통계로 생각하고 프로그래밍 언어로 말을 할 뿐이다.

생각을 깊게 하고, 그 생각을 예쁘게 표현할 수 있는 데이터 사이언티스트가 되고 싶다.

(22.08.) 중앙교육연수원 신임 장학사/교육연구사 대상 강의 후기 (1)	2022.12.29
계량경제학은 어떨까?(Feat. Causal inference) (2)	2022.05.19
pytorch lightning 기초 형태 정리 (0)	2022.03.19
데싸 얘기, 면접질문 등 (0)	2022.02.18
경북대학교 데이터사이언스 대학원 합격 후기 (50)	2022.02.05

데분데싸