끄적끄적

Data-centric AI

H_erb Salt 2022. 4. 20. 15:51

https://www.samsungsds.com/kr/insights/data_centric_ai.html

 

인공지능의 한계 3 - AI 응용 상용화 85% 실패, 그리고 Data-Centric AI로의 이동

인공지능의 한계 3 - AI 응용 상용화 85% 실패, 그리고 Data-Centric AI로의 이동

www.samsungsds.com

 

나의 블로그 이름을 짓는데 지대한 영향을 끼친 오픈 카톡방이 있다.

 

 

이름하여 데분데분(데이터분석 QnA&네트워킹) 카톡방이다(ㅋㅋㅋㅋㅋ).

그 카톡방에 매우 흥미로운 블로그 글이 올라와 정독해보았다.

 

위 블로그 글은 머신러닝의 아버지 Andrew Ng의 세미나 내용을 정리한 것으로 링크는 아래에 있다.

 

https://www.youtube.com/watch?v=06-AZXmwHjo 

 

내가 이해한 바로는 현재까지의 AI 모델은 시스템1인지 기술(개/고양이 구분)일 뿐, 시스템2인지 기술(인간의 의식 흐름-conscious process)랑은 거리가 멀고, 이는 결국 아무리 복잡한 AI 모델이라도 garbage in garbage out이라는 것.

 

즉, 예쁜 모델보다 예쁜 전처리가 더욱 필요하단 뜻으로 이해되었다.

 

위 삼성 SDS블로그에도 잘 나와있다. 

 

" 딥러닝은 입력공간을 표적공간에 사상(寫像, mapping)시키기 위해 연쇄적 기하 변환을 하는 계층적 표현 학습에 불과하다 " - Keras 창시자 François Chollet -

 

그 핫했던 GPT-3도 결국 

 

" 주어진 단어에 대해 통계적으로 가장 잘 어울리는 다음 단어를 추론하는, 대규모 언어 모델 기반 시스템1인지 기술일 뿐이다. "

 

이라고 꼬집고 있다. 예전부터 느끼고 있던 그대로다.

결국은 수학으로 이루어진(행렬..?) 세상인걸, AI는 만능이 아니야!

 

모든 것들이 자동화된 인공지능은 결국 내가 죽을 때 까지 만들어지진 않을 것 같다.

 

 

Data-centric AI를 바꿔말하면 예쁜 전처리가 아닐까?

 

데이터 사이언티스트는 결국 수학과 통계로 생각하고 프로그래밍 언어로 말을 할 뿐이다.

생각을 깊게 하고, 그 생각을 예쁘게 표현할 수 있는 데이터 사이언티스트가 되고 싶다.