본문 바로가기
마린일병의 사람사는 이야기/주제 넘은 서평

[서평][IT개발][AIML] 머신러닝을 위한 실전 데이터셋 / 한빛미디어

by 마린일병 2021. 2. 22.
728x90
반응형

머신러닝과 딥러닝은 데이터가 필요하다 그것도 아주 많이...

러닝이란 단어가 의미하는 바와 같이 이 둘을 학습이란 걸 통해 무언가를 해결하고자 하는 접근인데 그 학습을 위해서는 반드시 그 과제와 관련된 데이터가 동반되지 않으면 절대 원하는 결과에 근접할 수 없게 된다.

 

데이터의 양과 품질에 따라 모델을 통해 얻고자 하는 결과의 품질은 극명하게 달라지는데 현실세계에서 충분한 고품질의 데이터를 확보하기란 여간 어려운 것이 아니다.

 

이러한 현실로 인해 최근 합성 데이터에 대한 관심이 급속도로 증가하고 있는데 이는 개념적으로 합성 데이터라는 것이 실제 데이터는 아니지만 실제 데이터에서 생성되어 실제 데이터와 통계적 속성이 동일한 특성을 가지고 있기 때문에 기인한다.

 

"머신러닝을 위한 실전 데이터셋" 이 책은 이러한 합성 데이터에 대한 내용을 담고 있는 책이다.

이 책은 기술적인 데이터 합성 기법에 대해서는 다루지 않는다, 책의 초점은 합성 데이터의 개념과 합성시 고려해야 할 부분 그리고 여러 산업군에서의 합성 적용 사례와 합성 기법의 유형에 대한 개괄적인 내용을 담고 있다.

 

실질적인 구현 로직이나 방법에 대한 구체적인 내용을 기대했다면 실망스러울 수 있다. 하지만 분야의 개념과 컨셉과 같은 큰 그림을 그려보고자 한다면 이 책을 통해서 충분히 의미있는 인사이트를 얻을 수 있을 꺼라 생각한다.

 

그리고 한 뎁스 더 들어가보면 어떨까?

 

퀵하게 여러 방법에서의 접근을 통한 합성 데이터와 관련해서 밑그림을 그려보기에 적당한 분량의 책이 아닐까?

 

※ 본 리뷰는 IT 현업개발자로서 한빛미디어 리뷰어로 출판사로부터 제공받아 읽고 작성한 글입니다.

728x90

댓글