본문 바로가기
마린일병의 사람사는 이야기/주제 넘은 서평

[서평][IT개발][NLP] 파이토치로 배우는 자연어 처리 / 한빛미디어

by 마린일병 2021. 6. 22.
반응형

컴퓨터를 통한 자연어를 처리하는 방법에 대한 연구는 꽤 오랜 역사를 가지고 있다. 최근들어 이 분야도 머신러닝/딥러닝을 이용한 다양한 형태의 자연어 처리 방안이 연구되고 있는 핫한 분야이다.

 

그도그럴것이 음성이던 텍스트던 기계가 자연어를 알아듣고 인간과 소통할 수 있다는 것은 연구자/개발자만의 세계가 아닌 생활 밀착형 서비스를 만들기도 좋고, 바꿔 발하면 돈이 될 수 있는 여지가 좀더 많은 것이라 그렇지 않나 싶다.

 

나도 텍스트 기반의 자연어 처리로 인해 머신러닝과 딥러닝을 어설프게나마 시작하게 되었고, 아직 그 부분을 진행하고 있다. 

 

이 책은 파이토치 기반의 자연어 처리 방안에 대해 접근할 수 있는 내용을 담고 있다.

 

자연어 처리라는게 단순히 머신러닝/딥러닝을 알고 있다고 해서 술술 풀어나갈 수 있는 것은 아니다 보니 통상 자연어 처리 입문서에는 언어에 대한 내용과 이를 컴퓨터 기반으로 처리하기 위한 기술에 대해서도 기술하는 것이 통상적이다.

 

이 책 역시 그러한 구성을 가지고 있다. 그것도 꽤 잘 짜여진 구성으로...

 

1. 소개

2. NLP 기술 빠르게 훑어보기

3. 신경망의 기본 구성 요소

4. 자연어 처리를 위한 피드 포워드 신경망

5. 단어와 타입 임베딩

6. 자연어 처리를 위한 시퀀스 모델링 - 초급

7. 자연어 처리를 위한 시퀀스 모델링 - 중급

8. 자연어 처리를 위한 시퀀스 모델링 - 고급

9. 고전 모델, 최신 모델, 더 배울 것들

 

NLP와 신경망에 대한 기본적인 도입과 소개로 시작해 자연어 처리를 위한 실실적인 신경망 구성과 임베딩 그리고 실제 모델링 순으로 구체적이고 레벨을 높여서 접근 할 수 있도록 짜여진 구성은 파이토치 기반의 자연어 처리를 시작하는 사람들에게 무난한 도입구성이 아닌가 싶다.

 

여타의 책들과 차별화된 요소는 클래스 메소드의 매개변수와 리턴값에 대한 주석이 꼼꼼하게 달려있어, 클래스와 메소드에 대한 이해를 돕는다.

 

한가지 아쉬운점은 번역서이다 보니 영문 텍스트를 기반으로 모든 내용이 진행된다. 한글이라는 다른 언어체계를 사용하는 우리로서는 파이토치 기반의 자연어 처리를 위해서는 독자 개인의 또다른 학습과 연구가 필요한 것은 필연적이다.

 

대신 역자는 부록에 카카오 브레인의 한글 자연어 처리 라이브러리인 pororo에 대한 내용을 추가해서 담고 있다.

아마도 한글에 대한 자연어 처리 부분에 대해서 어떻게든 있어야 하는 부분에 대한 출판사와 역자님의 전략적 선택이지 싶다.

 

책은 번역서라 역자의 역할도 매우 중요하다. 뭐 이쪽 계속 입문하고 공부하는 사람치고 이분이 번역한 책 한권 없는 사람은 단 한명도 없을꺼라 생각된다.

 

믿고보는 박해선님이 번역했다.

 

나름 다른 번역서에 비하면 군더더기 없이 꽤 준수하게 번역되어 있지 않나 생각한다.

 

 

※ 본 리뷰는 IT 현업개발자가, 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성한 서평입니다.

728x90

댓글