본문 바로가기

머신러닝8

[서평][IT개발][NLP] 파이토치로 배우는 자연어 처리 / 한빛미디어 컴퓨터를 통한 자연어를 처리하는 방법에 대한 연구는 꽤 오랜 역사를 가지고 있다. 최근들어 이 분야도 머신러닝/딥러닝을 이용한 다양한 형태의 자연어 처리 방안이 연구되고 있는 핫한 분야이다. 그도그럴것이 음성이던 텍스트던 기계가 자연어를 알아듣고 인간과 소통할 수 있다는 것은 연구자/개발자만의 세계가 아닌 생활 밀착형 서비스를 만들기도 좋고, 바꿔 발하면 돈이 될 수 있는 여지가 좀더 많은 것이라 그렇지 않나 싶다. 나도 텍스트 기반의 자연어 처리로 인해 머신러닝과 딥러닝을 어설프게나마 시작하게 되었고, 아직 그 부분을 진행하고 있다. 이 책은 파이토치 기반의 자연어 처리 방안에 대해 접근할 수 있는 내용을 담고 있다. 자연어 처리라는게 단순히 머신러닝/딥러닝을 알고 있다고 해서 술술 풀어나갈 수 있는 .. 2021. 6. 22.
[서평][IT개발][데이터분석] 시계열 데이터 분석의 모든 것 / 한빛미디어 늦게 시작한 대학원 석사과정의 학위 논문을 준비하면서 시계열 데이터 분석이 필요한 상황이었다. 확률/통계라는걸 20여년도 넘은 대학 1~2년 시절에 공부하고 이제와서 다시금 이런것을 살펴와야 하는 상황이 낯설고 어렵기만 하다. 일반적으로 시계열 데이터 경제학 관련해서 연구와 활용이 많이 되어 왔고 통계적 기법과 모델이 아직까지는 대세인 분야라 수학적 특히 통계관련 지식이 없으면 접근하기가 여간 까다로운게 아니다. 요즘 웹검색이나 유튜브 검색해보면 시계열 분석과 관련한 많은 자료와 영상이 있긴 하지만 다들 케바케에다 단편적인 상황들에 대한 내용이라 기본 베이스 없이 출발하면 이해하기가 힘들다, 반면 체계적으로 시리즈화 되어 있는 것들은 다 학문적 접근이 대부분이고 내용이나 구성이 학교 수업같아 현실세계에 .. 2021. 5. 25.
[서평][IT개발][딥러닝] TinyML / 한빛미디어 바람이 부니 기술의 발전은 정말이지 엄청나다, 두어번의 침체기 끝에 새롭게 붐업된 인공지능 분야의 변화는 자고나면 새로운 내용 발표되고 실시간으로 전세계로 전파되는 가장 핫한 분야이다. 머신러닝, 딥러닝 하면 떠오르는게 뭐가 있을까? 알파고? 이런것 들먹이면 아재소리 들어야 하지 않을까 싶다. 좀더 원론적으로 들어가보면 데이터 그것도 충분한 학습을 위한 소위 빅데이터가 필요할 것이고 학습을 위한 엄청난 컴퓨팅파워, 그렇기에 GPU도 필요하고 한 것이 아니겠는가... 말그대로 딥러닝, 엄청난 레이어를 통과하며 엄청난 계산을 통해 최적화 해나가는 것 그래서 난 머신러닝, 딥러닝 하면 무겁다는 생각이 먼저 든다. 요즘 한참 열과성의를 다하고 있는 20여만건의 텍스트 분석을 위해 이런저런 언어모델을 돌리자니 컴.. 2020. 9. 28.
[서평][IT개발][딥러닝] 데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집 / 제이펍 소위 인공지능으로 통칭할 수 있는 분야의 책들이 다양한 구성과 형태로 쏟아지는게 현실인 것다. 나도 뒤늦게나마 이 전선에 뛰어 들어보니 쉬운 분야는 아닌 듯 하다. 그간 해왔던 IT공학적인 업무와는 전혀 다른 형태의 분야rk 아닌가 싶다, 공부해야 할 것도 많고 알아야 하는 것들에 대한 스펙트럼도 넓고... 반면에 발전속도는 엄청나게 빨라서 따라가기도 힘겨운게 사실이다. 그러던 와중에 재미난 책을 발견했다. '데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집' 이 책은 그간 봐왔던 여러 책들과는 이야기를 풀어나가는 형식과 구성이 다르다. 이쪽 계통 보통의 입문서들 예를들면 '밑바닥부터 시작하는 딥러닝 시리즈'나 '그로킹 딥러닝' 같은 책들은 파이썬 같은 개발언어 소개로 시작해서 머신러닝이나 딥러닝(신.. 2020. 9. 18.
[서평][IT개발][딥러닝] 핸즈온 비지도 학습 / 한빛미디어 우리는 데이터가 넘쳐나는 세상에 살고 있다. 그래서인지 몰라도 빅데이터, 데이터 사이언티스트, 시각화 분석 등등 데이터와 관련된 이야기가 사회적으로나 산업적으로나 화두다. 그리고 최근 몇년간은 아마도 머신러닝/딥러닝이 이들의 중심에 있는듯 하다. 기업 입장에서 넘쳐나는 데이터를 어떻게 분석하고 활용할 것인가? 의 관점에서 다양한 분석을 시도하고 있으나 흔히들 알고 있고 이야기 하는 몇몇 분야를 제외하고는 아직은 갈길이 먼것이 현실이지 않을까 생각한다. 책으로 돌아와서, 이쪽분야가 워낙 핫하다보니 기초에서 활용까지 정말 다양한 책이 나온다. 통상적으로 머신러닝/딥러닝을 분류해보자면 가장 기본적으로 지도 학습과 비지도 학습으로 분류해 볼 수 있다. 산업현장에서는 당연히 레이블이 있는 데이터에서 없는 데이터로.. 2020. 8. 24.
[서평][IT개발][딥러닝] 핸즈온 머신러닝 2판 / 한빛미디어 벌써 오래전 이야기지만 컴퓨터공학을 전공하던 대학 3,4학년 시절 미국에서 인공지능을 전공하고 오셨던 교수님을 통해 퍼셉트론에 관한 이야기를 들었었다, 그리고 당시 한참 보전 마이크로소프트웨어에서 데이터마이닝에 관한 이야기... 그리고 IT회사에 입사하여 주워들은 퍼셉트론, 데이터 마이닝 등등을 이용해서 당시 시스템 모니터링 개발하는 일을 맡아서 진행해봤다. 쓰고 있던 in-house 프로그램은 단순히 등록된 모니터링 아이템의 임계값 기준으로 warning, alram 정도 보여주던 것이었는데 어찌어찌 하다보니 대표이사 보고까지 들어가게 되었는데 여러가지 여건과 상황으로 인해 좋을 결과를 도출하지 못하고 접게되었다. 뭐 지금 생각하면 여러가지 여건과 상황중 가장 결정적인 것은 내 짧은 지식의 한계였던 것.. 2020. 7. 5.