본문 바로가기

강화학습4

[서평][IT개발][RL] 그로킹 심층 강화학습 / 한빛미디어 이제 막 한걸음 내딛어본 것이다 보니 아직 깊이있는 통찰이나 내공이 있는 것은 아니지만 강화학습(Reinforcement Learning) 라는게 다소 오묘하다, 적어도 내겐... 우리가 흔히들 알고 있는 머신러닝, 딥러닝과는 또 다른 색다름도 있지만 조금은 더 접근하기 어려운 부분이 아닌가 싶다. 하긴 러닝 붙은 것 치고 뭔들 쉬울까... ^^ 확률적인 요소가 중요한 역할을 하는 분야다 보니 수학적인 요소가 다른 것들에 비해 더 많이 나오기도 하지만 현실 세계를 강화학습에 필요한 환경, 상태, 액션 등으로 정의하고 학습을 시켜 목표하는 문제를 해결하는데 활용하는 과정 자체가 막연하기도 하고 막막하기도 한게 하닌가 싶다. 이제 막 강화학습을 통해 해보고자 하는 목표가 생긴 나로서 책 한권, 대학원 수업 .. 2022. 8. 30.
[스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #3 - 벌써 8주... 다음을 기약하며... [스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #1 - 지원 그리고 합격 [스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #2 - 커다란 벽, 그리고 삽질 [스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #3 - 벌써 8주... 다음을 기약하며... 시간 참 빠르다, 벌써 예정됐던 8주가 지났고 그 마지막 스터디 모임 발표가 좀전에 끝났다. 마지막 발표와 토론, 마지막 일분일초까지 진국이 아닐 수 없다. 해보고 싶었고 해야할 필요성은 항상 느끼고 있었지만 그간 이런저런 이유로 애써 외면하던 것을 벗어나 한발짝 다가가봤다는 점에서 큰 걸음 내딛었다 생각한다. 한편으로는 그간 외면하고 망설였는지를 확인하는 시간이었기도 하다. 강화학습에 대한 스스로의 부족함을 너무나 잘알기에 이리저리 애둘러 외면.. 2022. 7. 25.
[스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #2 - 커다란 벽, 그리고 삽질 [스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #1 - 지원 그리고 합격 [스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #2 - 커다란 벽, 그리고 삽질 [스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #3 - 벌써 8주... 다음을 기약하며... 너무 해보고 싶었던 일이기에 기대 만빵, 호기롭게 시작했다... 오늘로서 4주차 참여 할 수록 참여 멤버들 한분한분의 내공이나 스킬이 대단하다는 생각이 든다... 이와 달리 스스로는 많이 초라해진다... 흑흑... ㅠ.ㅠ 주차별 2명이 한시간씩 발표를 진행하는데 수준이 그냥 스터디 수준이 아니다... 뭐 이런 형태의 스터디 모임을 이전에 해본적이 없기에 다른 스터디 모임과 절대비교는 할 수 없지만 어찌됐던 리뷰 논문의 분야와 수준이 생각했던 것 .. 2022. 6. 20.
[스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #1 - 지원 그리고 합격 [스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #1 - 지원 그리고 합격 [스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #2 - 커다란 벽, 그리고 삽질 [스터디][논문리뷰][오픈] RL 논문 리뷰 스터디 #3 - 벌써 8주... 다음을 기약하며... 짧지만 심사숙고를 했다, 처음 논문 리뷰 스터디 모집 공고를 봤을때 내심하고 싶으나, 해야하는 필요성은 느끼나, 선듯 해보자라고 생각을 하지 못했다. 항상 이런 기회를 맞닥드리게 되면 걸림돌이 되는게 아이러니 하게도 대학원이다... 일주일에 3일 수업을 듣다보니 후배와 하는 최적화 스터디, 식구들과 하는 영어공부에 덧붙여 무언가를 하는게 정말 부담으로 다가온다. 그간에는 이런 상황에서는 자기방어적으로 포기하거나 외면하고 말았다. 그렇게 자기 위안.. 2022. 5. 3.