분류 전체보기 (52) 썸네일형 리스트형 [논문리뷰]Mastering Atari, Go, chess and shogi by planning with a learned model - MuZero_서론 https://www.nature.com/articles/s41586-020-03051-4 서론에서는 MuZero의 도입 계기에 대해 간략히 설명한다. 간단히 요약하자면, 지금까지는 Model-based RL (Reinforcement Learning)을 이용하여 좋은 결과를 내었지만 아타리 게임처럼 과거의 행동이 현재에 영향을 줄 경우 model-free RL로 주로 성공해왔다. model-free RL은 환경으로부터 policy와 value function을 얻어내지만, 체스나 바둑과 같이 정교하게 미래를 예측하는것은 조금 힘들었다. MuZero는 model-base RL로, 시각적으로 복잡한 환경을 가지는 아타리 게임에서 좋은 보여주며, 미래를 예측해야하는 체스, 쇼기, 바둑들을 인간 수준을 능가하.. [BOJ] 백준 1697 숨바꼭질 https://www.acmicpc.net/problem/1697 1697번: 숨바꼭질 수빈이는 동생과 숨바꼭질을 하고 있다. 수빈이는 현재 점 N(0 ≤ N ≤ 100,000)에 있고, 동생은 점 K(0 ≤ K ≤ 100,000)에 있다. 수빈이는 걷거나 순간이동을 할 수 있다. 만약, 수빈이의 위치가 X일 www.acmicpc.net 해결사항: 수빈이는 현재 위치에서 3가지로 이동할 수 있다. 위 3가지 이동을 하나의 그래프의 신장으로 보았을때 그래프를 신장해가며 너비 우선 탐색을 진행하다보면 동생의 위치를 알 수 있다. 문제를 해결하면서 첫번째에 봉착한 문제는 "몇 초"가 걸리는지를 함께 아는것이 중요하다. 제시된 예제 입력을 통해 알아보자. 예제 입력: 5 17 예제 출력: 4 가장 먼저 든 생각.. [BOJ] 백준 1004 어린왕자 https://www.acmicpc.net/problem/1004 1004번: 어린 왕자 입력의 첫 줄에는 테스트 케이스의 개수 T가 주어진다. 그 다음 줄부터 각각의 테스트케이스에 대해 첫째 줄에 출발점 (x1, y1)과 도착점 (x2, y2)이 주어진다. 두 번째 줄에는 행성계의 개수 n이 주 www.acmicpc.net 해결사항: 만약에 이 문제가 최단거리를 요구했다면 더 어려웠을 것이다. 하지만 단순히 요구하는 것은 행성계 진입/이탈 의 횟수를 최소화 하는 경로를 찾는 것. 즉, 경로가 아무리 길어져도 행성계 진입/이탈 횟수만 적다면 된다는 뜻이다. 결국 이 문제는 출발점/도착점이 각각 몇개의 행성계에 속해있는가를 알아보는 것이다. 1. 모든 행성계를 순회하며, 출발점/도착점이 행성계 안에 존재하.. php 설치중 오류 및 해결 cannot load php7apache2_4.dll into server http -k start를 했을 경우에, 위와같은 오류가 발생했다. php를 zip 형식으로 받을 때 운영체제를 잘 확인하자. 원인은 운영체제의 bit가 달랐기 때문이었다. (OS 10048) 각 소켓 주소(프로토콜/네트워크 주소/포트)는 하나만 사용할수 있습니다. Listen에 적혀있는 포트번호(default 80)과 Servername에서 localhots:80을 다른 포트번호로 수정하였다. 이후 접속할때 localhost:포트번호 로 접속해야한다는 단점이 있었다. 아마 80번이었으면 localhost만 쳐도 잘 접속될텐데. 모종의 이유로 80번 포트가 사용중이었던것 같은데 django와 함께 작업을 하다보니 중첩되었던것 같다.. 이전 1 ··· 4 5 6 7 다음