논문리뷰 (6) 썸네일형 리스트형 MoMask: Generative Masked Modeling of 3D Human Motions Hierarchical Layer: base layer 초록 (Abstract)새로운 text-driven 3D 사람 모션 생성을 위한 masked modeling frame-work인 MoMask를 소개한다.MoMask는 사람 모션을 high-fidelity detail을 표현하는 multi-layer discrete motion 토큰으로 표현하기 위해 계층적 양자화 방식(Hierarchical quantization scheme)을 사용한다.Vector Quantization으로 부터 얻어진 모션 토큰 시퀀스는 base layer부터 시작해서 순차적으로 residual 토큰을 만들고, hierarchy의 subsequent layer을 통해 저장된다.이후, 두 개의 bidirectional trans.. MotionGPT: Human Motion as a Foreign Language Abstractpre-train된 Large Language Model들이 나타나며, 언어와 multimodal 데이터를 통합한 모델을 만드는 것이 여전히 챌린지로 남아있다.Though the advancement of pre-trained large language models unfolds, the exploration of building a unified model for language and other multimodal data, such as motion, remains challenging and untouched so far.바디랭귀지처럼, human motion은 언어와 의미적으로 비슷함.언어모델과 large-scale motion 모델을 융합해 모션과 언어의 관계를 학습하는 사전학습.. PET (Point quEry Transformer) 코드 PET (Point quEry Transformer) 에서 핵심이 되는 backbone과 transformer 진행 방식에 대해 정리해봤습니다. pdf로 보기 용이하게 글씨를 줄였기 때문에, 뭉개져서 보기 힘든 부분이 있을 수 있습니다. 그런 경우에는 https://1drv.ms/o/s!AqaWCHp7NeOgg4ExylUk8xvo_O6ZJw?e=oyy8xQ 에서 원본으로 보시는 것을 추천합니다. 감사합니다. PET - Microsoft OneNote Online onedrive.live.com IONN: Incremental Offloading of Neural Network Computations from Mobile Devices to Edge Servers 리뷰 ABSTRACT 현재 많은 계산이 필요한 (computation-intensive) DNN을 자원이 제한된 (resource-constrained) 모바일 기기에 수행하는것에 대한 아이디어들은 모바일 client가 수행하고자하는 DNN 모델이 사전에 설치된 중앙 클라우드 서버에 DNN 쿼리를 요청한다. → decentralized cloud infrastructure에는 적합하지 않음 Decentralized cloud infrastructure에서는 clinent가 먼저 DNN model을 업로드 해야한다. → 업로드 하는 동안 심각한 딜레이 발생 IONN : partitioning-based DNN offloading technique for edge computing. client의 DNN 모델을 .. Adaptive Parallel Execution of Deep Neural Networks on Heterogeneous Edge Devices 논문을 전체 번역하는것이 아닌, 일부를 번역하며, 내 의견을 적어보기로 한다. 요약은 다음과 같다. 스마트 홈, 스마트 도시, 자율주행 자동차와 같은 새로운 애플리케이션들이 머신 러닝(ML)을 탑재하는것에 흥미를 두고있다. 하지만 Deep Neural Networks (DNNs)을 자원이 한정된 장치에 탑재하는 것은 상당한 도전이다. DNNs의 workload는 계산 집약적이고, 클라우드 만큼의 자원을 필요로 한다. 다른 논문의 경우에는 DNNs을 효과적으로 디자인하거나, 클라우드의 힘을 빌렸다. 이 논문에서는 이기종 IoT환경에서 최적화된 runtime으로 적응하는 CNN 가속 프레임워크를 제안한다. 이 프레임워크는 convolution layer 융합을 이용하여 공간 분할 기술을 활용하고, 네트워크 .. [논문리뷰]Mastering Atari, Go, chess and shogi by planning with a learned model - MuZero_서론 https://www.nature.com/articles/s41586-020-03051-4 서론에서는 MuZero의 도입 계기에 대해 간략히 설명한다. 간단히 요약하자면, 지금까지는 Model-based RL (Reinforcement Learning)을 이용하여 좋은 결과를 내었지만 아타리 게임처럼 과거의 행동이 현재에 영향을 줄 경우 model-free RL로 주로 성공해왔다. model-free RL은 환경으로부터 policy와 value function을 얻어내지만, 체스나 바둑과 같이 정교하게 미래를 예측하는것은 조금 힘들었다. MuZero는 model-base RL로, 시각적으로 복잡한 환경을 가지는 아타리 게임에서 좋은 보여주며, 미래를 예측해야하는 체스, 쇼기, 바둑들을 인간 수준을 능가하.. 이전 1 다음