본문 바로가기

:)

검색하기
:)
프로필사진 andre99

  • 분류 전체보기 (48)
    • AI (3)
    • Algorithm (5)
    • Coursera (12)
    • Data Storage (1)
    • Data Structure (7)
    • Data Visualization (7)
    • Paper Review (13)
Guestbook
Tags
  • rl
  • LoRa
  • LLM
  • Algorithm
  • tableau
  • Rag
  • 논문 리뷰
  • coursera
  • deepseekmath
  • Diffusion Models
  • Data Structure
  • 딥러닝
  • 자료구조
  • 코세라
  • 알고리즘
  • robotics
  • NLP
  • 강화학습
  • 태블로
  • SDGs
  • Gen AI
  • animatediff
  • Firebase
  • yolo
  • Kibana
  • paper review
  • deep learning
  • gemmasprint
  • 거대언어모델
  • elastic search
more
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록rl (1)

:)

[RL] Unsupervised Skill Discovery for Learning Shared Structures across Changing Environments

Abstract문제점기존 unsupervised skill discovery 방법들: 정적인 환경에만 초점. 에피소드 내 고정된 스킬만 사용. → 변화하는 환경 속 공통 구조를 제대로 학습 X.제안 기법incremental skills: 이전에 학습한 스킬들의 조합으로 구성된 state coverage를 확장하도록 새로운 스킬 학습.스킬 평가 프로세스: 중복 스킬 방지를 위해 새 스킬이 기존 스킬과 얼마나 다른지 & state coverage 확장 기여도 평가.실험 결과Maze navigation과 locomotion 환경에서 제안 알고리즘이 공통 구조를 잘 표현하는 스킬을 학습함.Downstream task에서도 기존 방법들보다 더 유용함.1.Introduction문제의식기존의 강화학습 에이전트는 매번..

Paper Review 2025. 3. 25. 16:15
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바