Seitaro Shinagawaの雑記帳
Seitaro Shinagawaの雑記帳
読者になる

Seitaro Shinagawaの雑記帳

2020-12-24から1日間の記事一覧

2020-12-24

OpenAIのPPO言語生成論文を読む①

この記事は強化学習苦手の会 Advent Calendar 2020の24日目の記事です。 2020.12.28 追記 解釈が致命的にミスってました・・・"To keep $\pi$ from moving too far from $\rho$"なので「両分布が離れすぎないように」です。 (誤)学習する方策$\pi$が、初期…

はてなブックマーク - OpenAIのPPO言語生成論文を読む①
プロフィール
id:snowman_88888 id:snowman_88888

主に雑記帳

読者です 読者をやめる 読者になる 読者になる
このブログについて
検索
リンク
  • はてなブログ
  • ブログをはじめる
  • 週刊はてなブログ
  • はてなブログPro
最新記事
  • あのD進から10年を振り返る
  • AppleのFerret-UI
  • NAIST助教を退職してSB Intuitionsで働き始めました。
  • 「頑張らない学生指導」を頑張ろう
  • Slack botとしてChatGPTをお招きしてスレッドに返信してもらう
月別アーカイブ
  • ▼ ▶
    2025
    • 2025 / 12
  • ▼ ▶
    2024
    • 2024 / 4
  • ▼ ▶
    2023
    • 2023 / 12
    • 2023 / 4
  • ▼ ▶
    2022
    • 2022 / 12
    • 2022 / 9
    • 2022 / 3
  • ▼ ▶
    2021
    • 2021 / 12
    • 2021 / 8
    • 2021 / 1
  • ▼ ▶
    2020
    • 2020 / 12
    • 2020 / 8
    • 2020 / 4
  • ▼ ▶
    2019
    • 2019 / 12
  • ▼ ▶
    2018
    • 2018 / 3
  • ▼ ▶
    2017
    • 2017 / 12
    • 2017 / 4
    • 2017 / 1
  • ▼ ▶
    2016
    • 2016 / 12
    • 2016 / 10
    • 2016 / 3
    • 2016 / 2
  • ▼ ▶
    2015
    • 2015 / 12
    • 2015 / 11
Seitaro Shinagawaの雑記帳 Seitaro Shinagawaの雑記帳

Powered by Hatena Blog | ブログを報告する

引用をストックしました

引用するにはまずログインしてください

引用をストックできませんでした。再度お試しください

限定公開記事のため引用できません。

読者です 読者をやめる 読者になる 読者になる