Thank you for your response.
I ask because I was repeatedly prodded by my professor about the difference between iterations, number of steps, and episodes and could not answer well.
I have an additional question, I would like to know more about the linkage between the PPO algorithm and Learning Agents.
Thank you in advance.
ーー
ご回答ありがとうございます。
イテレーション、ステップ数、エピソードの違いについて教授から何度も突かれてうまく答えられなかったのでお聞きしました。
追加で質問なのですが、PPOアルゴリズムとLearning Agentsの連携についてもう少し詳しくご教授願いたいです。
よろしくお願いいたします。