AGENTNI O‘RGATISHDA Q-LEARNING VA SARSA ALGORITMLARINI TAQQOSLASH

Авторы

  • Umarov Bekzod Azizovich Автор
  • Tursunova Azimaxon Alijon qizi Автор

Ключевые слова:

Kalit so‘zlar: Q-learning, SARSA, kuchaytirilgan o‘qitish, agent, optimal strategiya, o‘rganish, Python, algoritmlar, taqqoslash.

Аннотация

Annotatsiya 
Ushbu  maqolada  Q-learning  va  SARSA  (State-Action-Reward-State-Action) 
algoritmlarining  taqqoslanishi,  ularning  o‘rganish  jarayonlari  tahlil  qilinadi.  Q-
learning  va  SARSA  algoritmlari  kuchaytirilgan  o‘qitish  (Reinforcement  Learning) 
metodlaridan  bo‘lib,  agentning  maqsadga  erishish  uchun  optimal  strategiyalarni 
o‘rganishiga  yordam  beradi.  Bu  algoritmlar,  o‘rganish  jarayonida  qanday  turdagi 
ma'lumotlar  va  tajribalarga  asoslanib  qarorlar  qabul  qilishni  o‘rganishni  ko‘rsatadi. 
Maqolada ikkala algoritmning asosiy  farqlari  va qo‘llanilish sohalari tahlil qilinadi, 
shuningdek, Python dasturlash tilida kod namunasi ko‘rsatiladi. 

Библиографические ссылки

FOYDALANILGAN ADABIYOTLAR VA SAYTLAR

1.Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction

(2nd ed.). MIT Press.

2.Watkins, C. J. C. H., & Day

3. https://www.geeksforgeeks.org

Опубликован

2024-11-22

Как цитировать

Umarov Bekzod Azizovich, & Tursunova Azimaxon Alijon qizi. (2024). AGENTNI O‘RGATISHDA Q-LEARNING VA SARSA ALGORITMLARINI TAQQOSLASH . TADQIQOTLAR.UZ, 50(5), 10-13. https://scientific-jl.org/tad/article/view/3715