DigikalaScraping

Trying to Web Scraping Digikala Website Usings Beatiful Soup Library. Becuase of the Dynamic Nature of this website we have to Use Selenium Or PlayWright Lib to get full Page Source. This Project has two main Code File that each one can perform sepratly.

وب اسکرپینگ وبسایت دیجی کالا. در این پروژه از کتابخانه beatifulSoup جهت پردازش داده های HTML استفاده شده است. به دلیل ماهیت دینامیک این وبسایت و استفاده از JS و محدودیت های ایجاد شده جهت جلوگیری از وب اسکرپینگ باید از کتابخانه هایی نظیر Selenium یا PlayWright جهت دریافت کد منبع به صورت کامل استفاده کنیم. در این پروژه دو فایل کد وجود دارد که در فایل متد اول از کتابخانه PlayWright جهت دریافت کد منبع به صورت Asyncoronous استفاده شده است و در کد منبع متد دوم از کتابخانه Selenium استفاده شده است. در نهایت با استفاده از کتابخانه BeatifulSoup، اطلاعاتی نظیر نام کتاب، قیمت کتاب و تعداد ستاره محصول، استخراج و در کنسول چاپ گردیده است.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

DigikalaScraping

Files

README.md

Latest commit

History

README.md

File metadata and controls

DigikalaScraping