Skip to content

Latest commit

 

History

History
11 lines (9 loc) · 1.31 KB

README.md

File metadata and controls

11 lines (9 loc) · 1.31 KB

DigikalaScraping

Trying to Web Scraping Digikala Website Usings Beatiful Soup Library. Becuase of the Dynamic Nature of this website we have to Use Selenium Or PlayWright Lib to get full Page Source. This Project has two main Code File that each one can perform sepratly.

وب اسکرپینگ وبسایت دیجی کالا. در این پروژه از کتابخانه beatifulSoup جهت پردازش داده های HTML استفاده شده است. به دلیل ماهیت دینامیک این وبسایت و استفاده از JS و محدودیت های ایجاد شده جهت جلوگیری از وب اسکرپینگ باید از کتابخانه هایی نظیر Selenium یا PlayWright جهت دریافت کد منبع به صورت کامل استفاده کنیم. در این پروژه دو فایل کد وجود دارد که در فایل متد اول از کتابخانه PlayWright جهت دریافت کد منبع به صورت Asyncoronous استفاده شده است و در کد منبع متد دوم از کتابخانه Selenium استفاده شده است. در نهایت با استفاده از کتابخانه BeatifulSoup، اطلاعاتی نظیر نام کتاب، قیمت کتاب و تعداد ستاره محصول، استخراج و در کنسول چاپ گردیده است.