Skip to content

ehsanyaz/DigikalaScraping

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

DigikalaScraping

Trying to Web Scraping Digikala Website Usings Beatiful Soup Library. Becuase of the Dynamic Nature of this website we have to Use Selenium Or PlayWright Lib to get full Page Source. This Project has two main Code File that each one can perform sepratly.

وب اسکرپینگ وبسایت دیجی کالا. در این پروژه از کتابخانه beatifulSoup جهت پردازش داده های HTML استفاده شده است. به دلیل ماهیت دینامیک این وبسایت و استفاده از JS و محدودیت های ایجاد شده جهت جلوگیری از وب اسکرپینگ باید از کتابخانه هایی نظیر Selenium یا PlayWright جهت دریافت کد منبع به صورت کامل استفاده کنیم. در این پروژه دو فایل کد وجود دارد که در فایل متد اول از کتابخانه PlayWright جهت دریافت کد منبع به صورت Asyncoronous استفاده شده است و در کد منبع متد دوم از کتابخانه Selenium استفاده شده است. در نهایت با استفاده از کتابخانه BeatifulSoup، اطلاعاتی نظیر نام کتاب، قیمت کتاب و تعداد ستاره محصول، استخراج و در کنسول چاپ گردیده است.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages