-
Notifications
You must be signed in to change notification settings - Fork 1.8k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[有问题] 使用用户名+密码登录 #356
base: develop
Are you sure you want to change the base?
[有问题] 使用用户名+密码登录 #356
Conversation
问题:python第三方包playwright及相关依赖安装不到青龙容器中,其他容器我没试过
我一般用的比较多的爬虫是playwright,这个github action中可以安装使用。但是青龙中装不了。 我目前想到的办法是,用playwright每天固定时间在github用爬虫获取cookie,然后用青龙拉取,但是这太笨了。如果能把playwright相关的包放进青龙,就可以在需要的时候自己运行了。 playwright相关安装:
|
嗯你是对的,其实验证已经过了,但是因为账号和密码错了,最后 这一块验证可以优化下。 然后读取用户名和密码,可以从env环境变量里读 解析出cookie后,如果是青龙就存青龙环境变量里,如果是其他平台,就存bili根目录下的cookies.json里 这样,这个功能就完整了。 抽空我来看下怎么改。 |
我其实更想知道怎么把playwright这个包弄上,或者另外找个第三方包。我是真的搞不定。 这个循环判断,我懒得翻网页内容的变化(主要是对网页这一块真心不了解),所以就抓了title这个特征。这肯定是不合适的。 我用playwright纯粹就是为了模拟网页操作,效率低很多,但是一般来说,这种基于网页操作,网站也不会去管。 我主要是给大佬分享一个我之前弄得一些策略,要是有用更好,没用也就算了。 |
直接pip写到extra.sh里装不进青龙里吗 |
我试过,装不了。报错是找不到对应版本。 |
搜嘎!我的也是3.11版本的python。 |
个人觉得ocr没有必要,ocr若合并到主版本,会使项目体积增加很多。 |
绕不开ocr这个过程,除非你有极验的内部api,不然获取极验那个token也需要ocr |
你可能没理解我意思😂,我的意思是让用户手动验证,不是用ocr |
可以看看我超链接的手动验证器,用起来还不错。 |
哦…我主要是想让整个过程完全自动化,不用人为干预… 我看过那个api,我觉得既然也需要人工点击,就不如直接通过官方页面点击验证了,然后我就把别的地方写的这个验证拉过来了 |
直接用还不如你写的那个扫码登陆呢😂发自我的手机
|
如果能把这个识别过程整合到青龙,就不用再摸手机了…但是我觉得再额外调用第三方接口,如果人家接口变化,维护起来也怪麻烦的…不如直接ocr… |
或者说可以你自己写一个网页,接受key,再callback回token,青龙每天可以推送通知链接,你再手动验证下?-------- 原始邮件 --------发件人: AFUL ***@***.***>日期: 2022年12月21日周三 10:16收件人: RayWangQvQ/BiliBiliToolPro ***@***.***>抄送: Gumingjie0312 ***@***.***>, Comment ***@***.***>主 题: Re: [RayWangQvQ/BiliBiliToolPro] [有问题] 使用用户名+密码登录 (PR #356)
直接用还不如你写的那个扫码登陆呢😂发自我的手机
如果能把这个识别过程整合到青龙,就不用再摸手机了…但是我觉得再额外调用第三方接口,如果人家接口变化,维护起来也怪麻烦的…不如直接ocr…
扫码这个我纯粹是看别人说可以用这种方式登录弄爬虫,就顺手试了试,我还是觉得所有语言人工干预的登录过程都太麻烦了…所以就把这个ocr的拿了过来…
—Reply to this email directly, view it on GitHub, or unsubscribe.You are receiving this because you commented.Message ID: ***@***.***>
|
我不会写网站…青龙那个通知我也不会用…😂😂😂 |
那就让项目主来搞吧
|
你说的那个接口,我其实也看到过。 我本地试过,这个ocr登录获取cookie的成功率挺高的,比我想象的高,虽然都是别的不好。 其实,真正比较大的包不是ocr那个包,是playwright这个包,也可以用Selenium+对应的webdriver实现,但是这一套的包也比较大。不过用这套爬虫方法,除非比较异常的登陆模式(规律性太强,或者每天登录次数过多等),后台检测不出来,这就是驱动浏览器去登录,所以也比requests那个库慢很多。 |
问题:python第三方包playwright及相关依赖安装不到青龙容器中,其他容器我没试过
【内容】:
昨天看到大佬对我工作的认可,我就再抛砖引玉一下。
分享一下通过用户名+密码登录的爬虫。我现在本地用这个直接获取cookie并打开存储cookie的文件复制。
具体的问题,以及相关包安装,我都写进源码了。
Login_Bili.py
不过这个方式有比较严重的问题,playwright这个包以及相关依赖我装不进青龙容器,其他容器我没试过。
这个方法分享给大佬,主要是想给大佬分享一个登录方式,希望大佬能把这套方法改一下,以后直接账号密码弄。