人工智能pixiv高质量涩图爬虫

能学会你xp的AI涩图爬虫

爬虫部分基于 PixivCrawler 修改实现，涩图识别分类部分使用 ConvNeXt 作为backbone的分类模型实现，性能优于Trasnformer类模型。

自动筛选效果

环境配置

环境配置参考 ConvNeXt

需要 pytorch==1.8 timm==0.3.2

下载miniconda，创建新python环境并激活

conda create -n pixivai python=3.9
conda activate pixivai

安装pytorch

conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch-lts -c conda-forge
# 没有N卡的用这个
conda install pytorch torchvision torchaudio cpuonly -c pytorch-lts

安装其他依赖

pip install -r requirements.txt

使用方法

下载预训练权重放在ckpt/文件夹内:

下载权重-百度网盘提取码：mmwi 或下载权重

根据 PixivCrawler 的说明配置爬虫，设置账号和cookie，设置要爬的内容。

pixiv_crawler/config.py中配置爬虫基本参数。

运行命令启动AI爬虫:

# 不加关键字默认爬日榜
python AIcrawler.py --ckpt 模型权重 --n_images 总图像个数 [--keyword 关键字]

按自己的xp训练模型

数据处理

准备至少5000张图。用labeler.py打标签，数据集标签会储存为json格式。

或

把不同类别放入不同文件夹，用labeler_folder.py一键打标签。

images
|--0
|  |--1.png
|  |--2.png
|
|--1

用data_proc.py划分训练集和测试集，并对图像进行预处理。

修改参数，运行脚本训练:

python train.sh

训练参数设置参考 ConvNeXt

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
imgs		imgs
models		models
pixiv_crawler		pixiv_crawler
AIcrawler.py		AIcrawler.py
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
INSTALL.md		INSTALL.md
LICENSE		LICENSE
README.md		README.md
TRAINING.md		TRAINING.md
data_proc.py		data_proc.py
datasets.py		datasets.py
demo.py		demo.py
engine.py		engine.py
labeler.py		labeler.py
labeler_folder.py		labeler_folder.py
main.py		main.py
optim_factory.py		optim_factory.py
pixiv_AI_crawler.ipynb		pixiv_AI_crawler.ipynb
requirements.txt		requirements.txt
run_with_submitit.py		run_with_submitit.py
train.sh		train.sh
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

人工智能pixiv高质量涩图爬虫

能学会你xp的AI涩图爬虫

自动筛选效果

环境配置

使用方法

按自己的xp训练模型

数据处理

About

Releases 2

Packages

Contributors 2

Languages

License

IrisRainbowNeko/pixiv_AI_crawler

Folders and files

Latest commit

History

Repository files navigation

人工智能pixiv高质量涩图爬虫

能学会你xp的AI涩图爬虫

自动筛选效果

环境配置

使用方法

按自己的xp训练模型

数据处理

About

Resources

License

Code of conduct

Stars

Watchers

Forks

Releases 2

Packages 0

Contributors 2

Languages

Packages