Skip to content

Commit

Permalink
clean up
Browse files Browse the repository at this point in the history
  • Loading branch information
jiaojiaodubai committed Apr 18, 2024
1 parent 737659a commit ea85a6c
Show file tree
Hide file tree
Showing 9 changed files with 21 additions and 178 deletions.
162 changes: 21 additions & 141 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,155 +1,35 @@
# Zotero translators 中文维护小组
# Zotero translators 中文仓库

目前 Zotero 中有许多抓取中文学术网站的插件,这些插件有些已经非常老旧,缺少及时的维护。希望能在这里召集一些志同道合的朋友,共同维护中文学术或其他类型网站的抓取插件。
如果 Github 下载速度慢,可以试试 [Gitee](https://gitee.com/l0o0/translators_CN)
## 🎯 目标网站
目前 Zotero 中有许多抓取中文学术网站的转换器,但这些转换器有些已经非常老旧,缺少及时的维护。希望能在这里召集一些志同道合的朋友,共同维护中文学术或其他类型网站的 Zotero 转换器。
如果 Github 下载速度慢,可以试试 [Gitee](https://gitee.com/l0o0/translators_CN)

+ [知网或知网海外](https://cnki.net/) -> [CNKI.js](./CNKI.js) Update: 20210129
- [x] 搜索页面PDF附件下载
- [x] 期刊详细页面的信息收集
- [x] 文章格式都为PDF,学位论文的CAJ链接已经替换为PDF,注意学位论文的PDF应该是没有目录信息的。[如何设置拆分姓名,保留CAJ格式](#jump)
- [x] 修改旧版本将知网导出`refworks``CN`字段保存为期刊条目中的 `call number`,修改后`CN`字段不保留
- [x] 修改了拉取知网`refworks`格式引文的网址,新网址提供的摘要字数最多为500字
- [x] 知网海外版PDF和CAJ附件下载支持
- [x] 支持文献类型:期刊,学位论文,会议论文,报纸,修改知网refworks会议论文类型错误的问题
- [x] 保存文献DOI,引用次数,中文核心期刊信息
- [ ] 已同步到官方版本库中
+ [万方数据](http://www.wanfangdata.com.cn/index.html) -> [Wanfang Data.js](<./Wanfang Data.js>) Update: 20200930
- [x] 抓取引文信息
- [x] 支持文献类型:期刊,学位论文,专利,会议论文
- [x] PDF附件下载
+ 皮书数据库 -> [Pishu Data.js](<./Pishu Data.js>)
- [x] 抓取引文信息
- [x] 支持文献类型:报告(记录为bookSection)、图书
+ [维普](http://www.cqvip.com/) -> [WeiPu.js](./WeiPu.js)
- [x] 抓取引文信息
- [x] 支持文献类型:期刊
- [ ] PDF附件下载
+ [百度学术](http://xueshu.baidu.com/) -> [Baidu Scholar.js](<./Baidu Scholar.js>)
- [x] 修复抓取图书时错误
- [x] 修复中文作者姓,名问题
+ [谷粉学术-谷歌学术](https://gfsoso.99lb.net/) -> [GFSOSO.js](./GFSOSO.js)
- [x] 修改了网页匹配,识别抓取代码抄自Google Scholar。从搜索结果页识别搜索结果,引文信息正常
- [ ] 部分文献的PDF下载可能会有问题,谷粉搜搜上可能没有相应的下载链接
- 安装Adblock插件的朋友请注意下将谷粉学术`*.glgoo.top`添加到白名单,不然可能会出现问题
+ [专利搜索网站Soopat](http://www.soopat.com/) -> [Snnopat.js](./Soopat.js)
- [x] 搜索页面和单个专利页面信息抓取
- [x] PDF附件下载(需要登录,网站验证码可能会导致PDF下载失败)
+ [国家图书馆文津搜索](http://find.nlc.cn/) -> [Wenjin.js](./Wenjin.js)
- [x] 抓取引文信息
- [x] 支持文献类型:图书,论文
+ [国家版本馆版权数字中心](https://pdc.capub.cn/) -> [Publications Data Center - China.js](<./Publications Data Center - China.js>)
- [x] 抓取引文信息
- [x] 多条目导出
+ [国家科技图书文献中心](https://www.nstl.gov.cn/) -> [NSTL.js](<./National Science and Technology Library - China.js>)
- [x] 抓取引文信息
- [x] 支持期刊论文、学位论文、会议论文、图书章节、文集、标准、专利
+ [ProQuest 学位论文全文检索平台](http://www.pqdtcn.com/) -> [ProQuestCN Thesis.js](<./ProQuestCN Thesis.js>)
- [x] 抓取引文信息
- [x] 支持文献类型:学位论文
- [x] PDF附件下载(需要账号或者IP具有下载权限)
+ [中国科学院科技论文预发布平台](http://www.chinaxiv.org/home.htm) -> [ChinaXiv.js](./ChinaXiv.js)
- [x] 抓取引文信息
- [x] PDF附件下载
+ [专利之星](http://cprs.patentstar.com.cn/) -> [PatentStar.js](./PatentStar.js)
- [x] 抓取专利引文信息
- [x] PDF附件下载(需要注册账号)
+ 微信公众号 -> [Weixin.js](./Weixin.js)
- [x] 抓取网页引文信息
- [x] 公众号内容保存为笔记形式(仅保留文本)
+ 知乎 -> [Zhihu.js](./Zhihu.js)
- [x] 抓取知乎回答与专栏
- [x] 文章内容保存于笔记中
+ 读秀 -> [Duxiu.js](./Duxiu.js)
- [x] 读秀内容抓取
+ 超星期刊 -> [chaoxingqikan.js](/translators/chaoxingqikan.js)
- [x] 抓取引文信息
- [x] PDF附件下载(需要帐号或者IP具有下载权限)
+ 豆瓣 -> [DouBan.js](./Douban.js)
- 保留豆瓣评价人数+豆瓣评分+原作名+定价
- 作者优化:欧美作者区分开了名与姓(在这里吐槽下豆瓣编辑对作者的命名规范,尤其是外籍作者的命名规范真是各路牛鬼蛇神)
- 目录信息:目录存放至note附件里
- 支持识别豆瓣阅读的[出版图书](https://read.douban.com/ebooks/)(因为不像豆瓣读书那么规则,部分字段可能需要手动修改)
+ [国家出版发行信息公共服务平台](https://book.cppinfo.cn/home/index) -> [CCPINFO](/translators/CCPINFO.js)
- [x] 抓取引文信息
- [ ] 匹配出版地址
+ 玛格泰克 -> [MagTech.js](./MagTech.js)
- 支持大部分国内期刊(不一定是中文期刊)
- 支持大部分期刊首页或搜索页面的多条目抓取
+ 勤云科技 -> [E-Tiller](/E-Tiller.js)
- 支持最新、次新版的勤云科技期刊网站
- 对照meta标签补全导出结果
+ 仁和汇智 -> [RHHZ.js](./RHHZ.js)
- [x] 抓取引文信息
- [x] 支持单条目
- [x] 支持多条目
- [x] PDF附件下载
+ [全国报刊索引](https://www.cnbksy.cn/home) -> [CNBKSY](./CNBKSY.js)
- [x] 抓取引文信息
- [x] 支持单条目
- [x] 支持多条目
+ 来自[道格学社仓库](https://github.com/gezhongran/DougSociety)的翻译器
- [Bilibili 视频网站](./BiliBili.js)
- [当当网图书](./Dangdang.js)
- [京东图书](./Jd.js)
- [国家哲学社会科学文献中心](./Ncpssd.js)
- [国家图书馆 - 中国标准在线服务网](./Nlc.cn.js)
- [中国标准在线服务网](./Spc.org.cn.js)
## 📢 如何更新

👉 视频教程:[Zotero 更新知网Translator翻译器教程 - Bilibili](https://www.bilibili.com/video/BV1F54y1k73n)
👉 图文教程:[Zotero 百科全书](https://zotero-chinese.com/user-guide/faqs/update-translators.html)
👉 完整讨论:[从浏览器保存条目时发生错误 / 抓取时不能自动下载PDF / 无法自动给添加的PDF附件创建条目怎么办](https://gitee.com/zotero-chinese/zotero-chinese/issues/I56D62)

## 📢 如何使用
👉 [无聊的视频教程](https://www.bilibili.com/video/BV1F54y1k73n)
图文教程 👇
**1 下载网页翻译器(web translator)文件**
如果完成以上操作后仍未解决问题,请发布 issue 反馈问题:

![](https://s1.ax1x.com/2020/08/19/dlKNRK.png)
- [Github 反馈入口](https://github.com/l0o0/translators_CN/issues/new/choose)(首选)
- [Gitee 反馈入口](https://gitee.com/l0o0/translators_CN/issues/new)(备用)

**2 解压下载的压缩包,将根目录(原为translators目录)中的所有.js文件复制到 Zotero 的 translators 目录**

![](https://s1.ax1x.com/2020/09/07/wnDwlV.jpg)
![](https://s1.ax1x.com/2020/08/19/dlM36S.png)

**3 更新 translator 信息,Firefox 和 Chrome 浏览器操作类似。下面以 Firefox 为例**
![](https://s1.ax1x.com/2020/08/19/dlQgKS.gif)

Chrome 浏览器按照下面信息找到更新按钮

![](https://s1.ax1x.com/2020/08/19/dlKUxO.png)

**更新时请多点几下,根据我的经验,Chrome 浏览器更新比较快,Firefox 会比较慢,也可多重启几次 Zotero 或浏览器**

最新版的知网翻译器,能够识别VPN之后的知网,不必做额外的设置,如有问题可提交 issue


## <span id="jump">🍇 如何在Zotero Connector 中添加中文姓名处理以及保留知网CAJ格式文件的设置</span>

需要特别注意的是,这里在 Zotero Connector 中添加的参数,只是方便控制的网页翻译器的数据抓取行为,限本页面列出的一些翻译器中起作用,并不影响其他翻译器和Zotero的其他功能。
添加的参数有:

+ `translators.zhnamesplit`,默认为true,抓取过程会拆分姓和名,如果想全并姓名,请设置为false
+ `translators.CNKIPDF`,默认为true,下载知网上文章的PDF文件,如果想要下载学位论文的CAJ格式,请设置为false

设置方法请参考下面:

![](https://s1.ax1x.com/2020/08/19/dl1AyT.gif)

为防止设置错误,可以把参数名复制过去。设置完成后,请刷新网页,再重新抓取。如果你参数名写错了也没事,不会有什么问题,放着就好。

## 📄 相关材料
## 📄 参与贡献

在开始创建前,浏览下面这些材料可以帮你了解一些创建 translator 的基本知识和开发的工具。

+ [Zotero 文档教你写 translator](https://www.zotero.org/support/dev/translators/coding)
+ [Zotero JavaScript API](https://www.zotero.org/support/dev/client_coding/javascript_api)
+ [Translator 中可能用到的函数](https://www.zotero.org/support/dev/translators/functions)
+ [Wiki-Create translator](https://www.mediawiki.org/wiki/Citoid/Creating_Zotero_translators),了解基本HTML结构,CSS选择器,javascript基本语法等
+ [refworks 引文格式](./data/refworks.pdf),有些学术网站可以将引文导出为 refworks 格式
+ [Scaffold 使用说明](https://www.zotero.org/support/dev/translators/scaffold),官方出品,便于创建 translator 的工具
+ [MDN Javascript 中文教程](https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/A_re-introduction_to_JavaScript)
+ [Zotero 条目类型说明](https://aurimasv.github.io/z2csl/typeMap.xml)
+ [How to write a Zotero translator](https://niche-canada.org/member-projects/zotero-guide/about.html)
- [Zotero 文档教你写 translator](https://www.zotero.org/support/dev/translators/coding)
- [Zotero JavaScript API](https://www.zotero.org/support/dev/client_coding/javascript_api)
- [Translator 中可能用到的函数](https://www.zotero.org/support/dev/translators/functions)
- [Wiki-Create translator](https://www.mediawiki.org/wiki/Citoid/Creating_Zotero_translators),了解基本HTML结构,CSS选择器,javascript基本语法等
- [refworks 引文格式](./data/refworks.pdf),有些学术网站可以将引文导出为 refworks 格式
- [Scaffold 使用说明](https://www.zotero.org/support/dev/translators/scaffold),官方出品,便于创建 translator 的工具
- [MDN Javascript 中文教程](https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/A_re-introduction_to_JavaScript)
- [Zotero 条目类型说明](https://aurimasv.github.io/z2csl/typeMap.xml)
- [How to write a Zotero translator](https://niche-canada.org/member-projects/zotero-guide/about.html)

## 🦸 其他热心参与者

[@jiaojiaodubai](https://github.com/jiaojiaodubai)
[@wanyzh](https://github.com/wanyzh)
[@smilevent](https://github.com/smilevent)
Expand Down
Binary file removed data/howto1.png
Binary file not shown.
Binary file removed data/howto2.png
Binary file not shown.
Binary file removed data/howto3.png
Binary file not shown.
Binary file removed data/howto4.gif
Binary file not shown.
Binary file removed data/howto5.png
Binary file not shown.
Binary file removed data/howto6.gif
Binary file not shown.
Binary file removed data/refworks.pdf
Binary file not shown.
37 changes: 0 additions & 37 deletions metadata.py

This file was deleted.

0 comments on commit ea85a6c

Please sign in to comment.