Save The Web Project
## 安装 ### 使用 pipx pipx install --force --index-url https://git.saveweb.org/api/packages/Save The Web Project/com.saveweb/pypi/simple/ --pip-args='--extra-index-url https://pypi.tuna.tsinghua.edu.cn/simple' chouti ### 或使用 pip pip install -U --index-url https://git.saveweb.org/…
chouti_links
即将完成爬取,请更新 chouti 包并运行 chouti_comments
。开始存档全部评论。
在跑 1.3.0/1.3.1/1.3.2 的可以停了,停了会加快其它跑 1.3.3 的收尾的速度。
目前队列里还有四百万任务需要 1.3.3 处理。
咱做好人,别抢跟新版本抢任务,误。
目前队列里还有四百万任务需要 1.3.3 处理。
Save The Web Project
Photo
抽屉删除了 2014 年 7 月 14 日前的所有link。(约 6,150,407 篇)
在总计 42,468,932 个 links 中,至今仍存在的仅有 13,623,632 个。
采样发现,抽屉近几年几乎没有删过 link,可能是由于运营状况恶化而放松了内容把控?
评论采样结果也很有趣,近一年似乎没有删过评论。
在总计 42,468,932 个 links 中,至今仍存在的仅有 13,623,632 个。
采样发现,抽屉近几年几乎没有删过 link,可能是由于运营状况恶化而放松了内容把控?
评论采样结果也很有趣,近一年似乎没有删过评论。
Giweb: Git with a cup of web
chouti/links_sample.png at main
Save The Web Project
pip(x) install https://static.saveweb.org/huashijie-1.0.1-py3-none-any.whl huashijie_work 画世界。与上条消息是不同的项目,可与上面那个可以同时跑。(但单个项目不要多开) 源码: https://github.com/Save The Web Project/com.saveweb/huashijie_work
huashijie_work
已用 Golang 重写,吃上的群友都说 Go 好 Py 坏,建议迁移。https://git.saveweb.org/Save The Web Project/com.saveweb/huashijie_go/releases
——
docker 可用
icecodexi/Save The Web Project/com.saveweb:huashijie
,注意需要传入 ARCHIVIST
环境变量。Giweb: Git with a cup of web
huashijie_go
最近那篇说中文互联网寄了的微信文章很火,我们想用实测说话。🫠🫠
大家好,请帮助我们测量 2014 年(十年前)的中文互联网资讯类链接的腐烂情况。
https://docs.google.com/spreadsheets/d/16XX9E6iUxWbWXoZNl7W_VJntL3aGSoX0hL76GJnZTyo/edit?usp=sharing
目前有 8k+ 抽样链接,但统计结果收敛之后就停。
大家好,请帮助我们测量 2014 年(十年前)的中文互联网资讯类链接的腐烂情况。
https://docs.google.com/spreadsheets/d/16XX9E6iUxWbWXoZNl7W_VJntL3aGSoX0hL76GJnZTyo/edit?usp=sharing
目前有 8k+ 抽样链接,但统计结果收敛之后就停。
https://blog.nicovideo.jp/niconews/225099.html
TL;DR:
NicoNico 被勒索组织攻击,攻击进到了内部私有云,大量虚拟机被锁。
(他们拿 2007 年的备份搭了个临时站?? https://www.nicovideo.jp ,一朝回到解放前)
TL;DR:
NicoNico 被勒索组织攻击,攻击进到了内部私有云,大量虚拟机被锁。
(他们拿 2007 年的备份搭了个临时站?? https://www.nicovideo.jp ,一朝回到解放前)
【調査中/追記】ニコニコサービス全体において正常に利用できない場合がある不具合|ニコニコインフォ
いつもニコニコをご利用いただきまして、誠にありがとうございます。 この度、ニコニコサービス全体において発生している不具合に伴い、緊急メンテナンスを実施させていただきます。 ■ メンテナンス日時 ・20
https://git.saveweb.org/Save The Web Project/com.saveweb/acfunction_go/releases
尝试存档 AcFun 全站弹幕。(目标高度:2亿)
Coming s∞n: AcFun 视频存档。
#FunWithoutB
尝试存档 AcFun 全站弹幕。(目标高度:2亿)
Coming s∞n: AcFun 视频存档。
#FunWithoutB
Giweb: Git with a cup of web
acfunction_go
Save The Web Project
Photo
感谢 ArchiveTeam。
来自抽屉的 13,623,632 个外部网页链接(多为新闻、帖子)已全部完成爬取,其中有效的网页(预计 >20% <70%)已编入 Wayback Machine 中。
来自抽屉的 13,623,632 个外部网页链接(多为新闻、帖子)已全部完成爬取,其中有效的网页(预计 >20% <70%)已编入 Wayback Machine 中。
Save The Web Project
https://git.saveweb.org/Save The Web Project/com.saveweb/acfunction_go/releases 尝试存档 AcFun 全站弹幕。(目标高度:2亿) Coming s∞n: AcFun 视频存档。 #FunWithoutB
https://github.com/Save The Web Project/com.saveweb/Save The Web Project/com.saveweb-images/blob/master/README.md
目前所有依赖社区众包的数据抓取程序都已获得半官方的 docker 容器支持(目前仅提供 Linux amd64/arm64 镜像)
容器运行不污染环境,不会遇到依赖项无法满足的问题,且开箱就能获得不错的安全隔离,推荐 Linux/macOS 用户使用
目前所有依赖社区众包的数据抓取程序都已获得半官方的 docker 容器支持(目前仅提供 Linux amd64/arm64 镜像)
容器运行不污染环境,不会遇到依赖项无法满足的问题,且开箱就能获得不错的安全隔离,推荐 Linux/macOS 用户使用
GitHub
saveweb-images/README.md at master · saveweb/Save The Web Project/com.saveweb-images
various worker images. Contribute to saveweb/Save The Web Project/com.saveweb-images development by creating an account on GitHub.