扫码阅读
手机扫码阅读
如何获取指定CSDN博主的全部文章信息

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。


鲁飞
扫码关注公众号
本文介绍了如何爬取CSDN上的作者文章,以开源社(username为kaiyuanshe)为例。
1. 创作历程
使用特定API获取开源社每年每月发布的文章数量和查看链接。例如:https://blog.csdn.net/community/home-api/v1/get-place-on-file?username=kaiyuanshe
。通过这个接口可以获得JSON数据,包含了年份、月份、文章数量和对应链接。
2. 文章列表
文章列表默认按最后发布时间排序。通过调整API请求,如下所示:
- 最后发布时间:
https://blog.csdn.net/community/home-api/v1/get-business-list?page=1&size=20&businessType=blog&orderby=&noMore=false&year=&month=&username=kaiyuanshe
- 按访问量排序:
https://blog.csdn.net/community/home-api/v1/get-business-list?page=1&size=20&businessType=blog&orderby=ViewCount&noMore=false&year=&month=&username=kaiyuanshe&filterType=&blogType=ViewCount
- 创作历程排序:
https://blog.csdn.net/community/home-api/v1/get-business-list?page=1&size=20&businessType=blog&orderby=&noMore=false&year=2023&month=06&username=kaiyuanshe&filterType=&blogType=ViewCount
通过调整API的参数,可以获取不同排序和时间范围的文章列表。返回的JSON数据中包含了文章的基础信息,如文章ID、标题、描述、详情URL、原创标识、置顶标识、浏览量、评论数、发布时间、封面图等。
获取文章详情则通过访问文章对应的URL来爬取HTML内容。
总结以上,通过CSDN提供的API可以实现对作者文章的有效爬取,从而获取所需的文章数据。
想要了解更多内容?


鲁飞
扫码关注公众号
鲁飞的其他文章
你不知道的PHP小技巧之计算文本相似度
有这样一个需求:需要对于用户发布的内容标题进行相似度对比,如果有之前的内容和当前发布的内容标题相似度到达某个阈值时则禁止发布或进行其他的一些操作。
PHP8正式版发布,带来了注解和JIT
PHP8 正式版已经发布,来看看都有哪些新特性
腾讯企业邮箱收不到邮件怎么回事
原因就是域名解析 CNAME 和 MX 记录冲突所导致的。
GitHub Actions 真香系列之scp和ssh
虽然现在有 k8s 作为部署服务,但也有一部分的业务还是使用传统的方式,在服务器上使用 LNMP 进行部署 Web 站点。
MQTT 怎么在单独一个端口上分别使用 v3.x 和 v5.0 协议解析?
在 1883 端口上,同时处理 v3.1、v3.1.1 和 v5.0 这 3 种协议等级
加入社区微信群
与行业大咖零距离交流学习


PMO实践白皮书
白皮书上线
白皮书上线