扫码阅读
手机扫码阅读
如何获取指定CSDN博主的全部文章信息

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。


鲁飞
扫码关注公众号
本文介绍了如何爬取CSDN上的作者文章,以开源社(username为kaiyuanshe)为例。
1. 创作历程
使用特定API获取开源社每年每月发布的文章数量和查看链接。例如:https://blog.csdn.net/community/home-api/v1/get-place-on-file?username=kaiyuanshe
。通过这个接口可以获得JSON数据,包含了年份、月份、文章数量和对应链接。
2. 文章列表
文章列表默认按最后发布时间排序。通过调整API请求,如下所示:
- 最后发布时间:
https://blog.csdn.net/community/home-api/v1/get-business-list?page=1&size=20&businessType=blog&orderby=&noMore=false&year=&month=&username=kaiyuanshe
- 按访问量排序:
https://blog.csdn.net/community/home-api/v1/get-business-list?page=1&size=20&businessType=blog&orderby=ViewCount&noMore=false&year=&month=&username=kaiyuanshe&filterType=&blogType=ViewCount
- 创作历程排序:
https://blog.csdn.net/community/home-api/v1/get-business-list?page=1&size=20&businessType=blog&orderby=&noMore=false&year=2023&month=06&username=kaiyuanshe&filterType=&blogType=ViewCount
通过调整API的参数,可以获取不同排序和时间范围的文章列表。返回的JSON数据中包含了文章的基础信息,如文章ID、标题、描述、详情URL、原创标识、置顶标识、浏览量、评论数、发布时间、封面图等。
获取文章详情则通过访问文章对应的URL来爬取HTML内容。
总结以上,通过CSDN提供的API可以实现对作者文章的有效爬取,从而获取所需的文章数据。
想要了解更多内容?


鲁飞
扫码关注公众号
鲁飞的其他文章
新注册的域名被微信拦截怎么处理?
前段时间新注册了一个域名,没有在微信测试访问,等用到的时候发现居然被微信拦截了...
使用Composer Scripts为依赖进行瘦身
常见的 SDK 都会将所有功能都集成在一个代码库中,本文以腾讯云开发者工具套件(SDK)3.0 为例。
怎么使用默认的 PHP 执行 phar 包?
最近在开发一个安装程序的时候,打包为了 phar 包,遇到了一个问题就是打包后的 phar 包不能省略 php 去运行。
MacOS 等机器配置 Docker 启用 Remote API
Docker 不仅可以通过本地命令行docker命令进行调用,还可以通过开启远程控制 API,使用 HTTP
simps/mqtt:适用于 PHP 的 MQTT 协议解析和协程客户端
也许这是第一个支持 MQTT v5.0 协议的 PHP library…
加入社区微信群
与行业大咖零距离交流学习


PMO实践白皮书
白皮书上线
白皮书上线