|
您的内容之前,您需要了解更多有关 的信息。好吧,我已经为您完成了其中一些操作,今天我将教您如何为其他网站执行此操作。这是高级内容分析 现在开始。 大脑的孩子 在 上进行高级内容分析的想法来自于 和我有一天关于从他们那里获取链接的对话。他打趣道,你真正需要做的就是写一篇类似 做 的 种方法 的帖子。我笑了,因为这是真的(列表帖子做得很好),但后来问自己: 的帖子中有多少是列表? 当我深入研究如何获。
取尽可能多的帖子标题后,我意识到还有多少可用数据以及分析可以真正深入多少。 数据处理 我月的 帖子;也就是说,直到我 易趣编号数据 开始提取数据并意识到他们每月发布近 个帖子。两千。神圣的内容,蝙蝠侠。一个月的时间里,两千个帖子对于我的分析来说已经足够了。如果有人想做更多,我很想听听大约六个月的数据。 我使用了三种工具来提取分析所需的数据: 、 和 。 导入 为了收集帖子标题,我使用了 。链接的。

指南将比我更详细地告诉您如何使用 从网站中抓取内容。对于那些好奇的人,我提供了用于 的公式。如果您只想查看论坛的实际情况,这里有一份只读 文档供您研究。 第一个重要部分是要抓取的页面。您想要访问博客 网站的存档页面。对于 ,您可以通过在其主页上点击 下一步 来访问它们。这为我们提供了要抓取的页面。下面的 是您输入要抓取的页码的位置。这个论坛对我来说是 单元格 您很快就会知道这一点。 下面,您就可以。
|
|