如何实现scrapy针对网页内容变化的增量爬取

2025-03-24 17:57:49
推荐回答(1个)
回答1:

主要网页结构不变都可以通过apscheduler做定时任务爬取,有新的内容自然会写到数据库
DataTable dt = new DataTable();
dt.Columns.Add(new DataColumn("PreRevDate0", typeof(decimal)));
DataColumn col = new DataColumn();
col.ColumnName = "PreRevDate1";
col.Expression = "ABS(Convert.ToInt32(PreRevDate0))";
col.DataType = typeof(decimal);
dt.Columns.Add(col);
DataRow dr = dt.NewRow();
dr["PreRevDate0"] = -1;
dt.Rows.Add(dr);